Jump to content

6.12.10 连续多次失联找不到原因,每次时间大概5-10天,死机一次只能强制重启


Recommended Posts

这是第三次反馈:
第一次使用约 13-14 天发生崩溃,表明机器违规,无法访问后台 docker 虚拟机,可见显示器有显示信息,但按重启无法成功,会卡处于关闭状态。

平台为Z370M+8600T+32G内存,内存跑过TM5无稳定,当时大佬建议跑稳定性测试。

 

第二次:不稳定崩溃,一旦使用docker到某些节点就出现第一个状态,后续发现限制docker最大使用内存就解决了。

 

从娃娃开始平台更换成:Z690+12100+32G内存

 

这次情况和第一次反馈的差不多,同样是正常使用系统的情况下,无法访问后台docker虚拟机,但显示器无可见信息,黑屏无信号。通过强制关机重启恢复。

 

不过发现了一个重复的现象,就是在崩溃之前,群晖虚拟机会掉线

 

图像.缩略图.png.0dc55f50bd3e44005be5137071c70a79.png

 

掉线约6-8小时后,突袭就死机了。但是第一次崩溃的时候

 

确实没发现什么问题,上传了日志

syslog-上一个.txt

Edited by 黄哲扬
Link to comment

这边会看了一下从3月开始的记录

在Z370M+8600T的时候,失联不是死机,是万兆网卡崩溃,在开启后第13-14天左右,切换网口就好了,后续就换平台了。

 

这边继续持续跟进

Link to comment

所以第一次可能不是死机,那么这个情况可能是更换平台后,出现的,我也记不清是不是安装群晖虚拟机出现的了,但是虚拟机不能停,先观察一下

由于我判断不出问题,目前的想法是:既然观察到每次群晖虚拟机无反应后,unraid会死机,那么我在确定一次后,通过ping检查虚拟机情况,如果在无反应,我尝试重启虚拟机,看是否可以保持unraid在线情况。

Link to comment

这个问题我也遇到过,排查了好多遍,硬件问题是解决了 6.12.10我是几个小时就崩溃 查不出来具体是什么原因 目前我是回退到6.12.9  已经稳定运行45天没出问题了

Link to comment
4 hours ago, mengxia said:

这个问题我也遇到过,排查了好多遍,硬件问题解决了 6.12.10我现在几个小时就崩溃了 查不出具体原因 目前我回退到 6.12.9 已经稳定运行45天没出问题了

我基本上都是稳定7、8天呢,降级的话要怎么处理呢

 

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...