Wizard_

Members
  • Posts

    51
  • Joined

  • Last visited

Everything posted by Wizard_

  1. 如题,unraid7快来了(根据ca插件的更新日志推断,大概还有个6.13),这次更新会解决不少使用上的痛点。 以下内容不是访谈的全部内容,欢迎补充! 1.虚拟机快照&克隆 (将现存插件集成至os) 2.zfs拓展,更全面的zfs支持 3.unraid阵列不再是必要,可以选择只用zfs或者btrfs pool 4.可以使用多个unraid阵列 5.pool之间可以用mover互相转移 (目前只允许pool到array) 6.集成file manager、GUI Search和其他一些插件 (听不清🤣) 另外还有一些小细节,limetech会随时更新到最新的内核,但前提是所有子系统都支持(比如目前拖后腿的openzfs)。 未来会有一个“硬件数据库”,用来帮助新用户检查自己的硬件能不能运行unraid,需不需要加一些启动项等等 (简化了翻社区的过程)
  2. That's good enough, thanks for your work!
  3. Will this plugin replace "Virtual Machine Wake On Lan" ? Which is quite old and lack necessary support.
  4. 同升级6.12.8后docker无法启动,使用rm /etc/docker/daemon.json命令解决。 但是我是在go里每次开机生成daemon.json的,之前貌似没有问题? 附上我的go文件,求大佬提供修改的地方。go 顺带一提,访问https://docker.mirrors.ustc.edu.cn会显示这个镜像源貌似现在只供中科大内部使用,是不是可以删了?
  5. 把980pro升级到最新的固件(5开头那个),再搭配上文提到的两条命令。已经两周以上没有再出现类似问题了,应该可以认为问题已经解决。
  6. unraid定位就不是面向生产环境的吧。为了支持最新的特性,经常更新最新的组件。不可避免会有各种兼容性、奇奇怪怪的问题。需要用于生产环境最好不更新,或者用群晖那样远古内核、应用全部自己研发的系统。
  7. 这是qemu的问题,最新版unraid的qemu版本(7.2)已经解决了这个问题
  8. 好了,给直通了显卡的虚拟机关机的时候问题再次出现。 因为昨天相同环境下已经尝试过关机,当时一切正常。所以应该初步可以判断是系统稳定性的问题吧? 网上查了一圈也没有问题的具体成因和解决方案,只能暂时这样了
  9. 似乎问题解决了?具体我也不太清楚是什么情况,但是貌似"无法纠正的I/O错误"问题不再出现、RxErr问题和BadDLLP问题无论高低负载情况都没有再出现。 似乎之前日志内要求的两条启动参数解决了问题。 此问题暂时解决,如有其他问题我会更新。 简单总结一下解决方案: 在syslinux内加上两条启动参数,即 nvme_core.default_ps_max_latency_us=0 pcie_aspm=off 命令作用: 第一条命令的作用是禁止nvme的APST,禁止ssd主动进入省电模式,只能进入Host设置的电源状态。 第二条命令的作用是禁止linux内核的ASPM,在这种情况下系统将不会启用ASPM,也就不会主动省电。
  10. 没有后续...问题还没解决 既然虚拟机放在其他阵列里是可以运行的,我怀疑就是ssd/zfs配置的问题了,下一步考虑更换文件系统到xfs试一试。 目前的临时解决方案是暂时先把虚拟机放在raw池,也就是hdd池里使用。
  11. 另外,将系统放到别的池里再启动是可行的,我将镜像放到了raw池里并成功在显卡直通的情况下启动了系统。
  12. 我今天尝试了一下 使用nvme_core.default_ps_max_latency_us=0后开机不再会有大量AER错误刷屏,但是一旦进行高负载操作依然会刷屏 我根据日志里的提示,又加了一条pcie_aspm=off,目前还不清楚效果。 另外,虚拟机依旧无法启动,但是显示器能显示出桌面(随后死机并出现以下日志,这是否说明问题与显卡关系不大?) 而且,正常情况下使用zpool status -v命令,没有什么特殊的 但是在显示nvme控制器出问题时,再使用这个命令就能看到错误了(类似这样) 最后,我尝试重装了下ssd上的文件系统,目前还是装的zfs,问题依旧。 wizard-server-diagnostics-20240126-1725.zip
  13. 收到,感谢大佬回复! 我这个虚拟机无法启动的问题是纯粹由ssd引起的吗?如果不直通显卡的话,是可以正常启动系统的。
  14. 硬件配置:铭瑄w680+13500+64g ecc,显卡为一张gt710。 虚拟机为win10 22h2,之前显卡直通一直正常,在某一个晚上突然出现问题且导致unraid死机。 此为直通显卡且启动虚拟机后unraid日志报错。cache池是一个zfs池,重启后进行scrub未发现错误,ssd smart也无错误信息,文件读写看起来也是正常的。 此时怀疑是win10虚拟机系统问题,不直通显卡通过vnc访问虚拟机正常 重做了一个win11系统(vnc正常)且直通显卡,系统无法正常启动,虚拟机日志如图 求解决方案! 顺带一提,当我将ssd插到直连cpu的m2插槽时会有如下报错: 尝试在syslinux文件里添加pci=nommconf,可进入系统但无法获取ip,关闭aspm无明显效果。 此为将显卡直通到win10虚拟机,cpu满载时生成的日志。 此时webui功能正常,命令行可使用top命令,显示占用最多的是 z_wr_iss、z_wr_int_2等几个类似的进程,无法kill虚拟机进程 wizard-server-diagnostics-20240123-0258.zip
  15. 如题,有一块980pro作为缓存盘,已经打开独占。 以下为理论跑分与实际跑分 (运行于winserver2022,磁盘为zfs) 可以看到io性能差的不是一点点,有什么办法进行优化吗?
  16. Errr...no,but i don't need such thing when i still use 6.11.5+12400. That's kinda wierd
  17. Thanks for answering my question! I have removed the i915.conf and reboot the system, it seems nothing happened? By the way, i can't shutdown the server normally (use the "shutdown" button in the webui). It will stuck at somewhere and i have to press the power button manually. wizard-server-diagnostics-20231216-1204.zip
  18. Does intel 13th CPU work with this plugin poperly? I can install the plugin, but it goes wrong when i reboot the system. However, i do saw "card render0" in /dev/dri for a few time. 向导-服务器-诊断-20231215-1722.zip
  19. 如题,升级到13500之后正常运行了一段时间。在经过一次修改fan auto control的参数并重启之后,显示无/dev/dri目录,intel gpu top变成错误插件。 删除后,intel gpu top可重新安装,但安装完成就会变成错误插件。 wizard-server-diagnostics-20231209-2233.zip i915驱动已屏蔽
  20. 收到!我在前面重装了中文语言包之后,貌似几乎所有问题都解决了。这个错误已经一周没有再出现,之前也只是偶尔连续出现几条这样的报错。总的来说,现在运行还算稳定。 感谢大佬回复!
  21. unraid报错问题在重装ssd文件系统之前也有出现过类似报错,重装后消失了一段时间直到现在
  22. 如题,最近从铭瑄h610i更换到了铭瑄w680、更换ecc内存,系统从6.11.5升级到了6.12.4。 系统变得非常不稳定,重启有很大概率无法正常开机,各种从没出现过的报错层出不穷,甚至阵列发生了灾难性的事故。 - 以下是可能已经解决的几个问题: 1.unraid阵列内有一块盘显示错误。通过更改这块盘的uuid再用校验盘恢复解决 2.缓存盘(btrfs)显示c-tree错误、文件系统失效无法正常读取。通过ud只读模式挂载+格式化到zfs+unbalace转移解决 问题12在解决后暂时没再出问题,smart等均正常 3.系统经常突然崩溃,显示系统u盘无法写入。通过重做系统盘部分解决。 - 以下是未解决的问题: 1.正常浏览器内,file manager无法读取cache和user文件夹的内容。ssh、unraid gui、docker各种其他方式读写均正常。 2.时常有插件出错(这里是gpu-top,之前该插件和vmbackup插件均已经出现过问题) 此问题之前通过删除&重装对应插件+重启解决了,几天内复发。 3.unraid报错 Nov 7 22:06:34 Wizard-Server kernel: pcieport 0000:00:1a.0: AER: Corrected error received: 0000:00:1a.0 Nov 7 22:06:34 Wizard-Server kernel: pcieport 0000:00:1a.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID) Nov 7 22:06:34 Wizard-Server kernel: pcieport 0000:00:1a.0: device [8086:7ac8] error status/mask=00000001/00002000 之前SSD插在直连cpu的插槽也报类似错误,我以为是接口出问题就切换到南桥接口,几天后类似问题再次出现 [8086:7ac8] 00:1a.0 PCI bridge: Intel Corporation Alder Lake-S PCH PCI Express Root Port #25 (rev 11) 求大佬解答问题!是否是主板坏了(全新主板,概率应该不大吧?)或其他原因。 wizard-server-diagnostics-20231108-0138.zip
  23. 感谢大佬回复!我最终还是直接只给unraid及docker保留了一个网口,其他的考虑直通给虚拟机得了。 顺带一提,我貌似在没看到您回复的情况下搜到了您的博客,并解决了这个问题(笑)。