November 1, 20241 yr Hallo zusammen, in den letzten Tagen ist mir häufiger aufgefallen, das sich Unraid aufhängt und auch nach teils langem warten nicht reagiert. Hat jemand eine Idee woran das liegen kann und wie die passende Lösung ist? Lieben Gruß
November 1, 20241 yr Community Expert Okay, das ist leider zu Allgemein. Da braucht es schon die Diagnostics (< Klick) damit Dir geholfen werden kann. Am besten aber aktivierst Du zunächst unter Settings > Syslog Server > Mirror syslog to flash > yes Dann hast Du, wenn der Server wieder abschmiert, die letzten Daten auf dem Stick. Aber dran denken, das wieder zu deaktivieren. Sonst killt es Dir schnell den Stick > Hohe Schreiblast
November 1, 20241 yr Author Hi, vielen dank für die Rückmeldung. Ich habe mal die Log Datein in den Anhang gepackt. homelab-diagnostics-20241101-1547.zip
November 1, 20241 yr Community Expert Von wann sind die? Hast die eben einfach vom laufenden Server gezogen? Dann wird nicht viel zu sehen sein. Direkt nach einem zukünftigen Absturz die Diagnostics vom Stick hier hochladen.
November 1, 20241 yr Author Ja genau, die sind von jetzt eben gerade. Oh okay, ja. dann werde ich das machen und sie hier dann nochmal hochladen.
November 1, 20241 yr Community Expert 2 minutes ago, Pascal_Bcn said: dann werde ich das machen Aber zuvor den Syslog-Mirror (siehe oben) aktivieren...
November 1, 20241 yr 50 minutes ago, Pascal_Bcn said: Oh okay, ja. dann werde ich das machen und sie hier dann nochmal hochladen. dann mal ein paar Infos vorweg ... Netzwerk, du hast einen bond eingestellt (Verbund mehrerer Karten) ... was ja nicht der Fall ist, daher, bond entfernen und nur bridge ... dann auch MTU 9000 eingestellt ... so gewollt ? bei einer max 2.5G NIC, ... und einer Fritz ? und dann muss alles darauf abgestimmt sein ... Nov 1 14:42:02 HomeLab rc.inet1: ip link set lo up Nov 1 14:42:02 HomeLab kernel: MII link monitoring set to 100 ms Nov 1 14:42:02 HomeLab rc.inet1: ip link add name bond0 type bond mode 1 miimon 100 Nov 1 14:42:02 HomeLab rc.inet1: ip link set bond0 mtu 9000 Nov 1 14:42:02 HomeLab rc.inet1: ip link set eth0 up Nov 1 14:42:02 HomeLab rc.inet1: ip link set eth0 master bond0 down type bond_slave Nov 1 14:42:02 HomeLab kernel: bond0: (slave eth0): Enslaving as a backup interface with a down link Nov 1 14:42:02 HomeLab rc.inet1: ip link set name bond0 type bond primary eth0 Nov 1 14:42:02 HomeLab rc.inet1: ip link add name br0 type bridge stp_state 0 forward_delay 0 Nov 1 14:42:03 HomeLab kernel: bridge: filtering via arp/ip/ip6tables is no longer available by default. Update your scripts to load br_netfilter if you need this. Nov 1 14:42:03 HomeLab rc.inet1: ip link set eth0 mtu 9000 Nov 1 14:42:03 HomeLab rc.inet1: ip link set bond0 down Nov 1 14:42:03 HomeLab rc.inet1: ip -4 addr flush dev bond0 Nov 1 14:42:03 HomeLab rc.inet1: ip link set bond0 master br0 up du hast einige DRM errors, evtl. von der iGPU (sr iov im Einsatz) ... vielleicht auch mal ohne probieren zum Test, oder zumindest ein paar weniger und nicht die max 7 ... dann nutzt du ein single drive cache, diese als btrfs ... bisher mal keine Fehler zu erkennen, mal schauen was raus kommt beim nächsten crash ...
November 3, 20241 yr Author Hi Leute, Gestern lief noch alles, bis heute abend wieder alles gecrasht ist. Ich habe jetzt mal den aktuellen Log rausgezogen. Vielleicht könnt Ihr ja erkennen woran das liegt. @alturismo: Das Netzwerk habe ich umgestellt, aber es kommt ne zweite Karte mit 10G in der nächsten Woche rein. Die MTU stimmt soweit schon. Die Fritzbox kann das. sr iov i habe ich von 7 auf 5 gestellt. syslog-previous
November 4, 20241 yr 8 hours ago, Pascal_Bcn said: Vielleicht könnt Ihr ja erkennen woran das liegt. naja, du hast ne Menge crashes und traces ... @JorgeB may an idea what these traces could be ? starting in syslog from here on ... many many errors Nov 3 20:42:47 HomeLab kernel: general protection fault, probably for non-canonical address 0x7fff80000a003907: 0000 [#1] PREEMPT SMP NOPTI Nov 3 20:42:47 HomeLab kernel: CPU: 2 PID: 3483911 Comm: smartctl_type Tainted: P U O 6.6.56-Unraid #1 Nov 3 20:42:47 HomeLab kernel: Hardware name: ASUS System Product Name/TUF GAMING Z790-PLUS WIFI, BIOS 1611 01/16/2024 Nov 3 20:42:47 HomeLab kernel: RIP: 0010:list_del+0x7/0x28 Nov 3 20:42:47 HomeLab kernel: Code: 98 88 00 00 00 f0 48 01 1d 95 85 39 01 5b c3 cc cc cc cc 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 48 8b 47 08 48 8b 17 <48> 89 42 08 48 89 10 48 b8 00 01 00 00 00 00 ad de 48 89 07 48 83 Nov 3 20:42:47 HomeLab kernel: RSP: 0000:ffffc9000d987b90 EFLAGS: 00010297 Nov 3 20:42:47 HomeLab kernel: RAX: ffff88981f2b1f68 RBX: 0000000000000000 RCX: 0000000000000981 ... .. . 8 hours ago, Pascal_Bcn said: Die MTU stimmt soweit schon. Die Fritzbox kann das. und auch alle Clients wo darauf zugreifen ? nur dann macht es eventuell Sinn ... egal, lass es 8 hours ago, Pascal_Bcn said: sr iov i habe ich von 7 auf 5 gestellt. ich würde es mal abschalten und schauen ob dass der Auslöser ist
November 4, 20241 yr 5 hours ago, alturismo said: may an idea what these traces could be Not really, recommend running memtest, could also be related to the Intel 13/14th gen issue.
November 4, 20241 yr Author 12 hours ago, alturismo said: naja, du hast ne Menge crashes und traces ... @JorgeB may an idea what these traces could be ? starting in syslog from here on ... many many errors Nov 3 20:42:47 HomeLab kernel: general protection fault, probably for non-canonical address 0x7fff80000a003907: 0000 [#1] PREEMPT SMP NOPTI Nov 3 20:42:47 HomeLab kernel: CPU: 2 PID: 3483911 Comm: smartctl_type Tainted: P U O 6.6.56-Unraid #1 Nov 3 20:42:47 HomeLab kernel: Hardware name: ASUS System Product Name/TUF GAMING Z790-PLUS WIFI, BIOS 1611 01/16/2024 Nov 3 20:42:47 HomeLab kernel: RIP: 0010:list_del+0x7/0x28 Nov 3 20:42:47 HomeLab kernel: Code: 98 88 00 00 00 f0 48 01 1d 95 85 39 01 5b c3 cc cc cc cc 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 48 8b 47 08 48 8b 17 <48> 89 42 08 48 89 10 48 b8 00 01 00 00 00 00 ad de 48 89 07 48 83 Nov 3 20:42:47 HomeLab kernel: RSP: 0000:ffffc9000d987b90 EFLAGS: 00010297 Nov 3 20:42:47 HomeLab kernel: RAX: ffff88981f2b1f68 RBX: 0000000000000000 RCX: 0000000000000981 ... .. . und auch alle Clients wo darauf zugreifen ? nur dann macht es eventuell Sinn ... egal, lass es ich würde es mal abschalten und schauen ob dass der Auslöser ist Hmm, wenn man nur wüsste wo die herkommen. Ja. :)) Ich habe das Plugin jetzt mal komplett deinstalliert, mal schauen ob es hilft.
November 4, 20241 yr Author 7 hours ago, JorgeB said: Not really, recommend running memtest, could also be related to the Intel 13/14th gen issue. It´s the 12th gen which i am using.
November 4, 20241 yr Community Expert 6 minutes ago, Pascal_Bcn said: Hmm, wenn man nur wüsste wo die herkommen. Nur so: Hast Du seit dem schon mal einen ausführlichen Ramtest gemacht?
November 4, 20241 yr Author 6 minutes ago, DataCollector said: Nur so: Hast Du seit dem schon mal einen ausführlichen Ramtest gemacht? Ne habe ich noch nicht, aber die beiden Riegel sind nagel neu. Aber ich kann mal einen machen, wenn es vielleicht zum Lösen des Problems beiträgt.
November 4, 20241 yr 20 minutes ago, Pascal_Bcn said: Ne habe ich noch nicht, aber die beiden Riegel sind nagel neu. Aber ich kann mal einen machen, wenn es vielleicht zum Lösen des Problems beiträgt. teste mal, und du hast auch kein XMP aktiv ?
November 4, 20241 yr Author 23 minutes ago, alturismo said: teste mal, und du hast auch kein XMP aktiv ? Mache ich. Nein, XPM ist ausgeschaltet.
November 6, 20241 yr Author Der Server lief jetzt 2 Tage ohne Probleme, bis ich heute Morgen einen erneuten Absturz feststellen musste. Ich habe den Log mal wieder angehängt, vielleicht verhilft dieser ja zur Lösung. syslog-previous
November 6, 20241 yr 21 minutes ago, Pascal_Bcn said: Ich habe den Log mal wieder angehängt, vielleicht verhilft dieser ja zur Lösung. eher nicht, jede Menge traces ... nur überlebt der anscheinend etwas länger ... weil dein log ist 14 MB groß ... was viel ist ... und traces beginnen bei nur das du mal eine Dimension siehst ... da ist was kaputt ... memtest mal gemacht ? 24 Stunden run ?
November 6, 20241 yr Author Oh weh... ne der memtest wird heute noch gemacht. Ich stehe echt auf dem Schlauch was das Problem sein kann... Mich nervt es wirklich wahnsinnig das ich mich nicht auf den Server verlassen kann... Ich hoffe dass das Problem bald behoben werden kann und er dann einfach läuft wie er soll.
November 6, 20241 yr 46 minutes ago, Pascal_Bcn said: Ich hoffe dass das Problem bald behoben werden kann und er dann einfach läuft wie er soll. naja, du hast Unmengen Hardware Call Traces, die könnten durch Software verursacht werden, oder irgendwas passt mit der Hardware nicht ... ich würde 2 Optionen durchtesten 1/ memtest mal 24 Stunden laufen lassen, wenn der ok ist 2/ BIOS defaults laden falls Anpassungen vorgenommen wurden (xmp aus) 3/ Unraid "safe mode" starten, ohne plugins, ohne alles ... mal laufen lassen ... wenn er dann immer noch abschmiert ist es Hardware, schwer zu finden außer Trial & Error 4/ wenn er im "safe mode" ohne traces laufen sollte (log sichten), dann nach und nach Dienste aktivieren, syslog im Auge behalten ... mehr bleibt da nicht ... irgendwas klemmt bei Dir, sorry ... aber es ist nicht eindeutig was ... wenn er hart neu starten würde wäre es zu 99,9 Hardware ... aber so ...
November 6, 20241 yr Das hilft vielleicht nicht wirklich weiter, aber ich hatte sehr ähnliche Probleme am Anfang. Habe auch Memtest, sogar für 48h, laufen lassen. Keine Fehler. Schlussendlich war es die 14600er Intel CPU. Diese habe ich in einem anderen Rechner getestet und dieser schmierte sofort ab. Zuvor hatte ich den RAM und das Board getauscht. Nichts hat was gebracht. Erst als die CPU eine andere war, war alles wieder gut. Auch wenn Du eine 12 Gen hast, würde ich das nicht unversucht lassen! Gruß Infosucher Edited November 6, 20241 yr by Infosucher
November 7, 20241 yr Author Also ich habe den memtest jetzt laufen lassen und ist "passed" mit 0 errors. Zuvor ist über Nacht wieder das System abgeschmiert. Anbei mal wieder der log. Das Bios ist nochmlas zurückgesetzt auf die Werkseinstellungen. Den CPU werde ich mir mal anschauen, allerdings habe ich keinen anderen da und muss erst einen i7 kaufen. syslog-previous
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.