Unraid nach ca. 5 Tagen nicht mehr erreichbar, IP, Monitor


Johnny4233

Recommended Posts

Hallo, aktuell habe ich das Problem, das nach ca. 5 Tagen der Server nicht mehr erreichbar ist. Kein dienst auf irgendwelchen ports, ips, etc, und auch auf Port 80/443 die GUI nicht. Es ist jetzt 2x aufgetreten.

 

Heute hatte ich auch mal versucht per Monitor eine Ausgabe zu sehen. Kam aber auch kein Signal. Der Rechner ist aber eingeschaltet laut LED am Gehäuse und die Netzwerk LED blinkt.

 

Es hilft dann nur ein hard Reset. Aber das kann doch auch nicht sinnvoll sein.

 

Gibt es irgendwo logs die im nachhinein noch einsehbar sind? Die ich euch vielleicht zur Verfügung stellen könnte?

 

Das Problem müsste nachts auftreten, da es gestern Abend noch lief, aber heute morgen nicht mehr. 

 

Mainboard: Gigabyte C246m WU-4 (f4 Bios)

Prozessor: Intel i3 9100

Netzteil: Corsair 650 watt

 

vielleicht kann mir ja jemand helfen. 🙂

 

EDIT: Ich habe das anonymisiertes Diagnose File angehangen, falls es ok ist.

nasty-diagnostics-20211201-1105.zip

 

edit2: ich habe mal ein wenig gesucht nach dem Thema. Das kann wohl auch was mit dem CPU governor zu tun haben. Ich hatte den auf power saving gesetzt. Steht jetzt wieder auf Performance im Plugin. Kann man das im Bios abschalten? Wenn ja, wo finde ich das im Bios von meinem mainboard? 

Edited by Johnny4233
Link to comment
9 hours ago, Johnny4233 said:

Ich habe das anonymisiertes Diagnose File angehangen, f

Du musst a) den syslog server auf  USB schreiben lassen und b) die Zeit nennen, sonst weiß man ja gar nicht wo man suchen soll.

 

9 hours ago, Johnny4233 said:

Ich hatte den auf power saving gesetzt. Steht jetzt wieder auf Performance im Plugin

Du kannst versuchen hpet zu deaktivieren. Siehe:

https://forums.unraid.net/topic/109990-kein-spindown-nach-hardwareaustausch-mit-aktiviertem-powertop/?do=findComment&comment=1008019

 

 

 

Link to comment
42 minutes ago, mgutt said:

Du musst a) den syslog server auf  USB schreiben lassen und b) die Zeit nennen, sonst weiß man ja gar nicht wo man suchen soll.

 

Du kannst versuchen hpet zu deaktivieren. Siehe:

https://forums.unraid.net/topic/109990-kein-spindown-nach-hardwareaustausch-mit-aktiviertem-powertop/?do=findComment&comment=1008019

 

 

 

 

Das mit dem Syslog werde ich aktivieren und laufen lassen bis der Fehler eventuell wieder auftritt.

 

Wie schalte ich das hpet aus? Dat das das andere besondere Einflüsse?

Edited by Johnny4233
Link to comment
23 minutes ago, Johnny4233 said:

Wie schalte ich das hpet aus? Dat das das andere besondere Einflüsse?

Ja es löst einen CPU Fehler von Intel ^^

 

Sobald die CPU in C10 wechselt, ist das System super langsam, wenn hpet aktiv ist. Steht aber alles in dem Link. hpet=enable ist eine Kernel Option, die man in Unraid ändern kann, wenn man auf "Flash" klickt, also den USB Stick:

image.png.06be5a5f37b9b20858bd59889e422a74.png

Link to comment
15 minutes ago, mgutt said:

Ja es löst einen CPU Fehler von Intel ^^

 

Sobald die CPU in C10 wechselt, ist das System super langsam, wenn hpet aktiv ist. Steht aber alles in dem Link. hpet=enable ist eine Kernel Option, die man in Unraid ändern kann, wenn man auf "Flash" klickt, also den USB Stick:

image.png.06be5a5f37b9b20858bd59889e422a74.png

 

 

Ah alles klar 😄 Hoffentlich findet der Fix bald Einzug in den Kernel. Ich habe hpet=disable mal eingefügt und einen Reboot angestoßen. Syslog schreibt jetzt erstmal auf den USB Stick. Ich werde Berichten 🙂

Link to comment

So, Problem ist wieder aufgetreten. Jetzt schon nach ca. 5 Stunden. Syslog wurde geschrieben. Habe ich angehangen. Kann da jemand was draus erkennen?

 

22:17:54 -> login von mir und update unassigned.devices

00:04:16 -> ????

Gegen 3 Uhr ist mir das dann aufgefallen. Ich hatte einen Monitor und Tastatur angeschlossen. Erst reagierte er nicht. Dann konnte ich mich per ssh einloggen. Hatte dann mit reboot einen Neustart versucht.  Hing aber dann bei forcing shutdown. Musste dann Hard resetten. 

log021221_unraid.txt nasty-diagnostics-20211202-0343.zip

Link to comment

Ich hatte das gleiche Problem.

 

nach ca.- 7 Tagen ging nichts mehr außer physikalisch ausschalten, selbst IPMI hat nicht mehr reagiert.

Da ich zu der Zeit über das Nerd-Pack BorgBackup installiert hatte und auch über UseerScripts genutzt habe, habe das zuerst darauf geschoben und Borg und BerdPack deinstalliert. Und hat das etwas genützt? Nö. nach 7 Tagen war wieder alles tod.

Als Backup hatte ich aber auch noch rsync scripte laufen und mir fiel auf, daß das Einfrieren immer nach oder während des rsync stattfand. Also habe ich die rsync scripte gestoppt. Jetzt läuft der Server seit 16 Tagen ohne Unterbrechung, hoffen wir mal.

 

Das Backup macht jetzt ein kleiner Proxmox Container auf einem separatem Server. 4 Container mit separatem BorgBackup und einem"cp --udate".

 

Bisher läuft es.

 

Gruß

Jann

Link to comment

Ich habe mal ein wenig gesucht. Gefunden habe ich einen ähnlichen Fehler bei jemandem im error Log nf_conntrack. Ich nutze auch Custom network zur IP Zuweisung an Docker Container. Habe die Container nun in VMs verschoben oder auf bridge umgestellt soweit möglich.

 

Da mein Router kein Vlan kann, gibt es ja keine andere richtige Möglichkeit aktuell?

 

Soweit läuft das bis jetzt gut.

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.