Jump to content

Server startet immer wieder neu. Finde keinen Grund.


Recommended Posts

Hallo alle zusammen,

 

kurze Vorgeschichte: Mein Unraid-AMD-Homelab lief ein paar Jahre problemlos aber zog mir etwas zu viel Strom aus der Steckdose. Daher entschied ich mich einen HW-Umbau auf Intel vorzunehmen und mich die ganzen Energie-Spar-Tipps und Tricks zu testen. Leider bekomme ich aber den Server nicht mehr stabil. Der Rechner startet regelmäßig neu und das Syslog zeigt keinen Grund an in der Hoffnung das vielleicht jemand etwas sieht was ich noch noch nicht gesehen habe.

 

HW (neu): Intel 13500, 64GB DDR5 5600 GSkill, BeQuit 300W Gold

HW (aus alt-system) 4 IronWolf 4TB, 1 500GB NVME Samsung 970 (Docker + Appdata), 250 Sata SSD (Cache für Array)

Laufende Anwendungen: HomeAssistant, postgres, influx, redis, mosquito, zigbee2mqtt, nextcloud, caddy, Adguard (noch paar mehr Container aber zur Zeit nicht aktiv am laufen weil ich nach den Fehlern suche)

 

Energie-Spar-Einstellung hatte ich im verdacht (C-States ASPM) -> alles deaktiviert im Bios, (Bios auf aktueller Version)

Mac-Vlan Crashes hatte ich im verdacht -> Hatte ich umgestellt nach Anleitung aus releasenotes von 6.12.4 (ich glaube da war das drin), IPVlan hatte ich auch probiert -> auch kein Erfolg. 

Realtek Treiber-Plugin wieder deinstalliert -> keine Änderung. 

 

Interessant finde ich noch: Wenn der Parity-Check läuft ist das system stabil. Ist dieser vorbei und das System "idled" passiert es ziemlich schnell.

 

Aber jetzt gehen mir die Ideen aus.

tower-diagnostics-20240615-1417.zip

Link to comment
5 minutes ago, Rico Backasch said:

Der Rechner startet regelmäßig neu

wenn es harte Neustarts sind ... ist es in der Regel immer ein Hardware Thema ... übertaktet ... Temps ... oder zu aggressive Stromspar Mechanismen

 

wenn Unraid Software freezed, dann bleibt die Kiste "stehen" und du musst hart neu starten.

 

kurz, wenn 1/ ... dann wird es (leider) ein trial & error Spiel mit Hardware testen, wenn 2/ dann sag nochmal Bescheid,

dann kann man schauen ob es Software Themen sind.

Link to comment

Ich hatte vor kurzen ein ähnliches Problem, bei mir ist es verschwunden als ich alle sata Festplatten an meinen PCIE Sata erweiterungskarte Angeschlossen hatte, davor waren beide Parity am Mainboard und die 14 Datenplatten über die Erweiterungskarte angebunden. Ich habe dann alle Platten an die Karte gehängt und die Reboots bzw. Freezes sind verschwunden

 

Vieleicht siehst du parallen zu deine Config

Link to comment

Ach ich hatte gehofft das es doch noch ein SW Problem sein könnte.

Das mit den SATA-Anschlüssen ist interessant. Ich hab leider keine Erweiterungskarte um das zu testen aber ich werde in die Richtung mal weiter schauen. Ich glaube ich hatte vor langer Zeit auch mal ein doofes SATA-Kabel was Probleme verursacht.

 

Link to comment
  • 3 weeks later...

Was du auch mal testen kannst ist den Stick an einen anderen USB 2.0 Port zu stecken hatte kürzlich das Pro kem das mein UnRaid Plötzlich nicht mehr erreichbar war und auch sonst nicht mehr reagiert hat, habe jetzt den Stick an einen anderen Port und bist jetzt gibt es keine Probleme mehr, falls es für dich noch relevant ist

Link to comment

Hi zusammen, sorry für die späte Antwort aber ich war ein paar Tage im Urlaub.

 

Netzteil hatte ich auch im Verdacht und hab es gegen ein 700W getauscht was im Alt-System drin war -> Selbes Verhalten.

Das mit dem USB-Port konnte ich nicht mehr testen aus folgendem Grund.

 

Ich habe zwar Antwort vom Gigabyte-Support bekommen aber nur so etwas generisches wie: "Sie haben wohl ein defektes Produkt". Ich hab das Mainboard zurück geschickt und warte auf Ersatz. Wenn ich Ersatz habe würde ich nochmal ein Update posten.

 

 

Kleine Anmerkung zum Netzteil: Ich hab dann mein Altsystem wieder aufgebaut aber das neue Netzteil drin gelassen. Läuft ohne Probleme und zieht ca 25W mehr aus der Wand wenn das System startet. 

Link to comment
On 7/14/2024 at 3:43 PM, DarthOcir said:

Gleiches Verhalten im ersten versuch -> Rechner startet, ich starte das Preclear-Skript der platte -> Rechner startet irgendwann neu

Ich tippe auf das Netzteil wenn der einfach so neu startet, wie alt is das Netzteil denn? Kann man das überhaupt noch kaufen?

Tausch das mal gegen was ordentliches:

Corsair, Seasonic, BeQuiet und mindestens 500W

 

Kann aber natürlich auch das Motherboard sein (ich mag Gigabyte nicht mehr sonderlich), die haben manchmal ziemliche Probleme mit der Firmware.


Was du auch noch versuchen kannst is das XMP profil zu deaktivieren und den RAM auf standard takt laufen zu lassen.

Link to comment

Ich hab noch ein Thermaltake Thoughpower XT 675W.  Test läuft......

 

XMP hatte mit dem alten Motherboard schon getestet und der andere Test-Ram den ich noch hatte war auch ohne XMP. Probieren werde ich es trotzdem nochmal.

Ich mache Meldung wenn beide Tests durch sind.

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...