Fendt Posted August 13, 2021 Share Posted August 13, 2021 Hallo, ich habe einen Unraid Server seit einem Jahr der ohne Probleme lief noch nie abgestürzt. Nun habe ich vor ein paar Tagen den RAM ausgetauscht von 4gb auf 8gb und neue Festplatten eingebaut da die alten nur Desktop Festplatten waren. Eingebaut wurden zwei Seagate Ironwolf Pro je 4tb. Der Cache läuft im Raid 1 um Datenverlust zu vermeiden. Wenn ich aber jetzt versuche einen Parity check zu machen stürzt die Kiste ab. Weis aber nicht an was das liegt habe schon probiert den RAM zu tauschen, kein Erfolg. Wahrscheinlich wäre ein Log file für euch von Vorteil, wie lasse ich diese automatisch auf den Stick speichern? Sofern er überhaut noch einen erstellt wenn er sich aufhängt. Quote Link to comment
ViRtualRealitY Posted August 13, 2021 Share Posted August 13, 2021 Einstellung -> Syslog Server -> Syslog auf den Flash-Speicher spiegeln anstellen Dann speichert er den Log auf den USB stick. Hast du ein AMD System ? AMD Systeme sind sehr RAM sensible. Lad am besten auch mal die Diagnostics hoch. 1 Quote Link to comment
Fendt Posted August 13, 2021 Author Share Posted August 13, 2021 (edited) nas-diagnostics-20210813-0854.zipEs ist ein Intel System: BIOSTAR Group J1900MH2 8gb DDR3 RAM Cache betrieben im Raid 1: Samsung 850Evo 250gb SanDisk SSD PLUS 240gb Array: 2x Seagate Ironwolf Pro je 4tb eine als Parität und eine als Datenplattte. Marvel PCI adapter auf 4 Sata nas-diagnostics-20210813-0854.zip syslog Edited August 13, 2021 by Fendt Quote Link to comment
mgutt Posted August 13, 2021 Share Posted August 13, 2021 Die logs nützen uns jetzt nichts, da der Server ja erst frisch gestartet wurde (was die Logs zurücksetzt). Du musst den Server erst wieder zum Abstürzen bringen und dann lädst du die syslog aus dem /boot/logs Verzeichnis hoch mit Angabe der Uhrzeit wann der Server abgeschmiert ist. Da sollte dann nun drinstehen was den Fehler verursacht hat. Hoffentlich ^^ Quote Link to comment
ViRtualRealitY Posted August 13, 2021 Share Posted August 13, 2021 Just now, mgutt said: Da sollte dann nun drinstehen was den Fehler verursacht hat. Hoffentlich ^^ Kleines Beispiel von mir dazwischen, bei mir war der Server auch zwischenzeitlich "weg", also entweder nicht erreichbar weil gecrasht oder was auch immer, aber das war anscheinend ein Hardware fehler, der (wurde mir gesagt) wird nicht mitgeloggt. Deswegen die Frage nach der CPU, bei AMD gibt es häufig RAM Schwierigkeiten, aber bei Intel bin ich raus. Da weiß ich nur das XMP auch nicht so toll sein sollte. Quote Link to comment
mgutt Posted August 13, 2021 Share Posted August 13, 2021 Was man auch noch machen könnte: Monitor am Server anschließen und Server crashen lassen. Da sollten dann auch Fehler ausgegeben werden. Quote Link to comment
Fendt Posted August 13, 2021 Author Share Posted August 13, 2021 Der log war eigentlich vom Absturz😅 bzw habe den log auf usb schreiben eingeschalten und gespeichert und dann ist der server abgeschmiert... Das heißt er war nicht mehr erreichbar ist aber noch gelaufen. Was bedeutet das auf dem Bild mit dem Fehler code? Quote Link to comment
ViRtualRealitY Posted August 13, 2021 Share Posted August 13, 2021 2 minutes ago, Fendt said: Was bedeutet das auf dem Bild mit dem Fehler code? Das der Parity Check nicht durchgelaufen ist, sondern abgebrochen wurde. Hast du XMP an? Quote Link to comment
mgutt Posted August 13, 2021 Share Posted August 13, 2021 2 hours ago, Fendt said: Der log war eigentlich vom Absturz😅 bzw habe den log auf usb schreiben eingeschalten und gespeichert und dann ist der server abgeschmiert... Ja, dann ist es wie @ViRtualRealitY sagte. Der Fehler wird schon gar nicht mehr geloggt. Ich würde erst mal hingehen und jedes RAM-Modul einzeln auf Fehler testen. Also Module bis auf eines raus, neu starten und beim Neustart den RAM-Test durchführen. PS bei ECC RAM würdest du RAM Fehler in den Logs sehen. So tappt man erst mal im Dunkeln. Quote Link to comment
Fendt Posted August 13, 2021 Author Share Posted August 13, 2021 Werde die nächste Zeit vielleicht mal in ECC RAM investieren😅 wie teste ich die RAM Module bei Start geht das im Bios? Quote Link to comment
ViRtualRealitY Posted August 13, 2021 Share Posted August 13, 2021 1 minute ago, Fendt said: wie teste ich die RAM Module bei Start geht das im Bios? Unraid hat beim Start die möglichkeit den Memtest zu machen, also einfach mal monitor anschließen und beim boot menü memtest auswählen. Quote Link to comment
jj1987 Posted August 13, 2021 Share Posted August 13, 2021 Funktioniert aber nur wenn man im BIOS legacy Boot aktiviert hat. Die memtest Version kann kein uefi - zumindest war das "früher" ein Problem Quote Link to comment
Fendt Posted August 13, 2021 Author Share Posted August 13, 2021 (edited) Also wenn ich probiere denn memtest zu machen flickert er blos auf aber ohne reaktion. Trotz umgesttlt auf legancy Hab gerade das System gebootet mit einem Ram Stick und das ist mir aufgefallen Obwohl die CPU und Mainboard doch kein ecc unterstützen oder bin ich jetzt kommplet falsch? Das ist wieder ein Log bei dem der Server nicht mehr erreichbar war... syslog.txt Edited August 13, 2021 by Fendt Quote Link to comment
mgutt Posted August 14, 2021 Share Posted August 14, 2021 Nutzt du evtl irgendwelche Stromsparmechanismen oder Undervolting? Quote Link to comment
Fendt Posted August 14, 2021 Author Share Posted August 14, 2021 Nein nichts Kann es an den Platten liegen denn die sind jetzt das einzigste das ich getauscht habe von 3x 1tb auf die zwei 4tb von Seagate? da er ja nur bei der Paritätsprüfung abstürzt. Ram ist jetzt wieder der alte drin der funktioniert sicher bzw. hat bis vor Ausbau immer super funktioniert. Quote Link to comment
mgutt Posted August 14, 2021 Share Posted August 14, 2021 Glaube ich nicht. Das liegt wenn an dem SATA Controller. Tja und RAM kann auch schlechten Kontakt haben oder eben einfach so kaputt gehen. Vielleicht einen Schlag bekommen beim Umbau. Quote Link to comment
mgutt Posted August 14, 2021 Share Posted August 14, 2021 9 hours ago, Fendt said: Obwohl die CPU und Mainboard doch kein ecc unterstützen Das ist wirklich komisch. Dann wären das ja Reg ECC Module?! Quote Link to comment
jj1987 Posted August 14, 2021 Share Posted August 14, 2021 10 hours ago, Fendt said: Also wenn ich probiere denn memtest zu machen flickert er blos auf aber ohne reaktion. Trotz umgesttlt auf legancy Hab gerade das System gebootet mit einem Ram Stick und das ist mir aufgefallen Obwohl die CPU und Mainboard doch kein ecc unterstützen oder bin ich jetzt kommplet falsch? Das ist wieder ein Log bei dem der Server nicht mehr erreichbar war... syslog.txt 213.24 kB · 0 downloads Ziemlich sicher ein Anzeige/Diagnose Fehler. Intel Consumer/Prosumer CPUs (da zähle ich die "einfachen" Xeons dazu) können so oder so kein Multibit ECC. Wäre allerdings Mal interessant wie es zu dieser "Fehldiagnose" kommt. Quote Link to comment
Fendt Posted August 17, 2021 Author Share Posted August 17, 2021 Ich hab jetzt das System wieder zurückgebaut auf zwei 1tb Platten um zu testen ob es vielleicht nicht doch an den Platten liegt. siehe da alles funktioniert und er ist Bomben Stabil. Folgedessen würde es mich interessieren wie ich eine Platte testen kann ? Auch beides RAM also der 4gb und 8gb funktionieren😁 Quote Link to comment
mgutt Posted August 17, 2021 Share Posted August 17, 2021 On 8/13/2021 at 8:59 AM, Fendt said: Marvel PCI adapter auf 4 Sata Wie hast du zurückgebaut? Ich würde nämlich eher auf den tippen. Quote Link to comment
Fendt Posted August 17, 2021 Author Share Posted August 17, 2021 Anstatt die 4tb einfach die 1tb dran aber alles am pci marvel Quote Link to comment
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.