Matzel08 Posted June 30, 2023 Share Posted June 30, 2023 Guten Abend, leider weiß ich nicht so richtig, wie ich anfangen soll. Mein System geht einfach aus. Aus der Syslog werde ich nicht schlau und habe dann schon Freunde im Umfeld, die auch Unraid nutzen gefragt sowie das Internet auf mögliche Fehler durchsucht, bedauerlicherweise blieben alle Tipps und Ratschläge erfolglos. Dabei war von Starte die Docker einzeln, lösche manche Plugins etc. dabei. Ich kann den Fehler nicht genau erklären, der Server fährt einfach runter bzw. geht aus. Nicht nach einer bestimmten Zeit oder Ablauf. Manchmal starte ich ihn neu und dann geht er direkt aus. Manchmal läuft er 3-5 Tage durch. Neuer RAM, Netzteil und Grafikkarte wurden verbaut. Das Problem bestand allerdings bereits davor und ich dachte, es liegt an der Hardware, auch ein anderes Mainboard wurde getestet. Ich weiß nicht mehr weiter, evtl. kann mir jemand erklären, wo ich den Haken falsch gesetzt habe. Quote Link to comment
cz13 Posted July 1, 2023 Share Posted July 1, 2023 12 hours ago, Matzel08 said: Aus der Syslog werde ich nicht schlau Servus @Matzel08 aber vielleicht der ein oder andere hier😉 Also Syslog Mirror To Flash aktivieren und nach dem nächsten „herunterfahren“ die log hier posten. Quote Link to comment
Matzel08 Posted July 1, 2023 Author Share Posted July 1, 2023 Moin @cz13, da es erst letztens passiert ist😪, hier die letzte. Syslog (15) Quote Link to comment
alturismo Posted July 1, 2023 Share Posted July 1, 2023 1 hour ago, Matzel08 said: da es erst letztens passiert ist😪, hier die letzte. da ist am Ende nichts zu sehen ... wenn ein Rechner sich einfach komplett abschaltet tippe ich mal ganz beherzt auf Hardware ... oder Strom wenn Unraid sich aufhängt bleibt der Rechner normal an und du kannst nichts mehr machen, aber der Rechner läuft weiter ... wenn der kpl. abschaltet oder neu startet, ist es in der Regel eigentlich immer ein Hardware Thema ... Quote Link to comment
Matzel08 Posted July 1, 2023 Author Share Posted July 1, 2023 8 minutes ago, alturismo said: da ist am Ende nichts zu sehen ... wenn ein Rechner sich einfach komplett abschaltet tippe ich mal ganz beherzt auf Hardware ... oder Strom wenn Unraid sich aufhängt bleibt der Rechner normal an und du kannst nichts mehr machen, aber der Rechner läuft weiter ... wenn der kpl. abschaltet oder neu startet, ist es in der Regel eigentlich immer ein Hardware Thema ... Hallo @alturismo, Also am Ende steht ja lediglich alles vom Neustart, der letzte unerwartete Showdown war am 24.06. um rund 00:21 Uhr. Die Hardware wurde 2x komplett geändert und weiterhin eine unerwartete Reaktion vom Server. Für mein Verständnis kann ich nicht nachvollziehen, wie es an der Hardware liegen kann. Gerne lasse ich mich etwas besseren belehren, wenn es also einen Tipp gibt, wie ich die derzeitige Hardware testen kann, bin ich offen es zu probieren. - Strom ist durchgehend gesichert, so mal das BIOS so konfiguriert ist, dass es automatisch startet bei Stromausfall und Wiederherstellung. Mich frustriert das ganze einfach so massiv Quote Link to comment
alturismo Posted July 1, 2023 Share Posted July 1, 2023 4 minutes ago, Matzel08 said: Mich frustriert das ganze einfach so massiv vollkommen verständlich, ich würde wahnsinnig werden ... 4 minutes ago, Matzel08 said: Für mein Verständnis kann ich nicht nachvollziehen, wie es an der Hardware liegen kann. nur um keine Missverständnisse aufkommen zu lassen, ich rede davon dass der Rechner komplett aus ist (Power LED aus) oder bei der BIOS Einstellung kpl. neu gestartet ist (BIOS setting Power fail ... off, on, last state) Daher auch bei Unraid crahses die finale Empfehlung einen Monitor anzuschließen um den finalen Post zu sehen ... aber wenn der Rechner kpl. aus ist ... ist das natürlich sinnfrei wenn das der Fall ist, geh davon aus dass irgendwas mit der Hardware nicht passt ... im Log sehe ich übrigens nichts ... die letzten Zeilen aus deinem syslog ... Jun 30 19:43:37 Tower emhttpd: spinning down /dev/sde Jun 30 19:44:42 Tower emhttpd: spinning down /dev/sdf Jun 30 19:51:52 Tower ool www[21582]: Successful logout user root from 192.168.178.22 Jun 30 20:21:32 Tower ool www[8365]: Successful logout user root from 192.168.178.22 Jul 1 10:27:51 Tower ool www[4802]: Successful logout user root from 192.168.178.22 Jul 1 10:29:11 Tower webGUI: Successful login user root from 192.168.178.22 mal gefragt, war der Rechner da dauerhaft an in der Zeit ? weil die Lücke von gestern zu heute ist schon groß ... 14 Stunden ohne irgendwas ... Quote Link to comment
Matzel08 Posted July 1, 2023 Author Share Posted July 1, 2023 Mich macht es durch und durch wahnsinnig. Ein Freund riet mir dazu, mich mal im Forum zu melden. Ich kämpfe mit dem Problem schon seit mehreren Wochen. Das, was mit dem BIOS gemeint ist, verstehe ich nicht so ganz. Gibt es eine Logdatei im BIOS? Der PC hat keine Power LED oder dergleichen, ich orientiere mich in letzter Zeit nur an den LEDs vom Netzwerkkabel. Der Rechner war dauerhaft an, nur ich habe derzeit kaum etwas darauf laufen, da er ja meistens ausgeht. Dadurch vermeide ich es Ihn aus Frustration aus dem Fenster zu werfen . Ich meinte in der Logdatei den Part: Jun 24 00:21:16 Tower dhcpcd[1258]: br0: removing interface Jun 24 00:21:16 Tower dhcpcd[1258]: br0: releasing lease of 192.168.178.40 Jun 24 00:21:16 Tower dhcpcd[1258]: br0: deleting route to 192.168.178.0/24 Jun 24 00:21:16 Tower dhcpcd[1258]: br0: deleting default route via 192.168.178.1 Jun 24 00:21:17 Tower rc.inet1: ip -4 addr flush dev br0 Jun 24 00:21:18 Tower rc.inet1: ip -4 route flush dev br0 Jun 24 00:21:18 Tower rc.inet1: ip -4 addr flush dev bond0 Jun 24 00:21:18 Tower rc.inet1: ip -4 route flush dev bond0 Jun 24 00:21:18 Tower rc.inet1: ip -4 addr flush dev eth0 Jun 24 00:21:18 Tower rc.inet1: ip -4 route flush dev eth0 Jun 24 00:21:18 Tower rc.inet1: ip link set br0 down Jun 24 00:21:18 Tower kernel: br0: port 1(bond0) entered disabled state Jun 24 00:21:18 Tower rc.inet1: ip link set bond0 promisc off nomaster Jun 24 00:21:18 Tower kernel: br0: port 1(bond0) entered disabled state Jun 24 00:21:18 Tower kernel: device bond0 left promiscuous mode Jun 24 00:21:18 Tower kernel: device eth0 left promiscuous mode Jun 24 00:21:18 Tower rc.inet1: ip link set br0 down Jun 24 00:21:18 Tower rc.inet1: ip link del br0 Jun 24 00:21:18 Tower rc.inet1: ip link set eth0 nomaster Jun 24 00:21:18 Tower kernel: bond0: (slave eth0): Releasing backup interface Jun 24 00:21:18 Tower kernel: r8169 0000:08:00.0 eth0: Link is Down Jun 24 00:21:18 Tower rc.inet1: ip link set bond0 down Jun 24 00:21:18 Tower rc.inet1: ip link del bond0 Jun 24 00:21:18 Tower kernel: bond0 (unregistering): Released all slaves Jun 24 00:21:18 Tower rc.inet1: ip link set lo down Was ich dabei im zugriff auf die WebOS beobachten konnte war das links Unten steht "Array gestartet" dann erschien "Array Shutdown" und nichts ging mehr. Es schien, als wäre er ganz normal heruntergefahren, Lüfter gingen aus und gut. Quote Link to comment
mgutt Posted July 1, 2023 Share Posted July 1, 2023 4 hours ago, Matzel08 said: Die Hardware wurde 2x komplett geändert Das heißt? Auch Netzteil und alle Kabel, die was mit der Stromversorgung zu tun haben? Aktuelle Hardwareliste? Quote Link to comment
Matzel08 Posted July 1, 2023 Author Share Posted July 1, 2023 7 hours ago, mgutt said: Das heißt? Auch Netzteil und alle Kabel, die mit der Stromversorgung zu tun waren? Aktuelle Hardwareliste? Guten Morgen @mgutt, Entschuldigung für die mangelnde Ausführung. Ich hatte erst Hardware, die sehr alt war (ca. 11 Jahre) diese zeigte bereits solche Probleme, woraufhin ich andere aktuellere Hardware genommen hatte. Dann tauchten die Probleme weiterhin auf und ich dachte okay ich kaufe nun neue Hardware, da ich bereits die Vermutung hatte das es daran liegen könnte, doch das Problem besteht weiterhin. Neues Netzteil sowie alle Kabel der Stromversorgung innerhalb sowie außerhalb wurden erneuert. Aktuelles Hardware Profile im Anhang, ich hoffe, es ist das gewünschte. Ansonsten kurz erklären, wie ich eine aktuelle Liste einsehen bzw. Herunterladen kann Hardware Profile.txt Quote Link to comment
DataCollector Posted July 2, 2023 Share Posted July 2, 2023 On 6/30/2023 at 7:47 PM, Matzel08 said: Mein System geht einfach aus. Nur zum Verständnis: Was bedeutet das genau? a) Der Rechner läuft und klack von einer auf die andere Sekunde ist alles dunkel b) oder der rechner läuft und fährt geordnet herunter? Bei a): Hardwareproblem (Stromversorgung/Kabelisolierung durchgescheuert/fehlerhaftes Netzteil/etc...) Bei b): irgendetwqas hat den Shutdown ausgelöst: Software Quote Link to comment
alturismo Posted July 2, 2023 Share Posted July 2, 2023 17 hours ago, Matzel08 said: Es schien, als wäre er ganz normal heruntergefahren, Lüfter gingen aus und gut. der log part ist auch ein normaler shutdown ... so sieht das hier auch aus bei shutdown un 28 14:05:58 AlsServer rc.inet1: ip link set br0 down Jun 28 14:05:58 AlsServer rc.inet1: ip link del br0 Jun 28 14:05:58 AlsServer rc.inet1: ip link set lo down ### hier war der Neustart ### Jun 28 14:14:22 AlsServer kernel: microcode: microcode updated early to revision 0xf4, date = 2022-07-31 Jun 28 14:14:22 AlsServer kernel: Linux version 5.19.17-Unraid (root@Develop) (gcc (GCC) 12.2.0, GNU ld version 2.39-slack151) #2 SMP PREEMPT_DYNAMIC Wed Nov 2 11:54:15 PDT 2022 Jun 28 14:14:22 AlsServer kernel: Command line: BOOT_IMAGE=/bzimage initrd=/bzroot mitigations=off isolcpus=2-9,12-19 intel_pstate=passive intel_iommu=on kvm-intel.nested=1 da ist jetzt zeitlich ne Lücke, hing aber an einem Firmware upgrade für eine DD TV Karte und bewusstem "Warten", Stromlos gemacht, Strom an ... sicher dass du keine/n Hund/Katze/Maus hast wo an den Powerknopf kommt ? ernsthaft gemeint, meine haben das auch schon fertig gebracht, da habe ich das Gehäuse gewechselt oder ein script, plugin, ... wo den Rechner ausschaltet ? Quote Link to comment
mgutt Posted July 2, 2023 Share Posted July 2, 2023 7 hours ago, Matzel08 said: Ansonsten kurz erklären, wie ich eine aktuelle Liste einsehen bzw. Herunterladen kann Das musst du schon aufschreiben. Linux kann ja schlecht ermitteln welches Netzteil du zb verwendest. Quote Link to comment
Matzel08 Posted July 2, 2023 Author Share Posted July 2, 2023 7 hours ago, DataCollector said: Nur zum Verständnis: Was bedeutet das genau? a) Der Rechner läuft und klack von einer auf die andere Sekunde ist alles dunkel b) oder der Rechner läuft und fährt geordnet herunter? Bei a): Hardwareproblem (Stromversorgung/Kabelisolierung durchgescheuert/fehlerhaftes Netzteil/etc...) Bei b): irgendetwas hat den Shutdown ausgelöst: Software Hallo, dann sage ich ganz klar "b". Das Netzteil ist neu. Vom Geräusch her hört es sich auch eher an wie ein gezwungenes Herunterfahren. Kein sofortiger Zack aus. Quote Link to comment
Matzel08 Posted July 2, 2023 Author Share Posted July 2, 2023 1 hour ago, mgutt said: Das musst du schon aufschreiben. Linux kann ja schlecht ermitteln, welches Netzteil du zb verwendest. Okay, es ist von: be quiet! Pure Power 12M 650W (https://www.bequiet.com/de/powersupply/4074) Quote Link to comment
Matzel08 Posted July 2, 2023 Author Share Posted July 2, 2023 2 hours ago, alturismo said: Der Log-Teil ist auch ein normaler Shutdown ... So sieht das hier auch aus bei Shutdown Da ist jetzt zeitlich ne Lücke, hing aber an einem Firmware-Upgrade für eine DD TV Karte und bewusstem „Warten“, Stromlos gemacht, Strom an ... Sicher, dass du kein/n Hund/Katze/Maus hast, wo an den Powerknopf kommt ? Ernsthaft gemeint, meine haben das auch schon fertig gebracht, da habe ich das Gehäuse gewechselt oder ein Skript, Plugin, ... wo den Rechner ausschaltet ? Da ich keine Tiere in meiner Wohnung habe, ganz klares ja ich bin mir sicher . Manchmal fährt er auch kurz nach dem Starten wieder herunter, wo nur ich in der Nähe des Servers bin und nein auch da bin ich nicht aus Versehen an den Knopf gekommen . Ich kenne mich nicht gut mit Skripten oder Plugins aus. Anbei Screenshots von den installierten Sachen. Hatte bereits in der Vergangenheit einiges entfernt, wo ich dachte, das könnte es verursachen. Quote Link to comment
alturismo Posted July 2, 2023 Share Posted July 2, 2023 Hast du mal die Temperaturen beobachtet ? ggf. eine BIOS Sicherheitseinstellung wo denn Rechner runterfährt bei ... Was anderes bleibt ja fast nicht.Gesendet von meinem SM-S901B mit Tapatalk Quote Link to comment
Solution DataCollector Posted July 2, 2023 Solution Share Posted July 2, 2023 1 hour ago, Matzel08 said: dann sage ich ganz klar "b". Das Netzteil ist neu. Vom Geräusch her hört es sich auch eher an wie ein gezwungenes Herunterfahren. Kein sofortiger Zack aus. Du hast zwar sehr viel Hardware ausgetauscht. Nur als ganz blöde Frage: Ist das Gehäuse (und sein Powertaster) das Alte geblieben? Idee dahinter: Ein Powertaster (dessen Verkabelung) die vielleicht einen Schaden hat und bei Vibration oder so ab und zu selber kontaktiert würde zumindest bei Windows einen geregelten Shutdown/Standby verursachen. Ich habe noch nie probiert/getestet ob unraid auch auf kurzes drücken/kontaktieren des Tasters entsprechend geordnet herunter fährt, aber vielleicht ist eine der noch nicht gewechselten Komponenten verantwortlich? Hintergrund: Ich hatte mir zu meiner PC Anfangszeit einen PC von einer kleine Computerklitsche zusammenschrauben lassen (BigTower). Die haben mir den als getestet ausgehändigt. Bei mir aufgestellt und der ging sporadisch aus. Zurück zur Klitsche: die haben ihn in ihre Werkstatt nach hinten (ausser Sicht) getragen und dort getestet, kein Problem. Dann bin ich mit nach hinten gegangen und habe gesehen: die testeten den BigTower im Liegen. Habe gebeten den mal hinzustellen und zu testen. Widerwillig haben sie es getan und da war der Fehler. Nachgesehen: beim Zusammenbau hatte jemand einmal das Kabel des Powerknopfes eingeklemmt und dabei die Isolieung beschädigt. Und somit hat der vibrationsabhängig ab und zu mal Kontakt zum Gehäuse bekommen und damit das Ding ausgeschaltet. Quote Link to comment
Matzel08 Posted July 2, 2023 Author Share Posted July 2, 2023 1 hour ago, alturismo said: Hast du mal die Temperaturen beobachtet? ggf. Eine BIOS-Sicherheitseinstellung wo denn Rechner runterfährt bei ... Was anderes bleibt ja fast nicht. Gesendet von meinem SM-S901B mit Tapatalk Aber fährt Unraid dann kontrolliert runter, wenn das BIOS Probleme macht? Unraid macht gerade eine Paritätsprüfung. Die würde ich gerne noch durchlaufen lassen, danach schaue ich im BIOS, ob es da so eine Einstellung/ Funktion gibt. Quote Link to comment
Matzel08 Posted July 2, 2023 Author Share Posted July 2, 2023 1 hour ago, DataCollector said: Du hast zwar sehr viel Hardware ausgetauscht. Nur als ganz blöde Frage: Ist das Gehäuse (und sein Powertaster) das Alte geblieben? Idee dahinter: Ein Powertaster (dessen Verkabelung) die vielleicht einen Schaden hat und bei Vibration oder so ab und zu selbst kontaktiert würde zumindest bei Windows einen geregelten Shutdown/Standby verursachen. Ich habe noch nie probiert/getestet ob unraid auch auf kurzes drücken/kontaktieren des Tasters entsprechend geordnet herunterfährt, aber vielleicht ist eine der noch nicht ausgetauschten Komponenten dafür verantwortlich? Hintergrund: Ich hatte mir zu meinem PC Anfangszeit einen PC von einer kleinen Computerklitsche zusammenschrauben lassen (BigTower). Die haben mir den als getestet ausgehändigt. Bei mir aufgestellt und der ging sporadisch aus. Zurück zur Klitsche: Die haben ihn in ihrer Werkstatt nach hinten (ausser Sicht) getragen und dort getestet, kein Problem. Dann bin ich mit nach hinten gegangen und habe gesehen: die testeten den BigTower im Liegen. Habe darum gebeten mal hinzustellen und zu testen. Widerwillig haben sie es getan und da war der Fehler. Nachgesehen: Beim Zusammenbau hatte jemand einmal das Kabel des Powerknopfes eingeklemmt und dabei die Isolierung beschädigt. Und somit hat der vibrationsabhängig ab und zu mal Kontakt zum Gehäuse bekommen und damit das Ding ausgeschaltet. Nein, tatsächlich ist das Gehäuse und das was da alles mit dran baumelt (USB, POWER & 1x Lüfter) nicht gewechselt worden. Ich werde das nach der Paritätsprüfung mal simulieren und ein bisschen an den Kabeln wackeln. Doch ist es überhaupt so, dass Unraid normal herunterfährt, wenn ich den Power-Button am Tower betätige? Wenn das so ist, könnte ich, sofern ich nichts feststelle, einfach den Stecker vom Board ziehen, da er ja eh automatisch hochfährt, sobald er Strom bekommt (ist im BIOS so eingestellt). An dieser Stelle möchte ich noch anmerken, dass das Gehäuse auch Staubarm ist, damit meine ich das der Staub die Kurzschlussbrücke nicht geschaffen haben kann. Quote Link to comment
alturismo Posted July 2, 2023 Share Posted July 2, 2023 1 hour ago, Matzel08 said: Doch ist es überhaupt so, dass Unraid normal herunterfährt, wenn ich den Power-Button am Tower betätige? klar und ja, kannst du machen (Stecker ziehen) 1 hour ago, Matzel08 said: Aber fährt Unraid dann kontrolliert runter, wenn das BIOS Probleme macht? nicht wenn das BIOS Probleme macht, Beispiel Überhitzungsschutz ... vielleicht hat dein BIOS ja einen safe mode ab 90° CPU Temp > Rechner runter fahren daher die Frage, hast du mal auf deine Temps geschaut ... Quote Link to comment
Matzel08 Posted July 3, 2023 Author Share Posted July 3, 2023 20 hours ago, alturismo said: klar und ja, kannst du machen (Stecker ziehen) nicht wenn das BIOS Probleme macht, Beispiel Überhitzungsschutz ... vielleicht hat dein BIOS ja einen abgesicherten Modus ab 90° CPU Temp > Rechner runter fahren Daher die Frage, hast du mal auf deine Temps geschaut ... Guten Morgen, Also ich habe nun an allen Kabeln leicht gewackelt/ gezogen. Eins war tatsächlich nicht richtig im Stecker, doch vom USB Frontpannel (wird nicht genutzt, da separater Cardreader). Habe es isoliert das, dass ausgeschlossen werden kann. Den Power-Knopf habe ich komplett abgestöpselt. Dort konnte ich zwar keine Einschränkung feststellen, doch um es auszuschließen. Im BIOS habe ich nichts bezüglich eines Überhitzungsschutzes finden können oder etwas, das dem nahekommt. Ich hatte den Tower jetzt ca. 40 - 60 min. im BIOS laufen lassen für die Temperatur, doch die blieb recht konstant in einem normalen Bereich. Bild anbei. Quote Link to comment
alturismo Posted July 3, 2023 Share Posted July 3, 2023 2 minutes ago, Matzel08 said: Im BIOS habe ich nichts bezüglich eines Überhitzungsschutzes finden können oder etwas, das dem nahekommt. Ich hatte den Tower jetzt ca. 40 - 60 min. im BIOS laufen lassen für die Temperatur, doch die blieb recht konstant in einem normalen Bereich. Bild anbei. dann können wir das Thema ausschließen ... da es auch kein opposite zu WOL gibt m.W. nach ... wird es langsam eng warum dein Rechner sich ausschaltet, abgesehen von dem 24.06. Eintrag, danach nochmal ... ? Quote Link to comment
Matzel08 Posted July 3, 2023 Author Share Posted July 3, 2023 Just now, alturismo said: Dann können wir das Thema ausschließen ... da es auch kein Gegenteil zu WOL gibt mW nach ... wird es langsam eng warum dein Rechner sich ausschaltet, abgesehen von dem 24.06. Eintrag, danach nochmal ... ? Ich glaube WoL ist angeschaltet im BIOS, sollte ich das lieber ausschalten? Bisher ist er "noch" nicht ausgegangen, das kommt immer sporadisch, doch derzeit nicht länger als eine Woche. Ich habe noch die älteren Syslogs auf dem PC, soll ich die Passagen heraussuchen? Quote Link to comment
alturismo Posted July 3, 2023 Share Posted July 3, 2023 1 hour ago, Matzel08 said: Ich habe noch die älteren Syslogs auf dem PC, soll ich die Passagen heraussuchen? ganz ehrlich, wüsste jetzt nicht wirklich für was (zumindest für mich ) aber ein Schaden wäre es nicht, vielleicht sieht ja jemand anderes noch etwas darin ... Server aus mit den genannten Meldungen ist ein normaler shutdown (gewollt, lokal per Powerbutton, Shutdown getriggered, ...) ansonsten ist Server einfach so komplett aus ... für mich immer Hardware Defekt sorry, da kann ich nicht wirklich weiter helfen ... vielleicht sieht jemand anderes etwas hier. Quote Link to comment
Matzel08 Posted July 3, 2023 Author Share Posted July 3, 2023 34 minutes ago, alturismo said: ganz ehrlich, wüsste jetzt nicht wirklich für was (zumindest für mich ) aber ein Schaden wäre es nicht, vielleicht sieht ja jemand anderes noch etwas darin ... Server aus mit den genannten Meldungen ist ein normaler Shutdown (gewollt, lokal per Powerbutton, Shutdown getriggert, ...) ansonsten ist Server einfach so komplett aus ... für mich immer Hardware Defekt sorry, da kann ich nicht wirklich weiter helfen ... vielleicht sieht jemand anderes etwas hier. Danke bereits an dieser Stelle für die ganze Hilfe. Ich beobachte das ganze mal weiterhin und poste die Syslog sobald er wieder Down ist. Ansonsten lag es ggf. doch an einem Wackler am Power Button 🙄. Bisher hat er nicht länger als eine Woche ohne Shutdown ausgehalten. Quote Link to comment
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.