Jump to content

Unraid Tower geht einfach aus


Matzel08
Go to solution Solved by DataCollector,

Recommended Posts

Guten Abend,

 

leider weiß ich nicht so richtig, wie ich anfangen soll. Mein System geht einfach aus. Aus der Syslog werde ich nicht schlau und habe dann schon Freunde im Umfeld, die auch Unraid nutzen gefragt sowie das Internet auf mögliche Fehler durchsucht, bedauerlicherweise blieben alle Tipps und Ratschläge erfolglos. Dabei war von Starte die Docker einzeln, lösche manche Plugins etc. dabei. Ich kann den Fehler nicht genau erklären, der Server fährt einfach runter bzw. geht aus. Nicht nach einer bestimmten Zeit oder Ablauf. Manchmal starte ich ihn neu und dann geht er direkt aus. Manchmal läuft er 3-5 Tage durch. Neuer RAM, Netzteil und Grafikkarte wurden verbaut. Das Problem bestand allerdings bereits davor und ich dachte, es liegt an der Hardware, auch ein anderes Mainboard wurde getestet. Ich weiß nicht mehr weiter, evtl. kann mir jemand erklären, wo ich den Haken falsch gesetzt habe.

Link to comment
1 hour ago, Matzel08 said:

da es erst letztens passiert ist😪, hier die letzte.

 

da ist am Ende nichts zu sehen ...

 

wenn ein Rechner sich einfach komplett abschaltet tippe ich mal ganz beherzt auf Hardware ... oder Strom ;)

 

wenn Unraid sich aufhängt bleibt der Rechner normal an und du kannst nichts mehr machen, aber der Rechner läuft weiter ... wenn der kpl. abschaltet oder neu startet, ist es in der Regel eigentlich immer ein Hardware Thema ...

Link to comment
8 minutes ago, alturismo said:

da ist am Ende nichts zu sehen ...

 

wenn ein Rechner sich einfach komplett abschaltet tippe ich mal ganz beherzt auf Hardware ... oder Strom ;)

 

wenn Unraid sich aufhängt bleibt der Rechner normal an und du kannst nichts mehr machen, aber der Rechner läuft weiter ... wenn der kpl. abschaltet oder neu startet, ist es in der Regel eigentlich immer ein Hardware Thema ...

Hallo @alturismo

Also am Ende steht ja lediglich alles vom Neustart, der letzte unerwartete Showdown war am 24.06. um rund 00:21 Uhr. Die Hardware wurde 2x komplett geändert und weiterhin eine unerwartete Reaktion vom Server. Für mein Verständnis kann ich nicht nachvollziehen, wie es an der Hardware liegen kann. Gerne lasse ich mich etwas besseren belehren, wenn es also einen Tipp gibt, wie ich die derzeitige Hardware testen kann, bin ich offen es zu probieren. 
 

- Strom ist durchgehend gesichert, so mal das BIOS so konfiguriert ist, dass es automatisch startet bei Stromausfall und Wiederherstellung.

 

Mich frustriert das ganze einfach so massiv :( 

Link to comment
4 minutes ago, Matzel08 said:

Mich frustriert das ganze einfach so massiv :( 

vollkommen verständlich, ich würde wahnsinnig werden ...

 

4 minutes ago, Matzel08 said:

Für mein Verständnis kann ich nicht nachvollziehen, wie es an der Hardware liegen kann.

nur um keine Missverständnisse aufkommen zu lassen, ich rede davon dass der Rechner komplett aus ist (Power LED aus) oder bei der BIOS Einstellung kpl. neu gestartet ist (BIOS setting Power fail ... off, on, last state)

 

Daher auch bei Unraid crahses die finale Empfehlung einen Monitor anzuschließen um den finalen Post zu sehen ... aber wenn der Rechner kpl. aus ist ... ist das natürlich sinnfrei ;)

 

wenn das der Fall ist, geh davon aus dass irgendwas mit der Hardware nicht passt ... im Log sehe ich übrigens nichts ... die letzten Zeilen aus deinem syslog ...

 

Jun 30 19:43:37 Tower emhttpd: spinning down /dev/sde
Jun 30 19:44:42 Tower emhttpd: spinning down /dev/sdf
Jun 30 19:51:52 Tower ool www[21582]: Successful logout user root from 192.168.178.22
Jun 30 20:21:32 Tower ool www[8365]: Successful logout user root from 192.168.178.22
Jul  1 10:27:51 Tower ool www[4802]: Successful logout user root from 192.168.178.22
Jul  1 10:29:11 Tower webGUI: Successful login user root from 192.168.178.22

 

mal gefragt, war der Rechner da dauerhaft an in der Zeit ? weil die Lücke von gestern zu heute ist schon groß ... 14 Stunden ohne irgendwas ...

Link to comment

Mich macht es durch und durch wahnsinnig. Ein Freund riet mir dazu, mich mal im Forum zu melden. Ich kämpfe mit dem Problem schon seit mehreren Wochen. 

Das, was mit dem BIOS gemeint ist, verstehe ich nicht so ganz. Gibt es eine Logdatei im BIOS?
 

Der PC hat keine Power LED oder dergleichen, ich orientiere mich in letzter Zeit nur an den LEDs vom Netzwerkkabel.

Der Rechner war dauerhaft an, nur ich habe derzeit kaum etwas darauf laufen, da er ja meistens ausgeht. Dadurch vermeide ich es Ihn aus Frustration aus dem Fenster zu werfen xD .

Ich meinte in der Logdatei den Part: 

Jun 24 00:21:16 Tower dhcpcd[1258]: br0: removing interface
Jun 24 00:21:16 Tower dhcpcd[1258]: br0: releasing lease of 192.168.178.40
Jun 24 00:21:16 Tower dhcpcd[1258]: br0: deleting route to 192.168.178.0/24
Jun 24 00:21:16 Tower dhcpcd[1258]: br0: deleting default route via 192.168.178.1
Jun 24 00:21:17 Tower rc.inet1: ip -4 addr flush dev br0
Jun 24 00:21:18 Tower rc.inet1: ip -4 route flush dev br0
Jun 24 00:21:18 Tower rc.inet1: ip -4 addr flush dev bond0
Jun 24 00:21:18 Tower rc.inet1: ip -4 route flush dev bond0
Jun 24 00:21:18 Tower rc.inet1: ip -4 addr flush dev eth0
Jun 24 00:21:18 Tower rc.inet1: ip -4 route flush dev eth0
Jun 24 00:21:18 Tower rc.inet1: ip link set br0 down
Jun 24 00:21:18 Tower kernel: br0: port 1(bond0) entered disabled state
Jun 24 00:21:18 Tower rc.inet1: ip link set bond0 promisc off nomaster
Jun 24 00:21:18 Tower kernel: br0: port 1(bond0) entered disabled state
Jun 24 00:21:18 Tower kernel: device bond0 left promiscuous mode
Jun 24 00:21:18 Tower kernel: device eth0 left promiscuous mode
Jun 24 00:21:18 Tower rc.inet1: ip link set br0 down
Jun 24 00:21:18 Tower rc.inet1: ip link del br0
Jun 24 00:21:18 Tower rc.inet1: ip link set eth0 nomaster
Jun 24 00:21:18 Tower kernel: bond0: (slave eth0): Releasing backup interface
Jun 24 00:21:18 Tower kernel: r8169 0000:08:00.0 eth0: Link is Down
Jun 24 00:21:18 Tower rc.inet1: ip link set bond0 down
Jun 24 00:21:18 Tower rc.inet1: ip link del bond0
Jun 24 00:21:18 Tower kernel: bond0 (unregistering): Released all slaves
Jun 24 00:21:18 Tower rc.inet1: ip link set lo down


Was ich dabei im zugriff auf die WebOS beobachten konnte war das links Unten steht "Array gestartet" dann erschien  "Array Shutdown" und nichts ging mehr. Es schien, als wäre er ganz normal heruntergefahren, Lüfter gingen aus und gut.

Link to comment
7 hours ago, mgutt said:

Das heißt? Auch Netzteil und alle Kabel, die mit der Stromversorgung zu tun waren? Aktuelle Hardwareliste?

Guten Morgen @mgutt,

Entschuldigung für die mangelnde Ausführung. Ich hatte erst Hardware, die sehr alt war (ca. 11 Jahre) diese zeigte bereits solche Probleme, woraufhin ich andere aktuellere Hardware genommen hatte. Dann tauchten die Probleme weiterhin auf und ich dachte okay ich kaufe nun neue Hardware, da ich bereits die Vermutung hatte das es daran liegen könnte, doch das Problem besteht weiterhin. 
 

Neues Netzteil sowie alle Kabel der Stromversorgung innerhalb sowie außerhalb wurden erneuert. 

Aktuelles Hardware Profile im Anhang, ich hoffe, es ist das gewünschte. Ansonsten kurz erklären, wie ich eine aktuelle Liste einsehen bzw. Herunterladen kann :) 

Hardware Profile.txt

Link to comment
On 6/30/2023 at 7:47 PM, Matzel08 said:

Mein System geht einfach aus.

Nur zum Verständnis: Was bedeutet das genau?

a) Der Rechner läuft und klack von einer auf die andere Sekunde ist alles dunkel

b) oder der rechner läuft und fährt geordnet herunter?

 

Bei a): Hardwareproblem (Stromversorgung/Kabelisolierung durchgescheuert/fehlerhaftes Netzteil/etc...)

Bei b): irgendetwqas hat den Shutdown ausgelöst: Software

Link to comment
17 hours ago, Matzel08 said:

Es schien, als wäre er ganz normal heruntergefahren, Lüfter gingen aus und gut.

der log part ist auch ein normaler shutdown ...

 

so sieht das hier auch aus bei shutdown ;)

 

un 28 14:05:58 AlsServer rc.inet1: ip link set br0 down
Jun 28 14:05:58 AlsServer rc.inet1: ip link del br0
Jun 28 14:05:58 AlsServer rc.inet1: ip link set lo down

### hier war der Neustart ###

Jun 28 14:14:22 AlsServer kernel: microcode: microcode updated early to revision 0xf4, date = 2022-07-31
Jun 28 14:14:22 AlsServer kernel: Linux version 5.19.17-Unraid (root@Develop) (gcc (GCC) 12.2.0, GNU ld version 2.39-slack151) #2 SMP PREEMPT_DYNAMIC Wed Nov 2 11:54:15 PDT 2022
Jun 28 14:14:22 AlsServer kernel: Command line: BOOT_IMAGE=/bzimage initrd=/bzroot mitigations=off isolcpus=2-9,12-19 intel_pstate=passive intel_iommu=on kvm-intel.nested=1

 

 

da ist jetzt zeitlich ne Lücke, hing aber an einem Firmware upgrade für eine DD TV Karte und bewusstem "Warten", Stromlos gemacht, Strom an ...

 

sicher dass du keine/n Hund/Katze/Maus hast wo an den Powerknopf kommt ? ;) ernsthaft gemeint, meine haben das auch schon fertig gebracht, da habe ich das Gehäuse gewechselt ;) oder ein script, plugin, ... wo den Rechner ausschaltet ?

Link to comment
7 hours ago, DataCollector said:

Nur zum Verständnis: Was bedeutet das genau?

a) Der Rechner läuft und klack von einer auf die andere Sekunde ist alles dunkel

b) oder der Rechner läuft und fährt geordnet herunter?

 

Bei a): Hardwareproblem (Stromversorgung/Kabelisolierung durchgescheuert/fehlerhaftes Netzteil/etc...)

Bei b): irgendetwas hat den Shutdown ausgelöst: Software

Hallo,

 

dann sage ich ganz klar "b". Das Netzteil ist neu. Vom Geräusch her hört es sich auch eher an wie ein gezwungenes Herunterfahren. Kein sofortiger Zack aus.

Link to comment
2 hours ago, alturismo said:

Der Log-Teil ist auch ein normaler Shutdown ...

 

So sieht das hier auch aus bei Shutdown;)

 



 

 

Da ist jetzt zeitlich ne Lücke, hing aber an einem Firmware-Upgrade für eine DD TV Karte und bewusstem „Warten“, Stromlos gemacht, Strom an ...

 

Sicher, dass du kein/n Hund/Katze/Maus hast, wo an den Powerknopf kommt ? ;) Ernsthaft gemeint, meine haben das auch schon fertig gebracht, da habe ich das Gehäuse gewechselt ;) oder ein Skript, Plugin, ... wo den Rechner ausschaltet ?

Da ich keine Tiere in meiner Wohnung habe, ganz klares ja ich bin mir sicher :).  Manchmal fährt er auch kurz nach dem Starten wieder herunter, wo nur ich in der Nähe des Servers bin und nein auch da bin ich nicht aus Versehen an den Knopf gekommen :P.
 

Ich kenne mich nicht gut mit Skripten oder Plugins aus. Anbei Screenshots von den installierten Sachen. Hatte bereits in der Vergangenheit einiges entfernt, wo ich dachte, das könnte es verursachen. 

image.png

image.png

image.png

image.png

Link to comment
  • Solution
1 hour ago, Matzel08 said:

dann sage ich ganz klar "b". Das Netzteil ist neu. Vom Geräusch her hört es sich auch eher an wie ein gezwungenes Herunterfahren. Kein sofortiger Zack aus.

Du hast zwar sehr viel Hardware ausgetauscht.

Nur als ganz blöde Frage: Ist das Gehäuse (und sein Powertaster) das Alte geblieben?

 

Idee dahinter:

Ein Powertaster (dessen Verkabelung) die vielleicht einen Schaden hat und bei Vibration oder so ab und zu selber kontaktiert würde zumindest bei Windows einen geregelten Shutdown/Standby verursachen.

Ich habe noch nie probiert/getestet ob unraid auch auf kurzes drücken/kontaktieren des Tasters entsprechend geordnet herunter fährt, aber vielleicht ist eine der noch nicht gewechselten Komponenten verantwortlich?

 

Hintergrund:

Ich hatte mir zu meiner PC Anfangszeit einen PC von einer kleine Computerklitsche zusammenschrauben lassen (BigTower). Die haben mir den als getestet ausgehändigt.

Bei mir aufgestellt und der ging sporadisch aus.

Zurück zur Klitsche: die haben ihn in ihre Werkstatt nach hinten (ausser Sicht) getragen und dort getestet, kein Problem.

Dann bin ich mit nach hinten gegangen und habe gesehen: die testeten den BigTower im Liegen.

Habe gebeten den mal hinzustellen und zu testen. Widerwillig haben sie es getan und da war der Fehler.

Nachgesehen: beim Zusammenbau hatte jemand einmal das Kabel des Powerknopfes eingeklemmt und dabei die Isolieung beschädigt. Und somit hat der vibrationsabhängig ab und zu mal Kontakt zum Gehäuse bekommen und damit das Ding ausgeschaltet.

 

Link to comment
1 hour ago, alturismo said:

Hast du mal die Temperaturen beobachtet? ggf. Eine BIOS-Sicherheitseinstellung wo denn Rechner runterfährt bei ... Was anderes bleibt ja fast nicht.

Gesendet von meinem SM-S901B mit Tapatalk
 

Aber fährt Unraid dann kontrolliert runter, wenn das BIOS Probleme macht?

Unraid macht gerade eine Paritätsprüfung. Die würde ich gerne noch durchlaufen lassen, danach schaue ich im BIOS, ob es da so eine Einstellung/ Funktion gibt.

Link to comment
1 hour ago, DataCollector said:

Du hast zwar sehr viel Hardware ausgetauscht.

Nur als ganz blöde Frage: Ist das Gehäuse (und sein Powertaster) das Alte geblieben?

 

Idee dahinter:

Ein Powertaster (dessen Verkabelung) die vielleicht einen Schaden hat und bei Vibration oder so ab und zu selbst kontaktiert würde zumindest bei Windows einen geregelten Shutdown/Standby verursachen.

Ich habe noch nie probiert/getestet ob unraid auch auf kurzes drücken/kontaktieren des Tasters entsprechend geordnet herunterfährt, aber vielleicht ist eine der noch nicht ausgetauschten Komponenten dafür verantwortlich?

 

Hintergrund:

Ich hatte mir zu meinem PC Anfangszeit einen PC von einer kleinen Computerklitsche zusammenschrauben lassen (BigTower). Die haben mir den als getestet ausgehändigt.

Bei mir aufgestellt und der ging sporadisch aus.

Zurück zur Klitsche: Die haben ihn in ihrer Werkstatt nach hinten (ausser Sicht) getragen und dort getestet, kein Problem.

Dann bin ich mit nach hinten gegangen und habe gesehen: die testeten den BigTower im Liegen.

Habe darum gebeten mal hinzustellen und zu testen. Widerwillig haben sie es getan und da war der Fehler.

Nachgesehen: Beim Zusammenbau hatte jemand einmal das Kabel des Powerknopfes eingeklemmt und dabei die Isolierung beschädigt. Und somit hat der vibrationsabhängig ab und zu mal Kontakt zum Gehäuse bekommen und damit das Ding ausgeschaltet.

 

Nein, tatsächlich ist das Gehäuse und das was da alles mit dran baumelt (USB, POWER & 1x Lüfter) nicht gewechselt worden. Ich werde das nach der Paritätsprüfung mal simulieren und ein bisschen an den Kabeln wackeln.

Doch ist es überhaupt so, dass Unraid normal herunterfährt, wenn ich den Power-Button am Tower betätige? Wenn das so ist, könnte ich, sofern ich nichts feststelle, einfach den Stecker vom Board ziehen, da er ja eh automatisch hochfährt, sobald er Strom bekommt (ist im BIOS so eingestellt).
 

An dieser Stelle möchte ich noch anmerken, dass das Gehäuse auch Staubarm ist, damit meine ich das der Staub die Kurzschlussbrücke nicht geschaffen haben kann.

 

Link to comment
1 hour ago, Matzel08 said:

Doch ist es überhaupt so, dass Unraid normal herunterfährt, wenn ich den Power-Button am Tower betätige?

klar und ja, kannst du machen (Stecker ziehen)

 

1 hour ago, Matzel08 said:

Aber fährt Unraid dann kontrolliert runter, wenn das BIOS Probleme macht?

nicht wenn das BIOS Probleme macht, Beispiel Überhitzungsschutz ... vielleicht hat dein BIOS ja einen safe mode

ab 90° CPU Temp > Rechner runter fahren

 

daher die Frage, hast du mal auf deine Temps geschaut ...

Link to comment
20 hours ago, alturismo said:

klar und ja, kannst du machen (Stecker ziehen)

 

nicht wenn das BIOS Probleme macht, Beispiel Überhitzungsschutz ... vielleicht hat dein BIOS ja einen abgesicherten Modus

ab 90° CPU Temp > Rechner runter fahren

 

Daher die Frage, hast du mal auf deine Temps geschaut ...

Guten Morgen,

Also ich habe nun an allen Kabeln leicht gewackelt/ gezogen. Eins war tatsächlich nicht richtig im Stecker, doch vom USB Frontpannel (wird nicht genutzt, da separater Cardreader). Habe es isoliert das, dass ausgeschlossen werden kann. Den Power-Knopf habe ich komplett abgestöpselt. Dort konnte ich zwar keine Einschränkung feststellen, doch um es auszuschließen.

Im BIOS habe ich nichts bezüglich eines Überhitzungsschutzes finden können oder etwas, das dem nahekommt. Ich hatte den Tower jetzt ca. 40 - 60 min. im BIOS laufen lassen für die Temperatur, doch die blieb recht konstant in einem normalen Bereich. Bild anbei.

BIOS.jpg

Link to comment
2 minutes ago, Matzel08 said:

Im BIOS habe ich nichts bezüglich eines Überhitzungsschutzes finden können oder etwas, das dem nahekommt. Ich hatte den Tower jetzt ca. 40 - 60 min. im BIOS laufen lassen für die Temperatur, doch die blieb recht konstant in einem normalen Bereich. Bild anbei.

dann können wir das Thema ausschließen ... ;)

 

da es auch kein opposite zu WOL gibt m.W. nach ... wird es langsam eng warum dein Rechner sich ausschaltet, abgesehen von dem 24.06. Eintrag, danach nochmal ... ?

Link to comment
Just now, alturismo said:

Dann können wir das Thema ausschließen ...;)

 

da es auch kein Gegenteil zu WOL gibt mW nach ... wird es langsam eng warum dein Rechner sich ausschaltet, abgesehen von dem 24.06. Eintrag, danach nochmal ... ?

Ich glaube WoL ist angeschaltet im BIOS, sollte ich das lieber ausschalten?

Bisher ist er "noch" nicht ausgegangen, das kommt immer sporadisch, doch derzeit nicht länger als eine Woche. Ich habe noch die älteren Syslogs auf dem PC, soll ich die Passagen heraussuchen?

Link to comment
1 hour ago, Matzel08 said:

Ich habe noch die älteren Syslogs auf dem PC, soll ich die Passagen heraussuchen?

ganz ehrlich, wüsste jetzt nicht wirklich für was (zumindest für mich ;))

aber ein Schaden wäre es nicht, vielleicht sieht ja jemand anderes noch etwas darin ... 

 

Server aus mit den genannten Meldungen ist ein normaler shutdown (gewollt, lokal per Powerbutton, Shutdown getriggered, ...)

 

ansonsten ist Server einfach so komplett aus ... für mich immer Hardware Defekt ;) sorry, da kann ich nicht wirklich weiter helfen ... vielleicht sieht jemand anderes etwas hier.

Link to comment
34 minutes ago, alturismo said:

ganz ehrlich, wüsste jetzt nicht wirklich für was (zumindest für mich ;))

aber ein Schaden wäre es nicht, vielleicht sieht ja jemand anderes noch etwas darin ... 

 

Server aus mit den genannten Meldungen ist ein normaler Shutdown (gewollt, lokal per Powerbutton, Shutdown getriggert, ...)

 

ansonsten ist Server einfach so komplett aus ... für mich immer Hardware Defekt ;) sorry, da kann ich nicht wirklich weiter helfen ... vielleicht sieht jemand anderes etwas hier.

Danke bereits an dieser Stelle für die ganze Hilfe. 

Ich beobachte das ganze mal weiterhin und poste die Syslog sobald er wieder Down ist. Ansonsten lag es ggf. doch an einem Wackler am Power Button 🙄. Bisher hat er nicht länger als eine Woche ohne Shutdown ausgehalten.

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...