Unraid hängt sich auf


Frefle

Recommended Posts

49 minutes ago, Frefle said:

Moin,

 

habe  seit ein paar wochen das Problem dass sich Unraid gern mal aufhängt. Das passiert von 1x die woche bis hin zu 2x am tag vollständig random. Hätte wer ne idee wo ich am besten die Suche anfange?

Da ich primaer hardwareorientiert bin würde ich zuerst die betreffende Hardware alleine testen.

System abspecken, Memtest, Temperaturen prüfen, Netzteil mal tauschen...

 

Link to comment

Danke,

 

System absprecken? im grunde sind nur ne nvme und  4 HDDs verbaut

Temperaturen sollten laut unraid webinterface und reingreifen ok cpu läuft so auf 50-60c°  unter volllast

Netzteil ist neu

Memtest könnt ich mal probieren problem  is nur das System hat keine grafikkarte, auch keine onboard

Link to comment
1 hour ago, Frefle said:

System absprecken? im grunde sind nur ne nvme und  4 HDDs verbaut

 

Wenn Du ausschließen kannst, daß eine dieser 5 Komponenten definitiv nichgt die Ursache ist, kannst Du die natürlich drin lassen.

Es könnte ja auch beispielsweise ein fehlerhafter USB Stick oder ein Problem im Kontroller (im Chipsatz) sein.

Ist ja nur temporär für die Tests/Prüfungen, bis der Fehler weiter eingekreist/gefunden wurde.

 

Aber zuerst würde ich wirklich mit 24h (oder etwas länger) memtest anfangen und dafür kann eigentlich erst einmal alles drin bleiben.

Sollten aber keine Sepicherfehler bei memtest auftauchen muß man eben weiter suchen.

Du könntest vielleicht mit einem anderen Bootstick (Problelizenz läuft ja ca. 1 Monat + möglicher Verlängerung) versuchen eine möglichst gleiche Konfiguration einzustellen und dann schauen ob das problem bleibt. wenn ja, ist es entweder der ursprüngliche Bootstick oder eine dort noch anders vorhandene Konfiguration.

 

Stück für Stück herantasten wäre eben mein Weg.

 

1 hour ago, Frefle said:

Netzteil ist neu

Was nicht vor einem Defekt schützt. (Vielleicht greift irgendeine Schutzschaltung (was aber eher zu einer Totalen Abschaltung führt), oder es ist eien Restwelligkeit vorhanden, die vom Mainboard nichg tvertragen wird.. oder   oder ... oder.

Ich würde eben soweit es Möglich ist alles erst einmal testen/austauschen und schauen oder Fehler verschwindet oder bleibt.

 

1 hour ago, Frefle said:

Memtest könnt ich mal probieren problem  is nur das System hat keine grafikkarte, auch keine onboard

 

Ich habe mir die Diagnostics nicht angesehen. aber vielleicht kanst Du ja für die Tests temporär mal eine nachrüsten?

 

Link to comment
2 hours ago, Frefle said:

Das passiert von 1x die woche bis hin zu 2x am tag vollständig random. Hätte wer ne idee wo ich am besten die Suche anfange?

ich würde mal von vorne anfangen

 

1/ hängt sich auf heißt was ? Symptome ... nicht mehr erreichbar aber Rechner läuft noch oder komplett aus.

- dann noch, ist im BIOS aktiviert das nach "Stromausfall" wieder angeschaltet werden soll ... nur falls das Netzteil wirklich einen Schlag hat ...

2/ syslog mirror auf USB aktivieren (wie bereits oft hier im Forum beschrieben, das man eine Chance hat einen Fehler zu sehen ...)

3/ Monitor anschließen und Fehler ablesen, anscheinend optionslos da keinerlei GPU ...

 

ansonsten wird es schwer, ist ja fast wie "Mein Auto springt nicht an, was kann ich machen ...", tanken, Schlüssel umdrehen, ... ;)

Link to comment

Hey, danke für die vielen tipps

@alturismo

der Unraid Rechner läuft, ist aber nicht mehr erreichbar (netzlaufwerk, browser, ping). Die Einstellung im bios ist nicht gesetzt, heißt is er aus bleibt er es auch

 

das mitm syslog mach ich mal und ich schau mal ob ich in der arbeit irgendwo so ne 50€ graka finde

 

thema stick wäre es möglich einen anderen zu installieren und die jetzige  config zu exportieren/importieren?

Link to comment

kleines update

cpu läuft unter last normal auf ca. 60c°

ich kam gerade nach hause, selbes fehlerblid. Habe das gehäuse aktuell aufgeschraubt. Trotz nicht erreichbarem unraid ist der cpu kühler heiß (unangenehm zum anlangen also weit über 60c° könnte mainboard/cpu sein mhm

Link to comment

So neues Update, Fehler is wohl gefunden <.<

sideinfo mein Unraid is in dem Inter-Tech 88887112 verbaut (an das Mainboard kommen is ne qual) Nachdem ich jetzt ne stunde Videos mit Handbreake convertiert hab ist er mir wieder abgeschmiert. Hab ihn danach sofort zerlegt um zu schauen wo die Hitze entsteht... CPU Lüfter ist defekt wohl das lager Sry für den unnötigen Thread

Link to comment
1 hour ago, Frefle said:

Inter-Tech 88887112

Damit nicht andere auch Suchen müssen: EIn kleines NAS artiges Gehäuse mit 4 fest verbauten Festplatten Einschüben und dem Mainboard darunter.

 

1 hour ago, Frefle said:

Hab ihn danach sofort zerlegt um zu schauen wo die Hitze entsteht... CPU Lüfter ist defekt wohl das lager Sry für den unnötigen Thread

Ist doch schön, daß Du einen Ansatzpunkt gefunden hast. Also erst einmal schauen oB Du mit einer ausreichenden Kühlung alles wieder stabil bekommst.

Viel Erfolg!

Link to comment

Freitag kam der neue Lüfter. Lüfter verbaut, Problem besteht immernoch.

Anderes Netzteil angeschlossen, selbes Problem

Was mir aufgefallen ist die CPU läuft auf entspannten Temperaturen, nachdem sich das System aufhängt wird der CPU kühler trotz funktionierendem Lüfter sehr warm. Nach einem neustart läuft der Parity Check durch (gestern abend gestartet und heute früh bei 80%. Ich vermute mal er war jetzt erfolgreich und das System hat sich wieder aufgehangen). Gefühlt läuft er problemlos solange er arbeitet, im Idle hängt er sich dann aber auf

syslog hab ich auf appdata aktiviert, jedoch erstellt er mir da nix

Link to comment
2 hours ago, Frefle said:

Freitag kam der neue Lüfter. Lüfter verbaut, Problem besteht immernoch.

Hast du Docker Container im br0 laufen?

 

Kannst du mal bitte den avahi Daemon abschalten, dazu einfach diese beiden Befehle von einem Unraid Terminal ausführen:

/etc/rc.d/rc.avahidaemon stop
/etc/rc.d/rc.avahidnsconfd stop

 

Falls du Unraid mal neu startest musst du die Befehle erneut ausführen bitte um sie wieder zu deaktivieren.

 

Teste mal ein paar Tage und Berichte dann nochmal ob dein System noch immer abstürzt wenn avahi ausgeschaltet ist. Wenn dein System dann noch immer abstürzt hab ich noch was auf lager. ;)

 

Mal so nebenbei, hast du zufällig eine Fritzbox?

Link to comment
2 hours ago, Frefle said:

Hab den Avahi Deamon mal abgeschaltet.

Wenn dein server trotzdem crashed bitte markier mich auch oder quote eine antwort von mir damit ich benahrichtigt werde.

 

2 hours ago, Frefle said:

habe paar docker im br0

Darf ich fragen welche und warum br0?

Link to comment
47 minutes ago, Frefle said:

Im grunde gehts um themen, die mit portfreigabe laufen. Ich möchte keine Portfreigabe auf die IP meines Unraids. Im grunde auch macht der Gewohnheit^^

Macht nicht viel bis keinen Unterschied und wenn der Server dann trotz dem deaktivieren avahi Daemon noch immer crashed musst du das sowieso umstellen sonst hast mit deiner Fritzbox ein Problem.

 

Du könntest dir auch eigene Docker bridges anlegen so wie es auch empfohlen wird.

 

BTW: Sieh dir mal dieses tutorial hier an (ist sehr umfangreich weil es ein step-by-stop tutorial ist, aber ist schnell erledigt):

 

Link to comment

@ich777

nach deaktivieren von avahi lief es eigentlich recht gut. Aber ich war heut auch den ganzen tag auf dem server aktiv (Parity Check war Nachmittag durch, resttag bis jetzt auf plex was geschaut. jetzt ca. 15min nachdem ich fertig war mit meiner serie und nix mehr aufm unraid getan habe is er wieder abgeschmiert.

 

Das Script von @mgutthab ich mal rein gepackt und direkt nach reboot gestartet. Kam direkt folgende Meldung

 

Mar 7 23:40:39 UnraidAsrock kernel: ata1.00: irq_stat 0x48000008, interface fatal errorMar 7 23:40:39 UnraidAsrock kernel: ata1: SError: { UnrecovData 10B8B BadCRC Handshk }Mar 7 23:40:39 UnraidAsrock kernel: ata1.00: failed command: READ FPDMA QUEUEDMar 7 23:40:39 UnraidAsrock kernel: res 40/00:00:c8:93:1e/00:00:00:00:00/40 Emask 0x10 (ATA bus error)Mar 7 23:42:37 UnraidAsrock ntpd[1175]: kernel reports TIME_ERROR: 0x41: Clock Unsynchronized

 

scheint  was mit dem  onboard sata controller zu sein? werd morgen mal schauen ich hab noch irgendwo ne alte pci-e sata karte rumliegen

Link to comment
7 hours ago, Frefle said:

wieder abgeschmiert

Ich würde dir empfehlen das Netzwerk von MACVLAN auf IPVLAN in den Docker Settings um zu stellen (mit der Advanced View an geschaltet und der Docker Dienst muss aber vorher gestoppt sein).

 

I vermute bei dir auch das MACVLAN dran schuld ist das er dauernd absturzt.

 

Sei dir aber bewusst wenn du das umstellst hast du Probleme mit deiner Frotzbox da sich die dann nicht mehr aus kennt wenn du Docker Container in br0 hast.

Link to comment

kurzes update thema "habe das gefühl solange er arbeitet stürzt er nicht ab"

 

@mguttsata und stromkabel habe ich getauscht, bekam aber danach wieder nen absturz. Das einzige wovon ich weiß wäre das spindown delay auf 1 stunde (bei den 4 Festplatten)

 

hab nochmal nachgedacht ob oder was sich geändert hat seit ich die abstürze habe und das einzig nenneswerte ich habe meine nextcloud nicht mehr am laufen. Habe meine Nextcloud wieder gestartet jetzt läuft der Unraid fast 3 tage ohne absturz. 

 

Ich würde ihn vorerst mal so weiter laufen lassen und schauen ob er nochmal abstürzt (bisher waren die abstürze (sofern ich parity check abgebrochen habe min. halbtäglich, mit Parity check spätestens ne stunde nach abschluss)

Link to comment
1 hour ago, Frefle said:

update: läuft immer noch jetzt schon über 4 tage nur dank gestartetem nextcloud docker container. Kann sich das wer erklären

Du hattest das Problem ja, wenn das System sich gelangweilt hat.

Mir scheint es so, als wenn der Docker nun permanent das System nicht in den 'Langeweile' Modus läßt.

Ist Dein Strombedarf dadurch gestiegen?

Link to comment

Ich gehe mal nicht davon aus die festplatten fahren sauber in standby und cpu auslastung dümpelt zwischen 0 und 25% rum. würde auch mal behaupten dass mein 7dtd docker der non stop läuft (auch wärend den abstürzen) mehr performance frisst als der nextcloud docker. Macht halt kein sinn dass er jetzt 4 tage durchläuft mit eingeschaltetem nextcloud container und ohne stürzt er halbtäglich ab

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.