Regelmäßiger Systemfreeze / Crash


Recommended Posts

Moin zusammen,

 

ich benötige bitte eure Unterstützung bei der Suche nach einem Fehler auf meinem Unraid-Server.

 

Seit ca. vier Jahren betreibe ich einen Unraid-Server mit folgender Hardware:

 

Intel Xeon E-2288G

ASRock Rack E3C246D4U2-2L2T

64 GB Kingston DDR4-2666 ECC RAM (2x 32 GB)

Broadcom 9400-16i HBA

2x Cache NVMe's

7x HDDs

1x SSD

 

In den letzten Monaten ist der Server drei mal gecrasht. Dabei läuft der Server zwar weiter, jedoch ist die GUI nicht mehr bedienbar und beim lesen / kopieren von Dateien findet keine Datenübertragung mehr statt.

 

Das Problem tritt erst seit meinem Umzug in eine neue Wohnung auf. Dabei war der Server zwischen 07/2023 und 12/2023 offline. Anfang Dezember habe ich nach der Wiederinbetriebnahme direkt ein Update von 6.11.5 auf 6.12.6 gemacht.

 

Ich vermute, dass die Probleme erst seit dem 6.12er Release auftreten, auch ein Update auf das aktuelle 6.12.8 Release hat die Probleme jedoch nicht beseitigt.

 

Zwischenzeitlich habe ich bereits von macvlan auf ipvlan umgestellt, die Probleme sind jedoch die gleichen. Auch habe ich bereits alte Logs von 2021 und 2022 durchgeschaut und konnte bisher keine Fehler feststellen, die es nicht auch schon damals gegeben hat.

 

In den Anhang habe ich die Diagnostics von heute gepackt. Der Server stürzte zuletzt am Montagmorgen ab, wobei ich den Sonntag nicht aktiv mit dem Server gearbeitet habe, weshalb der Crash auch schon dort stattgefunden haben kann.

 

Ich hoffe ihr könnt mir und meinem Server helfen.

 

Vielen Dank & einen guten Start in den Dienstag,

d1ck13

 

 

d1ck13-nas-srv-diagnostics-20240325-2243.zip

Link to comment

Ich bin mal über deine Logs geflogen und konnte jetzt nichts aufälliges finden. (bin aber auch kein Crack)

 

Du hast eine Fritzbox wie ich am IP Range gesehen habe. Fährst du vielleicht gerade MCVlan und Bridge paralell? Du hast zwar geschrieben, das du es wieder umgestellt hast, hast du auch was in den Dockern aktualisiert? (Hast du überhaupt welche)

 

Installier mal die App Fix Common Problems aus dem Appstore und poste mal was er da ausgibt

image.thumb.png.5dcef9f2c6c15fda279ca4658a2c214c.png

Edited by zero_neverload
Link to comment
Posted (edited)

Moin,

 

8 hours ago, zero_neverload said:

Ich bin mal über deine Logs geflogen und konnte jetzt nichts aufälliges finden. (bin aber auch kein Crack)

Das klingt doch erstmal gut, danke!

 

8 hours ago, zero_neverload said:

Du hast eine Fritzbox wie ich am IP Range gesehen habe. Fährst du vielleicht gerade MCVlan und Bridge paralell? Du hast zwar geschrieben, das du es wieder umgestellt hast, hast du auch was in den Dockern aktualisiert? (Hast du überhaupt welche)

Nein, ich habe alles soweit auf IPVLAn umgestellt. Ich mache später einen Screenshot und poste den nochmal hier von meiner Config. Docker nutze ich, na klar. Aktuell drei Stück.

 

- homeassistant, der jedoch aktuell ausgeschaltet ist

- omada

- unifi controller (jedoch der alte, der nicht mehr weiterentwickelt wird - Probleme gab es aber bereits, als er noch im Service war)

 

8 hours ago, zero_neverload said:

Installier mal die App Fix Common Problems aus dem Appstore und poste mal was er da ausgibt

Das werde ich später machen und mich dann erneut melden.

 

@alturismo

Kann ich das Downgrade direkt aus Unraid heraus machen? Oder wie stelle ich das an? Habe selber schon daran gedacht, auf die letzte 6.11er zu gehen. Aber auf der Version kann ich ja nicht immer bleiben. Oder verwendet das nächste Release, ob nun 6.12er oder 6.13er einen neuen Linux Kernel, bei dem die Probleme wieder "weg" sein könnten?

 

Danke & Gruß,

d1ck13

Edited by d1ck13
Link to comment
14 minutes ago, d1ck13 said:

Kann ich das Downgrade direkt aus Unraid heraus machen? Oder wie stelle ich das an? Habe selber schon daran gedacht, auf die letzte 6.11er zu gehen. Aber auf der Version kann ich ja nicht immer bleiben. Oder verwendet das nächste Release, ob nun 6.12er oder 6.13er einen neuen Linux Kernel, bei dem die Probleme wieder "weg" sein könnten?

entweder habe ich falsch verlinkt ... oder es kam falsch an ;)

 

Downgrade bringt nicht, da ist die Anleitung was zu ändern ist an den Einstellungen um zumindest das Fritz / macvlan Problem zu lösen.

 

Dann beobachten ...

Link to comment

Moin,

 

ich habe zwischenzeitlich ein Update auf 6.12.9 gemacht.

Hier noch ein Auszug von der App "Fix Common Problems", sowie je ein Screenshot aus meinen Netzwerkeinstellungen und den Dockereinstellungen.

 

yj4w3tje.png

sg2n3jil.png

vv66lgvt.png

 

Kann ich da noch etwas umkonfigurieren?

 

Grüße!

Link to comment
2 minutes ago, d1ck13 said:

Kann ich da noch etwas umkonfigurieren?

 

naja, bist fritz user und nutzt ipvlan ... genau das was in dem verlinkten Thread angesprochen wird nicht zu machen ...

 

also willst du ja nicht darauf eingehen ... mehr gibt es nicht mehr zu sagen.

Link to comment
11 minutes ago, jj1987 said:

und im dümmsten Fall UNRAID selbst aufgrund der "springenden" IP Zuordnung nicht erreichbar sind

und genau dann meinen Unraid sei abgestürzt .... ;)

 

ne, hast Recht, aber bridge ist anscheinend auch noch aktiv ... und da bin ich persönlich dann raus weil in Kombi mit Fritz das einfach meist ...

Link to comment

Moin zusammen,

 

59 minutes ago, alturismo said:

naja, bist fritz user und nutzt ipvlan ... genau das was in dem verlinkten Thread angesprochen wird nicht zu machen ...

Da ich keine Dockerprobleme habe, bin ich davon ausgegangen, dass die Einstellung für mich nicht notwendig ist. Danke!

59 minutes ago, alturismo said:

also willst du ja nicht darauf eingehen ... mehr gibt es nicht mehr zu sagen.

Genau! ;-)

58 minutes ago, alturismo said:

ps. Bilder lassen sich hier einfügen, anstelle extern zu verlinken ... wird oft gerne NICHT angefasst ...

Vielen Dank, das war mir nicht bekannt. Beim nächsten mal lade ich die Bilder direkt im Forum hoch.

45 minutes ago, jj1987 said:

Wobei IPVLAN und Fritz nicht zu abstürzen führt, sondern nur dafür sorgt dass Docker, VMs und im dümmsten Fall UNRAID selbst aufgrund der "springenden" IP Zuordnung nicht erreichbar sind

Dann kann es ja durchaus sein, dass genau das bei mir eingetreten ist. Ich habe auf alle Fälle alle Einstellungen entsprechend deines Threads angepasst und teste mal ein bisschen.

 

Danke für eure bisherige Unterstützung.

 

Grüße,

d1ck13

 

Link to comment
14 hours ago, d1ck13 said:

Dann kann es ja durchaus sein, dass genau das bei mir eingetreten ist. Ich habe auf alle Fälle alle Einstellungen entsprechend deines Threads angepasst und teste mal ein bisschen.

Das ist genau das was ich dir oben geschrieben hatte.

 

Stell es einfach zum testen um, sind zwei drei Klicks

Array stoppen -> Netzwerkeinstellungen

 

image.png.166fe19f7b45c7c1631fea5d8217925b.png

 

Einstellungen -> Docker

image.thumb.png.ae9ca2fdabda45b06ae369b05e82a510.png

 

Docker prüfen ob umgestellt wenn vorher Custom: br0 sollte jetzt custom: eth0 sein

image.png.9d60d596fe1c3209e51213a6b080582e.png

so aus sehen

 

Wenn der Docker nicht im custom br lief ist es wie gehabt auf Bridge und kann so bleiben

image.png.3e6425794e9245e872a0570958d7a9cf.png

 

Link to comment
  • 2 weeks later...

Was liegt denn alles auf BTRFS? Docker / VMS?

 

Hattest du dein Netzwerk nochmal nach Anweisung optimiert?

Poste nochmal einen Screenshot von deinem Netzwerkeinstellungen und deinen Dockereinstellungen.

 

Quote

Apr 12 00:20:03 d1ck13-nas-srv sSMTP[28125]: Sent mail for [email protected] (221 2.0.0 closing connection n5-20020a170906724500b00a47423b4c33sm1132782ejk.128 - gsmtp) uid=0 username=xxx outbytes=1612


Apr 12 00:21:18 d1ck13-nas-srv kernel: i2c i2c-2: sendbytes: NAK bailout.


### [PREVIOUS LINE REPEATED 95 TIMES] ###
Apr 12 08:11:14 d1ck13-nas-srv emhttpd: read SMART /dev/sdj
Apr 12 08:11:26 d1ck13-nas-srv emhttpd: read SMART /dev/sdh
Apr 12 08:11:38 d1ck13-nas-srv emhttpd: read SMART /dev/sdk
Apr 12 08:11:38 d1ck13-nas-srv emhttpd: read SMART /dev/sde
Apr 12 08:11:51 d1ck13-nas-srv emhttpd: read SMART /dev/sdf
Apr 12 08:12:00 d1ck13-nas-srv emhttpd: read SMART /dev/sdd
Apr 12 08:12:10 d1ck13-nas-srv emhttpd: read SMART /dev/sdg
Apr 12 08:12:20 d1ck13-nas-srv emhttpd: read SMART /dev/sdi
 

 

Hier hat jemand das selbe Problem:

 

Diese Meldung kommt halt jedesmal kurz vor deinem Absturz: 

 

kernel: i2c i2c-2: sendbytes: NAK bailout.

 

 

Edited by zero_neverload
Link to comment
Posted (edited)

Moin,

 

danke für deine Antwort.

 

Den Fehler:

kernel: i2c i2c-2: sendbytes: NAK bailout.

hatte ich auch erst im Verdacht, jedoch gibt es den "Fehler" bei mir im System schon seit 2021, jedoch gibt es die Probleme mit den Abstürzen erst, wie geschrieben, mit 6.12.x.

 

Leider findet man zu der genannten Meldung auch nichts weiter.

 

Hier noch die gewünschten Screenshots.

 

Viele Grüße,

d1ck13

 

EDIT: Auf dem BTRFS Pool liegen meine Docker, VMs und zum Teil auch ein paar Daten.

 

004.png

005.png

Edited by d1ck13
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.