Server-Abstürze


HStarck

Recommended Posts

unraid.log

Hallo,

seit dem Update auf 6.9 hab ich leider ein Problem mit der Stabilität meines Servers. Nach einer gewissen Zeit, das kann weniger als eine Woche bis hin zu fast ein ganzer Monat sein, stürzt der Server einfach ab.

 

Die Meldung im Log lautet:

Jun 28 16:15:16 Athene kernel: general protection fault, probably for non-canonical address 0x76aacd3e4d81a4a4: 0000 [#1] SMP PTI
Jun 28 16:15:16 Athene kernel: CPU: 2 PID: 15126 Comm: php7 Tainted: G    B   W         5.10.28-Unraid #1
Jun 28 16:15:16 Athene kernel: Hardware name: Supermicro X10DRi/X10DRi, BIOS 3.1a 04/16/2019
Jun 28 16:15:16 Athene kernel: RIP: 0010:nf_nat_setup_info+0x129/0x6aa [nf_nat]
Jun 28 16:15:16 Athene kernel: Code: ff 48 8b 15 ef 6a 00 00 89 c0 48 8d 04 c2 48 8b 10 48 85 d2 74 80 48 81 ea 98 00 00 00 48 85 d2 0f 84 70 ff ff ff 8a 44 24 46 <38> 42 46 74 09 48 8b 92 98 00 00 00 eb d9 48 8b 4a 20 48 8b 42 28

 

Der ganze Bereich des Logs, von vor dem Absturz bis zum Neustart ist im Anhang.

 

Kann mir jemand einen Tipp geben, in welcher Richtung ich suchen muss?

Link to comment
On 7/6/2021 at 9:34 AM, HStarck said:

Kann mir jemand einen Tipp geben, in welcher Richtung ich suchen muss?

Hi,

 

ich hatte bisher 2 Abstürze gehabt, habe dazu auch einen Forum thread aufgemacht

Habe mich mit @ich777 @alturismo @sonic6 dazu unterhalten und es wurde mir empfohlen, dass ich meine Docker Container nicht im "br0" Network Type betreiben soll, sondern alles in ein eigenes Proxynet packen. Zusätzlich habe ich den "Host Access" des Docker Dienstes deaktiviert (k.A. ob du es evtl. aktiviert hast, falls ja, deaktiviere es)

 

Nun läuft mein Unraid seit ca. 4 Tagen und ich beobachte meinen Syslog, um zu schauen, ob noch relevante Einträge zum möglichen "macvlan" Problem auftreten, was bis eben noch nicht der Fall ist/war.

 

Hoffentlich bleibt es auch so, damit ich meine Docker Container ohne Einschränkungen/Abstürze nutzen kann :-)

 

Grüße,

Luk

 

  • Thanks 1
Link to comment

Ich habe gestern die 2 Netzwerkkarten aus dem Bond genommen und das docker-Netzwerk auf eth1 gelegt. "Host Access" benötige ich leider.

 

Der Server ist nach den Änderungen gestern wieder einmal abgestürzt, mit der gleichen Meldung.

 

So wie ich es aus dem anderen Thread gelesen habe, wird die 6.10 eine andere Variante vom docker-Netzwerk verwenden, ich hoffe das löst dieses Problem.

Link to comment
11 minutes ago, HStarck said:

Host Access

Warum?

Der funktioniert in 6.10 nicht mehr.

 

Hast du schon den Vorschlag von @luk ausprobiert?

 

EDIT: Könntest du mir deine Diagnostics übermitteln, gerne auch per PN wenn du sie nicht öffentlich teilen willst (Tools -> Diagnostics -> Download).

Link to comment

Ich habe einige Container, die in einem custom-Network laufen, damit sie ihre Ports nach Belieben haben können (zB openhab, nodered, unify-Controller). Außerdem verwende ich einen reverse-Proxy (nginx) um auf einige meiner Container gesichert zuzugreifen.

 

Diagnostics hab ich per PN gesendet

Link to comment
9 minutes ago, HStarck said:

Ich habe einige Container, die in einem custom-Network laufen

Custom bridge netzwerk oder macvlan, ich nehme mal an macvlan.

 

Mit der Änderung von macvlan zu ipvlan in 6.10 funktioniert der Host Access nicht mehr und ist nicht mehr bis nur mehr schwer realisierbar mit VLANs usw, muss dann aber auch der Router/Switch unterstützen...

 

9 minutes ago, HStarck said:

Diagnostics hab ich per PN gesendet

Aber nicht mir oder? Ich hab noch nichts bekommen.

Link to comment
  • 1 month later...
8 minutes ago, mgutt said:

Geht doch oder fliegt das noch raus?

Das funktioniert noch und wird nicht rausfliegem weil das "feature" relativ viele leute doch noch benutzen...

 

In 6.10.0.-beta26 flog das glaub ich raus aber nach intervention wurde es doch noch gelassen und mit der option ob du ipvpan oder macvlan nutzen willst.

 

macvlan sollte das "ding" sein das bei vielen eine Kernel Panic verursacht.

  • Thanks 1
Link to comment

Ich habe das große Glück, das mein Mainboard 2 NICs hat. Diese waren vorher als Bond konfiguriert. Ich habe das aufgelöst und ein Custom Network auf den zweiten NIC gelegt und alle Container in diesem custom-net, teilweise mit definierter IP-Adresse, teilweise mit automatischer.

Mit dieser Konfiguration läuft der Server jetzt seit 48 Tagen ohne Absturz.

 

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.