Jump to content

Server stürzt halb ab, funktionalität teilweise eingeschränkt. Fix nur mit Hard Reset


Go to solution Solved by alturismo,

Recommended Posts

Hallo Zusammen,

 

Ich habe ein Problem mit meinem Server, auf dem Server laufen 2 VMs mit Home Assistant, 1 Teamspeak Docker und meine Datenverwaltung/shares.

 

Der Server stürzt regelmäßig aber unbeständig ab (teilweise nach 24h, teilweise erst nach 7 Tagen Laufzeit). Nun bin ich noch relativ neu in dem ganzen Thema und habe mein Problem nicht wirklich ausfindig machen können. Log Dateien von Unraid bekomme ich ja nach einem Hard Reset nichtmehr ausgelesen, soweit ich rausgefunden habe. Die einzigen Logs die ich bekommen habe sind von Home Assistant, diese hänge ich hier an (abfotografiert, ja ich weis.... war froh das ich die noch einsehen konnte und wollte die verschicken :) ).

 

- Wenn der Server abstürzt läuft der Teamspeak docker, zum Beispiel ohne Probleme weiter, ich kann mich noch mit jedem unterhalten und jeder kann dem Teamspeak joinen/leaven.

 

- Die Funktionalität in Unraid ist eingeschränkt, VMs laden nichtmehr und der Server reagiert auf keine Befehle, auch kein "shutdown" oder "reboot" aus der UI.

 

- Die 2 Home Assistant  VMs stürzen mit der Fehlermeldung Failed to Start Journal Service ab und können nicht rebooted werden, oder zeigen nach reboot den selber Fehler erneut.     Der Fehler verschwindet erst nach Hard Reset.

 

Das System wurde komplett neu gebaut im Dezember 2023, den Unraid stick habe ich von meinem alten System übernommen, er hat die neue Konfig analysiert und erkannt.

 

Der Server:

Intel® Core™ i3-13100F

ASRock B660M-HDV, Mainboard

NVIDIA GTX 770

2x Kingston DIMM 32 GB DDR4-3200 , Arbeitsspeicher (grün, KSM32ED8/32HC, Server Premier)

 

3x SATA HDD

2x M2 SSD

 

Das BIOS habe ich updated und auf den neusten Stand gebracht ohne veränderung der Situation.

 

Ich bräuchte echt Hilfe bei dem Thema, als Option habe ich noch UNRAID neu zu Installieren in erwägung gezogen. Allerdings weis ich noch nicht wohin mit meinen Daten da Unraid ja dann sicherlich die Festplatten wieder leer macht?

 

Bin für Ideen und Vorschläge offen :)

 

Grüße

 

IMG-5393-1.jpgIMG-5392-1.jpg

 

 

friday-diagnostics-20240404-1057.zip

Edited by Blackbird234
Link to comment
5 minutes ago, Blackbird234 said:

als Option habe ich noch UNRAID neu zu Installieren in erwägung gezogen. Allerdings weis ich noch nicht wohin mit meinen Daten da Unraid ja dann sicherlich die Festplatten wieder leer macht?

Nein ... wenn du die Platten wieder so zuweist wie vorher erkennt Unraid den Inhalt und alles ist ok ...

 

wobei ich nicht glaube dass dies dein Problem lösen wird ...

 

häng eher mal ne diagnostics hier rein, dann kann vielleicht jemand eher was dazu sagen ... 

Link to comment
  • Solution
19 hours ago, Blackbird234 said:

Hab die diagnostics mal angehangen

 

zum Start

 

1/ pci acs override inkl. allem aktiviert, warum und wo hat es gehangen dass dies notwendig war ? bitte deaktivieren und nochmals ohne testen ...

 

2/ folgender Fehler noch in der syslog

 

Apr  4 07:16:47 Friday kernel: ------------[ cut here ]------------
Apr  4 07:16:47 Friday kernel: WARNING: CPU: 2 PID: 708 at net/netfilter/nf_conntrack_core.c:1210 __nf_conntrack_confirm+0xa4/0x2b0 [nf_conntrack]
Apr  4 07:16:47 Friday kernel: Modules linked in: veth xt_CHECKSUM ipt_REJECT nf_reject_ipv4 ip6table_mangle ip6table_nat iptable_mangle vhost_net tun vhost vhost_iotlb tap xt_nat xt_tcpudp macvlan xt_conntrack xt_MASQUERADE nf_conntrack_netlink nfnetlink xfrm_user xfrm_algo iptable_nat nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 xt_addrtype br_netfilter xfs md_mod zfs(PO) zunicode(PO) zzstd(O) zlua(O) zavl(PO) icp(PO) zcommon(PO) znvpair(PO) spl(O) ip6table_filter ip6_tables iptable_filter ip_tables x_tables efivarfs bridge 8021q garp mrp stp llc bonding tls e1000e r8169 realtek intel_rapl_msr intel_rapl_common iosf_mbi x86_pkg_temp_thermal intel_powerclamp coretemp kvm_intel kvm crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel sha512_ssse3 sha256_ssse3 sha1_ssse3 aesni_intel btusb crypto_simd btrtl cryptd btbcm rapl wmi_bmof btintel intel_cstate intel_uncore bluetooth cp210x ahci nvme i2c_i801 mei_me ecdh_generic i2c_smbus tpm_crb usbserial nvme_core ecc mei i2c_core libahci tpm_tis
Apr  4 07:16:47 Friday kernel: video tpm_tis_core wmi tpm intel_pmc_core backlight acpi_tad acpi_pad button unix [last unloaded: e1000e]
Apr  4 07:16:47 Friday kernel: CPU: 2 PID: 708 Comm: kworker/u16:5 Tainted: P           O       6.1.64-Unraid #1
Apr  4 07:16:47 Friday kernel: Hardware name: ASRock B660M-HDV/B660M-HDV, BIOS 17.01 01/11/2024
Apr  4 07:16:47 Friday kernel: Workqueue: events_unbound macvlan_process_broadcast [macvlan]
Apr  4 07:16:47 Friday kernel: RIP: 0010:__nf_conntrack_confirm+0xa4/0x2b0 [nf_conntrack]
Apr  4 07:16:47 Friday kernel: Code: 44 24 10 e8 e2 e1 ff ff 8b 7c 24 04 89 ea 89 c6 89 04 24 e8 7e e6 ff ff 84 c0 75 a2 48 89 df e8 9b e2 ff ff 85 c0 89 c5 74 18 <0f> 0b 8b 34 24 8b 7c 24 04 e8 18 dd ff ff e8 93 e3 ff ff e9 72 01
  ...
  ..
  .

 

was nutzt du an Netzwerk Hardware ? 2 NICs sind drin, beide aktiv ?

 

anscheinend beide im bond aktiviert, ist das auch so ?

 

wenn ja, vielleicht mal noch versuchen den realtek Treiber installieren (aus CA App)

 

ist ne Fritz dein Router ? wenn ja, macvlan issue unter Anleitungen anschauen und umsetzen.

Link to comment

Hi, danke für deine Antwort.

 

Ich nutze im Server eine extra Netzwerkkarte weil ich eine Verbindung zu meiner Mutter im Nebenhaus aufbaue. Ihr Netzwerk: HomeAssistant und Datenverwaltung läuft darüber.

Verbaut ist diese: EDUP Gigabit Ethernet PCI Express PCI-E Netzwerkkarte

 

https://www.amazon.de/gp/product/B07PSGQ4H7/ref=ppx_yo_dt_b_search_asin_title?ie=UTF8&psc=1

 

Mein Router ist eine Unifi Dreamstation und davor ein Dreytek modem.

 

Bei der Graka gab es beim einrichten soweit ich weis irgendwie Probleme das die VMs nicht gestartet haben, erinner mich nichtmehr genau, das habe ich mit meinem Bruder zusammen gemacht. Ich war tatsächlich schon am überlegen die GRAKA auszubauen da kein Bildschirm oder ähnliches angeschlossen ist lediglich die Home Assistant VMs laufen ja, bräuchte ich die GRAKA da überhaupt noch ?

 

Kannst du mir sagen was du mit der (CA APP) meinst? Dann würde ich die Treiber direkt mal installieren.

 

 

Link to comment
44 minutes ago, Blackbird234 said:

Hi, danke für deine Antwort.

 

Ich nutze im Server eine extra Netzwerkkarte weil ich eine Verbindung zu meiner Mutter im Nebenhaus aufbaue. Ihr Netzwerk: HomeAssistant und Datenverwaltung läuft darüber.

Verbaut ist diese: EDUP Gigabit Ethernet PCI Express PCI-E Netzwerkkarte

https://www.amazon.de/gp/product/B07PSGQ4H7/ref=ppx_yo_dt_b_search_asin_title?ie=UTF8&psc=1

 

Leider ist (für mich) nicht zu erkennen welchen Chipsatz die Karte nutzt.

Bitte mal nachreichen: Realtek, Intel oder noch ein anderer?

 

44 minutes ago, Blackbird234 said:

Mein Router ist eine Unifi Dreamstation und davor ein Dreytek modem.

 

Ich glaube die Unifi hatten ein vergleichbares Problem, wie die Fritzboxen mit unraid erzeugt.

Viellicht mal abarbeiten:

https://forums.unraid.net/topic/150620-how-to-macvlan-ab-unraid-6124-call-traces-im-syslog/

 

44 minutes ago, Blackbird234 said:

Bei der Graka gab es beim einrichten soweit ich weis irgendwie Probleme das die VMs nicht gestartet haben, erinner mich nichtmehr genau, das habe ich mit meinem Bruder zusammen gemacht. Ich war tatsächlich schon am überlegen die GRAKA auszubauen da kein Bildschirm oder ähnliches angeschlossen ist lediglich die Home Assistant VMs laufen ja, bräuchte ich die GRAKA da überhaupt noch ?

 

Du brauchst für unraid iin der Regel eine GPU. Aber wenn eine iGPU in der CPU verbaut ist, braucht man somit keine dGPU extra.

 

44 minutes ago, Blackbird234 said:

Kannst du mir sagen was du mit der (CA APP) meinst?

 

Das ist die Community Application = das, was man App Store oder so nennen könnte.

Und er meint, wenn eine Realtek-LAN-Karte installiert ist, könnten die dazu passenden Treiber helfen.

 

 

 

 

CAScreenshot 2024-04-05 082849.png

RTLScreenshot 2024-04-05 083029.png

Link to comment
1 hour ago, DataCollector said:

Leider ist (für mich) nicht zu erkennen welchen Chipsatz die Karte nutzt.

Bitte mal nachreichen: Realtek, Intel oder noch ein anderer?

 

Also was ich jetzt rausfinden konnte ist es Realtek RTL8125, diesen Treiber habe ich jetzt einmal installiert und das System rebooted

 

1 hour ago, DataCollector said:

Ich glaube die Unifi hatten ein vergleichbares Problem, wie die Fritzboxen mit unraid erzeugt.

Viellicht mal abarbeiten:

https://forums.unraid.net/topic/150620-how-to-macvlan-ab-unraid-6124-call-traces-im-syslog/

 

Den nehme ich mir heute Abend vor und überprüfe mal alles, danke für den Tipp!

 

1 hour ago, DataCollector said:

Du brauchst für unraid iin der Regel eine GPU. Aber wenn eine iGPU in der CPU verbaut ist, braucht man somit keine dGPU extra.

 

Ist keine iGPU verbaut, Graka demzufolge zwingend notwendig, entnehme ich dem ganzen. Dann lasse ich die drinne, stören tut Sie ja in dem Sinne nicht, nur Strom verbauchen :)

 

 

Link to comment

Die Lösungsansätze haben wir jetzt alle Umgesetzt.

 

MACVLAN konnten wir nicht umstellen auf IPVLAN da in diesem Fall der Teamspeak server nichtmehr funktioniert, der Docker will dann einfach nicht starten. 

 

On 4/5/2024 at 6:26 AM, alturismo said:

anscheinend beide im bond aktiviert, ist das auch so ?

 

Das Bonding haben wir jetzt mal deaktiviert, werde es jetzt mal beobachten und die Woche testen, da ich den Absturz ja nicht direkt hervorrufen kann. Wir haben das System auch nochmal gecheckt ob wir die Netzwerkkarte wirklich brauchen und könnten diese im Falle tatsächlich rausnehmen. Kann so ein Server absturz verhalten denn durch eine Netzwerkkarte aufgelöst werden?

 

 

Link to comment
  • 2 weeks later...

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...