Unraid crashed häufig seit 6.10.*


JeyPi

Recommended Posts

Hallo Community,

 

ich bin neu hier im Forum und betreibe seit Beginn diesen Jahres einen Unraid-Server. Alles lief super, bis die Version 6.10.* heraus kam. Seit dem hängt sich mein Server unregelmäßig zwischen 1 und 5 Tagen auf. Keine GUI, kein SSH, keine Shares. Leider schafft bislang nur der Resetbutton Abhilfe. Auffällig ist, dass das Problem meistens nachts auftritt. Mit Version 6.9.* lief mein Server Monate lang ohne Auffälligkeiten.

 

Zu Meiner Konfiguration:

Unraid 6.10.3

Asus ROG Strix B550-F Gaming (aktuellste Bios Version 2803)

Ryzen 5600X

2x 16GB Samsung ECC-Ram

3x 4TB WD Red Plus

2x 500GB nvme WD Red SN700

 

Im Log finden sich dann vermehrt solche Einträge:

Jun 30 22:02:50 UnraidServer kernel: rcu: INFO: rcu_sched self-detected stall on CPU
Jun 30 22:02:50 UnraidServer kernel: rcu: 	7-....: (420006 ticks this GP) idle=af1/1/0x4000000000000000 softirq=7951272/7951272 fqs=104974 
Jun 30 22:02:50 UnraidServer kernel: 	(t=420008 jiffies g=33325017 q=42817)
Jun 30 22:02:50 UnraidServer kernel: NMI backtrace for cpu 7
Jun 30 22:02:50 UnraidServer kernel: CPU: 7 PID: 3921 Comm: emhttpd Tainted: G    B D W         5.15.46-Unraid #1
Jun 30 22:02:50 UnraidServer kernel: Hardware name: ASUS System Product Name/ROG STRIX B550-F GAMING, BIOS 2803 04/27/2022
Jun 30 22:02:50 UnraidServer kernel: Call Trace:
Jun 30 22:02:50 UnraidServer kernel: <IRQ>
Jun 30 22:02:50 UnraidServer kernel: dump_stack_lvl+0x46/0x5a
Jun 30 22:02:50 UnraidServer kernel: nmi_cpu_backtrace+0xae/0xd2
Jun 30 22:02:50 UnraidServer kernel: ? lapic_can_unplug_cpu+0x93/0x93
Jun 30 22:02:50 UnraidServer kernel: nmi_trigger_cpumask_backtrace+0x56/0xd3
Jun 30 22:02:50 UnraidServer kernel: rcu_dump_cpu_stacks+0xc3/0xea
Jun 30 22:02:50 UnraidServer kernel: rcu_sched_clock_irq+0x22d/0x631
Jun 30 22:02:50 UnraidServer kernel: ? trigger_load_balance+0x7a/0x292
Jun 30 22:02:50 UnraidServer kernel: ? tick_sched_do_timer+0x3e/0x3e
Jun 30 22:02:50 UnraidServer kernel: update_process_times+0x8c/0xab
Jun 30 22:02:50 UnraidServer kernel: tick_sched_timer+0x38/0x65
Jun 30 22:02:50 UnraidServer kernel: __hrtimer_run_queues+0xfa/0x18a
Jun 30 22:02:50 UnraidServer kernel: hrtimer_interrupt+0x92/0x160
Jun 30 22:02:50 UnraidServer kernel: __sysvec_apic_timer_interrupt+0x99/0xdb
Jun 30 22:02:50 UnraidServer kernel: sysvec_apic_timer_interrupt+0x61/0x7d
Jun 30 22:02:50 UnraidServer kernel: </IRQ>
Jun 30 22:02:50 UnraidServer kernel: <TASK>
Jun 30 22:02:50 UnraidServer kernel: asm_sysvec_apic_timer_interrupt+0x12/0x20
Jun 30 22:02:50 UnraidServer kernel: RIP: 0010:native_queued_spin_lock_slowpath+0x78/0x18f
Jun 30 22:02:50 UnraidServer kernel: Code: 2a 08 8b 02 0f 92 c1 0f b6 c9 c1 e1 08 30 e4 09 c8 a9 00 01 ff ff 74 0c 0f ba e0 08 72 1a c6 42 01 00 eb 14 85 c0 74 0a 8b 02 <84> c0 74 04 f3 90 eb f6 66 c7 02 01 00 c3 48 c7 c1 40 c8 02 00 65
Jun 30 22:02:50 UnraidServer kernel: RSP: 0018:ffffc90000aa7c50 EFLAGS: 00000202
Jun 30 22:02:50 UnraidServer kernel: RAX: 0000000000140101 RBX: 0000000000000022 RCX: 0000000000000000
Jun 30 22:02:50 UnraidServer kernel: RDX: ffffffff82878518 RSI: 0000000000000000 RDI: ffffffff82878518
Jun 30 22:02:50 UnraidServer kernel: RBP: 0000000000005000 R08: ffffc90000aa7c10 R09: 0000000000000000
Jun 30 22:02:50 UnraidServer kernel: R10: 0000000000000202 R11: 0000000000000000 R12: ffff8883ae87c2c0
Jun 30 22:02:50 UnraidServer kernel: R13: 0000000000004000 R14: 0000000000004000 R15: ffff8883ae87cec0
Jun 30 22:02:50 UnraidServer kernel: queued_spin_lock_slowpath+0x7/0xa
Jun 30 22:02:50 UnraidServer kernel: alloc_vmap_area+0xda/0x5e8
Jun 30 22:02:50 UnraidServer kernel: __get_vm_area_node.constprop.0+0xce/0x136
Jun 30 22:02:50 UnraidServer kernel: __vmalloc_node_range+0x6e/0x299
Jun 30 22:02:50 UnraidServer kernel: ? kernel_clone+0xa5/0x244
Jun 30 22:02:50 UnraidServer kernel: ? copy_process+0x1d7/0x1728
Jun 30 22:02:50 UnraidServer kernel: ? kmem_cache_alloc_node+0x13b/0x1b7
Jun 30 22:02:50 UnraidServer kernel: copy_process+0x261/0x1728
Jun 30 22:02:50 UnraidServer kernel: ? kernel_clone+0xa5/0x244
Jun 30 22:02:50 UnraidServer kernel: ? get_page+0x5/0xa
Jun 30 22:02:50 UnraidServer kernel: ? set_pte+0x5/0x8
Jun 30 22:02:50 UnraidServer kernel: kernel_clone+0xa5/0x244
Jun 30 22:02:50 UnraidServer kernel: __do_sys_clone+0x5f/0x7b
Jun 30 22:02:50 UnraidServer kernel: do_syscall_64+0x83/0xa5
Jun 30 22:02:50 UnraidServer kernel: entry_SYSCALL_64_after_hwframe+0x44/0xae
Jun 30 22:02:50 UnraidServer kernel: RIP: 0033:0x14f80d3b34a1
Jun 30 22:02:50 UnraidServer kernel: Code: 48 85 ff 74 3d 48 85 f6 74 38 48 83 ee 10 48 89 4e 08 48 89 3e 48 89 d7 4c 89 c2 4d 89 c8 4c 8b 54 24 08 b8 38 00 00 00 0f 05 <48> 85 c0 7c 13 74 01 c3 31 ed 58 5f ff d0 48 89 c7 b8 3c 00 00 00
Jun 30 22:02:50 UnraidServer kernel: RSP: 002b:000014f807ffe5d8 EFLAGS: 00000206 ORIG_RAX: 0000000000000038
Jun 30 22:02:50 UnraidServer kernel: RAX: ffffffffffffffda RBX: 000014f807ffeac0 RCX: 000014f80d3b34a1
Jun 30 22:02:50 UnraidServer kernel: RDX: 000014f807fff640 RSI: 000014f80d824ff0 RDI: 0000000000004111
Jun 30 22:02:50 UnraidServer kernel: RBP: 0000000000009000 R08: 0000000000000000 R09: 0000000000000000
Jun 30 22:02:50 UnraidServer kernel: R10: 0000000000000000 R11: 0000000000000206 R12: 000014f80d81c000
Jun 30 22:02:50 UnraidServer kernel: R13: 0000000000000004 R14: 000014f807ffe610 R15: 000014f80d4430e2
Jun 30 22:02:50 UnraidServer kernel: </TASK>

 

Alles was ich bis jetzt gefunden habe, hat mir nicht weiter geholfen.

Bin um jeden Ratschlag dankbar!

 

Viele Grüße und ein schönes Wochenende!

Link to comment

Geht zurück auf 6.9. und versuche dein Glück erst wieder mit 6.11. Aktuell gefällt mir 6.10. gar nicht. Einfach zu viele Meldungen wegen Problemen.

 

Alternativ wären die Klassiker zu testen wie BIOS Update, deaktivieren aller Stromspar-Mechanismen, Docker auf ipvlan umstellen...

 

Aus den Logs werde ich jedenfalls nicht schlauer als du. Laut Google hat sich was aufgegangen, aber die Logs geben meiner Ansicht nach nicht aus welcher Prozess das ausgelöst hat.

Link to comment
1 hour ago, JeyPi said:

Danke für deine Mühe. Ich werde wohl noch 1-2 Einstellungen durchtesten, spätestens dann gehe ich deinem Ratschlag nach und wechsel wieder auf 6.9.

ich würde noch vorschlagen einen bug Report zu erstellen (falls nicht bereits geschehen) wenn du Interesse daran hast dass es auch gelöst wird ...

Link to comment
  • 3 weeks later...

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.