Unraid hängt beim Neustart oder Herunterfahren


AimLess
Go to solution Solved by mgutt,

Recommended Posts

Als Anfänger bitte ich so eine Frage zu verzeihen^^ aber ich weiß nicht woran es liegen könnte. Vielleicht weiß ja jemand Abhilfe oder kann mich auf die richtige Spur bringen.

Wenn ich mein Unraid neu starten möchte oder es Herunterfahre beibt die Konsole immer bei "starting diagnostig collection...". Weiter passiert nichts. Nervig ist vor allem das er nach einem reset dann die Parity wieder checken möchte...

 

Getestet habe ich auch schon alle Docker vor dem zu beenden - das brachte keine Änderung. VM´s habe ich im Moment nicht installiert.

 

Über Hilfe oder einen Tipp würde ich mich freuen!

 

bis dahin

Daniel

 

P.s.: Wie gesagt, Unraid A N F Ä N G E R, bitte bei möglichen Lösungen, Tipps und Tricks vom Level her nicht allzu hoch anfagen!!!

xeonserver-diagnostics-20220817-1741.zip

Link to comment
19 minutes ago, AimLess said:

Ist das nicht die Datei die ich schon hochgeladen habe?

Du hast die Diagnostics doch über das Menü erstellt oder nicht? Die ist leider nutzlos, solange du den syslog mirror nicht aktivierst, weil Logs standardmäßig im RAM liegen und nach einem Neustart verloren gehen.

 

19 minutes ago, AimLess said:

Abgesehen von der befindet sich nur noch "unbalance.log" in dem Ordner.

 

OK, dh du schaltest dann hart ab? Dann hat er die Diagnostics natürlich nicht erstellt.

 

Also bleibt nur syslog mirror und dann aus Log die logfile nach einem Shutdown hochzuladen. Hinweis: die ist nicht anonymisiert. Es reichen aber auch die letzten Zeilen des Shutdown. 

Link to comment

Ja richtig, die habe ich nach dem reset erstellt da mir nichts anderes über blieb. GUI war weg und auch am System konnte ich nichts machen.

 

Im Moment kopiere ich einen Haufen Daten drauf, danach könnte ich ja nochmal neu starten/herunterfahren. Dann kann ich die syslog mirror nutzen? Muss ich den Stick dafür wo anders auslesen, sprich sobald ich wieder starte wird die Datei überschrieben? 

Link to comment
On 8/18/2022 at 6:02 PM, mgutt said:

Syslos mirror schreibt auch in den Ordner Log auf dem Stick.

 

So tut mir leid das es etwas gedauert hat aber konnte den Fehler etwas eingrenzen - es scheint wohl irgendein Prozess eine meiner CPU´s zu stressen und diese kann ihn wohl nicht beenden. Leider ist mein Linuxisch etwas schlecht - ich hoffe hier hat jemand eine Idee und kann das lesen. Auch eine kurze kleine Erklärung dazu wäre toll da ich mich ja verbessen möchte.

 

Aug 21 01:27:40 XeonServer shutdown[21700]: shutting down for system halt
Aug 21 01:27:40 XeonServer init: Switching to runlevel: 0
Aug 21 01:27:40 XeonServer init: Trying to re-exec init
Aug 21 01:28:43 XeonServer kernel: rcu: INFO: rcu_sched detected expedited stalls on CPUs/tasks: { 12-... } 604524 jiffies s: 2125 root: 0x1/.
Aug 21 01:28:43 XeonServer kernel: rcu: blocking rcu_node structures (internal RCU debug): l=1:0-15:0x1000/.
Aug 21 01:28:43 XeonServer kernel: Task dump for CPU 12:
Aug 21 01:28:43 XeonServer kernel: task:kworker/u161:5  state:R  running task     stack:    0 pid:42520 ppid:     2 flags:0x00004008
Aug 21 01:28:43 XeonServer kernel: Workqueue: events_power_efficient gc_worker [nf_conntrack]
Aug 21 01:28:43 XeonServer kernel: Call Trace:
Aug 21 01:28:43 XeonServer kernel: <TASK>
Aug 21 01:28:43 XeonServer kernel: ? gc_worker+0xb2/0x30b [nf_conntrack]
Aug 21 01:28:43 XeonServer kernel: ? process_one_work+0x198/0x27a
Aug 21 01:28:43 XeonServer kernel: ? worker_thread+0x19c/0x240
Aug 21 01:28:43 XeonServer kernel: ? rescuer_thread+0x28b/0x28b
Aug 21 01:28:43 XeonServer kernel: ? kthread+0xde/0xe3
Aug 21 01:28:43 XeonServer kernel: ? set_kthread_struct+0x32/0x32
Aug 21 01:28:43 XeonServer kernel: ? ret_from_fork+0x22/0x30
Aug 21 01:28:43 XeonServer kernel: </TASK>
Aug 21 01:29:12 XeonServer root: Status of all loop devices
Aug 21 01:29:12 XeonServer root: /dev/loop1: [2049]:11 (/boot/bzmodules)
Aug 21 01:29:12 XeonServer root: /dev/loop2: [0049]:263 (/mnt/cache/system/libvirt/libvirt.img)
Aug 21 01:29:12 XeonServer root: /dev/loop0: [2049]:9 (/boot/bzfirmware)
Aug 21 01:29:12 XeonServer root: Active pids left on /mnt/*
Aug 21 01:29:12 XeonServer root:                      USER        PID ACCESS COMMAND
Aug 21 01:29:12 XeonServer root: /mnt/cache:          root     kernel mount /mnt/cache
Aug 21 01:29:12 XeonServer root:                      root      26442 F.... shfs
Aug 21 01:29:12 XeonServer root:                      root      80776 F.... dockerd
Aug 21 01:29:12 XeonServer root:                      root      80805 F.... containerd
Aug 21 01:29:12 XeonServer root: /mnt/disk1:          root     kernel mount /mnt/disk1
Aug 21 01:29:12 XeonServer root: /mnt/disk2:          root     kernel mount /mnt/disk2
Aug 21 01:29:12 XeonServer root: /mnt/disk3:          root     kernel mount /mnt/disk3
Aug 21 01:29:12 XeonServer root: /mnt/disk4:          root     kernel mount /mnt/disk4
Aug 21 01:29:12 XeonServer root: /mnt/user:           root     kernel mount /mnt/user
Aug 21 01:29:12 XeonServer root:                      nobody     2217 F.... nginx
Aug 21 01:29:12 XeonServer root:                      nobody     2218 F.... nginx
Aug 21 01:29:12 XeonServer root:                      nobody     2219 F.... nginx
Aug 21 01:29:12 XeonServer root:                      nobody     2220 F.... nginx
Aug 21 01:29:12 XeonServer root: /mnt/user0:          root     kernel mount /mnt/user0
Aug 21 01:29:12 XeonServer root: /mnt/vm:             root     kernel mount /mnt/vm
Aug 21 01:29:12 XeonServer root: Active pids left on /dev/md*
Aug 21 01:29:12 XeonServer root:                      USER        PID ACCESS COMMAND
Aug 21 01:29:12 XeonServer root: /dev/md1:            root     kernel mount /mnt/disk1
Aug 21 01:29:12 XeonServer root: /dev/md2:            root     kernel mount /mnt/disk2
Aug 21 01:29:12 XeonServer root: /dev/md3:            root     kernel mount /mnt/disk3
Aug 21 01:29:12 XeonServer root: /dev/md4:            root     kernel mount /mnt/disk4
Aug 21 01:29:12 XeonServer root: Generating diagnostics...
Aug 21 01:30:04 XeonServer kernel: rcu: INFO: rcu_sched self-detected stall on CPU
Aug 21 01:30:04 XeonServer kernel: rcu:     12-....: (43080716 ticks this GP) idle=6d9/1/0x4000000000000000 softirq=1288317/1288317 fqs=10740041
Aug 21 01:30:04 XeonServer kernel:     (t=43080717 jiffies g=45493341 q=146528435)
Aug 21 01:30:04 XeonServer kernel: NMI backtrace for cpu 12
Aug 21 01:30:04 XeonServer kernel: CPU: 12 PID: 42520 Comm: kworker/u161:5 Tainted: P        W  O      5.15.46-Unraid #1
Aug 21 01:30:04 XeonServer kernel: Hardware name: ASUSTeK COMPUTER INC. WS-C621E-SAGE Series/WS-C621E-SAGE Series, BIOS 6801 04/26/2022
Aug 21 01:30:04 XeonServer kernel: Workqueue: events_power_efficient gc_worker [nf_conntrack]
Aug 21 01:30:04 XeonServer kernel: Call Trace:
Aug 21 01:30:04 XeonServer kernel: <IRQ>
Aug 21 01:30:04 XeonServer kernel: dump_stack_lvl+0x46/0x5a
Aug 21 01:30:04 XeonServer kernel: nmi_cpu_backtrace+0xae/0xd2
Aug 21 01:30:04 XeonServer kernel: ? lapic_can_unplug_cpu+0x93/0x93
Aug 21 01:30:04 XeonServer kernel: nmi_trigger_cpumask_backtrace+0x56/0xd3
Aug 21 01:30:04 XeonServer kernel: rcu_dump_cpu_stacks+0xc3/0xea
Aug 21 01:30:04 XeonServer kernel: rcu_sched_clock_irq+0x22d/0x631
Aug 21 01:30:04 XeonServer kernel: ? _raw_spin_unlock_irqrestore+0xe/0x1b
Aug 21 01:30:04 XeonServer kernel: ? tick_sched_do_timer+0x3e/0x3e
Aug 21 01:30:04 XeonServer kernel: update_process_times+0x8c/0xab
Aug 21 01:30:04 XeonServer kernel: tick_sched_timer+0x38/0x65
Aug 21 01:30:04 XeonServer kernel: __hrtimer_run_queues+0xfa/0x18a
Aug 21 01:30:04 XeonServer kernel: hrtimer_interrupt+0x92/0x160
Aug 21 01:30:04 XeonServer kernel: __sysvec_apic_timer_interrupt+0x99/0xdb
Aug 21 01:30:04 XeonServer kernel: sysvec_apic_timer_interrupt+0x61/0x7d
Aug 21 01:30:04 XeonServer kernel: </IRQ>
Aug 21 01:30:04 XeonServer kernel: <TASK>
Aug 21 01:30:04 XeonServer kernel: asm_sysvec_apic_timer_interrupt+0x12/0x20
Aug 21 01:30:04 XeonServer kernel: RIP: 0010:gc_worker+0xa0/0x30b [nf_conntrack]
Aug 21 01:30:04 XeonServer kernel: Code: 24 0c 48 8d 7c 24 10 e8 fc ec ff ff 39 6c 24 0c 77 0a e8 0f f1 ff ff e9 c7 01 00 00 48 8b 54 24 10 89 e8 48 8d 04 c2 4c 8b 38 <41> f6 c7 01 0f 85 76 01 00 00 4c 89 ff e8 f4 eb ff ff 49 89 c5 48
Aug 21 01:30:04 XeonServer kernel: RSP: 0018:ffffc90025467e48 EFLAGS: 00000246
Aug 21 01:30:04 XeonServer kernel: RAX: 00000000000493df RBX: 00000000000493df RCX: ffff88820b400000
Aug 21 01:30:04 XeonServer kernel: RDX: 00000000000493e0 RSI: ffffc90025467e54 RDI: ffff88815b65f4c8
Aug 21 01:30:04 XeonServer kernel: RBP: 0000000000039e82 R08: 0000000000000000 R09: 000000008033002d
Aug 21 01:30:04 XeonServer kernel: R10: ffff888221f435c0 R11: ffff888221f435c0 R12: ffffffffa00f8620
Aug 21 01:30:04 XeonServer kernel: R13: ffff88815b65f480 R14: 000000000000000d R15: ffff88815b65f4c8
Aug 21 01:30:04 XeonServer kernel: ? gc_worker+0xb2/0x30b [nf_conntrack]
Aug 21 01:30:04 XeonServer kernel: process_one_work+0x198/0x27a
Aug 21 01:30:04 XeonServer kernel: worker_thread+0x19c/0x240
Aug 21 01:30:04 XeonServer kernel: ? rescuer_thread+0x28b/0x28b
Aug 21 01:30:04 XeonServer kernel: kthread+0xde/0xe3
Aug 21 01:30:04 XeonServer kernel: ? set_kthread_struct+0x32/0x32
Aug 21 01:30:04 XeonServer kernel: ret_from_fork+0x22/0x30
Aug 21 01:30:04 XeonServer kernel: </TASK>
Aug 21 01:31:43 XeonServer kernel: rcu: INFO: rcu_sched detected expedited stalls on CPUs/tasks: { 12-... } 784748 jiffies s: 2125 root: 0x1/.
Aug 21 01:31:43 XeonServer kernel: rcu: blocking rcu_node structures (internal RCU debug): l=1:0-15:0x1000/.
Aug 21 01:31:43 XeonServer kernel: Task dump for CPU 12:
Aug 21 01:31:43 XeonServer kernel: task:kworker/u161:5  state:R  running task     stack:    0 pid:42520 ppid:     2 flags:0x00004008
Aug 21 01:31:43 XeonServer kernel: Workqueue: events_power_efficient gc_worker [nf_conntrack]
Aug 21 01:31:43 XeonServer kernel: Call Trace:
Aug 21 01:31:43 XeonServer kernel: <TASK>

 

Die Meldung das irgenetwas CPU 12 stört wiederholt sich die ganze Zeit. Das ist aber nur jetzt so, es kann auch ein anderer Kern sein. Das wechselt sich wohl ab. Sollte noch mehr log gebraucht werden dann kann ich dem bestimmt nachkommen - erstmal ein Danke an alle die daraus schlau werden und mir einen Lösungsweg unterbreiten können!

 

Grüße

AimLess

Link to comment
  • Solution
6 hours ago, AimLess said:

task:kworker/u161:5  state:R  running task     stack:    0 pid:42520 ppid:     2

Das ist der einzige Prozess, der zu dem Zeitpunkt auf dem Kern läuft. kworker ist ein Kernel-Prozess. Wir wissen allerdings nicht was der tut. Siehe auch:

https://www.linux-magazin.de/ausgaben/2016/01/kern-technik/

 

Spontan würde ich sagen:

- Reparatur auf allen Disks und Pools durchführen

- memtest durchführen 

 

 

  • Thanks 1
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.