Segfault on Cerley | dotnet | tesseract | python

January 14, 20251 yr

Hallo,

seit kurzem habe ich das Problem, dass ich viele "Segfault"-Fehler im Log habe und teilweise deswegen meine Container abstürzen. Es kommt gefühlt immer öfter vor. Ich kann nicht sagen, wie lange der Fehler schon im Log steht, aber meine Container stürzen erst seit ein paar Tagen ab.

Was ich bereits gemacht habe:

Memtest, auch mit einzeln gestecken RAMs -> min. je 4 Durchgänge -> Pass
System mit nur einem RAM gestartet -> Fehler kommt auch
Boot-Stick neu aufgesetzt (config kopiert von vor der Neuinstallation) -> Keine Änderung
CPU-Test (Intel Processor Diagnostics Tool) (Auf einer Win-Installation auf einer NVMe ohne VM) -> Pass
Cinebench 30 Min Single Core Test -> keine Auffälligkeiten

Fehlerbeschreibung: Der Fehler tritt hauptsächlich (quasi nur) auf, wenn paperless-ngx Dokumente verarbeitet. Das Komische: Kein Update von irgendwas gemacht, was den Kernel-Fehler verursachen könnte. Wenn ich ein Dokument (irgend ein pdf) hochlade, kommt sporadisch der Fehler und das pdf kann nicht verarbeitet werden. Wenn ich es dann nochmal hochlade, geht es zu 70%. Wenn nicht, beim dritten Mal. Außerdem stürzt auch gerne der "Umlautadaptarr" mit einem dotnet-Fehler ab. Andere Container scheinen stabil.

Hardware:
CPU: Intel Core i9 14900K (kein overclocking!)
MB: Asus Proart Z790 Creator Wifi
RAM: 4x 32GB Crucial Pro
GPU: Nvidia 4070ti super (Passtrhrought VM)
Storage: 2x WD Black 770 1 TB for Cache (Raid1)
Storage VM: 1x WD Black 7701 TB , 1x WD Black 770 2 TB (Passthrought VM)
Main-Storage: 3x Seagate Ironwolf Pro 20TB
Software: Unraid 6.10.14, error kommt auch in  7.0.0

Anbei mein syslog von 7.0.0 und 6.10.14. Im log von 6.10.14 ist es am Schluss des logs sehr deutlich zu erkennen, was ich meine.

Hier habe ich noch meinen Reddit-Beitrag, in dem ich noch die alten Fehlercodes angehängt habe. Außerdem sind hier die Fehlercodes in vom paperless log.

Hier ein kleiner Einblick:

Jan 12 17:50:50 nasgul kernel: gunicorn: worke[403374]: segfault at 0 ip 0000152757318d07 sp 0000152754296950 error 4 in libpython3.12.so.1.0[1527572fe000+215000] likely on CPU 4 (core 8, socket 0)
Jan 12 20:22:03 nasgul kernel: python3[1107071]: segfault at 28 ip 0000152cb9b0cc38 sp 00007ffea28e5f60 error 4 in libpython3.12.so.1.0[152cb98fe000+215000] likely on CPU 4 (core 8, socket 0)
Jan 12 20:23:59 nasgul kernel: [celeryd: celer[1115918]: segfault at 28 ip 0000145ab730cc38 sp 00007ffe77d20d60 error 4 in libpython3.12.so.1.0[145ab70fe000+215000] likely on CPU 4 (core 8, socket 0)
Jan 12 20:39:16 nasgul kernel: tesseract[1189108]: segfault at 4135999a ip 0000152afba614de sp 00007fff60247b30 error 4 in libtesseract.so.5.0.3[152afb886000+225000] likely on CPU 4 (core 8, socket 0)

Ich habe keine Ahnung, wie ich als nächstes vorgehen soll, was ich testen kann, ob ich bei der Hardware (Immer Core 8 im log)

oder bei der Software suchen soll. System ist ca. 2 Monate alt.

syslog 7.0.0.zip syslog 6.10.14.zip

Quote

January 15, 20251 yr

8 hours ago, Xerxes said:

Ich habe keine Ahnung, wie ich als nächstes vorgehen soll, was ich testen kann, ob ich bei der Hardware (Immer Core 8 im log)

was mich etwas verwundert, python Fehler auf dem Host ohne Python installiert zu haben

läuft paperless im priviledged mode ? wenn ja, deaktivieren.

ansonsten hast du nicht nur segfaults ... sonder Kernel Traces im Bezug auf btrfs ... ein leidiges Thema.

da dein Docker Setup auf "Verzeichnis" eingestellt ist könnte es damit zusammenhängen, das würde ich als erstes fixen ...

Ansätze ...

1/ zumindest scrub ausführen und schauen ob das hilft

2/ Daten weg sichern (außer /system/docker/), cache pool neu formatieren, Sicherung retour spielen, Docker neu installieren

>> Docker Tab, add, dropdown, user templates >> Start Parameter liegen auf dem Stick, persistent Daten unter /appdata, alles bleibt erhalten

3/ kein btrfs nutzen (Suche oben rechts im Forum zu btrfs)

dann schauen ob noch was kommt ...

Quote

January 15, 20251 yr

Author

Paperless läuft nicht im privileged mode. Ich hatte mal spaßeshalber python 3 installiert, um wegen den Bibliotheksfehlern zu schauen, ob die dann weg gehen. Hatte nichts geändert.

Die Kernel Fehler bzgl. btrfs hatte ich im ersten Schritt mal ignoriert und gehofft, dass das keinen Zusammenhang hat. Was schafft da Abhilfe? Cache anders formatieren? Geht das überhaupt?

Bzgl. des Docker-Setups "Verzeichnis": Ich hatte mir zur ersten Einrichtung von Unraid das Video von TheGeekFreaks auf YT angeschaut, und der Alex hat das empfohlen (Falls das img sich zerschießt, sind nicht gleich alle Docker kaputt). Habe ich ohne Fragen übernommen, hat für mich Sinn ergeben. Soll ich das besser auf btrfs-/ xfs-Verzeichnis stellen?

Scrub schuf keine Abhilfe.
Werde ich später nach der Arbeit mal machen. Cache dann aber mit btrfs formatieren?
Hier werde ich nicht ganz schlau, was genau du meinst.

Aber ganz allgemein meinst du, dass das eher ein Software- statt eines Hardware-Fehlers ist?

Quote

January 15, 20251 yr

14 minutes ago, Xerxes said:

Paperless läuft nicht im privileged mode.

ok, wundert mich aber dann ...

14 minutes ago, Xerxes said:

Die Kernel Fehler bzgl. btrfs hatte ich im ersten Schritt mal ignoriert und gehofft, dass das keinen Zusammenhang hat. Was schafft da Abhilfe? Cache anders formatieren? Geht das überhaupt?

naja, ein Filesystem zu ignorieren ist kein guter Plan, du machst auch Backups hoffe ich doch

15 minutes ago, Xerxes said:

Bzgl. des Docker-Setups "Verzeichnis": Ich hatte mir zur ersten Einrichtung von Unraid das Video von TheGeekFreaks auf YT angeschaut, und der Alex hat das empfohlen

kommentiere ich ganz sicher nicht

15 minutes ago, Xerxes said:

Scrub schuf keine Abhilfe.

fast erwartet

15 minutes ago, Xerxes said:

Werde ich später nach der Arbeit mal machen. Cache dann aber mit btrfs formatieren?

wenn du bei btrfs bleiben willst

16 minutes ago, Xerxes said:

Hier werde ich nicht ganz schlau, was genau du meinst.

es gibt zig Issues wo das btrfs Filesystem immer wieder Fehler verursacht, System hängen bleibt, ... daher bei raid_N pools eher mal zfs nutzen oder auf single drive caches wechseln in xfs und Backup Strategie umsetzen !!!

daher, Suche "oben rechts >> btrfs"

image.png.198715fca19d15c637684a98169ede9e.png

17 minutes ago, Xerxes said:

Aber ganz allgemein meinst du, dass das eher ein Software- statt eines Hardware-Fehlers ist?

aus dem "Bauch" raus, ja, im Zusammenhang evtl. mit deinem "nicht sauber laufenden" btrfs cache ...

Quote

1

January 15, 20251 yr

Author

Cache gesichert (außer /system/docker), neu als zfs raid1 formatiert, Docker-image als xfs.img eingestellt, alle Daten zurückgespielt und die Docker neu hinzugefügt.

Ist es normal, dass ich beim Sichern des Cache auf eine externe SSD eine Schreibgeschwindigkeit von ca. 400MB/s habe und beim zurückspielen der Daten nur noch 200MB/s? Ist der overhead bei zfs so arg?

Das Gute:

Pools sind nun so 5°C kälter.

Das Schlechte:

Nun kommen andere Docker mit Segfaults in der libpython (zb Plex) und stürzen ab.
Außerdem startet nun paperless erst beim 4-7 Anlauf. Sonst stürzt es direkt nach dem Start ab und im log steht wieder "segfault...libpython..." oder "ld-linux-x86-64.so.2". Habe nochmal python 3 installiert, keine Abhilfe
In der Übersicht kam nun ein neues Symbol dazu, das seit der Formatierung des Pools auf 100% steht

image.png.aeb73ff87d2e3d391c5c3b3f0542d78e.png

Gehört das so? Beim Hover darüber steht 3.15 GiB

Anbei nochmal ein aktueller Log von eben mit den letzten "segfault "Meldungen

diagnostics-20250115-1233.zip

Quote

January 15, 20251 yr

Author

Mein System hat sich jetzt seit heute Mittag 3x aufgehängt und es half nur ein hard reset. Ssh, WEBGui, geöffnete Docker, Web-Terminal, Web-Log, alles eingefroren. Nach ein paar Minuten kam "Internal Server Error 500" auf dem Browser. Bildschirm angesteckt, keine Ausgabe der Konsole. "Ins blaue" mal angemeldet und reboot getippt, nichts passiert. Logs hab ich leider keine davon, da ja nur ab boot gespeichert wird.

Ab dem ersten Hängen hatte ich parallel den Live-Log offen, um vielleicht noch die letzte Meldung vor Crash zu bekommen. Erfolglos. Nur Statusmeldungen von irgendwelchen Plugins.

Mache im Moment einen Segmenttest meines Boot-Sticks, sieht nach den ersten beiden Durchgängen noch gut aus.
Wenn ich parallel boote über die NVMe auf Windows funktioniert Windows laut Ereignisanzeige auch problemlos, also wird wohl irgendwas Unraid-Spezifisches sein.

Das System hat sich alle dreimal aufgehängt, als ich Filme von Radarr umbenennen hab lassen. Nach dem neu booten war die Datei jedoch noch nicht umbenannt. Rechte des Film-Ordners und die Ordner darunter sind -rwxrwxrwx und Besitzer ist "root", falls diese Info hilft.

Kann das Problem beim Kernel liegen und ich sollte es nochmal mit den zfs-Pools mit 7.0.0 versuchen?

Bin echt Ratlos und hab schon ein bisschen Hass auf das System...

Da der Fehler doch sehr sporadisch kommt, hab ich keine Ahnung wo ich anfangen soll.

Edited January 15, 20251 yr by Xerxes
Tippfehler behoben

Quote

January 15, 20251 yr

Community Expert

4 hours ago, Xerxes said:

Cache gesichert (außer /system/docker), neu als zfs raid1 formatiert, Docker-image als xfs.img eingestellt, alle Daten zurückgespielt und die Docker neu hinzugefügt.

Du hast also den angeschlagenen 8wegen vorheriger möglicher btrfs Fehler) Cache gesichert und zurückgespielt?

Bist Du Dir sicher, daß die ateien nicht immer noch beschädigt sind?

Entferne doch mal die Docker (vorher Backup machen) und installiere sie über Add Pool und bestehende templates neu.

Warum unbedingt zfs? muß es ein raid1 sein? Du siehst ja, daß es dir hier nicht hilft.

Soviel zu Ausfallsicherheit durch Raid1

Quote

January 15, 20251 yr

Author

Die Sicherung beinhaltete mnt/appdata, mnt/domains und mnt/system/libvirt. Dateien, die ich nicht erneut erstellen wollte. Die Container habe ich nach dem zurückspielen der appdata alle neu installiert. Oder was genau meinst du mit

6 minutes ago, DataCollector said:

Bist Du Dir sicher, daß die ateien nicht immer noch beschädigt sind?

Muss nicht zfs sein. Muss auch nicht RAID1 sein. Aber da ich keine Erfahrungen hiermit habe und mir empfohlen wurde von btrfs weg zu gehen, bin ich eben auf zfs gewechselt.

Quote

January 15, 20251 yr

4 hours ago, Xerxes said:

Anbei nochmal ein aktueller Log von eben mit den letzten "segfault "Meldungen

für was soll das sein ? war heute früh auch nicht drin ...

# Setting environment of docker
sysctl -w vm.overcommit_memory=1

hier ist auch ein python plugin installiert, brauchst du das auf dem host ? oder war das nur zum Test ?

wenn zum Test, weg damit ...

lrwxrwxrwx 1 root root 33 Jan 15 11:14 dwpython.plg -> /boot/config/plugins/dwpython.plg

hast du was im Zusammenhang mit Plex laufen ? irritiert mich alles etwas ... user scripts ?

Jan 15 09:03:47 nasgul kernel: Plex Script Hos[21214]: segfault at 0 ip 0000000000000000 sp 00007ffec1245828 error 14 likely on CPU 4 (core 8, socket 0)

16 minutes ago, Xerxes said:

Muss nicht zfs sein. Muss auch nicht RAID1 sein. Aber da ich keine Erfahrungen hiermit habe und mir empfohlen wurde von btrfs weg zu gehen, bin ich eben auf zfs gewechselt.

du hast keine Filesystem Fehler mehr ... das passt schon soweit. auch keine trace errors mehr ...

du hast jetzt umgestellt auf xfs image (auf einem zfs pool) anstelle directory ... das würde ich jetzt nicht machen, lass es auf directory ... einmal neu bitte

Jan 15 08:23:29 nasgul root: Creating new image file: '/mnt/user/system/docker/docker-xfs.img' size: 20G
Jan 15 08:23:29 nasgul root: meta-data=/mnt/cache/system/docker/docker-xfs.img isize=512    agcount=4, agsize=1310720 blks

es bleiben die traps errors

Zeile 4114: Jan 15 09:16:25 nasgul kernel: traps: dotnet[8006] general protection fault ip:1554164ac50f sp:7ffe0584a520 error:0 in libc.so.6[1554164ac000+155000]
Zeile 4401: Jan 15 09:27:13 nasgul kernel: traps: dotnet[11051] general protection fault ip:151fdfa9d50f sp:7ffe867bb910 error:0 in libc.so.6[151fdfa9d000+155000]
Zeile 5175: Jan 15 10:05:01 nasgul kernel: traps: [celeryd: celer[20868] general protection fault ip:14d12b596ec5 sp:7ffe95d7c440 error:0 in libpython3.12.so.1.0[14d12b4a6000+216000]

und segfaults (deinstallier bitte das python Teil sofern nicht gebraucht)

Zeile 2283: Jan 15 00:00:00 nasgul kernel: [celeryd: celer[2052]: segfault at 28 ip 000014ba9450d788 sp 00007ffef9fc33f0 error 4 in libpython3.12.so.1.0[14ba942fe000+216000] likely on CPU 4 (core 8, socket 0)
Zeile 2291: Jan 15 00:30:04 nasgul kernel: [celeryd: celer[10075]: segfault at 28 ip 000014ba9450d788 sp 00007ffef9fc3400 error 4 in libpython3.12.so.1.0[14ba942fe000+216000] likely on CPU 4 (core 8, socket 0)
Zeile 3247: Jan 15 07:49:13 nasgul kernel: python3[3408]: segfault at 28 ip 000014b77a50d788 sp 00007fffe9085500 error 4 in libpython3.12.so.1.0[14b77a2fe000+216000] likely on CPU 4 (core 8, socket 0)
Zeile 4006: Jan 15 09:03:47 nasgul kernel: Plex Script Hos[21214]: segfault at 0 ip 0000000000000000 sp 00007ffec1245828 error 14 likely on CPU 4 (core 8, socket 0)
Zeile 4027: Jan 15 09:04:27 nasgul kernel: Plex Script Hos[1594]: segfault at fffffffffffffff0 ip 0000150c1bfedb52 sp 00007ffcd32f3110 error 5 in libpython27.so[150c1bf3f000+179000] likely on CPU 4 (core 8, socket 0)
Zeile 4419: Jan 15 09:28:32 nasgul kernel: supervisord[23138]: segfault at 28 ip 0000146d6bc187d8 sp 00007ffdfd36c500 error 4 in libpython3.12.so.1.0[146d6ba09000+216000] likely on CPU 4 (core 8, socket 0)
Zeile 4433: Jan 15 09:29:23 nasgul kernel: python3[27732]: segfault at 0 ip 0000000000000000 sp 00007ffeda2ac580 error 14 likely on CPU 4 (core 8, socket 0)
Zeile 4474: Jan 15 09:30:28 nasgul kernel: python3[3151]: segfault at 28 ip 0000154eac3ce7d8 sp 00007ffd0e429a30 error 4 in libpython3.12.so.1.0[154eac1bf000+216000] likely on CPU 4 (core 8, socket 0)
Zeile 4481: Jan 15 09:31:02 nasgul kernel: Plex Script Hos[5842]: segfault at 8 ip 000014ea72f8b9e0 sp 00007ffca3d2d090 error 4 in libpython27.so[14ea72ea5000+179000] likely on CPU 4 (core 8, socket 0)
Zeile 5487: Jan 15 10:55:08 nasgul kernel: python3[28227]: segfault at 28 ip 00001510dba967d8 sp 00007ffce750ca70 error 4 in libpython3.12.so.1.0[1510db887000+216000] likely on CPU 4 (core 8, socket 0)

@JorgeB an idea for the traps and segfaults maybe ?

also, FS an sich jetzt ok, docker image bitte neu als Verzeichnis machen, Python weg ... dann nochmals beobachten, ansonsten sieht man nichts ...

Quote

January 15, 20251 yr

Author

Danke schonmal für diese Mühen!

# Setting environment of docker
sysctl -w vm.overcommit_memory=1

Das habe ich geschrieben, dass Redis nicht mehr pienst, da in den Redis logs diese Meldung (man solle den Parameter auf 1 Setzen) als Warnung steht. Hatte gehofft, dass sich Paperless gewissenhafter mit Redis verbinden kann. Vergeblich. Trotzdem ist die Warnung weg. Ich schätze mal bei 128GB RAM sollte das keine Probleme bereiten.

lrwxrwxrwx 1 root root 33 Jan 15 11:14 dwpython.plg -> /boot/config/plugins/dwpython.plg

Das Python Plugin hatte ich auch nur zum testen installiert, ist aktuell wieder entfernt.

6 minutes ago, alturismo said:

hast du was im Zusammenhang mit Plex laufen ? irritiert mich alles etwas ... user scripts ?

Plex an sich läuft eigenständig. Es ist nur die Beobachtungsliste per RSS-Feed mit Sonarr/Radarr/Lidarr verbunden. Sonst keine Verbindung, keinerlei user-scripts.

7 minutes ago, alturismo said:

du hast keine Filesystem Fehler mehr ... das passt schon soweit. auch keine trace errors mehr ...

Meinst du, ich soll alle Daten im Cache neu erstellen? Ist enorm viel Arbeit.

9 minutes ago, alturismo said:

es bleiben die traps errors

Da steht auch was von celeryd, also hatte ich hier angesetzt und eben die Warnung mit

sysctl -w vm.overcommit_memory=1

versucht zu beheben.

Quote

January 15, 20251 yr

6 minutes ago, Xerxes said:

Meinst du, ich soll alle Daten im Cache neu erstellen? Ist enorm viel Arbeit.

Nein, nur das Docker Image

1/ Settings, Docker, Docker Dienst stop

2/ Docker Image löschen

3/ Docker Verzeichnis einstellen

4/ Docker Dienst Start

5/ Docker entweder unter Docker Tab, add Container, dropdown ... geht ja schnell und alles bleibt erhalten ...

dein Cache Drive an sich wirft keine Fehler mehr aus, nur ein xfs Image auf ein zfs pool würde ich einfach ausschließen wollen ...

Quote

January 15, 20251 yr

9 minutes ago, Xerxes said:

versucht zu beheben.

mach das bitte auch weg ... lass mal Standard ... Ausschluss Verfahren ...

Quote

January 15, 20251 yr

Community Expert

1 hour ago, Xerxes said:

Die Sicherung beinhaltete mnt/appdata, mnt/domains und mnt/system/libvirt.

Sind das die selben dateien, die dann auf den neu formatierten cache zurückgespielt wurden?

Sind die definitiv nicht ggf. beschädigt?

1 hour ago, Xerxes said:

Muss nicht zfs sein. Muss auch nicht RAID1 sein. Aber da ich keine Erfahrungen hiermit habe und mir empfohlen wurde von btrfs weg zu gehen, bin ich eben auf zfs gewechselt.

Weg von btrfs: da bin ich voll dabei. Aber wenn es kein raid1 sein soll, wäre für Einzelne Datenträger xfs meine Wahl.

zfs eben nur, wenn es ein raid (-ähnliches Verhalten) sein soll.

Quote

January 15, 20251 yr

Author

2 hours ago, alturismo said:

dein Cache Drive an sich wirft keine Fehler mehr aus, nur ein xfs Image auf ein zfs pool würde ich einfach ausschließen wollen ...

Habe ich gemacht. 5 Minuten später hat sich das System wieder aufgehängt. Das maximale, was ich hin bekommen habe, ist der log aus dem Webterminal, da GUI nicht reagiert.

Vielleicht hilft das.

Die rot markierten Stellen im log sind

Jan 15 19:59:22 nasgul kernel: Call Trace:
Jan 15 19:59:22 nasgul kernel: CPU: 8 PID: 17145 Comm: Plex Media Scan Tainted: P      D    O       6.1.118-Unraid #1
Jan 15 19:59:22 nasgul kernel: Call Trace:
Jan 15 19:59:44 nasgul kernel: CPU: 8 PID: 17145 Comm: Plex Media Scan Tainted: P      D    O       6.1.118-Unraid #1
Jan 15 19:59:44 nasgul kernel: Call Trace:
Jan 15 19:59:44 nasgul kernel: CPU: 29 PID: 26936 Comm: Plex Media Scan Tainted: P      D    O       6.1.118-Unraid #1
Jan 15 19:59:44 nasgul kernel: Call Trace:
Jan 15 20:01:50 nasgul kernel: Call Trace:
Jan 15 20:01:50 nasgul kernel: CPU: 18 PID: 15 Comm: rcu_preempt Tainted: P      D    O       6.1.118-Unraid #1
Jan 15 20:01:50 nasgul kernel: Call Trace:
Jan 15 20:01:50 nasgul kernel: device offline error, dev sde, sector 0 op 0x1:(WRITE) flags 0x800 phys_seg 0 prio class 2

mehr konnte ich nicht retten. Was zu dem Zeitpunkt /dev/sde war, kann ich nicht sagen.

Irgendwie kommt es mir vor, als wenn der Fehler von Paperless zu Plex übergegangen ist...

2 hours ago, alturismo said:

mach das bitte auch weg ... lass mal Standard ... Ausschluss Verfahren ...

Ist auch weg. Stick ist neu aufgesetzt, config übernommen. go-file wieder auf Standard, python.plg ist runter.

Musste das System eben wieder killen per Ausknopf. 0,0 Reaktion mehr. Tut jedes mal weh

unraid log 20250115-2009.txt

Quote

January 15, 20251 yr

11 minutes ago, Xerxes said:

Musste das System eben wieder killen per Ausknopf. 0,0 Reaktion mehr. Tut jedes mal weh

glaub ich ...

und da sind wieder harte tracelogs, wenn ich mal etwas google ...

BIOS, ist aktuell

WLAN oder Ethernet könnte das auslösen, onboard wifi mal deaktivieren (wenn machbar)

ggf. NIC auch (Metzwek onboard) und mit einer separaten wenn verfügbar mal testen

ansonsten ... fällt mir tatsächlich nicht wirklich mehr ein so langsam ...

@JorgeB also may ideas to the syslog with new traces ...

Jan 15 19:59:22 nasgul kernel: CR2: ffffc9005be33f58 CR3: 0000000541164000 CR4: 0000000000750ef0
Jan 15 19:59:22 nasgul kernel: PKRU: 55555554
Jan 15 19:59:22 nasgul kernel: Call Trace:
Jan 15 19:59:22 nasgul kernel: <TASK>
Jan 15 19:59:22 nasgul kernel: ? __die_body+0x1a/0x5c
Jan 15 19:59:22 nasgul kernel: ? page_fault_oops+0x329/0x376
Jan 15 19:59:22 nasgul kernel: ? exc_page_fault+0xf4/0x11d
Jan 15 19:59:22 nasgul kernel: ? asm_exc_page_fault+0x22/0x30
Jan 15 19:59:22 nasgul kernel: ? do_user_addr_fault+0x246/0x465
Jan 15 19:59:22 nasgul kernel: ? exc_page_fault+0xfb/0x11d
Jan 15 19:59:22 nasgul kernel: ? asm_exc_page_fault+0x22/0x30
Jan 15 19:59:22 nasgul kernel: </TASK>
Jan 15 19:59:22 nasgul kernel: Modules linked in: ext4 mbcache jbd2 xt_CHECKSUM ipt_REJECT nf_reject_ipv4 ip6table_mangle ip6table_nat iptable_mangle vhost_net tun vhost vhost_iotlb tap veth xt_nat xt_tcpudp xt_conntrack xt_MASQUERADE nf_conntrack_netlink nfnetlink xfrm_user xfrm_algo iptable_nat nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 xt_addrtype br_netfilter xfs md_mod tcp_diag inet_diag nct6775 nct6775_core hwmon_vid ip6table_filter ip6_tables iptable_filter ip_tables x_tables efivarfs af_packet 8021q garp mrp bridge stp llc bonding tls zfs(PO) i915 intel_rapl_msr intel_rapl_common x86_pkg_temp_thermal zunicode(PO) intel_powerclamp coretemp zzstd(O) iosf_mbi drm_buddy i2c_algo_bit kvm_intel ttm zlua(O) drm_display_helper btusb btrtl zavl(PO) btbcm btintel drm_kms_helper icp(PO) kvm bluetooth drm crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel sha512_ssse3 sr_mod zcommon(PO) sha256_ssse3 cdrom sha1_ssse3 ecdh_generic aesni_intel ecc znvpair(PO) intel_gtt crypto_simd cryptd rapl
Jan 15 19:59:22 nasgul kernel: spl(O) intel_cstate mei_hdcp mei_pxp wmi_bmof mpt3sas thunderbolt i2c_i801 nvme intel_uncore atlantic agpgart mei_me i2c_smbus nvme_core ahci raid_class i2c_core mei scsi_transport_sas libahci syscopyarea sysfillrect vmd sysimgblt thermal fb_sys_fops fan video tpm_crb tpm_tis tpm_tis_core wmi tpm backlight intel_pmc_core acpi_pad acpi_tad button unix
Jan 15 19:59:22 nasgul kernel: CR2: ffffc9005be33f58
Jan 15 19:59:22 nasgul kernel: ---[ end trace 0000000000000000 ]---
Jan 15 19:59:22 nasgul kernel: RIP: 0010:mutex_lock+0xf/0x2e
Jan 15 19:59:22 nasgul kernel: Code: 03 59 eb c9 31 c0 5a c3 cc cc cc cc 0f 1f 44 00 00 be 02 00 00 00 e9 88 fc ff ff 0f 1f 44 00 00 51 48 89 3c 24 e8 13 f3 ff ff <31> c0 48 8b 3c 24 65 48 8b 14 25 80 cb 01 00 f0 48 0f b1 17 74 03
Jan 15 19:59:22 nasgul kernel: RSP: 0018:ffffc9006b1878b0 EFLAGS: 00010286
Jan 15 19:59:22 nasgul kernel: RAX: 0000000000000000 RBX: 00000000000046e0 RCX: 0000000000000000
Jan 15 19:59:22 nasgul kernel: RDX: 0000000080000000 RSI: 9f01b21ff904f6c9 RDI: ffffffffa124a620
Jan 15 19:59:22 nasgul kernel: RBP: 000000000000017a R08: 9ae16a3b2f90408f R09: 9ae16a3b2f90404f
Jan 15 19:59:22 nasgul kernel: R10: 0000000000000000 R11: 0000008000000000 R12: 000000000013497a
Jan 15 19:59:22 nasgul kernel: R13: 0000000000000036 R14: 0000000000000000 R15: 0000000000000000
Jan 15 19:59:22 nasgul kernel: FS:  0000000000000000(0000) GS:ffff88a03f000000(0000) knlGS:0000000000000000
Jan 15 19:59:22 nasgul kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 15 19:59:22 nasgul kernel: CR2: ffffc9005be33f58 CR3: 0000000541164000 CR4: 0000000000750ef0
Jan 15 19:59:22 nasgul kernel: PKRU: 55555554
Jan 15 19:59:22 nasgul kernel: note: zfs[27093] exited with irqs disabled
Jan 15 19:59:22 nasgul kernel: kernel tried to execute NX-protected page - exploit attempt? (uid: 99)
Jan 15 19:59:22 nasgul kernel: BUG: unable to handle page fault for address: ffff888596a5d000
Jan 15 19:59:22 nasgul kernel: #PF: supervisor instruction fetch in kernel mode
Jan 15 19:59:22 nasgul kernel: #PF: error_code(0x0011) - permissions violation
Jan 15 19:59:22 nasgul kernel: PGD 4c01067 P4D 4c01067 PUD 80000005800001e3 
Jan 15 19:59:22 nasgul kernel: Oops: 0011 [#3] PREEMPT SMP NOPTI
Jan 15 19:59:22 nasgul kernel: CPU: 8 PID: 17145 Comm: Plex Media Scan Tainted: P      D    O       6.1.118-Unraid #1
Jan 15 19:59:22 nasgul kernel: Hardware name: ASUS System Product Name/ProArt Z790-CREATOR WIFI, BIOS 2801 11/29/2024
Jan 15 19:59:22 nasgul kernel: RIP: 0010:0xffff888596a5d000
Jan 15 19:59:22 nasgul kernel: Code: 28 73 65 6c 66 2e 70 74 72 2c 20 69 6e 64 65 78 2c 20 64 69 6d 65 6e 73 69 6f 6e 2c 20 62 79 72 65 66 28 63 5f 64 6f 75 62 6c <00> 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 08 00
Jan 15 19:59:22 nasgul kernel: RSP: 0018:ffffc9000092fea0 EFLAGS: 00010046
Jan 15 19:59:22 nasgul kernel: RAX: 0000000000000000 RBX: ffff88a03f22e040 RCX: 0000000000000000
Jan 15 19:59:22 nasgul kernel: RDX: 0000000000000003 RSI: 0000000000000000 RDI: ffff88a03f22e040
Jan 15 19:59:22 nasgul kernel: RBP: ffffc9000092ff10 R08: 0000000000000000 R09: 0000000000000000
Jan 15 19:59:22 nasgul kernel: R10: 0000000000000000 R11: 0000000000000000 R12: ffff88a03f22e040
Jan 15 19:59:22 nasgul kernel: R13: 0000000000000000 R14: 0000000000000000 R15: 0000000000000000
Jan 15 19:59:22 nasgul kernel: FS:  00001512a7477f00(0000) GS:ffff88a03f200000(0000) knlGS:0000000000000000
Jan 15 19:59:22 nasgul kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 15 19:59:22 nasgul kernel: CR2: ffff888596a5d000 CR3: 0000000633ff8000 CR4: 0000000000750ee0
Jan 15 19:59:22 nasgul kernel: PKRU: 55555554
Jan 15 19:59:22 nasgul kernel: Call Trace:
Jan 15 19:59:22 nasgul kernel: <TASK>
Jan 15 19:59:22 nasgul kernel: ? __die_body+0x1a/0x5c
Jan 15 19:59:22 nasgul kernel: ? page_fault_oops+0x329/0x376
Jan 15 19:59:22 nasgul kernel: ? fixup_exception+0x22/0x24b
Jan 15 19:59:22 nasgul kernel: ? exc_page_fault+0xf4/0x11d
Jan 15 19:59:22 nasgul kernel: ? asm_exc_page_fault+0x22/0x30
Jan 15 19:59:22 nasgul kernel: ? rq_lock+0x12/0x24
Jan 15 19:59:22 nasgul kernel: ? __schedule+0xb5/0x612
Jan 15 19:59:22 nasgul kernel: ? flush_tlb_func+0xf9/0x15a
Jan 15 19:59:22 nasgul kernel: ? _raw_spin_lock+0x13/0x1c
Jan 15 19:59:22 nasgul kernel: schedule+0x8e/0xcc
Jan 15 19:59:22 nasgul kernel: __do_sys_sched_yield+0xa/0x11
Jan 15 19:59:22 nasgul kernel: do_syscall_64+0x65/0x7b
Jan 15 19:59:22 nasgul kernel: entry_SYSCALL_64_after_hwframe+0x6e/0xd8
Jan 15 19:59:22 nasgul kernel: RIP: 0033:0x1512abe0857a
Jan 15 19:59:22 nasgul kernel: Code: 0f 05 9b 48 89 c7 e9 45 38 fd ff 48 c7 c7 da ff ff ff e9 39 38 fd ff 48 c7 c7 da ff ff ff e9 2d 38 fd ff b8 18 00 00 00 0f 05 <9b> 48 89 c7 e9 1d 38 fd ff 48 8d 35 f6 eb 01 00 e9 00 00 00 00 41
Jan 15 19:59:22 nasgul kernel: RSP: 002b:00007fff9af39bd8 EFLAGS: 00000202 ORIG_RAX: 0000000000000018
Jan 15 19:59:22 nasgul kernel: RAX: ffffffffffffffda RBX: 00000000000000f0 RCX: 00001512abe0857a
Jan 15 19:59:22 nasgul kernel: RDX: 0000000000000000 RSI: 0000000000000001 RDI: 0000000000000000
Jan 15 19:59:22 nasgul kernel: RBP: 00007fff9af39c40 R08: 00001512abdc9640 R09: 0000000000001210
Jan 15 19:59:22 nasgul kernel: R10: 0000000000000004 R11: 0000000000000202 R12: 00001512a5439d90
Jan 15 19:59:22 nasgul kernel: R13: 00001512a61d6680 R14: 00001512a5439d98 R15: 00001512a5439e30
Jan 15 19:59:22 nasgul kernel: </TASK>
Jan 15 19:59:22 nasgul kernel: Modules linked in: ext4 mbcache jbd2 xt_CHECKSUM ipt_REJECT nf_reject_ipv4 ip6table_mangle ip6table_nat iptable_mangle vhost_net tun vhost vhost_iotlb tap veth xt_nat xt_tcpudp xt_conntrack xt_MASQUERADE nf_conntrack_netlink nfnetlink xfrm_user xfrm_algo iptable_nat nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 xt_addrtype br_netfilter xfs md_mod tcp_diag inet_diag nct6775 nct6775_core hwmon_vid ip6table_filter ip6_tables iptable_filter ip_tables x_tables efivarfs af_packet 8021q garp mrp bridge stp llc bonding tls zfs(PO) i915 intel_rapl_msr intel_rapl_common x86_pkg_temp_thermal zunicode(PO) intel_powerclamp coretemp zzstd(O) iosf_mbi drm_buddy i2c_algo_bit kvm_intel ttm zlua(O) drm_display_helper btusb btrtl zavl(PO) btbcm btintel drm_kms_helper icp(PO) kvm bluetooth drm crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel sha512_ssse3 sr_mod zcommon(PO) sha256_ssse3 cdrom sha1_ssse3 ecdh_generic aesni_intel ecc znvpair(PO) intel_gtt crypto_simd cryptd rapl
Jan 15 19:59:22 nasgul kernel: spl(O) intel_cstate mei_hdcp mei_pxp wmi_bmof mpt3sas thunderbolt i2c_i801 nvme intel_uncore atlantic agpgart mei_me i2c_smbus nvme_core ahci raid_class i2c_core mei scsi_transport_sas libahci syscopyarea sysfillrect vmd sysimgblt thermal fb_sys_fops fan video tpm_crb tpm_tis tpm_tis_core wmi tpm backlight intel_pmc_core acpi_pad acpi_tad button unix
Jan 15 19:59:22 nasgul kernel: CR2: ffff888596a5d000
Jan 15 19:59:22 nasgul kernel: ---[ end trace 0000000000000000 ]---
Jan 15 19:59:22 nasgul kernel: RIP: 0010:mutex_lock+0xf/0x2e
Jan 15 19:59:22 nasgul kernel: Code: 03 59 eb c9 31 c0 5a c3 cc cc cc cc 0f 1f 44 00 00 be 02 00 00 00 e9 88 fc ff ff 0f 1f 44 00 00 51 48 89 3c 24 e8 13 f3 ff ff <31> c0 48 8b 3c 24 65 48 8b 14 25 80 cb 01 00 f0 48 0f b1 17 74 03
Jan 15 19:59:22 nasgul kernel: RSP: 0018:ffffc9006b1878b0 EFLAGS: 00010286
Jan 15 19:59:22 nasgul kernel: RAX: 0000000000000000 RBX: 00000000000046e0 RCX: 0000000000000000
Jan 15 19:59:22 nasgul kernel: RDX: 0000000080000000 RSI: 9f01b21ff904f6c9 RDI: ffffffffa124a620
Jan 15 19:59:22 nasgul kernel: RBP: 000000000000017a R08: 9ae16a3b2f90408f R09: 9ae16a3b2f90404f
Jan 15 19:59:22 nasgul kernel: R10: 0000000000000000 R11: 0000008000000000 R12: 000000000013497a
Jan 15 19:59:22 nasgul kernel: R13: 0000000000000036 R14: 0000000000000000 R15: 0000000000000000
Jan 15 19:59:22 nasgul kernel: FS:  00001512a7477f00(0000) GS:ffff88a03f200000(0000) knlGS:0000000000000000
Jan 15 19:59:22 nasgul kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 15 19:59:22 nasgul kernel: CR2: ffff888596a5d000 CR3: 0000000633ff8000 CR4: 0000000000750ee0
Jan 15 19:59:22 nasgul kernel: PKRU: 55555554
Jan 15 19:59:22 nasgul kernel: note: Plex Media Scan[17145] exited with irqs disabled
Jan 15 19:59:44 nasgul kernel: rcu: INFO: rcu_preempt detected expedited stalls on CPUs/tasks: { 8-...D 29-.... } 21348 jiffies s: 9173 root: 0x3/.
Jan 15 19:59:44 nasgul kernel: rcu: blocking rcu_node structures (internal RCU debug): l=1:0-15:0x100/. l=1:16-31:0x2000/.
Jan 15 19:59:44 nasgul kernel: Sending NMI from CPU 11 to CPUs 8:
Jan 15 19:59:44 nasgul kernel: NMI backtrace for cpu 8
Jan 15 19:59:44 nasgul kernel: CPU: 8 PID: 17145 Comm: Plex Media Scan Tainted: P      D    O       6.1.118-Unraid #1
Jan 15 19:59:44 nasgul kernel: Hardware name: ASUS System Product Name/ProArt Z790-CREATOR WIFI, BIOS 2801 11/29/2024
Jan 15 19:59:44 nasgul kernel: RIP: 0010:native_queued_spin_lock_slowpath+0x86/0x1cf
Jan 15 19:59:44 nasgul kernel: Code: c2 0f b6 d2 c1 e2 08 30 e4 09 d0 3d ff 00 00 00 76 0c 0f ba e0 08 72 1e c6 43 01 00 eb 18 85 c0 74 0a 8b 03 84 c0 74 04 f3 90 <eb> f6 66 c7 03 01 00 e9 32 01 00 00 e8 60 3b ff ff 49 c7 c4 80 ed
Jan 15 19:59:44 nasgul kernel: RSP: 0018:ffffc90000434e88 EFLAGS: 00000002
Jan 15 19:59:44 nasgul kernel: RAX: 0000000000500101 RBX: ffff88a03f22e040 RCX: 0000001de2a81800
Jan 15 19:59:44 nasgul kernel: RDX: 0000000000000000 RSI: 0000000000000001 RDI: ffff88a03f22e040
Jan 15 19:59:44 nasgul kernel: RBP: 0000000000000000 R08: ffff88a03f5ae0f0 R09: ffff88a03f5ae0f0
Jan 15 19:59:44 nasgul kernel: R10: 0000000000000000 R11: ffffc90000434ff8 R12: 0000000000000008
Jan 15 19:59:44 nasgul kernel: R13: 000001dd5ecfedfb R14: 0000000000000006 R15: ffffffff810fd1ea
Jan 15 19:59:44 nasgul kernel: FS:  00001512a7477f00(0000) GS:ffff88a03f200000(0000) knlGS:0000000000000000
Jan 15 19:59:44 nasgul kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 15 19:59:44 nasgul kernel: CR2: ffff888596a5d000 CR3: 0000000633ff8000 CR4: 0000000000750ee0
Jan 15 19:59:44 nasgul kernel: PKRU: 55555554
Jan 15 19:59:44 nasgul kernel: Call Trace:
Jan 15 19:59:44 nasgul kernel: <NMI>
Jan 15 19:59:44 nasgul kernel: ? nmi_cpu_backtrace+0xd3/0x104
Jan 15 19:59:44 nasgul kernel: ? nmi_cpu_backtrace_handler+0xd/0x15
Jan 15 19:59:44 nasgul kernel: ? nmi_handle+0x54/0x131
Jan 15 19:59:44 nasgul kernel: ? native_queued_spin_lock_slowpath+0x86/0x1cf
Jan 15 19:59:44 nasgul kernel: ? default_do_nmi+0x66/0x15b
Jan 15 19:59:44 nasgul kernel: ? exc_nmi+0xbf/0x11c
Jan 15 19:59:44 nasgul kernel: ? end_repeat_nmi+0x16/0x67
Jan 15 19:59:44 nasgul kernel: ? tick_init_jiffy_update+0x7c/0x7c
Jan 15 19:59:44 nasgul kernel: ? native_queued_spin_lock_slowpath+0x86/0x1cf
Jan 15 19:59:44 nasgul kernel: ? native_queued_spin_lock_slowpath+0x86/0x1cf
Jan 15 19:59:44 nasgul kernel: ? native_queued_spin_lock_slowpath+0x86/0x1cf
Jan 15 19:59:44 nasgul kernel: </NMI>
Jan 15 19:59:44 nasgul kernel: <IRQ>
Jan 15 19:59:44 nasgul kernel: do_raw_spin_lock+0x14/0x1a
Jan 15 19:59:44 nasgul kernel: raw_spin_rq_lock_nested+0x1b/0x26
Jan 15 19:59:44 nasgul kernel: rq_lock+0x12/0x24
Jan 15 19:59:44 nasgul kernel: scheduler_tick+0x5e/0x186
Jan 15 19:59:44 nasgul kernel: ? tick_init_jiffy_update+0x7c/0x7c
Jan 15 19:59:44 nasgul kernel: ? irq_work_single+0x20/0x53
Jan 15 19:59:44 nasgul kernel: update_process_times+0x7a/0x81
Jan 15 19:59:44 nasgul kernel: tick_sched_timer+0x43/0x71
Jan 15 19:59:44 nasgul kernel: __hrtimer_run_queues+0xe8/0x190
Jan 15 19:59:44 nasgul kernel: hrtimer_interrupt+0x9c/0x16e
Jan 15 19:59:44 nasgul kernel: __sysvec_apic_timer_interrupt+0xc2/0x12f
Jan 15 19:59:44 nasgul kernel: sysvec_apic_timer_interrupt+0x8f/0xb5
Jan 15 19:59:44 nasgul kernel: </IRQ>
Jan 15 19:59:44 nasgul kernel: <TASK>
Jan 15 19:59:44 nasgul kernel: asm_sysvec_apic_timer_interrupt+0x16/0x20
Jan 15 19:59:44 nasgul kernel: RIP: 0010:make_task_dead+0x69/0x11c
Jan 15 19:59:44 nasgul kernel: Code: 58 0f 1f 40 00 0f ba e0 09 72 1f 8b 93 88 04 00 00 48 8d b3 80 06 00 00 48 c7 c7 f0 51 0c 82 e8 5a 36 7f 00 fb 0f 1f 44 00 00 <65> 8b 0d d1 67 fa 7e 81 e1 ff ff ff 7f 74 3f 65 48 8b 34 25 80 cb
Jan 15 19:59:44 nasgul kernel: RSP: 0018:ffffc9000092ff40 EFLAGS: 00000246
Jan 15 19:59:44 nasgul kernel: RAX: 0000000000000036 RBX: ffff888596a5d000 RCX: 0000000000000027
Jan 15 19:59:44 nasgul kernel: RDX: 0000000000000000 RSI: ffffffff820dabd1 RDI: 00000000ffffffff
Jan 15 19:59:44 nasgul kernel: RBP: 0000000000000009 R08: 0000000000000000 R09: ffffffff829583f0
Jan 15 19:59:44 nasgul kernel: R10: 00003fffffffffff R11: ffff88a0bf7b2965 R12: ffff888596a5d000
Jan 15 19:59:44 nasgul kernel: R13: ffff888004c010b0 R14: 0000000000000000 R15: 0000000000000010
Jan 15 19:59:44 nasgul kernel: rewind_stack_and_make_dead+0x17/0x17
Jan 15 19:59:44 nasgul kernel: RIP: 0033:0x1512abe0857a
Jan 15 19:59:44 nasgul kernel: Code: 0f 05 9b 48 89 c7 e9 45 38 fd ff 48 c7 c7 da ff ff ff e9 39 38 fd ff 48 c7 c7 da ff ff ff e9 2d 38 fd ff b8 18 00 00 00 0f 05 <9b> 48 89 c7 e9 1d 38 fd ff 48 8d 35 f6 eb 01 00 e9 00 00 00 00 41
Jan 15 19:59:44 nasgul kernel: RSP: 002b:00007fff9af39bd8 EFLAGS: 00000202 ORIG_RAX: 0000000000000018
Jan 15 19:59:44 nasgul kernel: RAX: ffffffffffffffda RBX: 00000000000000f0 RCX: 00001512abe0857a
Jan 15 19:59:44 nasgul kernel: RDX: 0000000000000000 RSI: 0000000000000001 RDI: 0000000000000000
Jan 15 19:59:44 nasgul kernel: RBP: 00007fff9af39c40 R08: 00001512abdc9640 R09: 0000000000001210
Jan 15 19:59:44 nasgul kernel: R10: 0000000000000004 R11: 0000000000000202 R12: 00001512a5439d90
Jan 15 19:59:44 nasgul kernel: R13: 00001512a61d6680 R14: 00001512a5439d98 R15: 00001512a5439e30
Jan 15 19:59:44 nasgul kernel: </TASK>
Jan 15 19:59:44 nasgul kernel: Sending NMI from CPU 11 to CPUs 29:
Jan 15 19:59:44 nasgul kernel: NMI backtrace for cpu 29
Jan 15 19:59:44 nasgul kernel: CPU: 29 PID: 26936 Comm: Plex Media Scan Tainted: P      D    O       6.1.118-Unraid #1
Jan 15 19:59:44 nasgul kernel: Hardware name: ASUS System Product Name/ProArt Z790-CREATOR WIFI, BIOS 2801 11/29/2024
Jan 15 19:59:44 nasgul kernel: RIP: 0010:smp_call_function_many_cond+0x26a/0x283
Jan 15 19:59:44 nasgul kernel: Code: d0 48 89 df e8 68 fa ff ff 3b 05 99 bc 2a 01 73 1f 48 63 c8 48 8b 55 00 48 03 14 cd 60 cb 16 82 8b 4a 08 80 e1 01 74 04 f3 90 <eb> f4 ff c0 eb c8 48 83 c4 38 5b 5d 41 5c 41 5d 41 5e 41 5f c3 cc
Jan 15 19:59:44 nasgul kernel: RSP: 0018:ffffc9006a7b7bd8 EFLAGS: 00000202
Jan 15 19:59:44 nasgul kernel: RAX: 0000000000000008 RBX: ffff88a03f76f208 RCX: 0000000000000001
Jan 15 19:59:44 nasgul kernel: RDX: ffff88a03f233f20 RSI: 0000000000000020 RDI: ffff88a03f76f208
Jan 15 19:59:44 nasgul kernel: RBP: ffff88a03f76f200 R08: 0000000000000008 R09: ffff888100fbdc88
Jan 15 19:59:44 nasgul kernel: R10: ffff88a03f75cee0 R11: ffff8882556b8d00 R12: 0000000000000001
Jan 15 19:59:44 nasgul kernel: R13: ffffffff81062d4c R14: ffffffff81063471 R15: 0000000000000017
Jan 15 19:59:44 nasgul kernel: FS:  00001512a0d6db00(0000) GS:ffff88a03f740000(0000) knlGS:0000000000000000
Jan 15 19:59:44 nasgul kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 15 19:59:44 nasgul kernel: CR2: 0000151298178000 CR3: 0000000633ff8000 CR4: 0000000000750ee0
Jan 15 19:59:44 nasgul kernel: PKRU: 55555554
Jan 15 19:59:44 nasgul kernel: Call Trace:
Jan 15 19:59:44 nasgul kernel: <NMI>
Jan 15 19:59:44 nasgul kernel: ? nmi_cpu_backtrace+0xd3/0x104
Jan 15 19:59:44 nasgul kernel: ? nmi_cpu_backtrace_handler+0xd/0x15
Jan 15 19:59:44 nasgul kernel: ? nmi_handle+0x54/0x131
Jan 15 19:59:44 nasgul kernel: ? smp_call_function_many_cond+0x26a/0x283
Jan 15 19:59:44 nasgul kernel: ? default_do_nmi+0x66/0x15b
Jan 15 19:59:44 nasgul kernel: ? exc_nmi+0xbf/0x11c
Jan 15 19:59:44 nasgul kernel: ? end_repeat_nmi+0x16/0x67
Jan 15 19:59:44 nasgul kernel: ? leave_mm+0x34/0x34
Jan 15 19:59:44 nasgul kernel: ? write_cr3+0xb/0xb
Jan 15 19:59:44 nasgul kernel: ? smp_call_function_many_cond+0x26a/0x283
Jan 15 19:59:44 nasgul kernel: ? smp_call_function_many_cond+0x26a/0x283
Jan 15 19:59:44 nasgul kernel: ? smp_call_function_many_cond+0x26a/0x283
Jan 15 19:59:44 nasgul kernel: </NMI>
Jan 15 19:59:44 nasgul kernel: <TASK>
Jan 15 19:59:44 nasgul kernel: ? write_cr3+0xb/0xb
Jan 15 19:59:44 nasgul kernel: on_each_cpu_cond_mask+0x42/0x69
Jan 15 19:59:44 nasgul kernel: ? leave_mm+0x34/0x34
Jan 15 19:59:44 nasgul kernel: __flush_tlb_multi+0x5/0xb
Jan 15 19:59:44 nasgul kernel: flush_tlb_mm_range+0xc3/0x111
Jan 15 19:59:44 nasgul kernel: tlb_flush_mmu_tlbonly+0x6c/0x94
Jan 15 19:59:44 nasgul kernel: tlb_flush_mmu+0x15/0x99
Jan 15 19:59:44 nasgul kernel: tlb_finish_mmu+0x2c/0x5b
Jan 15 19:59:44 nasgul kernel: unmap_region+0xd6/0x104
Jan 15 19:59:44 nasgul kernel: do_mas_align_munmap.constprop.0+0x2e7/0x3c6
Jan 15 19:59:44 nasgul kernel: __vm_munmap+0x9d/0xdd
Jan 15 19:59:44 nasgul kernel: __x64_sys_munmap+0x17/0x1e
Jan 15 19:59:44 nasgul kernel: do_syscall_64+0x65/0x7b
Jan 15 19:59:44 nasgul kernel: entry_SYSCALL_64_after_hwframe+0x6e/0xd8
Jan 15 19:59:44 nasgul kernel: RIP: 0033:0x1512abdf6895
Jan 15 19:59:44 nasgul kernel: Code: 00 00 00 0f 05 9b 48 89 c7 e9 27 55 fe ff 41 56 53 50 49 89 f6 48 89 fb e8 88 3d 02 00 b8 0b 00 00 00 48 89 df 4c 89 f6 0f 05 <9b> 48 89 c7 48 83 c4 08 5b 41 5e e9 fb 54 fe ff 31 c0 83 fa 04 74
Jan 15 19:59:44 nasgul kernel: RSP: 002b:00001512a0d6bf30 EFLAGS: 00000206 ORIG_RAX: 000000000000000b
Jan 15 19:59:44 nasgul kernel: RAX: ffffffffffffffda RBX: 0000151298155000 RCX: 00001512abdf6895
Jan 15 19:59:44 nasgul kernel: RDX: 0000000000000000 RSI: 0000000000037000 RDI: 0000151298155000
Jan 15 19:59:44 nasgul kernel: RBP: 0000000000000000 R08: 000000000000002c R09: 0000000000000002
Jan 15 19:59:44 nasgul kernel: R10: 0000000000000002 R11: 0000000000000206 R12: 0000000000011000
Jan 15 19:59:44 nasgul kernel: R13: 0000000000000007 R14: 0000000000037000 R15: 0000000000037000
Jan 15 19:59:44 nasgul kernel: </TASK>
Jan 15 20:01:50 nasgul kernel: rcu: INFO: rcu_preempt self-detected stall on CPU
Jan 15 20:01:50 nasgul kernel: rcu:     29-...!: (60001 ticks this GP) idle=e38c/1/0x4000000000000000 softirq=45883/45885 fqs=8672
Jan 15 20:01:50 nasgul kernel:  (t=60001 jiffies g=1021861 q=192184 ncpus=32)
Jan 15 20:01:50 nasgul kernel: rcu: rcu_preempt kthread starved for 30000 jiffies! g1021861 f0x0 RCU_GP_DOING_FQS(6) ->state=0x0 ->cpu=18
Jan 15 20:01:50 nasgul kernel: rcu:     Unless rcu_preempt kthread gets sufficient CPU time, OOM is now expected behavior.
Jan 15 20:01:50 nasgul kernel: rcu: RCU grace-period kthread stack dump:
Jan 15 20:01:50 nasgul kernel: task:rcu_preempt     state:R  running task     stack:0     pid:15    ppid:2      flags:0x00004000
Jan 15 20:01:50 nasgul kernel: Call Trace:
Jan 15 20:01:50 nasgul kernel: <TASK>
Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0xc5/0x1cf
Jan 15 20:01:50 nasgul kernel: ? do_raw_spin_lock+0x14/0x1a
Jan 15 20:01:50 nasgul kernel: ? raw_spin_rq_lock_nested+0x1b/0x26
Jan 15 20:01:50 nasgul kernel: ? _raw_spin_rq_lock_irqsave+0x15/0x1e
Jan 15 20:01:50 nasgul kernel: ? resched_cpu+0x26/0x56
Jan 15 20:01:50 nasgul kernel: ? rcu_implicit_dynticks_qs+0x1b3/0x210
Jan 15 20:01:50 nasgul kernel: ? rcu_gp_kthread+0x170/0x170
Jan 15 20:01:50 nasgul kernel: ? force_qs_rnp+0x14e/0x1d3
Jan 15 20:01:50 nasgul kernel: ? rcu_gp_init+0x497/0x497
Jan 15 20:01:50 nasgul kernel: ? rcu_gp_fqs_loop+0x231/0x47b
Jan 15 20:01:50 nasgul kernel: ? rcu_gp_kthread+0x154/0x170
Jan 15 20:01:50 nasgul kernel: ? kthread+0xe4/0xef
Jan 15 20:01:50 nasgul kernel: ? kthread_complete_and_exit+0x1b/0x1b
Jan 15 20:01:50 nasgul kernel: ? ret_from_fork+0x1f/0x30
Jan 15 20:01:50 nasgul kernel: </TASK>
Jan 15 20:01:50 nasgul kernel: rcu: Stack dump where RCU GP kthread last ran:
Jan 15 20:01:50 nasgul kernel: Sending NMI from CPU 29 to CPUs 18:
Jan 15 20:01:50 nasgul kernel: NMI backtrace for cpu 18
Jan 15 20:01:50 nasgul kernel: CPU: 18 PID: 15 Comm: rcu_preempt Tainted: P      D    O       6.1.118-Unraid #1
Jan 15 20:01:50 nasgul kernel: Hardware name: ASUS System Product Name/ProArt Z790-CREATOR WIFI, BIOS 2801 11/29/2024
Jan 15 20:01:50 nasgul kernel: RIP: 0010:native_queued_spin_lock_slowpath+0x15e/0x1cf
Jan 15 20:01:50 nasgul kernel: Code: cc c1 ee 12 83 e0 03 ff ce 48 c1 e0 05 48 63 f6 48 05 80 ed 02 00 48 03 04 f5 60 cb 16 82 48 89 10 8b 42 08 85 c0 75 04 f3 90 <eb> f5 48 8b 32 48 85 f6 74 bc 0f 0d 0e 8b 03 66 85 c0 74 04 f3 90
Jan 15 20:01:50 nasgul kernel: RSP: 0018:ffffc900000dfdd0 EFLAGS: 00000046
Jan 15 20:01:50 nasgul kernel: RAX: 0000000000000000 RBX: ffff88a03f22e040 RCX: 00000000004c0000
Jan 15 20:01:50 nasgul kernel: RDX: ffff88a03f4aed80 RSI: 0000000000000013 RDI: ffff88a03f22e040
Jan 15 20:01:50 nasgul kernel: RBP: 0000000000000012 R08: 0000000000000008 R09: 0000000000000000
Jan 15 20:01:50 nasgul kernel: R10: 0000000000000020 R11: 0000000000000365 R12: ffff88a03f4aed80
Jan 15 20:01:50 nasgul kernel: R13: 0000000000000000 R14: ffff88a03f22ee00 R15: 000000000002ee00
Jan 15 20:01:50 nasgul kernel: FS:  0000000000000000(0000) GS:ffff88a03f480000(0000) knlGS:0000000000000000
Jan 15 20:01:50 nasgul kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 15 20:01:50 nasgul kernel: CR2: 0000145e92497f20 CR3: 000000062fdd6000 CR4: 0000000000750ee0
Jan 15 20:01:50 nasgul kernel: PKRU: 55555554
Jan 15 20:01:50 nasgul kernel: Call Trace:
Jan 15 20:01:50 nasgul kernel: <NMI>
Jan 15 20:01:50 nasgul kernel: ? nmi_cpu_backtrace+0xd3/0x104
Jan 15 20:01:50 nasgul kernel: ? nmi_cpu_backtrace_handler+0xd/0x15
Jan 15 20:01:50 nasgul kernel: ? nmi_handle+0x54/0x131
Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0x15e/0x1cf
Jan 15 20:01:50 nasgul kernel: ? default_do_nmi+0x66/0x15b
Jan 15 20:01:50 nasgul kernel: ? exc_nmi+0xbf/0x11c
Jan 15 20:01:50 nasgul kernel: ? end_repeat_nmi+0x16/0x67
Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0x15e/0x1cf
Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0x15e/0x1cf
Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0x15e/0x1cf
Jan 15 20:01:50 nasgul kernel: </NMI>
Jan 15 20:01:50 nasgul kernel: <TASK>
Jan 15 20:01:50 nasgul kernel: do_raw_spin_lock+0x14/0x1a
Jan 15 20:01:50 nasgul kernel: raw_spin_rq_lock_nested+0x1b/0x26
Jan 15 20:01:50 nasgul kernel: _raw_spin_rq_lock_irqsave+0x15/0x1e
Jan 15 20:01:50 nasgul kernel: resched_cpu+0x26/0x56
Jan 15 20:01:50 nasgul kernel: rcu_implicit_dynticks_qs+0x1b3/0x210
Jan 15 20:01:50 nasgul kernel: ? rcu_gp_kthread+0x170/0x170
Jan 15 20:01:50 nasgul kernel: force_qs_rnp+0x14e/0x1d3
Jan 15 20:01:50 nasgul kernel: ? rcu_gp_init+0x497/0x497
Jan 15 20:01:50 nasgul kernel: rcu_gp_fqs_loop+0x231/0x47b
Jan 15 20:01:50 nasgul kernel: rcu_gp_kthread+0x154/0x170
Jan 15 20:01:50 nasgul kernel: kthread+0xe4/0xef
Jan 15 20:01:50 nasgul kernel: ? kthread_complete_and_exit+0x1b/0x1b
Jan 15 20:01:50 nasgul kernel: ret_from_fork+0x1f/0x30
Jan 15 20:01:50 nasgul kernel: </TASK>
Jan 15 20:01:50 nasgul kernel: rcu: INFO: rcu_preempt detected expedited stalls on CPUs/tasks: {
Jan 15 20:01:50 nasgul kernel: usb 2-7: USB disconnect, device number 2
Jan 15 20:01:50 nasgul kernel: device offline error, dev sde, sector 0 op 0x1:(WRITE) flags 0x800 phys_seg 0 prio class 2

Quote

January 15, 20251 yr

Author

Just now, alturismo said:

BIOS, ist aktuell

Ja, nicht mal mit einer nicht aktuellen Version das erste Mal gebootet. System ist erst 2 Monate alt, da gabs das BIOS schon. Unterstützt auch den 14900K. Overclocking ist aber aus und er taktet mit 3.2GHz, also ganz gemütlich.

1 minute ago, alturismo said:

WLAN oder Ethernet könnte das auslösen, onboard wifi mal deaktivieren (wenn machbar)

Ist seit Tag 1 deaktiviert. Genauso der 2,5GbE Port. Nutze nur das 10 GbE per LAN. Ist ein Marvell-Aqtion Adapter. Könnte auch den Intel (2,5GbE) aktivieren und mal probeweise nehmen.

3 minutes ago, alturismo said:

ggf. NIC auch (Metzwek onboard) und mit einer separaten wenn verfügbar mal testen

hab tatsächlich noch eine Intel X550-T2 rumliegen. Würde das mit den Segfaults zusammenpassen? Wobei ich in diesem Log keine gefunden habe

Aber mal nebenbei: sollte der Fehler dann nicht schon seit Tag 1 kommen? Mir ist noch nie das System eingefroren oder abgestürzt.

Eben kamen noch, ohne eine Änderung meinerseits, folgende Meldungen, was im Bezug auf das Netzwerk interessant sein könnten.

Jan 15 20:38:42 nasgul kernel: atlantic 0000:06:00.0 eth0: atlantic: link change old 10000 new 0
Jan 15 20:38:42 nasgul kernel: bond0: (slave eth0): link status definitely down, disabling slave
Jan 15 20:38:42 nasgul kernel: device eth0 left promiscuous mode
Jan 15 20:38:42 nasgul kernel: bond0: now running without any active interface!
Jan 15 20:38:42 nasgul kernel: br0: port 1(bond0) entered disabled state
Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: carrier lost
Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: deleting route to 10.0.0.0/16
Jan 15 20:38:43 nasgul avahi-daemon[13021]: Withdrawing address record for 10.0.2.1 on br0.
Jan 15 20:38:43 nasgul avahi-daemon[13021]: Leaving mDNS multicast group on interface br0.IPv4 with address 10.0.2.1.
Jan 15 20:38:43 nasgul avahi-daemon[13021]: Interface br0.IPv4 no longer relevant for mDNS.
Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: deleting default route via 10.0.0.1
Jan 15 20:38:45 nasgul ntpd[24025]: Deleting interface #1 br0, 10.0.2.1#123, interface stats: received=19, sent=19, dropped=0, active_time=900 secs
Jan 15 20:38:45 nasgul ntpd[24025]: 216.239.35.4 local addr 10.0.2.1 -> <null>
Jan 15 20:38:47 nasgul kernel: atlantic 0000:06:00.0 eth0: atlantic: link change old 0 new 10000
Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: carrier acquired
Jan 15 20:38:47 nasgul kernel: bond0: (slave eth0): link status definitely up, 10000 Mbps full duplex
Jan 15 20:38:47 nasgul kernel: bond0: (slave eth0): making interface the new active one
Jan 15 20:38:47 nasgul kernel: device eth0 entered promiscuous mode
Jan 15 20:38:47 nasgul kernel: bond0: active interface up!
Jan 15 20:38:47 nasgul kernel: br0: port 1(bond0) entered blocking state
Jan 15 20:38:47 nasgul kernel: br0: port 1(bond0) entered forwarding state
Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: rebinding lease of 10.0.2.1
Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: probing address 10.0.2.1/16
Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: leased 10.0.2.1 for infinity
Jan 15 20:38:51 nasgul avahi-daemon[13021]: Joining mDNS multicast group on interface br0.IPv4 with address 10.0.2.1.
Jan 15 20:38:51 nasgul avahi-daemon[13021]: New relevant interface br0.IPv4 for mDNS.
Jan 15 20:38:51 nasgul avahi-daemon[13021]: Registering new address record for 10.0.2.1 on br0.IPv4.
Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: adding route to 10.0.0.0/16
Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: adding default route via 10.0.0.1
Jan 15 20:38:51 nasgul network: hook services: interface=br0, reason=BOUND, protocol=dhcp
Jan 15 20:38:51 nasgul network: update services: 45s
Jan 15 20:38:54 nasgul ntpd[24025]: Listen normally on 2 br0 10.0.2.1:123
Jan 15 20:38:54 nasgul ntpd[24025]: new interface(s) found: waking up resolver

Quote

January 15, 20251 yr

1 minute ago, Xerxes said:

Könnte auch den Intel (2,5GbE) aktivieren und mal probeweise nehmen.

einfach mal zum Quertest würde ich das machen

2 minutes ago, Xerxes said:

Aber mal nebenbei: sollte der Fehler dann nicht schon seit Tag 1 kommen? Mir ist noch nie das System eingefroren oder abgestürzt.

der Meinung bin ich normal auch ... hier geht es tatsächlich mehr um "Ausschluss"

nur wenn es an einer Version liegen würde, downgrade geht immer, aber das hast du ja auch bereits durch ... nur weiter runter jetzt nicht mehr wegen zfs, dazu backup machen wenn man das nochmals testen wollte ...

alles was ich zu NMI gefunden habe war in Verbindung mit Netzwerkkarten ... daher sag ich ja auch, mir gehen die Ideen aus ...

Quote

January 16, 20251 yr

13 hours ago, alturismo said:

also may ideas to the syslog with new traces ...

Difficult to say if they are hardware or software related, one thing you can to try is to boot the server in safe mode with all docker containers/VMs disabled, let it run as a basic NAS for a few days, if there are still call traces or crashes it's likely a hardware problem, if it doesn't start turning on the other services one by one, including the docker containers.

Quote

1

January 16, 20251 yr

Author

Mir ist heute das System noch ein paarmal abgestürzt, auch nachts im idle.

Die verbundenen Docker liefen weiter, aber konnte einen laufenden Docker nicht neu aufrufen.

Habe mich entschieden, alle unersetzbaren Daten im Array auf andere, externe Festplatten zu schieben, mit Ubuntu to go einmal alles platt und den Rest einfach neu erstellen. Ein paar Docker hab ich intern gesichert.

Finde ich absehbarer als jetzt Ewigkeiten rum zu probieren. Möchte ein stabiles System, kein 50/50

Andere LAN-Schnittstelle hab ich nicht getestet.

Hatte mal testweise einen anderen RAM eingebaut, immer noch Segfault Meldungen.

Werde mir am Wochenende das mal vorknöpfen und fange mit paperless an und beobachte mal den log. Als ich die Sicherung gemacht habe mit

sudo docker exec paperless-ngx document_export ../export -f

musste ich den Befehl sicher so 10-15x ausführen, bis es ohne, jedes mal unterschiedliche, Fehler in python ging. Zu dem Zeitpunkt war nur Redis und Paperless am laufen.

Quote

January 17, 20251 yr

Author

On 1/15/2025 at 8:47 PM, Xerxes said:

Jan 15 20:38:42 nasgul kernel: atlantic 0000:06:00.0 eth0: atlantic: link change old 10000 new 0
Jan 15 20:38:42 nasgul kernel: bond0: (slave eth0): link status definitely down, disabling slave
Jan 15 20:38:42 nasgul kernel: device eth0 left promiscuous mode
Jan 15 20:38:42 nasgul kernel: bond0: now running without any active interface!
Jan 15 20:38:42 nasgul kernel: br0: port 1(bond0) entered disabled state
Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: carrier lost
Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: deleting route to 10.0.0.0/16
Jan 15 20:38:43 nasgul avahi-daemon[13021]: Withdrawing address record for 10.0.2.1 on br0.
Jan 15 20:38:43 nasgul avahi-daemon[13021]: Leaving mDNS multicast group on interface br0.IPv4 with address 10.0.2.1.
Jan 15 20:38:43 nasgul avahi-daemon[13021]: Interface br0.IPv4 no longer relevant for mDNS.
Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: deleting default route via 10.0.0.1
Jan 15 20:38:45 nasgul ntpd[24025]: Deleting interface #1 br0, 10.0.2.1#123, interface stats: received=19, sent=19, dropped=0, active_time=900 secs
Jan 15 20:38:45 nasgul ntpd[24025]: 216.239.35.4 local addr 10.0.2.1 -> <null>
Jan 15 20:38:47 nasgul kernel: atlantic 0000:06:00.0 eth0: atlantic: link change old 0 new 10000
Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: carrier acquired
Jan 15 20:38:47 nasgul kernel: bond0: (slave eth0): link status definitely up, 10000 Mbps full duplex
Jan 15 20:38:47 nasgul kernel: bond0: (slave eth0): making interface the new active one
Jan 15 20:38:47 nasgul kernel: device eth0 entered promiscuous mode
Jan 15 20:38:47 nasgul kernel: bond0: active interface up!
Jan 15 20:38:47 nasgul kernel: br0: port 1(bond0) entered blocking state
Jan 15 20:38:47 nasgul kernel: br0: port 1(bond0) entered forwarding state
Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: rebinding lease of 10.0.2.1
Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: probing address 10.0.2.1/16
Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: leased 10.0.2.1 for infinity
Jan 15 20:38:51 nasgul avahi-daemon[13021]: Joining mDNS multicast group on interface br0.IPv4 with address 10.0.2.1.
Jan 15 20:38:51 nasgul avahi-daemon[13021]: New relevant interface br0.IPv4 for mDNS.
Jan 15 20:38:51 nasgul avahi-daemon[13021]: Registering new address record for 10.0.2.1 on br0.IPv4.
Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: adding route to 10.0.0.0/16
Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: adding default route via 10.0.0.1
Jan 15 20:38:51 nasgul network: hook services: interface=br0, reason=BOUND, protocol=dhcp
Jan 15 20:38:51 nasgul network: update services: 45s
Jan 15 20:38:54 nasgul ntpd[24025]: Listen normally on 2 br0 10.0.2.1:123
Jan 15 20:38:54 nasgul ntpd[24025]: new interface(s) found: waking up resolver

Habe über Nacht das array gesichert auf externen Platten und es kam heute morgen einmal noch genau der gleiche Fehler. Alle docker deinstalliert und einziges Plugin war das unassigned devices.
Kann das am Atlantik Treiber liegen? Also tatsächlich das 10 GbE?

Evtl das neue setup mit 7.0.0 stable beginnen, da doch recht neue Hardware?

Quote

January 17, 20251 yr

Community Expert

4 hours ago, Xerxes said:

Habe über Nacht das array gesichert auf externen Platten und es kam heute morgen einmal noch genau der gleiche Fehler. Alle docker deinstalliert und einziges Plugin war das unassigned devices.
Evtl das neue setup mit 7.0.0 stable beginnen, da doch recht neue Hardware?

Ich würde wirklich ganz von Anfang an anfangen:

Anstatt Dich durch Deinstallationen zurück zu kämpfen, mach eine Sicherung (auch vom USB Stick mit key file) und beginne mit dem selben aber einmal komplett gelöschten USB Stick.

Aber dann sauber neu installiertem unraid mit dem alten keyfile und lass das mal so einige Zeit laufen. Wenn das/ein Problem wieder auftaucht hat man einen definierten Grundzustand und der ist eigentlich ziemlich stabil. Das würde dann wirklich auf Hardwareprobleme hin deuten.

Ob Du nun 7 stable oder 6.12.14 stable nimmst sollte egal sein, da Lime ja meint, daß 7 stable nun weit genug gereift sei.

Quote

January 17, 20251 yr

Author

19 minutes ago, DataCollector said:

Ob Du nun 7 stable oder 6.12.14 stable nimmst sollte egal sein, da Lime ja meint, daß 7 stable nun weit genug gereift sei.

Ich meinte Hauptsächlich im Bezug auf den atlanic Treiber im Kernel

Quote

January 17, 20251 yr

Author

Backup abgeschlossen, alles auf den Disks gelöscht, Array und Cache Pool neu formatiert, alles von Grund auf von vorne begonnen mit 7.0.0. Nur media-Ordner ist noch alt.

Nach 3-4h up-time und nur Paperless mit Redis installiert kommt schon der erste Segfault, aber ohne Systemabsturz. Kann gut sein, dass das schon immer war und ich es einfach nie gesehen habe, da mein log bis vor kurzem mit aspm-Meldungen geflutet wurde.

Jan 17 21:05:04 nasgul kernel: [celeryd: celer[949456]: segfault at 28 ip 000015267a4c77d8 sp 00007ffcc194eeb0 error 4 in libpython3.12.so.1.0[15267a2b8000+216000] likely on CPU 4 (core 8, socket 0)
Jan 17 21:05:04 nasgul kernel: Code: 89 44 24 38 31 c0 48 89 56 38 4d 8d bc 24 c0 00 00 00 49 8b 8c 24 a8 00 00 00 4c 29 fa 48 89 d0 48 d1 f8 4c 63 f0 4b 8d 2c 36 <48> 03 69 28 83 7f 2c 00 74 27 0f b6 45 00 48 8b 54 24 38 64 48 2b

Der Fehler kam genau 4s nach dem Ausführen der 5-minütigen Abfrage der Mails und in Paperless standen auch Fehler.

Da dieser Fehler immer auf CPU 4 (core 8, socket 0) kommt ist das für mich naheliegend, dass die CPU was hat.

Plex habe ich mich noch nicht getraut zu installieren, wollte erstmal die Daten wieder sauber zurückspielen ohne crashes.

Kennt ihr gute Tools, mit denen man sowas testen kann? Also eventuell defekte Cores auf Leistung testen. Ich glaube, dass Windows hier zu weit weg von der Hardware ist.

Quote

January 17, 20251 yr

Community Expert

14 minutes ago, Xerxes said:

Da dieser Fehler immer auf CPU 4 (core 8, socket 0) kommt ist das für mich naheliegend, dass die CPU was hat.

Ich glaube die Intel Core i9 14900K gehört zu den CPUs, die sich mit der Zeit 'selbst zerstören' (overclocking würde es nur beschleunigen).

Intel hat auf die betroffenen CPUs die Garantiezeit erhöht.

Vielleicht solltest Du die CPU mal richtig stressen (Prime95 ein paar Tage drauf laufen lassen) und schauen ob es Aussetzer gibt.

https://www.heise.de/download/product/prime95-36233

Intel selber hat auch irgendsoein (habgares) CPU Testtool.

https://www.intel.de/content/www/de/de/support/articles/000005567/processors.html

Spätestens wenn sich da etwas negatives Zeigt wird es Zeit für die Garantie.

Kannst ja schon mal den Kaufbeleg suchen gehen, während das System sich testet.

https://www.computerbase.de/news/prozessoren/instabile-raptor-lake-cpus-intel-verlaengert-garantie-von-13-und-14-gen-um-zwei-jahre.89079/

Edited January 17, 20251 yr by DataCollector

Quote

January 17, 20251 yr

Author

11 minutes ago, DataCollector said:

Intel hat auf die betroffenen CPUs die Garantiezeit erhöht.

Gut zu wissen. Tatsächlich ist der Chip recht neu (2 Monate) und dank Paperless, wenn es doch funktioniert, die Rechnung schnell auffindbar. CPU wurde nicht einmal übertaktet. Da das so ein Beast ist und ich die ganze Zeit noch keine Zeit zum zocken hatte, hat die warscheinlich noch nie über 10% gemacht unter Linux.

Habe vorhin auch schon drüber nachgedacht, einfach nen Garantieantrag zu stellen. Aber ich sehs dann kommen und die entweder die CPU hat nix und ich muss die Überprüfung zahlen oder die macht einfach bei der Prüfung alles wunderbar mit und ich bin wieder am Anfang.

Aber da der Fehler, wie eben schon geschrieben, wirklich ausschließlich auf core 8 auftritt und RAM i.O. ist, glaube ich immer mehr, dass es ein HW Problem ist.

15 minutes ago, DataCollector said:

Vielleicht solltest Du die CPU mal richtig stressen (Prime95 ein paar Tage drauf laufen lassen) und schauen ob es Aussetzer gibt.

https://www.heise.de/download/product/prime95-36233

Sobald meine Parität fertig überprüft hat werde ich mal das Prime95 anschauen. Sieht man da dann auch, was genau der Fehler ist? Das Intel Tool hatte ich schon mal getestet, ist eher so määh.

Quote

Segfault on Cerley | dotnet | tesseract | python | gunicorn

Featured Replies

Solved by Xerxes

Join the conversation

Account

Navigation

Search

Configure browser push notifications

Chrome (Android)

Chrome (Desktop)

Safari (iOS 16.4+)

Safari (macOS)

Edge (Android)

Edge (Desktop)

Firefox (Android)

Firefox (Desktop)