January 14, 20251 yr Hallo, seit kurzem habe ich das Problem, dass ich viele "Segfault"-Fehler im Log habe und teilweise deswegen meine Container abstürzen. Es kommt gefühlt immer öfter vor. Ich kann nicht sagen, wie lange der Fehler schon im Log steht, aber meine Container stürzen erst seit ein paar Tagen ab. Was ich bereits gemacht habe: Memtest, auch mit einzeln gestecken RAMs -> min. je 4 Durchgänge -> Pass System mit nur einem RAM gestartet -> Fehler kommt auch Boot-Stick neu aufgesetzt (config kopiert von vor der Neuinstallation) -> Keine Änderung CPU-Test (Intel Processor Diagnostics Tool) (Auf einer Win-Installation auf einer NVMe ohne VM) -> Pass Cinebench 30 Min Single Core Test -> keine Auffälligkeiten Fehlerbeschreibung: Der Fehler tritt hauptsächlich (quasi nur) auf, wenn paperless-ngx Dokumente verarbeitet. Das Komische: Kein Update von irgendwas gemacht, was den Kernel-Fehler verursachen könnte. Wenn ich ein Dokument (irgend ein pdf) hochlade, kommt sporadisch der Fehler und das pdf kann nicht verarbeitet werden. Wenn ich es dann nochmal hochlade, geht es zu 70%. Wenn nicht, beim dritten Mal. Außerdem stürzt auch gerne der "Umlautadaptarr" mit einem dotnet-Fehler ab. Andere Container scheinen stabil. Hardware: CPU: Intel Core i9 14900K (kein overclocking!) MB: Asus Proart Z790 Creator Wifi RAM: 4x 32GB Crucial Pro GPU: Nvidia 4070ti super (Passtrhrought VM) Storage: 2x WD Black 770 1 TB for Cache (Raid1) Storage VM: 1x WD Black 7701 TB , 1x WD Black 770 2 TB (Passthrought VM) Main-Storage: 3x Seagate Ironwolf Pro 20TB Software: Unraid 6.10.14, error kommt auch in 7.0.0 Anbei mein syslog von 7.0.0 und 6.10.14. Im log von 6.10.14 ist es am Schluss des logs sehr deutlich zu erkennen, was ich meine. Hier habe ich noch meinen Reddit-Beitrag, in dem ich noch die alten Fehlercodes angehängt habe. Außerdem sind hier die Fehlercodes in vom paperless log. Hier ein kleiner Einblick: Jan 12 17:50:50 nasgul kernel: gunicorn: worke[403374]: segfault at 0 ip 0000152757318d07 sp 0000152754296950 error 4 in libpython3.12.so.1.0[1527572fe000+215000] likely on CPU 4 (core 8, socket 0) Jan 12 20:22:03 nasgul kernel: python3[1107071]: segfault at 28 ip 0000152cb9b0cc38 sp 00007ffea28e5f60 error 4 in libpython3.12.so.1.0[152cb98fe000+215000] likely on CPU 4 (core 8, socket 0) Jan 12 20:23:59 nasgul kernel: [celeryd: celer[1115918]: segfault at 28 ip 0000145ab730cc38 sp 00007ffe77d20d60 error 4 in libpython3.12.so.1.0[145ab70fe000+215000] likely on CPU 4 (core 8, socket 0) Jan 12 20:39:16 nasgul kernel: tesseract[1189108]: segfault at 4135999a ip 0000152afba614de sp 00007fff60247b30 error 4 in libtesseract.so.5.0.3[152afb886000+225000] likely on CPU 4 (core 8, socket 0) Ich habe keine Ahnung, wie ich als nächstes vorgehen soll, was ich testen kann, ob ich bei der Hardware (Immer Core 8 im log) oder bei der Software suchen soll. System ist ca. 2 Monate alt. syslog 7.0.0.zip syslog 6.10.14.zip
January 15, 20251 yr 8 hours ago, Xerxes said: Ich habe keine Ahnung, wie ich als nächstes vorgehen soll, was ich testen kann, ob ich bei der Hardware (Immer Core 8 im log) was mich etwas verwundert, python Fehler auf dem Host ohne Python installiert zu haben läuft paperless im priviledged mode ? wenn ja, deaktivieren. ansonsten hast du nicht nur segfaults ... sonder Kernel Traces im Bezug auf btrfs ... ein leidiges Thema. da dein Docker Setup auf "Verzeichnis" eingestellt ist könnte es damit zusammenhängen, das würde ich als erstes fixen ... Ansätze ... 1/ zumindest scrub ausführen und schauen ob das hilft 2/ Daten weg sichern (außer /system/docker/), cache pool neu formatieren, Sicherung retour spielen, Docker neu installieren >> Docker Tab, add, dropdown, user templates >> Start Parameter liegen auf dem Stick, persistent Daten unter /appdata, alles bleibt erhalten 3/ kein btrfs nutzen (Suche oben rechts im Forum zu btrfs) dann schauen ob noch was kommt ...
January 15, 20251 yr Author Paperless läuft nicht im privileged mode. Ich hatte mal spaßeshalber python 3 installiert, um wegen den Bibliotheksfehlern zu schauen, ob die dann weg gehen. Hatte nichts geändert. Die Kernel Fehler bzgl. btrfs hatte ich im ersten Schritt mal ignoriert und gehofft, dass das keinen Zusammenhang hat. Was schafft da Abhilfe? Cache anders formatieren? Geht das überhaupt? Bzgl. des Docker-Setups "Verzeichnis": Ich hatte mir zur ersten Einrichtung von Unraid das Video von TheGeekFreaks auf YT angeschaut, und der Alex hat das empfohlen (Falls das img sich zerschießt, sind nicht gleich alle Docker kaputt). Habe ich ohne Fragen übernommen, hat für mich Sinn ergeben. Soll ich das besser auf btrfs-/ xfs-Verzeichnis stellen? Scrub schuf keine Abhilfe. Werde ich später nach der Arbeit mal machen. Cache dann aber mit btrfs formatieren? Hier werde ich nicht ganz schlau, was genau du meinst. Aber ganz allgemein meinst du, dass das eher ein Software- statt eines Hardware-Fehlers ist?
January 15, 20251 yr 14 minutes ago, Xerxes said: Paperless läuft nicht im privileged mode. ok, wundert mich aber dann ... 14 minutes ago, Xerxes said: Die Kernel Fehler bzgl. btrfs hatte ich im ersten Schritt mal ignoriert und gehofft, dass das keinen Zusammenhang hat. Was schafft da Abhilfe? Cache anders formatieren? Geht das überhaupt? naja, ein Filesystem zu ignorieren ist kein guter Plan, du machst auch Backups hoffe ich doch 15 minutes ago, Xerxes said: Bzgl. des Docker-Setups "Verzeichnis": Ich hatte mir zur ersten Einrichtung von Unraid das Video von TheGeekFreaks auf YT angeschaut, und der Alex hat das empfohlen kommentiere ich ganz sicher nicht 15 minutes ago, Xerxes said: Scrub schuf keine Abhilfe. fast erwartet 15 minutes ago, Xerxes said: Werde ich später nach der Arbeit mal machen. Cache dann aber mit btrfs formatieren? wenn du bei btrfs bleiben willst 16 minutes ago, Xerxes said: Hier werde ich nicht ganz schlau, was genau du meinst. es gibt zig Issues wo das btrfs Filesystem immer wieder Fehler verursacht, System hängen bleibt, ... daher bei raid_N pools eher mal zfs nutzen oder auf single drive caches wechseln in xfs und Backup Strategie umsetzen !!! daher, Suche "oben rechts >> btrfs" 17 minutes ago, Xerxes said: Aber ganz allgemein meinst du, dass das eher ein Software- statt eines Hardware-Fehlers ist? aus dem "Bauch" raus, ja, im Zusammenhang evtl. mit deinem "nicht sauber laufenden" btrfs cache ...
January 15, 20251 yr Author Cache gesichert (außer /system/docker), neu als zfs raid1 formatiert, Docker-image als xfs.img eingestellt, alle Daten zurückgespielt und die Docker neu hinzugefügt. Ist es normal, dass ich beim Sichern des Cache auf eine externe SSD eine Schreibgeschwindigkeit von ca. 400MB/s habe und beim zurückspielen der Daten nur noch 200MB/s? Ist der overhead bei zfs so arg? Das Gute: Pools sind nun so 5°C kälter. Das Schlechte: Nun kommen andere Docker mit Segfaults in der libpython (zb Plex) und stürzen ab. Außerdem startet nun paperless erst beim 4-7 Anlauf. Sonst stürzt es direkt nach dem Start ab und im log steht wieder "segfault...libpython..." oder "ld-linux-x86-64.so.2". Habe nochmal python 3 installiert, keine Abhilfe In der Übersicht kam nun ein neues Symbol dazu, das seit der Formatierung des Pools auf 100% steht Gehört das so? Beim Hover darüber steht 3.15 GiB Anbei nochmal ein aktueller Log von eben mit den letzten "segfault "Meldungen diagnostics-20250115-1233.zip
January 15, 20251 yr Author Mein System hat sich jetzt seit heute Mittag 3x aufgehängt und es half nur ein hard reset. Ssh, WEBGui, geöffnete Docker, Web-Terminal, Web-Log, alles eingefroren. Nach ein paar Minuten kam "Internal Server Error 500" auf dem Browser. Bildschirm angesteckt, keine Ausgabe der Konsole. "Ins blaue" mal angemeldet und reboot getippt, nichts passiert. Logs hab ich leider keine davon, da ja nur ab boot gespeichert wird. Ab dem ersten Hängen hatte ich parallel den Live-Log offen, um vielleicht noch die letzte Meldung vor Crash zu bekommen. Erfolglos. Nur Statusmeldungen von irgendwelchen Plugins. Mache im Moment einen Segmenttest meines Boot-Sticks, sieht nach den ersten beiden Durchgängen noch gut aus. Wenn ich parallel boote über die NVMe auf Windows funktioniert Windows laut Ereignisanzeige auch problemlos, also wird wohl irgendwas Unraid-Spezifisches sein. Das System hat sich alle dreimal aufgehängt, als ich Filme von Radarr umbenennen hab lassen. Nach dem neu booten war die Datei jedoch noch nicht umbenannt. Rechte des Film-Ordners und die Ordner darunter sind -rwxrwxrwx und Besitzer ist "root", falls diese Info hilft. Kann das Problem beim Kernel liegen und ich sollte es nochmal mit den zfs-Pools mit 7.0.0 versuchen? Bin echt Ratlos und hab schon ein bisschen Hass auf das System... Da der Fehler doch sehr sporadisch kommt, hab ich keine Ahnung wo ich anfangen soll. Edited January 15, 20251 yr by Xerxes Tippfehler behoben
January 15, 20251 yr Community Expert 4 hours ago, Xerxes said: Cache gesichert (außer /system/docker), neu als zfs raid1 formatiert, Docker-image als xfs.img eingestellt, alle Daten zurückgespielt und die Docker neu hinzugefügt. Du hast also den angeschlagenen 8wegen vorheriger möglicher btrfs Fehler) Cache gesichert und zurückgespielt? Bist Du Dir sicher, daß die ateien nicht immer noch beschädigt sind? Entferne doch mal die Docker (vorher Backup machen) und installiere sie über Add Pool und bestehende templates neu. Warum unbedingt zfs? muß es ein raid1 sein? Du siehst ja, daß es dir hier nicht hilft. Soviel zu Ausfallsicherheit durch Raid1
January 15, 20251 yr Author Die Sicherung beinhaltete mnt/appdata, mnt/domains und mnt/system/libvirt. Dateien, die ich nicht erneut erstellen wollte. Die Container habe ich nach dem zurückspielen der appdata alle neu installiert. Oder was genau meinst du mit 6 minutes ago, DataCollector said: Bist Du Dir sicher, daß die ateien nicht immer noch beschädigt sind? Muss nicht zfs sein. Muss auch nicht RAID1 sein. Aber da ich keine Erfahrungen hiermit habe und mir empfohlen wurde von btrfs weg zu gehen, bin ich eben auf zfs gewechselt.
January 15, 20251 yr 4 hours ago, Xerxes said: Anbei nochmal ein aktueller Log von eben mit den letzten "segfault "Meldungen für was soll das sein ? war heute früh auch nicht drin ... # Setting environment of docker sysctl -w vm.overcommit_memory=1 hier ist auch ein python plugin installiert, brauchst du das auf dem host ? oder war das nur zum Test ? wenn zum Test, weg damit ... lrwxrwxrwx 1 root root 33 Jan 15 11:14 dwpython.plg -> /boot/config/plugins/dwpython.plg hast du was im Zusammenhang mit Plex laufen ? irritiert mich alles etwas ... user scripts ? Jan 15 09:03:47 nasgul kernel: Plex Script Hos[21214]: segfault at 0 ip 0000000000000000 sp 00007ffec1245828 error 14 likely on CPU 4 (core 8, socket 0) 16 minutes ago, Xerxes said: Muss nicht zfs sein. Muss auch nicht RAID1 sein. Aber da ich keine Erfahrungen hiermit habe und mir empfohlen wurde von btrfs weg zu gehen, bin ich eben auf zfs gewechselt. du hast keine Filesystem Fehler mehr ... das passt schon soweit. auch keine trace errors mehr ... du hast jetzt umgestellt auf xfs image (auf einem zfs pool) anstelle directory ... das würde ich jetzt nicht machen, lass es auf directory ... einmal neu bitte Jan 15 08:23:29 nasgul root: Creating new image file: '/mnt/user/system/docker/docker-xfs.img' size: 20G Jan 15 08:23:29 nasgul root: meta-data=/mnt/cache/system/docker/docker-xfs.img isize=512 agcount=4, agsize=1310720 blks es bleiben die traps errors Zeile 4114: Jan 15 09:16:25 nasgul kernel: traps: dotnet[8006] general protection fault ip:1554164ac50f sp:7ffe0584a520 error:0 in libc.so.6[1554164ac000+155000] Zeile 4401: Jan 15 09:27:13 nasgul kernel: traps: dotnet[11051] general protection fault ip:151fdfa9d50f sp:7ffe867bb910 error:0 in libc.so.6[151fdfa9d000+155000] Zeile 5175: Jan 15 10:05:01 nasgul kernel: traps: [celeryd: celer[20868] general protection fault ip:14d12b596ec5 sp:7ffe95d7c440 error:0 in libpython3.12.so.1.0[14d12b4a6000+216000] und segfaults (deinstallier bitte das python Teil sofern nicht gebraucht) Zeile 2283: Jan 15 00:00:00 nasgul kernel: [celeryd: celer[2052]: segfault at 28 ip 000014ba9450d788 sp 00007ffef9fc33f0 error 4 in libpython3.12.so.1.0[14ba942fe000+216000] likely on CPU 4 (core 8, socket 0) Zeile 2291: Jan 15 00:30:04 nasgul kernel: [celeryd: celer[10075]: segfault at 28 ip 000014ba9450d788 sp 00007ffef9fc3400 error 4 in libpython3.12.so.1.0[14ba942fe000+216000] likely on CPU 4 (core 8, socket 0) Zeile 3247: Jan 15 07:49:13 nasgul kernel: python3[3408]: segfault at 28 ip 000014b77a50d788 sp 00007fffe9085500 error 4 in libpython3.12.so.1.0[14b77a2fe000+216000] likely on CPU 4 (core 8, socket 0) Zeile 4006: Jan 15 09:03:47 nasgul kernel: Plex Script Hos[21214]: segfault at 0 ip 0000000000000000 sp 00007ffec1245828 error 14 likely on CPU 4 (core 8, socket 0) Zeile 4027: Jan 15 09:04:27 nasgul kernel: Plex Script Hos[1594]: segfault at fffffffffffffff0 ip 0000150c1bfedb52 sp 00007ffcd32f3110 error 5 in libpython27.so[150c1bf3f000+179000] likely on CPU 4 (core 8, socket 0) Zeile 4419: Jan 15 09:28:32 nasgul kernel: supervisord[23138]: segfault at 28 ip 0000146d6bc187d8 sp 00007ffdfd36c500 error 4 in libpython3.12.so.1.0[146d6ba09000+216000] likely on CPU 4 (core 8, socket 0) Zeile 4433: Jan 15 09:29:23 nasgul kernel: python3[27732]: segfault at 0 ip 0000000000000000 sp 00007ffeda2ac580 error 14 likely on CPU 4 (core 8, socket 0) Zeile 4474: Jan 15 09:30:28 nasgul kernel: python3[3151]: segfault at 28 ip 0000154eac3ce7d8 sp 00007ffd0e429a30 error 4 in libpython3.12.so.1.0[154eac1bf000+216000] likely on CPU 4 (core 8, socket 0) Zeile 4481: Jan 15 09:31:02 nasgul kernel: Plex Script Hos[5842]: segfault at 8 ip 000014ea72f8b9e0 sp 00007ffca3d2d090 error 4 in libpython27.so[14ea72ea5000+179000] likely on CPU 4 (core 8, socket 0) Zeile 5487: Jan 15 10:55:08 nasgul kernel: python3[28227]: segfault at 28 ip 00001510dba967d8 sp 00007ffce750ca70 error 4 in libpython3.12.so.1.0[1510db887000+216000] likely on CPU 4 (core 8, socket 0) @JorgeB an idea for the traps and segfaults maybe ? also, FS an sich jetzt ok, docker image bitte neu als Verzeichnis machen, Python weg ... dann nochmals beobachten, ansonsten sieht man nichts ...
January 15, 20251 yr Author Danke schonmal für diese Mühen! # Setting environment of docker sysctl -w vm.overcommit_memory=1 Das habe ich geschrieben, dass Redis nicht mehr pienst, da in den Redis logs diese Meldung (man solle den Parameter auf 1 Setzen) als Warnung steht. Hatte gehofft, dass sich Paperless gewissenhafter mit Redis verbinden kann. Vergeblich. Trotzdem ist die Warnung weg. Ich schätze mal bei 128GB RAM sollte das keine Probleme bereiten. lrwxrwxrwx 1 root root 33 Jan 15 11:14 dwpython.plg -> /boot/config/plugins/dwpython.plg Das Python Plugin hatte ich auch nur zum testen installiert, ist aktuell wieder entfernt. 6 minutes ago, alturismo said: hast du was im Zusammenhang mit Plex laufen ? irritiert mich alles etwas ... user scripts ? Plex an sich läuft eigenständig. Es ist nur die Beobachtungsliste per RSS-Feed mit Sonarr/Radarr/Lidarr verbunden. Sonst keine Verbindung, keinerlei user-scripts. 7 minutes ago, alturismo said: du hast keine Filesystem Fehler mehr ... das passt schon soweit. auch keine trace errors mehr ... Meinst du, ich soll alle Daten im Cache neu erstellen? Ist enorm viel Arbeit. 9 minutes ago, alturismo said: es bleiben die traps errors Da steht auch was von celeryd, also hatte ich hier angesetzt und eben die Warnung mit sysctl -w vm.overcommit_memory=1 versucht zu beheben.
January 15, 20251 yr 6 minutes ago, Xerxes said: Meinst du, ich soll alle Daten im Cache neu erstellen? Ist enorm viel Arbeit. Nein, nur das Docker Image 1/ Settings, Docker, Docker Dienst stop 2/ Docker Image löschen 3/ Docker Verzeichnis einstellen 4/ Docker Dienst Start 5/ Docker entweder unter Docker Tab, add Container, dropdown ... geht ja schnell und alles bleibt erhalten ... dein Cache Drive an sich wirft keine Fehler mehr aus, nur ein xfs Image auf ein zfs pool würde ich einfach ausschließen wollen ...
January 15, 20251 yr 9 minutes ago, Xerxes said: versucht zu beheben. mach das bitte auch weg ... lass mal Standard ... Ausschluss Verfahren ...
January 15, 20251 yr Community Expert 1 hour ago, Xerxes said: Die Sicherung beinhaltete mnt/appdata, mnt/domains und mnt/system/libvirt. Sind das die selben dateien, die dann auf den neu formatierten cache zurückgespielt wurden? Sind die definitiv nicht ggf. beschädigt? 1 hour ago, Xerxes said: Muss nicht zfs sein. Muss auch nicht RAID1 sein. Aber da ich keine Erfahrungen hiermit habe und mir empfohlen wurde von btrfs weg zu gehen, bin ich eben auf zfs gewechselt. Weg von btrfs: da bin ich voll dabei. Aber wenn es kein raid1 sein soll, wäre für Einzelne Datenträger xfs meine Wahl. zfs eben nur, wenn es ein raid (-ähnliches Verhalten) sein soll.
January 15, 20251 yr Author 2 hours ago, alturismo said: dein Cache Drive an sich wirft keine Fehler mehr aus, nur ein xfs Image auf ein zfs pool würde ich einfach ausschließen wollen ... Habe ich gemacht. 5 Minuten später hat sich das System wieder aufgehängt. Das maximale, was ich hin bekommen habe, ist der log aus dem Webterminal, da GUI nicht reagiert. Vielleicht hilft das. Die rot markierten Stellen im log sind Jan 15 19:59:22 nasgul kernel: Call Trace: Jan 15 19:59:22 nasgul kernel: CPU: 8 PID: 17145 Comm: Plex Media Scan Tainted: P D O 6.1.118-Unraid #1 Jan 15 19:59:22 nasgul kernel: Call Trace: Jan 15 19:59:44 nasgul kernel: CPU: 8 PID: 17145 Comm: Plex Media Scan Tainted: P D O 6.1.118-Unraid #1 Jan 15 19:59:44 nasgul kernel: Call Trace: Jan 15 19:59:44 nasgul kernel: CPU: 29 PID: 26936 Comm: Plex Media Scan Tainted: P D O 6.1.118-Unraid #1 Jan 15 19:59:44 nasgul kernel: Call Trace: Jan 15 20:01:50 nasgul kernel: Call Trace: Jan 15 20:01:50 nasgul kernel: CPU: 18 PID: 15 Comm: rcu_preempt Tainted: P D O 6.1.118-Unraid #1 Jan 15 20:01:50 nasgul kernel: Call Trace: Jan 15 20:01:50 nasgul kernel: device offline error, dev sde, sector 0 op 0x1:(WRITE) flags 0x800 phys_seg 0 prio class 2 mehr konnte ich nicht retten. Was zu dem Zeitpunkt /dev/sde war, kann ich nicht sagen. Irgendwie kommt es mir vor, als wenn der Fehler von Paperless zu Plex übergegangen ist... 2 hours ago, alturismo said: mach das bitte auch weg ... lass mal Standard ... Ausschluss Verfahren ... Ist auch weg. Stick ist neu aufgesetzt, config übernommen. go-file wieder auf Standard, python.plg ist runter. Musste das System eben wieder killen per Ausknopf. 0,0 Reaktion mehr. Tut jedes mal weh unraid log 20250115-2009.txt
January 15, 20251 yr 11 minutes ago, Xerxes said: Musste das System eben wieder killen per Ausknopf. 0,0 Reaktion mehr. Tut jedes mal weh glaub ich ... und da sind wieder harte tracelogs, wenn ich mal etwas google ... BIOS, ist aktuell WLAN oder Ethernet könnte das auslösen, onboard wifi mal deaktivieren (wenn machbar) ggf. NIC auch (Metzwek onboard) und mit einer separaten wenn verfügbar mal testen ansonsten ... fällt mir tatsächlich nicht wirklich mehr ein so langsam ... @JorgeB also may ideas to the syslog with new traces ... Jan 15 19:59:22 nasgul kernel: CR2: ffffc9005be33f58 CR3: 0000000541164000 CR4: 0000000000750ef0 Jan 15 19:59:22 nasgul kernel: PKRU: 55555554 Jan 15 19:59:22 nasgul kernel: Call Trace: Jan 15 19:59:22 nasgul kernel: <TASK> Jan 15 19:59:22 nasgul kernel: ? __die_body+0x1a/0x5c Jan 15 19:59:22 nasgul kernel: ? page_fault_oops+0x329/0x376 Jan 15 19:59:22 nasgul kernel: ? exc_page_fault+0xf4/0x11d Jan 15 19:59:22 nasgul kernel: ? asm_exc_page_fault+0x22/0x30 Jan 15 19:59:22 nasgul kernel: ? do_user_addr_fault+0x246/0x465 Jan 15 19:59:22 nasgul kernel: ? exc_page_fault+0xfb/0x11d Jan 15 19:59:22 nasgul kernel: ? asm_exc_page_fault+0x22/0x30 Jan 15 19:59:22 nasgul kernel: </TASK> Jan 15 19:59:22 nasgul kernel: Modules linked in: ext4 mbcache jbd2 xt_CHECKSUM ipt_REJECT nf_reject_ipv4 ip6table_mangle ip6table_nat iptable_mangle vhost_net tun vhost vhost_iotlb tap veth xt_nat xt_tcpudp xt_conntrack xt_MASQUERADE nf_conntrack_netlink nfnetlink xfrm_user xfrm_algo iptable_nat nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 xt_addrtype br_netfilter xfs md_mod tcp_diag inet_diag nct6775 nct6775_core hwmon_vid ip6table_filter ip6_tables iptable_filter ip_tables x_tables efivarfs af_packet 8021q garp mrp bridge stp llc bonding tls zfs(PO) i915 intel_rapl_msr intel_rapl_common x86_pkg_temp_thermal zunicode(PO) intel_powerclamp coretemp zzstd(O) iosf_mbi drm_buddy i2c_algo_bit kvm_intel ttm zlua(O) drm_display_helper btusb btrtl zavl(PO) btbcm btintel drm_kms_helper icp(PO) kvm bluetooth drm crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel sha512_ssse3 sr_mod zcommon(PO) sha256_ssse3 cdrom sha1_ssse3 ecdh_generic aesni_intel ecc znvpair(PO) intel_gtt crypto_simd cryptd rapl Jan 15 19:59:22 nasgul kernel: spl(O) intel_cstate mei_hdcp mei_pxp wmi_bmof mpt3sas thunderbolt i2c_i801 nvme intel_uncore atlantic agpgart mei_me i2c_smbus nvme_core ahci raid_class i2c_core mei scsi_transport_sas libahci syscopyarea sysfillrect vmd sysimgblt thermal fb_sys_fops fan video tpm_crb tpm_tis tpm_tis_core wmi tpm backlight intel_pmc_core acpi_pad acpi_tad button unix Jan 15 19:59:22 nasgul kernel: CR2: ffffc9005be33f58 Jan 15 19:59:22 nasgul kernel: ---[ end trace 0000000000000000 ]--- Jan 15 19:59:22 nasgul kernel: RIP: 0010:mutex_lock+0xf/0x2e Jan 15 19:59:22 nasgul kernel: Code: 03 59 eb c9 31 c0 5a c3 cc cc cc cc 0f 1f 44 00 00 be 02 00 00 00 e9 88 fc ff ff 0f 1f 44 00 00 51 48 89 3c 24 e8 13 f3 ff ff <31> c0 48 8b 3c 24 65 48 8b 14 25 80 cb 01 00 f0 48 0f b1 17 74 03 Jan 15 19:59:22 nasgul kernel: RSP: 0018:ffffc9006b1878b0 EFLAGS: 00010286 Jan 15 19:59:22 nasgul kernel: RAX: 0000000000000000 RBX: 00000000000046e0 RCX: 0000000000000000 Jan 15 19:59:22 nasgul kernel: RDX: 0000000080000000 RSI: 9f01b21ff904f6c9 RDI: ffffffffa124a620 Jan 15 19:59:22 nasgul kernel: RBP: 000000000000017a R08: 9ae16a3b2f90408f R09: 9ae16a3b2f90404f Jan 15 19:59:22 nasgul kernel: R10: 0000000000000000 R11: 0000008000000000 R12: 000000000013497a Jan 15 19:59:22 nasgul kernel: R13: 0000000000000036 R14: 0000000000000000 R15: 0000000000000000 Jan 15 19:59:22 nasgul kernel: FS: 0000000000000000(0000) GS:ffff88a03f000000(0000) knlGS:0000000000000000 Jan 15 19:59:22 nasgul kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 Jan 15 19:59:22 nasgul kernel: CR2: ffffc9005be33f58 CR3: 0000000541164000 CR4: 0000000000750ef0 Jan 15 19:59:22 nasgul kernel: PKRU: 55555554 Jan 15 19:59:22 nasgul kernel: note: zfs[27093] exited with irqs disabled Jan 15 19:59:22 nasgul kernel: kernel tried to execute NX-protected page - exploit attempt? (uid: 99) Jan 15 19:59:22 nasgul kernel: BUG: unable to handle page fault for address: ffff888596a5d000 Jan 15 19:59:22 nasgul kernel: #PF: supervisor instruction fetch in kernel mode Jan 15 19:59:22 nasgul kernel: #PF: error_code(0x0011) - permissions violation Jan 15 19:59:22 nasgul kernel: PGD 4c01067 P4D 4c01067 PUD 80000005800001e3 Jan 15 19:59:22 nasgul kernel: Oops: 0011 [#3] PREEMPT SMP NOPTI Jan 15 19:59:22 nasgul kernel: CPU: 8 PID: 17145 Comm: Plex Media Scan Tainted: P D O 6.1.118-Unraid #1 Jan 15 19:59:22 nasgul kernel: Hardware name: ASUS System Product Name/ProArt Z790-CREATOR WIFI, BIOS 2801 11/29/2024 Jan 15 19:59:22 nasgul kernel: RIP: 0010:0xffff888596a5d000 Jan 15 19:59:22 nasgul kernel: Code: 28 73 65 6c 66 2e 70 74 72 2c 20 69 6e 64 65 78 2c 20 64 69 6d 65 6e 73 69 6f 6e 2c 20 62 79 72 65 66 28 63 5f 64 6f 75 62 6c <00> 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 08 00 Jan 15 19:59:22 nasgul kernel: RSP: 0018:ffffc9000092fea0 EFLAGS: 00010046 Jan 15 19:59:22 nasgul kernel: RAX: 0000000000000000 RBX: ffff88a03f22e040 RCX: 0000000000000000 Jan 15 19:59:22 nasgul kernel: RDX: 0000000000000003 RSI: 0000000000000000 RDI: ffff88a03f22e040 Jan 15 19:59:22 nasgul kernel: RBP: ffffc9000092ff10 R08: 0000000000000000 R09: 0000000000000000 Jan 15 19:59:22 nasgul kernel: R10: 0000000000000000 R11: 0000000000000000 R12: ffff88a03f22e040 Jan 15 19:59:22 nasgul kernel: R13: 0000000000000000 R14: 0000000000000000 R15: 0000000000000000 Jan 15 19:59:22 nasgul kernel: FS: 00001512a7477f00(0000) GS:ffff88a03f200000(0000) knlGS:0000000000000000 Jan 15 19:59:22 nasgul kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 Jan 15 19:59:22 nasgul kernel: CR2: ffff888596a5d000 CR3: 0000000633ff8000 CR4: 0000000000750ee0 Jan 15 19:59:22 nasgul kernel: PKRU: 55555554 Jan 15 19:59:22 nasgul kernel: Call Trace: Jan 15 19:59:22 nasgul kernel: <TASK> Jan 15 19:59:22 nasgul kernel: ? __die_body+0x1a/0x5c Jan 15 19:59:22 nasgul kernel: ? page_fault_oops+0x329/0x376 Jan 15 19:59:22 nasgul kernel: ? fixup_exception+0x22/0x24b Jan 15 19:59:22 nasgul kernel: ? exc_page_fault+0xf4/0x11d Jan 15 19:59:22 nasgul kernel: ? asm_exc_page_fault+0x22/0x30 Jan 15 19:59:22 nasgul kernel: ? rq_lock+0x12/0x24 Jan 15 19:59:22 nasgul kernel: ? __schedule+0xb5/0x612 Jan 15 19:59:22 nasgul kernel: ? flush_tlb_func+0xf9/0x15a Jan 15 19:59:22 nasgul kernel: ? _raw_spin_lock+0x13/0x1c Jan 15 19:59:22 nasgul kernel: schedule+0x8e/0xcc Jan 15 19:59:22 nasgul kernel: __do_sys_sched_yield+0xa/0x11 Jan 15 19:59:22 nasgul kernel: do_syscall_64+0x65/0x7b Jan 15 19:59:22 nasgul kernel: entry_SYSCALL_64_after_hwframe+0x6e/0xd8 Jan 15 19:59:22 nasgul kernel: RIP: 0033:0x1512abe0857a Jan 15 19:59:22 nasgul kernel: Code: 0f 05 9b 48 89 c7 e9 45 38 fd ff 48 c7 c7 da ff ff ff e9 39 38 fd ff 48 c7 c7 da ff ff ff e9 2d 38 fd ff b8 18 00 00 00 0f 05 <9b> 48 89 c7 e9 1d 38 fd ff 48 8d 35 f6 eb 01 00 e9 00 00 00 00 41 Jan 15 19:59:22 nasgul kernel: RSP: 002b:00007fff9af39bd8 EFLAGS: 00000202 ORIG_RAX: 0000000000000018 Jan 15 19:59:22 nasgul kernel: RAX: ffffffffffffffda RBX: 00000000000000f0 RCX: 00001512abe0857a Jan 15 19:59:22 nasgul kernel: RDX: 0000000000000000 RSI: 0000000000000001 RDI: 0000000000000000 Jan 15 19:59:22 nasgul kernel: RBP: 00007fff9af39c40 R08: 00001512abdc9640 R09: 0000000000001210 Jan 15 19:59:22 nasgul kernel: R10: 0000000000000004 R11: 0000000000000202 R12: 00001512a5439d90 Jan 15 19:59:22 nasgul kernel: R13: 00001512a61d6680 R14: 00001512a5439d98 R15: 00001512a5439e30 Jan 15 19:59:22 nasgul kernel: </TASK> Jan 15 19:59:22 nasgul kernel: Modules linked in: ext4 mbcache jbd2 xt_CHECKSUM ipt_REJECT nf_reject_ipv4 ip6table_mangle ip6table_nat iptable_mangle vhost_net tun vhost vhost_iotlb tap veth xt_nat xt_tcpudp xt_conntrack xt_MASQUERADE nf_conntrack_netlink nfnetlink xfrm_user xfrm_algo iptable_nat nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 xt_addrtype br_netfilter xfs md_mod tcp_diag inet_diag nct6775 nct6775_core hwmon_vid ip6table_filter ip6_tables iptable_filter ip_tables x_tables efivarfs af_packet 8021q garp mrp bridge stp llc bonding tls zfs(PO) i915 intel_rapl_msr intel_rapl_common x86_pkg_temp_thermal zunicode(PO) intel_powerclamp coretemp zzstd(O) iosf_mbi drm_buddy i2c_algo_bit kvm_intel ttm zlua(O) drm_display_helper btusb btrtl zavl(PO) btbcm btintel drm_kms_helper icp(PO) kvm bluetooth drm crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel sha512_ssse3 sr_mod zcommon(PO) sha256_ssse3 cdrom sha1_ssse3 ecdh_generic aesni_intel ecc znvpair(PO) intel_gtt crypto_simd cryptd rapl Jan 15 19:59:22 nasgul kernel: spl(O) intel_cstate mei_hdcp mei_pxp wmi_bmof mpt3sas thunderbolt i2c_i801 nvme intel_uncore atlantic agpgart mei_me i2c_smbus nvme_core ahci raid_class i2c_core mei scsi_transport_sas libahci syscopyarea sysfillrect vmd sysimgblt thermal fb_sys_fops fan video tpm_crb tpm_tis tpm_tis_core wmi tpm backlight intel_pmc_core acpi_pad acpi_tad button unix Jan 15 19:59:22 nasgul kernel: CR2: ffff888596a5d000 Jan 15 19:59:22 nasgul kernel: ---[ end trace 0000000000000000 ]--- Jan 15 19:59:22 nasgul kernel: RIP: 0010:mutex_lock+0xf/0x2e Jan 15 19:59:22 nasgul kernel: Code: 03 59 eb c9 31 c0 5a c3 cc cc cc cc 0f 1f 44 00 00 be 02 00 00 00 e9 88 fc ff ff 0f 1f 44 00 00 51 48 89 3c 24 e8 13 f3 ff ff <31> c0 48 8b 3c 24 65 48 8b 14 25 80 cb 01 00 f0 48 0f b1 17 74 03 Jan 15 19:59:22 nasgul kernel: RSP: 0018:ffffc9006b1878b0 EFLAGS: 00010286 Jan 15 19:59:22 nasgul kernel: RAX: 0000000000000000 RBX: 00000000000046e0 RCX: 0000000000000000 Jan 15 19:59:22 nasgul kernel: RDX: 0000000080000000 RSI: 9f01b21ff904f6c9 RDI: ffffffffa124a620 Jan 15 19:59:22 nasgul kernel: RBP: 000000000000017a R08: 9ae16a3b2f90408f R09: 9ae16a3b2f90404f Jan 15 19:59:22 nasgul kernel: R10: 0000000000000000 R11: 0000008000000000 R12: 000000000013497a Jan 15 19:59:22 nasgul kernel: R13: 0000000000000036 R14: 0000000000000000 R15: 0000000000000000 Jan 15 19:59:22 nasgul kernel: FS: 00001512a7477f00(0000) GS:ffff88a03f200000(0000) knlGS:0000000000000000 Jan 15 19:59:22 nasgul kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 Jan 15 19:59:22 nasgul kernel: CR2: ffff888596a5d000 CR3: 0000000633ff8000 CR4: 0000000000750ee0 Jan 15 19:59:22 nasgul kernel: PKRU: 55555554 Jan 15 19:59:22 nasgul kernel: note: Plex Media Scan[17145] exited with irqs disabled Jan 15 19:59:44 nasgul kernel: rcu: INFO: rcu_preempt detected expedited stalls on CPUs/tasks: { 8-...D 29-.... } 21348 jiffies s: 9173 root: 0x3/. Jan 15 19:59:44 nasgul kernel: rcu: blocking rcu_node structures (internal RCU debug): l=1:0-15:0x100/. l=1:16-31:0x2000/. Jan 15 19:59:44 nasgul kernel: Sending NMI from CPU 11 to CPUs 8: Jan 15 19:59:44 nasgul kernel: NMI backtrace for cpu 8 Jan 15 19:59:44 nasgul kernel: CPU: 8 PID: 17145 Comm: Plex Media Scan Tainted: P D O 6.1.118-Unraid #1 Jan 15 19:59:44 nasgul kernel: Hardware name: ASUS System Product Name/ProArt Z790-CREATOR WIFI, BIOS 2801 11/29/2024 Jan 15 19:59:44 nasgul kernel: RIP: 0010:native_queued_spin_lock_slowpath+0x86/0x1cf Jan 15 19:59:44 nasgul kernel: Code: c2 0f b6 d2 c1 e2 08 30 e4 09 d0 3d ff 00 00 00 76 0c 0f ba e0 08 72 1e c6 43 01 00 eb 18 85 c0 74 0a 8b 03 84 c0 74 04 f3 90 <eb> f6 66 c7 03 01 00 e9 32 01 00 00 e8 60 3b ff ff 49 c7 c4 80 ed Jan 15 19:59:44 nasgul kernel: RSP: 0018:ffffc90000434e88 EFLAGS: 00000002 Jan 15 19:59:44 nasgul kernel: RAX: 0000000000500101 RBX: ffff88a03f22e040 RCX: 0000001de2a81800 Jan 15 19:59:44 nasgul kernel: RDX: 0000000000000000 RSI: 0000000000000001 RDI: ffff88a03f22e040 Jan 15 19:59:44 nasgul kernel: RBP: 0000000000000000 R08: ffff88a03f5ae0f0 R09: ffff88a03f5ae0f0 Jan 15 19:59:44 nasgul kernel: R10: 0000000000000000 R11: ffffc90000434ff8 R12: 0000000000000008 Jan 15 19:59:44 nasgul kernel: R13: 000001dd5ecfedfb R14: 0000000000000006 R15: ffffffff810fd1ea Jan 15 19:59:44 nasgul kernel: FS: 00001512a7477f00(0000) GS:ffff88a03f200000(0000) knlGS:0000000000000000 Jan 15 19:59:44 nasgul kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 Jan 15 19:59:44 nasgul kernel: CR2: ffff888596a5d000 CR3: 0000000633ff8000 CR4: 0000000000750ee0 Jan 15 19:59:44 nasgul kernel: PKRU: 55555554 Jan 15 19:59:44 nasgul kernel: Call Trace: Jan 15 19:59:44 nasgul kernel: <NMI> Jan 15 19:59:44 nasgul kernel: ? nmi_cpu_backtrace+0xd3/0x104 Jan 15 19:59:44 nasgul kernel: ? nmi_cpu_backtrace_handler+0xd/0x15 Jan 15 19:59:44 nasgul kernel: ? nmi_handle+0x54/0x131 Jan 15 19:59:44 nasgul kernel: ? native_queued_spin_lock_slowpath+0x86/0x1cf Jan 15 19:59:44 nasgul kernel: ? default_do_nmi+0x66/0x15b Jan 15 19:59:44 nasgul kernel: ? exc_nmi+0xbf/0x11c Jan 15 19:59:44 nasgul kernel: ? end_repeat_nmi+0x16/0x67 Jan 15 19:59:44 nasgul kernel: ? tick_init_jiffy_update+0x7c/0x7c Jan 15 19:59:44 nasgul kernel: ? native_queued_spin_lock_slowpath+0x86/0x1cf Jan 15 19:59:44 nasgul kernel: ? native_queued_spin_lock_slowpath+0x86/0x1cf Jan 15 19:59:44 nasgul kernel: ? native_queued_spin_lock_slowpath+0x86/0x1cf Jan 15 19:59:44 nasgul kernel: </NMI> Jan 15 19:59:44 nasgul kernel: <IRQ> Jan 15 19:59:44 nasgul kernel: do_raw_spin_lock+0x14/0x1a Jan 15 19:59:44 nasgul kernel: raw_spin_rq_lock_nested+0x1b/0x26 Jan 15 19:59:44 nasgul kernel: rq_lock+0x12/0x24 Jan 15 19:59:44 nasgul kernel: scheduler_tick+0x5e/0x186 Jan 15 19:59:44 nasgul kernel: ? tick_init_jiffy_update+0x7c/0x7c Jan 15 19:59:44 nasgul kernel: ? irq_work_single+0x20/0x53 Jan 15 19:59:44 nasgul kernel: update_process_times+0x7a/0x81 Jan 15 19:59:44 nasgul kernel: tick_sched_timer+0x43/0x71 Jan 15 19:59:44 nasgul kernel: __hrtimer_run_queues+0xe8/0x190 Jan 15 19:59:44 nasgul kernel: hrtimer_interrupt+0x9c/0x16e Jan 15 19:59:44 nasgul kernel: __sysvec_apic_timer_interrupt+0xc2/0x12f Jan 15 19:59:44 nasgul kernel: sysvec_apic_timer_interrupt+0x8f/0xb5 Jan 15 19:59:44 nasgul kernel: </IRQ> Jan 15 19:59:44 nasgul kernel: <TASK> Jan 15 19:59:44 nasgul kernel: asm_sysvec_apic_timer_interrupt+0x16/0x20 Jan 15 19:59:44 nasgul kernel: RIP: 0010:make_task_dead+0x69/0x11c Jan 15 19:59:44 nasgul kernel: Code: 58 0f 1f 40 00 0f ba e0 09 72 1f 8b 93 88 04 00 00 48 8d b3 80 06 00 00 48 c7 c7 f0 51 0c 82 e8 5a 36 7f 00 fb 0f 1f 44 00 00 <65> 8b 0d d1 67 fa 7e 81 e1 ff ff ff 7f 74 3f 65 48 8b 34 25 80 cb Jan 15 19:59:44 nasgul kernel: RSP: 0018:ffffc9000092ff40 EFLAGS: 00000246 Jan 15 19:59:44 nasgul kernel: RAX: 0000000000000036 RBX: ffff888596a5d000 RCX: 0000000000000027 Jan 15 19:59:44 nasgul kernel: RDX: 0000000000000000 RSI: ffffffff820dabd1 RDI: 00000000ffffffff Jan 15 19:59:44 nasgul kernel: RBP: 0000000000000009 R08: 0000000000000000 R09: ffffffff829583f0 Jan 15 19:59:44 nasgul kernel: R10: 00003fffffffffff R11: ffff88a0bf7b2965 R12: ffff888596a5d000 Jan 15 19:59:44 nasgul kernel: R13: ffff888004c010b0 R14: 0000000000000000 R15: 0000000000000010 Jan 15 19:59:44 nasgul kernel: rewind_stack_and_make_dead+0x17/0x17 Jan 15 19:59:44 nasgul kernel: RIP: 0033:0x1512abe0857a Jan 15 19:59:44 nasgul kernel: Code: 0f 05 9b 48 89 c7 e9 45 38 fd ff 48 c7 c7 da ff ff ff e9 39 38 fd ff 48 c7 c7 da ff ff ff e9 2d 38 fd ff b8 18 00 00 00 0f 05 <9b> 48 89 c7 e9 1d 38 fd ff 48 8d 35 f6 eb 01 00 e9 00 00 00 00 41 Jan 15 19:59:44 nasgul kernel: RSP: 002b:00007fff9af39bd8 EFLAGS: 00000202 ORIG_RAX: 0000000000000018 Jan 15 19:59:44 nasgul kernel: RAX: ffffffffffffffda RBX: 00000000000000f0 RCX: 00001512abe0857a Jan 15 19:59:44 nasgul kernel: RDX: 0000000000000000 RSI: 0000000000000001 RDI: 0000000000000000 Jan 15 19:59:44 nasgul kernel: RBP: 00007fff9af39c40 R08: 00001512abdc9640 R09: 0000000000001210 Jan 15 19:59:44 nasgul kernel: R10: 0000000000000004 R11: 0000000000000202 R12: 00001512a5439d90 Jan 15 19:59:44 nasgul kernel: R13: 00001512a61d6680 R14: 00001512a5439d98 R15: 00001512a5439e30 Jan 15 19:59:44 nasgul kernel: </TASK> Jan 15 19:59:44 nasgul kernel: Sending NMI from CPU 11 to CPUs 29: Jan 15 19:59:44 nasgul kernel: NMI backtrace for cpu 29 Jan 15 19:59:44 nasgul kernel: CPU: 29 PID: 26936 Comm: Plex Media Scan Tainted: P D O 6.1.118-Unraid #1 Jan 15 19:59:44 nasgul kernel: Hardware name: ASUS System Product Name/ProArt Z790-CREATOR WIFI, BIOS 2801 11/29/2024 Jan 15 19:59:44 nasgul kernel: RIP: 0010:smp_call_function_many_cond+0x26a/0x283 Jan 15 19:59:44 nasgul kernel: Code: d0 48 89 df e8 68 fa ff ff 3b 05 99 bc 2a 01 73 1f 48 63 c8 48 8b 55 00 48 03 14 cd 60 cb 16 82 8b 4a 08 80 e1 01 74 04 f3 90 <eb> f4 ff c0 eb c8 48 83 c4 38 5b 5d 41 5c 41 5d 41 5e 41 5f c3 cc Jan 15 19:59:44 nasgul kernel: RSP: 0018:ffffc9006a7b7bd8 EFLAGS: 00000202 Jan 15 19:59:44 nasgul kernel: RAX: 0000000000000008 RBX: ffff88a03f76f208 RCX: 0000000000000001 Jan 15 19:59:44 nasgul kernel: RDX: ffff88a03f233f20 RSI: 0000000000000020 RDI: ffff88a03f76f208 Jan 15 19:59:44 nasgul kernel: RBP: ffff88a03f76f200 R08: 0000000000000008 R09: ffff888100fbdc88 Jan 15 19:59:44 nasgul kernel: R10: ffff88a03f75cee0 R11: ffff8882556b8d00 R12: 0000000000000001 Jan 15 19:59:44 nasgul kernel: R13: ffffffff81062d4c R14: ffffffff81063471 R15: 0000000000000017 Jan 15 19:59:44 nasgul kernel: FS: 00001512a0d6db00(0000) GS:ffff88a03f740000(0000) knlGS:0000000000000000 Jan 15 19:59:44 nasgul kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 Jan 15 19:59:44 nasgul kernel: CR2: 0000151298178000 CR3: 0000000633ff8000 CR4: 0000000000750ee0 Jan 15 19:59:44 nasgul kernel: PKRU: 55555554 Jan 15 19:59:44 nasgul kernel: Call Trace: Jan 15 19:59:44 nasgul kernel: <NMI> Jan 15 19:59:44 nasgul kernel: ? nmi_cpu_backtrace+0xd3/0x104 Jan 15 19:59:44 nasgul kernel: ? nmi_cpu_backtrace_handler+0xd/0x15 Jan 15 19:59:44 nasgul kernel: ? nmi_handle+0x54/0x131 Jan 15 19:59:44 nasgul kernel: ? smp_call_function_many_cond+0x26a/0x283 Jan 15 19:59:44 nasgul kernel: ? default_do_nmi+0x66/0x15b Jan 15 19:59:44 nasgul kernel: ? exc_nmi+0xbf/0x11c Jan 15 19:59:44 nasgul kernel: ? end_repeat_nmi+0x16/0x67 Jan 15 19:59:44 nasgul kernel: ? leave_mm+0x34/0x34 Jan 15 19:59:44 nasgul kernel: ? write_cr3+0xb/0xb Jan 15 19:59:44 nasgul kernel: ? smp_call_function_many_cond+0x26a/0x283 Jan 15 19:59:44 nasgul kernel: ? smp_call_function_many_cond+0x26a/0x283 Jan 15 19:59:44 nasgul kernel: ? smp_call_function_many_cond+0x26a/0x283 Jan 15 19:59:44 nasgul kernel: </NMI> Jan 15 19:59:44 nasgul kernel: <TASK> Jan 15 19:59:44 nasgul kernel: ? write_cr3+0xb/0xb Jan 15 19:59:44 nasgul kernel: on_each_cpu_cond_mask+0x42/0x69 Jan 15 19:59:44 nasgul kernel: ? leave_mm+0x34/0x34 Jan 15 19:59:44 nasgul kernel: __flush_tlb_multi+0x5/0xb Jan 15 19:59:44 nasgul kernel: flush_tlb_mm_range+0xc3/0x111 Jan 15 19:59:44 nasgul kernel: tlb_flush_mmu_tlbonly+0x6c/0x94 Jan 15 19:59:44 nasgul kernel: tlb_flush_mmu+0x15/0x99 Jan 15 19:59:44 nasgul kernel: tlb_finish_mmu+0x2c/0x5b Jan 15 19:59:44 nasgul kernel: unmap_region+0xd6/0x104 Jan 15 19:59:44 nasgul kernel: do_mas_align_munmap.constprop.0+0x2e7/0x3c6 Jan 15 19:59:44 nasgul kernel: __vm_munmap+0x9d/0xdd Jan 15 19:59:44 nasgul kernel: __x64_sys_munmap+0x17/0x1e Jan 15 19:59:44 nasgul kernel: do_syscall_64+0x65/0x7b Jan 15 19:59:44 nasgul kernel: entry_SYSCALL_64_after_hwframe+0x6e/0xd8 Jan 15 19:59:44 nasgul kernel: RIP: 0033:0x1512abdf6895 Jan 15 19:59:44 nasgul kernel: Code: 00 00 00 0f 05 9b 48 89 c7 e9 27 55 fe ff 41 56 53 50 49 89 f6 48 89 fb e8 88 3d 02 00 b8 0b 00 00 00 48 89 df 4c 89 f6 0f 05 <9b> 48 89 c7 48 83 c4 08 5b 41 5e e9 fb 54 fe ff 31 c0 83 fa 04 74 Jan 15 19:59:44 nasgul kernel: RSP: 002b:00001512a0d6bf30 EFLAGS: 00000206 ORIG_RAX: 000000000000000b Jan 15 19:59:44 nasgul kernel: RAX: ffffffffffffffda RBX: 0000151298155000 RCX: 00001512abdf6895 Jan 15 19:59:44 nasgul kernel: RDX: 0000000000000000 RSI: 0000000000037000 RDI: 0000151298155000 Jan 15 19:59:44 nasgul kernel: RBP: 0000000000000000 R08: 000000000000002c R09: 0000000000000002 Jan 15 19:59:44 nasgul kernel: R10: 0000000000000002 R11: 0000000000000206 R12: 0000000000011000 Jan 15 19:59:44 nasgul kernel: R13: 0000000000000007 R14: 0000000000037000 R15: 0000000000037000 Jan 15 19:59:44 nasgul kernel: </TASK> Jan 15 20:01:50 nasgul kernel: rcu: INFO: rcu_preempt self-detected stall on CPU Jan 15 20:01:50 nasgul kernel: rcu: 29-...!: (60001 ticks this GP) idle=e38c/1/0x4000000000000000 softirq=45883/45885 fqs=8672 Jan 15 20:01:50 nasgul kernel: (t=60001 jiffies g=1021861 q=192184 ncpus=32) Jan 15 20:01:50 nasgul kernel: rcu: rcu_preempt kthread starved for 30000 jiffies! g1021861 f0x0 RCU_GP_DOING_FQS(6) ->state=0x0 ->cpu=18 Jan 15 20:01:50 nasgul kernel: rcu: Unless rcu_preempt kthread gets sufficient CPU time, OOM is now expected behavior. Jan 15 20:01:50 nasgul kernel: rcu: RCU grace-period kthread stack dump: Jan 15 20:01:50 nasgul kernel: task:rcu_preempt state:R running task stack:0 pid:15 ppid:2 flags:0x00004000 Jan 15 20:01:50 nasgul kernel: Call Trace: Jan 15 20:01:50 nasgul kernel: <TASK> Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0xc5/0x1cf Jan 15 20:01:50 nasgul kernel: ? do_raw_spin_lock+0x14/0x1a Jan 15 20:01:50 nasgul kernel: ? raw_spin_rq_lock_nested+0x1b/0x26 Jan 15 20:01:50 nasgul kernel: ? _raw_spin_rq_lock_irqsave+0x15/0x1e Jan 15 20:01:50 nasgul kernel: ? resched_cpu+0x26/0x56 Jan 15 20:01:50 nasgul kernel: ? rcu_implicit_dynticks_qs+0x1b3/0x210 Jan 15 20:01:50 nasgul kernel: ? rcu_gp_kthread+0x170/0x170 Jan 15 20:01:50 nasgul kernel: ? force_qs_rnp+0x14e/0x1d3 Jan 15 20:01:50 nasgul kernel: ? rcu_gp_init+0x497/0x497 Jan 15 20:01:50 nasgul kernel: ? rcu_gp_fqs_loop+0x231/0x47b Jan 15 20:01:50 nasgul kernel: ? rcu_gp_kthread+0x154/0x170 Jan 15 20:01:50 nasgul kernel: ? kthread+0xe4/0xef Jan 15 20:01:50 nasgul kernel: ? kthread_complete_and_exit+0x1b/0x1b Jan 15 20:01:50 nasgul kernel: ? ret_from_fork+0x1f/0x30 Jan 15 20:01:50 nasgul kernel: </TASK> Jan 15 20:01:50 nasgul kernel: rcu: Stack dump where RCU GP kthread last ran: Jan 15 20:01:50 nasgul kernel: Sending NMI from CPU 29 to CPUs 18: Jan 15 20:01:50 nasgul kernel: NMI backtrace for cpu 18 Jan 15 20:01:50 nasgul kernel: CPU: 18 PID: 15 Comm: rcu_preempt Tainted: P D O 6.1.118-Unraid #1 Jan 15 20:01:50 nasgul kernel: Hardware name: ASUS System Product Name/ProArt Z790-CREATOR WIFI, BIOS 2801 11/29/2024 Jan 15 20:01:50 nasgul kernel: RIP: 0010:native_queued_spin_lock_slowpath+0x15e/0x1cf Jan 15 20:01:50 nasgul kernel: Code: cc c1 ee 12 83 e0 03 ff ce 48 c1 e0 05 48 63 f6 48 05 80 ed 02 00 48 03 04 f5 60 cb 16 82 48 89 10 8b 42 08 85 c0 75 04 f3 90 <eb> f5 48 8b 32 48 85 f6 74 bc 0f 0d 0e 8b 03 66 85 c0 74 04 f3 90 Jan 15 20:01:50 nasgul kernel: RSP: 0018:ffffc900000dfdd0 EFLAGS: 00000046 Jan 15 20:01:50 nasgul kernel: RAX: 0000000000000000 RBX: ffff88a03f22e040 RCX: 00000000004c0000 Jan 15 20:01:50 nasgul kernel: RDX: ffff88a03f4aed80 RSI: 0000000000000013 RDI: ffff88a03f22e040 Jan 15 20:01:50 nasgul kernel: RBP: 0000000000000012 R08: 0000000000000008 R09: 0000000000000000 Jan 15 20:01:50 nasgul kernel: R10: 0000000000000020 R11: 0000000000000365 R12: ffff88a03f4aed80 Jan 15 20:01:50 nasgul kernel: R13: 0000000000000000 R14: ffff88a03f22ee00 R15: 000000000002ee00 Jan 15 20:01:50 nasgul kernel: FS: 0000000000000000(0000) GS:ffff88a03f480000(0000) knlGS:0000000000000000 Jan 15 20:01:50 nasgul kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 Jan 15 20:01:50 nasgul kernel: CR2: 0000145e92497f20 CR3: 000000062fdd6000 CR4: 0000000000750ee0 Jan 15 20:01:50 nasgul kernel: PKRU: 55555554 Jan 15 20:01:50 nasgul kernel: Call Trace: Jan 15 20:01:50 nasgul kernel: <NMI> Jan 15 20:01:50 nasgul kernel: ? nmi_cpu_backtrace+0xd3/0x104 Jan 15 20:01:50 nasgul kernel: ? nmi_cpu_backtrace_handler+0xd/0x15 Jan 15 20:01:50 nasgul kernel: ? nmi_handle+0x54/0x131 Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0x15e/0x1cf Jan 15 20:01:50 nasgul kernel: ? default_do_nmi+0x66/0x15b Jan 15 20:01:50 nasgul kernel: ? exc_nmi+0xbf/0x11c Jan 15 20:01:50 nasgul kernel: ? end_repeat_nmi+0x16/0x67 Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0x15e/0x1cf Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0x15e/0x1cf Jan 15 20:01:50 nasgul kernel: ? native_queued_spin_lock_slowpath+0x15e/0x1cf Jan 15 20:01:50 nasgul kernel: </NMI> Jan 15 20:01:50 nasgul kernel: <TASK> Jan 15 20:01:50 nasgul kernel: do_raw_spin_lock+0x14/0x1a Jan 15 20:01:50 nasgul kernel: raw_spin_rq_lock_nested+0x1b/0x26 Jan 15 20:01:50 nasgul kernel: _raw_spin_rq_lock_irqsave+0x15/0x1e Jan 15 20:01:50 nasgul kernel: resched_cpu+0x26/0x56 Jan 15 20:01:50 nasgul kernel: rcu_implicit_dynticks_qs+0x1b3/0x210 Jan 15 20:01:50 nasgul kernel: ? rcu_gp_kthread+0x170/0x170 Jan 15 20:01:50 nasgul kernel: force_qs_rnp+0x14e/0x1d3 Jan 15 20:01:50 nasgul kernel: ? rcu_gp_init+0x497/0x497 Jan 15 20:01:50 nasgul kernel: rcu_gp_fqs_loop+0x231/0x47b Jan 15 20:01:50 nasgul kernel: rcu_gp_kthread+0x154/0x170 Jan 15 20:01:50 nasgul kernel: kthread+0xe4/0xef Jan 15 20:01:50 nasgul kernel: ? kthread_complete_and_exit+0x1b/0x1b Jan 15 20:01:50 nasgul kernel: ret_from_fork+0x1f/0x30 Jan 15 20:01:50 nasgul kernel: </TASK> Jan 15 20:01:50 nasgul kernel: rcu: INFO: rcu_preempt detected expedited stalls on CPUs/tasks: { Jan 15 20:01:50 nasgul kernel: usb 2-7: USB disconnect, device number 2 Jan 15 20:01:50 nasgul kernel: device offline error, dev sde, sector 0 op 0x1:(WRITE) flags 0x800 phys_seg 0 prio class 2
January 15, 20251 yr Author Just now, alturismo said: BIOS, ist aktuell Ja, nicht mal mit einer nicht aktuellen Version das erste Mal gebootet. System ist erst 2 Monate alt, da gabs das BIOS schon. Unterstützt auch den 14900K. Overclocking ist aber aus und er taktet mit 3.2GHz, also ganz gemütlich. 1 minute ago, alturismo said: WLAN oder Ethernet könnte das auslösen, onboard wifi mal deaktivieren (wenn machbar) Ist seit Tag 1 deaktiviert. Genauso der 2,5GbE Port. Nutze nur das 10 GbE per LAN. Ist ein Marvell-Aqtion Adapter. Könnte auch den Intel (2,5GbE) aktivieren und mal probeweise nehmen. 3 minutes ago, alturismo said: ggf. NIC auch (Metzwek onboard) und mit einer separaten wenn verfügbar mal testen hab tatsächlich noch eine Intel X550-T2 rumliegen. Würde das mit den Segfaults zusammenpassen? Wobei ich in diesem Log keine gefunden habe Aber mal nebenbei: sollte der Fehler dann nicht schon seit Tag 1 kommen? Mir ist noch nie das System eingefroren oder abgestürzt. Eben kamen noch, ohne eine Änderung meinerseits, folgende Meldungen, was im Bezug auf das Netzwerk interessant sein könnten. Jan 15 20:38:42 nasgul kernel: atlantic 0000:06:00.0 eth0: atlantic: link change old 10000 new 0 Jan 15 20:38:42 nasgul kernel: bond0: (slave eth0): link status definitely down, disabling slave Jan 15 20:38:42 nasgul kernel: device eth0 left promiscuous mode Jan 15 20:38:42 nasgul kernel: bond0: now running without any active interface! Jan 15 20:38:42 nasgul kernel: br0: port 1(bond0) entered disabled state Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: carrier lost Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: deleting route to 10.0.0.0/16 Jan 15 20:38:43 nasgul avahi-daemon[13021]: Withdrawing address record for 10.0.2.1 on br0. Jan 15 20:38:43 nasgul avahi-daemon[13021]: Leaving mDNS multicast group on interface br0.IPv4 with address 10.0.2.1. Jan 15 20:38:43 nasgul avahi-daemon[13021]: Interface br0.IPv4 no longer relevant for mDNS. Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: deleting default route via 10.0.0.1 Jan 15 20:38:45 nasgul ntpd[24025]: Deleting interface #1 br0, 10.0.2.1#123, interface stats: received=19, sent=19, dropped=0, active_time=900 secs Jan 15 20:38:45 nasgul ntpd[24025]: 216.239.35.4 local addr 10.0.2.1 -> <null> Jan 15 20:38:47 nasgul kernel: atlantic 0000:06:00.0 eth0: atlantic: link change old 0 new 10000 Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: carrier acquired Jan 15 20:38:47 nasgul kernel: bond0: (slave eth0): link status definitely up, 10000 Mbps full duplex Jan 15 20:38:47 nasgul kernel: bond0: (slave eth0): making interface the new active one Jan 15 20:38:47 nasgul kernel: device eth0 entered promiscuous mode Jan 15 20:38:47 nasgul kernel: bond0: active interface up! Jan 15 20:38:47 nasgul kernel: br0: port 1(bond0) entered blocking state Jan 15 20:38:47 nasgul kernel: br0: port 1(bond0) entered forwarding state Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: rebinding lease of 10.0.2.1 Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: probing address 10.0.2.1/16 Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: leased 10.0.2.1 for infinity Jan 15 20:38:51 nasgul avahi-daemon[13021]: Joining mDNS multicast group on interface br0.IPv4 with address 10.0.2.1. Jan 15 20:38:51 nasgul avahi-daemon[13021]: New relevant interface br0.IPv4 for mDNS. Jan 15 20:38:51 nasgul avahi-daemon[13021]: Registering new address record for 10.0.2.1 on br0.IPv4. Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: adding route to 10.0.0.0/16 Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: adding default route via 10.0.0.1 Jan 15 20:38:51 nasgul network: hook services: interface=br0, reason=BOUND, protocol=dhcp Jan 15 20:38:51 nasgul network: update services: 45s Jan 15 20:38:54 nasgul ntpd[24025]: Listen normally on 2 br0 10.0.2.1:123 Jan 15 20:38:54 nasgul ntpd[24025]: new interface(s) found: waking up resolver
January 15, 20251 yr 1 minute ago, Xerxes said: Könnte auch den Intel (2,5GbE) aktivieren und mal probeweise nehmen. einfach mal zum Quertest würde ich das machen 2 minutes ago, Xerxes said: Aber mal nebenbei: sollte der Fehler dann nicht schon seit Tag 1 kommen? Mir ist noch nie das System eingefroren oder abgestürzt. der Meinung bin ich normal auch ... hier geht es tatsächlich mehr um "Ausschluss" nur wenn es an einer Version liegen würde, downgrade geht immer, aber das hast du ja auch bereits durch ... nur weiter runter jetzt nicht mehr wegen zfs, dazu backup machen wenn man das nochmals testen wollte ... alles was ich zu NMI gefunden habe war in Verbindung mit Netzwerkkarten ... daher sag ich ja auch, mir gehen die Ideen aus ...
January 16, 20251 yr 13 hours ago, alturismo said: also may ideas to the syslog with new traces ... Difficult to say if they are hardware or software related, one thing you can to try is to boot the server in safe mode with all docker containers/VMs disabled, let it run as a basic NAS for a few days, if there are still call traces or crashes it's likely a hardware problem, if it doesn't start turning on the other services one by one, including the docker containers.
January 16, 20251 yr Author Mir ist heute das System noch ein paarmal abgestürzt, auch nachts im idle. Die verbundenen Docker liefen weiter, aber konnte einen laufenden Docker nicht neu aufrufen. Habe mich entschieden, alle unersetzbaren Daten im Array auf andere, externe Festplatten zu schieben, mit Ubuntu to go einmal alles platt und den Rest einfach neu erstellen. Ein paar Docker hab ich intern gesichert. Finde ich absehbarer als jetzt Ewigkeiten rum zu probieren. Möchte ein stabiles System, kein 50/50 Andere LAN-Schnittstelle hab ich nicht getestet. Hatte mal testweise einen anderen RAM eingebaut, immer noch Segfault Meldungen. Werde mir am Wochenende das mal vorknöpfen und fange mit paperless an und beobachte mal den log. Als ich die Sicherung gemacht habe mit sudo docker exec paperless-ngx document_export ../export -f musste ich den Befehl sicher so 10-15x ausführen, bis es ohne, jedes mal unterschiedliche, Fehler in python ging. Zu dem Zeitpunkt war nur Redis und Paperless am laufen.
January 17, 20251 yr Author On 1/15/2025 at 8:47 PM, Xerxes said: Jan 15 20:38:42 nasgul kernel: atlantic 0000:06:00.0 eth0: atlantic: link change old 10000 new 0 Jan 15 20:38:42 nasgul kernel: bond0: (slave eth0): link status definitely down, disabling slave Jan 15 20:38:42 nasgul kernel: device eth0 left promiscuous mode Jan 15 20:38:42 nasgul kernel: bond0: now running without any active interface! Jan 15 20:38:42 nasgul kernel: br0: port 1(bond0) entered disabled state Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: carrier lost Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: deleting route to 10.0.0.0/16 Jan 15 20:38:43 nasgul avahi-daemon[13021]: Withdrawing address record for 10.0.2.1 on br0. Jan 15 20:38:43 nasgul avahi-daemon[13021]: Leaving mDNS multicast group on interface br0.IPv4 with address 10.0.2.1. Jan 15 20:38:43 nasgul avahi-daemon[13021]: Interface br0.IPv4 no longer relevant for mDNS. Jan 15 20:38:43 nasgul dhcpcd[1742]: br0: deleting default route via 10.0.0.1 Jan 15 20:38:45 nasgul ntpd[24025]: Deleting interface #1 br0, 10.0.2.1#123, interface stats: received=19, sent=19, dropped=0, active_time=900 secs Jan 15 20:38:45 nasgul ntpd[24025]: 216.239.35.4 local addr 10.0.2.1 -> <null> Jan 15 20:38:47 nasgul kernel: atlantic 0000:06:00.0 eth0: atlantic: link change old 0 new 10000 Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: carrier acquired Jan 15 20:38:47 nasgul kernel: bond0: (slave eth0): link status definitely up, 10000 Mbps full duplex Jan 15 20:38:47 nasgul kernel: bond0: (slave eth0): making interface the new active one Jan 15 20:38:47 nasgul kernel: device eth0 entered promiscuous mode Jan 15 20:38:47 nasgul kernel: bond0: active interface up! Jan 15 20:38:47 nasgul kernel: br0: port 1(bond0) entered blocking state Jan 15 20:38:47 nasgul kernel: br0: port 1(bond0) entered forwarding state Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: rebinding lease of 10.0.2.1 Jan 15 20:38:47 nasgul dhcpcd[1742]: br0: probing address 10.0.2.1/16 Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: leased 10.0.2.1 for infinity Jan 15 20:38:51 nasgul avahi-daemon[13021]: Joining mDNS multicast group on interface br0.IPv4 with address 10.0.2.1. Jan 15 20:38:51 nasgul avahi-daemon[13021]: New relevant interface br0.IPv4 for mDNS. Jan 15 20:38:51 nasgul avahi-daemon[13021]: Registering new address record for 10.0.2.1 on br0.IPv4. Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: adding route to 10.0.0.0/16 Jan 15 20:38:51 nasgul dhcpcd[1742]: br0: adding default route via 10.0.0.1 Jan 15 20:38:51 nasgul network: hook services: interface=br0, reason=BOUND, protocol=dhcp Jan 15 20:38:51 nasgul network: update services: 45s Jan 15 20:38:54 nasgul ntpd[24025]: Listen normally on 2 br0 10.0.2.1:123 Jan 15 20:38:54 nasgul ntpd[24025]: new interface(s) found: waking up resolver Habe über Nacht das array gesichert auf externen Platten und es kam heute morgen einmal noch genau der gleiche Fehler. Alle docker deinstalliert und einziges Plugin war das unassigned devices. Kann das am Atlantik Treiber liegen? Also tatsächlich das 10 GbE? Evtl das neue setup mit 7.0.0 stable beginnen, da doch recht neue Hardware?
January 17, 20251 yr Community Expert 4 hours ago, Xerxes said: Habe über Nacht das array gesichert auf externen Platten und es kam heute morgen einmal noch genau der gleiche Fehler. Alle docker deinstalliert und einziges Plugin war das unassigned devices. Evtl das neue setup mit 7.0.0 stable beginnen, da doch recht neue Hardware? Ich würde wirklich ganz von Anfang an anfangen: Anstatt Dich durch Deinstallationen zurück zu kämpfen, mach eine Sicherung (auch vom USB Stick mit key file) und beginne mit dem selben aber einmal komplett gelöschten USB Stick. Aber dann sauber neu installiertem unraid mit dem alten keyfile und lass das mal so einige Zeit laufen. Wenn das/ein Problem wieder auftaucht hat man einen definierten Grundzustand und der ist eigentlich ziemlich stabil. Das würde dann wirklich auf Hardwareprobleme hin deuten. Ob Du nun 7 stable oder 6.12.14 stable nimmst sollte egal sein, da Lime ja meint, daß 7 stable nun weit genug gereift sei.
January 17, 20251 yr Author 19 minutes ago, DataCollector said: Ob Du nun 7 stable oder 6.12.14 stable nimmst sollte egal sein, da Lime ja meint, daß 7 stable nun weit genug gereift sei. Ich meinte Hauptsächlich im Bezug auf den atlanic Treiber im Kernel
January 17, 20251 yr Author Backup abgeschlossen, alles auf den Disks gelöscht, Array und Cache Pool neu formatiert, alles von Grund auf von vorne begonnen mit 7.0.0. Nur media-Ordner ist noch alt. Nach 3-4h up-time und nur Paperless mit Redis installiert kommt schon der erste Segfault, aber ohne Systemabsturz. Kann gut sein, dass das schon immer war und ich es einfach nie gesehen habe, da mein log bis vor kurzem mit aspm-Meldungen geflutet wurde. Jan 17 21:05:04 nasgul kernel: [celeryd: celer[949456]: segfault at 28 ip 000015267a4c77d8 sp 00007ffcc194eeb0 error 4 in libpython3.12.so.1.0[15267a2b8000+216000] likely on CPU 4 (core 8, socket 0) Jan 17 21:05:04 nasgul kernel: Code: 89 44 24 38 31 c0 48 89 56 38 4d 8d bc 24 c0 00 00 00 49 8b 8c 24 a8 00 00 00 4c 29 fa 48 89 d0 48 d1 f8 4c 63 f0 4b 8d 2c 36 <48> 03 69 28 83 7f 2c 00 74 27 0f b6 45 00 48 8b 54 24 38 64 48 2b Der Fehler kam genau 4s nach dem Ausführen der 5-minütigen Abfrage der Mails und in Paperless standen auch Fehler. Da dieser Fehler immer auf CPU 4 (core 8, socket 0) kommt ist das für mich naheliegend, dass die CPU was hat. Plex habe ich mich noch nicht getraut zu installieren, wollte erstmal die Daten wieder sauber zurückspielen ohne crashes. Kennt ihr gute Tools, mit denen man sowas testen kann? Also eventuell defekte Cores auf Leistung testen. Ich glaube, dass Windows hier zu weit weg von der Hardware ist.
January 17, 20251 yr Community Expert 14 minutes ago, Xerxes said: Da dieser Fehler immer auf CPU 4 (core 8, socket 0) kommt ist das für mich naheliegend, dass die CPU was hat. Ich glaube die Intel Core i9 14900K gehört zu den CPUs, die sich mit der Zeit 'selbst zerstören' (overclocking würde es nur beschleunigen). Intel hat auf die betroffenen CPUs die Garantiezeit erhöht. Vielleicht solltest Du die CPU mal richtig stressen (Prime95 ein paar Tage drauf laufen lassen) und schauen ob es Aussetzer gibt. https://www.heise.de/download/product/prime95-36233 Intel selber hat auch irgendsoein (habgares) CPU Testtool. https://www.intel.de/content/www/de/de/support/articles/000005567/processors.html Spätestens wenn sich da etwas negatives Zeigt wird es Zeit für die Garantie. Kannst ja schon mal den Kaufbeleg suchen gehen, während das System sich testet. https://www.computerbase.de/news/prozessoren/instabile-raptor-lake-cpus-intel-verlaengert-garantie-von-13-und-14-gen-um-zwei-jahre.89079/ Edited January 17, 20251 yr by DataCollector
January 17, 20251 yr Author 11 minutes ago, DataCollector said: Intel hat auf die betroffenen CPUs die Garantiezeit erhöht. Gut zu wissen. Tatsächlich ist der Chip recht neu (2 Monate) und dank Paperless, wenn es doch funktioniert, die Rechnung schnell auffindbar. CPU wurde nicht einmal übertaktet. Da das so ein Beast ist und ich die ganze Zeit noch keine Zeit zum zocken hatte, hat die warscheinlich noch nie über 10% gemacht unter Linux. Habe vorhin auch schon drüber nachgedacht, einfach nen Garantieantrag zu stellen. Aber ich sehs dann kommen und die entweder die CPU hat nix und ich muss die Überprüfung zahlen oder die macht einfach bei der Prüfung alles wunderbar mit und ich bin wieder am Anfang. Aber da der Fehler, wie eben schon geschrieben, wirklich ausschließlich auf core 8 auftritt und RAM i.O. ist, glaube ich immer mehr, dass es ein HW Problem ist. 15 minutes ago, DataCollector said: Vielleicht solltest Du die CPU mal richtig stressen (Prime95 ein paar Tage drauf laufen lassen) und schauen ob es Aussetzer gibt. https://www.heise.de/download/product/prime95-36233 Sobald meine Parität fertig überprüft hat werde ich mal das Prime95 anschauen. Sieht man da dann auch, was genau der Fehler ist? Das Intel Tool hatte ich schon mal getestet, ist eher so määh.
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.