Fidel84 Posted October 30, 2020 Share Posted October 30, 2020 Hallo allerseits Unraid 6.8.3 meldet mir seit ein paar Tagen immer den gleichen Fehler und ich finde einfach nicht woher der kommt oder ob der relevant ist. Der Server an sich funktioniert Tadellos so das mir da kein Fehler bisher aufgefallen war außer ab und zu das nach dem Herunterfahren er noch an war und über die GUI nicht erreichbar war. Die Protokolle werden bei mir auf der Synology gespeichert. Von unten nach oben das spukt er mir immer wieder mal aus. Habe in der Zeit nichts neues Installiert oder gemacht. Hoffe ist so ok 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,Disabling lock debugging due to kernel taint 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,R13: 000000000000000c R14: 000055a1fcb2db8b R15: 000055a1fcb2c740 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,R10: 0000000000000022 R11: 0000000000000246 R12: 000055a1fcb2ddae 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RBP: 0000000000371000 R08: 000014d128ae0010 R09: 000055a1fcb30ae0 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RDX: 0000000000000000 RSI: 0000000000371000 RDI: 000014d128ae0000 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RAX: ffffffffffffffda RBX: 0000000000000007 RCX: 000014d12f9a3d59 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RSP: 002b:00007ffd6dfcce30 EFLAGS: 00000246 ORIG_RAX: 000000000000000b 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,Code: 89 c7 e8 7d 97 fe ff 5a c3 55 48 89 f5 48 83 ec 10 48 89 7c 24 08 e8 34 ea 01 00 48 8b 7c 24 08 b8 0b 00 00 00 48 89 ee 0f 05 <48> 89 c7 e8 52 97 fe ff 48 83 c4 10 5d c3 31 c0 83 fa 04 74 0c 48 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RIP: 0033:0x14d12f9a3d59 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,entry_SYSCALL_64_after_hwframe+0x44/0xa9 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,do_syscall_64+0x57/0xf2 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,__x64_sys_munmap+0xd/0x10 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,vm_munmap+0x63/0x94 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,do_munmap+0x24d/0x2c0 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,unmap_region+0xdb/0x105 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,tlb_finish_mmu+0x19/0x25 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,arch_tlb_finish_mmu+0x35/0x58 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,tlb_flush_mmu_free+0x28/0x3d 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,release_pages+0x2dd/0x301 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,free_unref_page_list+0xca/0x10f 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,free_pcppages_bulk+0x12a/0x479 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,bad_page+0xec/0x106 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,dump_stack+0x67/0x83 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,Call Trace: 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,"Hardware name: System manufacturer System Product Name/PRIME B250-PLUS, BIOS 0809 07/10/2017" 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,CPU: 0 PID: 24272 Comm: ghb Not tainted 4.19.107-Unraid #1 2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,Modules linked in: xt_nat arc4 ecb md4 sha512_ssse3 sha512_generic cmac cifs veth ccm ipt_MASQUERADE iptable_filter iptable_nat nf_nat_ipv4 nf_nat ip_tables ext4 mbcache jbd2 xfs md_mod i915 i2c_algo_bit iosf_mbi drm_kms_helper drm intel_gtt agpgart syscopyarea sysfillrect sysimgblt fb_sys_fops bonding x86_pkg_temp_thermal intel_powerclamp coretemp kvm_intel kvm crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel pcbc aesni_intel aes_x86_64 crypto_simd cryptd wmi_bmof mxm_wmi glue_helper intel_cstate intel_uncore intel_rapl_perf r8169 i2c_i801 i2c_core realtek ahci pata_jmicron libahci wmi video pcc_cpufreq backlight thermal acpi_pad button fan 2020-10-30,08:57:28,Alert,Yggdrasil,kern,kernel,page dumped because: nonzero mapcount 2020-10-30,08:57:28,Alert,Yggdrasil,kern,kernel,raw: 0000000000000000 0000000000000000 00000000ffbfffff 0000000000000000 2020-10-30,08:57:28,Alert,Yggdrasil,kern,kernel,raw: 02ffff0000000000 dead000000000100 dead000000000200 0000000000000000 2020-10-30,08:57:28,Emergency,Yggdrasil,kern,kernel,flags: 0x2ffff0000000000() 2020-10-30,08:57:28,Emergency,Yggdrasil,kern,kernel,page:ffffea000a74f340 count:0 mapcount:-4194304 mapping:0000000000000000 index:0x0 2020-10-30,08:57:28,Alert,Yggdrasil,kern,kernel,BUG: Bad page state in process ghb pfn:29d3cd Fehler.txt Quote Link to comment
vakilando Posted October 30, 2020 Share Posted October 30, 2020 Hm, sagt mir auf den ersten Blick nichts. Bitte führe die Diagnose aus (Tools>Diagnostics) und poste hier die Zip-Datei. Hast du "vor ein paar Tagen" etwas geändert? Neuer Docker, oder VM, neue Hardware, ...? Bin gerade unterwegs und kann daher leider nicht weiter gucken... Quote Link to comment
Fidel84 Posted October 30, 2020 Author Share Posted October 30, 2020 Nein habe nichts neues Installiert gehabt oder neue Hardware. Hatte auch schon Probiert manche Plugins zu löschen wie S3Sleep usw.. hatte aber auch nicht geholfen yggdrasil-diagnostics-20201030-1813.zip Quote Link to comment
mgutt Posted October 31, 2020 Share Posted October 31, 2020 (edited) Ein paar deiner Fehlermeldungen tauchen auch hier auf und der User hat es mit neuem RAM gelöst: https://forums.unraid.net/topic/57635-unresponsive-after-upgrade-to-635/?tab=comments#comment-576465 Also mach erstmal einen Mem-Test. Edited November 12, 2020 by mgutt Quote Link to comment
Fidel84 Posted October 31, 2020 Author Share Posted October 31, 2020 Alles klar danke schon mal für den Tipp noch eine kleine frage zum Memtest hatte ich hab 2x8gb verbaut kann ich sie gleichzeitig dann testen und der spukt mir nahher erröte auf Bank 1 aus oder muss ich jeweils einen ausbauen und testen? Danke Quote Link to comment
mgutt Posted October 31, 2020 Share Posted October 31, 2020 Wenn man Dual Channel fährt, ist das so ähnlich wie ein RAID0. Dh das Betriebssystem weiß nicht auf welchem Modul die Daten liegen. Also ja, du müsstest die einzeln testen. Quote Link to comment
Fidel84 Posted November 6, 2020 Author Share Posted November 6, 2020 So hat etwas gedauert hab den Memtest86 durchlaufen lassen jeweils einzeln über den Arbeitsspeicher keine Fehler gefunden Quote Link to comment
ich777 Posted November 6, 2020 Share Posted November 6, 2020 20 minutes ago, Fidel84 said: So hat etwas gedauert hab den Memtest86 durchlaufen lassen jeweils einzeln über den Arbeitsspeicher keine Fehler gefunden Hast du irgendwelche Plugins installiert oder ein Custom Unraid selbst? Probier mal im Safe mode oder zumindest ohne Plugins zu starten? Welche Hardware hast du genau verbaut (PCIe Karten, andere addon Karten,...), hast du evtl. einen SATA Port Multiplier dran? USB Stick ist auch neu und ohne Fehler? Quote Link to comment
Fidel84 Posted November 7, 2020 Author Share Posted November 7, 2020 Also usb stik hatte noch nie Fehler und ist recht "frisch" 4Monate alt. Hab ein zusätzlichen sata controller drin aber der hatte von Anfang an ohne Probleme funktioniert und wurde erkannt und erkannte auch die Platten. Zz tritt der Fehler auch nur noch Sporadisch auf an manchen Tagen sogar gar nicht. Solange alles im Hintergrund funktioniert soll es halt so sein beobachte das weiter vieleicht lässt der sich ja doch noch provozieren und herausfinden woher der kommt. Danke für die bisherigen Ideen Quote Link to comment
ich777 Posted November 7, 2020 Share Posted November 7, 2020 2 hours ago, Fidel84 said: Also usb stik hatte noch nie Fehler und ist recht "frisch" 4Monate alt. Hab ein zusätzlichen sata controller drin aber der hatte von Anfang an ohne Probleme funktioniert und wurde erkannt und erkannte auch die Platten. Zz tritt der Fehler auch nur noch Sporadisch auf an manchen Tagen sogar gar nicht. Solange alles im Hintergrund funktioniert soll es halt so sein beobachte das weiter vieleicht lässt der sich ja doch noch provozieren und herausfinden woher der kommt. Danke für die bisherigen Ideen Hast du das zfs plugin drauf? Quote Link to comment
Fidel84 Posted November 9, 2020 Author Share Posted November 9, 2020 Nein nutze XFS für array und btrfs fürs Cache Quote Link to comment
Fidel84 Posted November 12, 2020 Author Share Posted November 12, 2020 Heute Spammt mich das System mal wieder zu mit dem Fehler zu der Hardware habs mal aus den iommu kopiert IOMMU group 0:[8086:591f] 00:00.0 Host bridge: Intel Corporation Xeon E3-1200 v6/7th Gen Core Processor Host Bridge/DRAM Registers (rev 05) IOMMU group 1:[8086:5912] 00:02.0 VGA compatible controller: Intel Corporation HD Graphics 630 (rev 04) IOMMU group 2:[8086:a2af] 00:14.0 USB controller: Intel Corporation 200 Series/Z370 Chipset Family USB 3.0 xHCI Controller IOMMU group 3:[8086:a2ba] 00:16.0 Communication controller: Intel Corporation 200 Series PCH CSME HECI #1 IOMMU group 4:[8086:a282] 00:17.0 SATA controller: Intel Corporation 200 Series PCH SATA controller [AHCI mode] IOMMU group 5:[8086:a294] 00:1c.0 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #5 (rev f0) IOMMU group 6:[8086:a295] 00:1c.5 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #6 (rev f0) IOMMU group 7:[8086:a296] 00:1c.6 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #7 (rev f0) IOMMU group 8:[8086:a297] 00:1c.7 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #8 (rev f0) IOMMU group 9:[8086:a298] 00:1d.0 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #9 (rev f0) IOMMU group 10:[8086:a2c8] 00:1f.0 ISA bridge: Intel Corporation 200 Series PCH LPC Controller (B250) [8086:a2a1] 00:1f.2 Memory controller: Intel Corporation 200 Series/Z370 Chipset Family Power Management Controller [8086:a2f0] 00:1f.3 Audio device: Intel Corporation 200 Series PCH HD Audio [8086:a2a3] 00:1f.4 SMBus: Intel Corporation 200 Series/Z370 Chipset Family SMBus Controller IOMMU group 11:[197b:2363] 01:00.0 SATA controller: JMicron Technology Corp. JMB363 SATA/IDE Controller (rev 03) [197b:2363] 01:00.1 IDE interface: JMicron Technology Corp. JMB363 SATA/IDE Controller (rev 03) IOMMU group 12:[10ec:8168] 02:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 15) IOMMU group 13:[1b4b:9215] 03:00.0 SATA controller: Marvell Technology Group Ltd. Device 9215 (rev 11) IOMMU group 14:[1b21:1080] 04:00.0 PCI bridge: ASMedia Technology Inc. ASM1083/1085 PCIe to PCI Bridge (rev 04) als Plugins hab ich laufen Community Applications Dynamix Active Streams Dynamix Cache Directories Dynamix S3 Sleep Dynamix SSD TRIM Dynamix System Statistics Fix Common Problems Preclear Disks Tips and Tweaks Unassigned Devices und das + unBALANCE Quote Link to comment
mgutt Posted November 12, 2020 Share Posted November 12, 2020 (edited) Hast du den Memtest auch mal über beide laufen lassen? Vielleicht ist es ja tatsächlich so, dass es nur dann auftritt, wenn der RAM im Dual Channel Modus läuft. bzw teste doch mal einige Tage nur mit einem RAM Modul und schau ob es dann nicht mehr passiert. Auch hier ähnliche Fehlermeldungen und ebenfalls mit neuem RAM gelöst: https://forums.unraid.net/topic/87683-unraid-crashing/?tab=comments#comment-815031 https://forums.unraid.net/bug-reports/stable-releases/crash-with-bug-bad-page-map-in-process-php7-r314/?tab=comments#comment-2441 Hattest du beide RAM-Module mal draußen? Einer hat auch davon geschrieben, dass er gelesen hat, dass neu reinstecken mal geholfen hätte (von wegen mangelhafter Kontakt). Edited November 12, 2020 by mgutt Quote Link to comment
ich777 Posted November 12, 2020 Share Posted November 12, 2020 2 hours ago, Fidel84 said: Fix Common Problems Preclear Disks Tips and Tweaks unBALANCE Könntest du diese Plugins mal vorübergehend deinstallieren und nach ein paar Tagen berichten ob sich was gebessert hat? EDIT: hab mir mal dein log angesehen dieser Fehler: Oct 30 14:37:44 Yggdrasil kernel: BUG: Bad page state in process kswapd0 pfn:285a9b deutet eindeutig auf einen Hardware defekt hin aber ob es der RAM, CPU, Motherboard ist kann man nicht herauslesen. kswapd0 ist für den virtuellen Arbeitsspeicher zuständig heißt jetzt aber nicht per se das es an deinem Arbeitsspeicher liegt... 1 Quote Link to comment
Fidel84 Posted November 12, 2020 Author Share Posted November 12, 2020 (edited) Also vor dem RAM test hatte sie jeweils komplett draußen und die Bänke durchgepustet. Dann eins eingebaut und den Memtest86 8.4 laufen lassen das vom unraid usb ist einfach nicht gestartet deswegen die neueste geholt. Nachdem der test ok war wieder ausgebaut den anderen rein und wieder laufen lassen. Werde morgen früh dann auch mal beide gleichzeitig laufen lassen und berichten. Das mit den Plugins ist auch kein Problem werde die löschen zZ werden diese kaum genutzt. Kleines Update nachdem der Fehler mir heute quasi jede Minute gemeldet wurde und ich ein Neustart gemacht habe hörte die Meldung/Fehler seit 2h auf (falls diese Info was bringt) deutet eindeutig auf einen Hardware defekt hin aber ob es der RAM, CPU, Motherboard ist kann man nicht herauslesen. Das wird ja immer schlimmer 😭 aber hoffen wir mal auf das beste Edited November 12, 2020 by Fidel84 1 Quote Link to comment
mgutt Posted November 12, 2020 Share Posted November 12, 2020 1 hour ago, ich777 said: kswapd0 ist für den virtuellen Arbeitsspeicher zuständig heißt jetzt aber nicht per se das es an deinem Arbeitsspeicher liegt... Ich habe viel dazu recherchiert und der Prozessname ist meiner Ansicht nach sogar unwichtig. Immer dann wenn "Bad Page state in process" auftaucht und das Problem gelöst wurde, hatte es was mit dem RAM zu tun. Alle anderen Meldungen, die ich dazu gefunden habe, endeten ungelöst (zumindest haben die betroffenen User nichts mehr gepostet). Könnte allerdings auch heißen, dass vielleicht was Schlimmeres kaputt war, was man nicht so eben ersetzt wie zB das Board, weshalb deswegen die Meldungen ausblieben. Zwei User habe ich jedenfalls noch angeschrieben, die nichts mehr dazu geschrieben haben. Mal sehen wie die das schlussendlich gelöst haben. 1 Quote Link to comment
Fidel84 Posted November 12, 2020 Author Share Posted November 12, 2020 Hab jetzt mal noch zum Testen bei einen frischen Ram-Riegel bestellt der kommt am Samstag. Quote Link to comment
ich777 Posted November 13, 2020 Share Posted November 13, 2020 8 hours ago, Fidel84 said: Hab jetzt mal noch zum Testen bei einen frischen Ram-Riegel bestellt der kommt am Samstag. Wie gesagt es muss nicht am RAM liegen, es kann auch das Motherboard oder die CPU sein (CPU eher weniger aber wie gesagt nicht auszuschließen). 1 Quote Link to comment
Fidel84 Posted November 13, 2020 Author Share Posted November 13, 2020 (edited) das ist klar und wenn der fehler nicht verschwindet gehen die auch wieder zurück. die besagten Plugins hatte auch entfernt keine verbesserung hab nun mit beiden laufen lasen und keine fehler Edited November 13, 2020 by Fidel84 Quote Link to comment
mgutt Posted November 15, 2020 Share Posted November 15, 2020 Ich hatte ja gesagt, dass ich noch welche wegen dem "bad page" Fehler per PN kontaktiert habe. Ometoch hat mir nun per PN geschrieben, dass auch er das Problem mit neuem RAM gelöst hat, obwohl sein memtest jedesmal fehlerfrei durchlief: Quote Yup, new RAM fixed it, even though it didn't fall memtest86 1 Quote Link to comment
Fidel84 Posted November 15, 2020 Author Share Posted November 15, 2020 Wollte erst morgen schreiben und auf eine Nummer sicher gehen. Seit 2d läuft und Startet der Server ohne Probleme nachdem ich den Neuen Arbeitsspeicher eingebaut hatte die log ist Sauben und er schreit nicht vor Fehlern. Kann also auch bestätigen das dieser Fehler am Arbeitsspeicher liegt. Verstehe zwar immernoch nicht wieso weil der Test war ja mehrfach sauber. Danke nochmal an alle die hier geholfen haben 1 Quote Link to comment
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.