[SOLVED] BUG: Bad page


Fidel84

Recommended Posts

Hallo allerseits 

Unraid 6.8.3 meldet mir seit ein paar Tagen immer den gleichen Fehler und ich finde einfach nicht woher der kommt oder ob der relevant ist.

Der Server an sich funktioniert Tadellos so das mir da kein Fehler bisher aufgefallen war außer ab und zu das nach dem Herunterfahren er noch an war und über die GUI nicht erreichbar war. Die Protokolle werden bei mir auf der Synology gespeichert.

Von unten nach oben das spukt er mir immer wieder mal aus. Habe in der Zeit nichts neues Installiert oder gemacht.

Hoffe ist so ok 

 

 

2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,Disabling lock debugging due to kernel taint
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,R13: 000000000000000c R14: 000055a1fcb2db8b R15: 000055a1fcb2c740
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,R10: 0000000000000022 R11: 0000000000000246 R12: 000055a1fcb2ddae
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RBP: 0000000000371000 R08: 000014d128ae0010 R09: 000055a1fcb30ae0
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RDX: 0000000000000000 RSI: 0000000000371000 RDI: 000014d128ae0000
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RAX: ffffffffffffffda RBX: 0000000000000007 RCX: 000014d12f9a3d59
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RSP: 002b:00007ffd6dfcce30 EFLAGS: 00000246 ORIG_RAX: 000000000000000b
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,Code: 89 c7 e8 7d 97 fe ff 5a c3 55 48 89 f5 48 83 ec 10 48 89 7c 24 08 e8 34 ea 01 00 48 8b 7c 24 08 b8 0b 00 00 00 48 89 ee 0f 05 <48> 89 c7 e8 52 97 fe ff 48 83 c4 10 5d c3 31 c0 83 fa 04 74 0c 48
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,RIP: 0033:0x14d12f9a3d59
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,entry_SYSCALL_64_after_hwframe+0x44/0xa9
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,do_syscall_64+0x57/0xf2
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,__x64_sys_munmap+0xd/0x10
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,vm_munmap+0x63/0x94
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,do_munmap+0x24d/0x2c0
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,unmap_region+0xdb/0x105
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,tlb_finish_mmu+0x19/0x25
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,arch_tlb_finish_mmu+0x35/0x58
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,tlb_flush_mmu_free+0x28/0x3d
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,release_pages+0x2dd/0x301
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,free_unref_page_list+0xca/0x10f
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,free_pcppages_bulk+0x12a/0x479
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,bad_page+0xec/0x106
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,dump_stack+0x67/0x83
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,Call Trace:
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,"Hardware name: System manufacturer System Product Name/PRIME B250-PLUS, BIOS 0809 07/10/2017"
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,CPU: 0 PID: 24272 Comm: ghb Not tainted 4.19.107-Unraid #1
2020-10-30,08:57:28,Warning,Yggdrasil,kern,kernel,Modules linked in: xt_nat arc4 ecb md4 sha512_ssse3 sha512_generic cmac cifs veth ccm ipt_MASQUERADE iptable_filter iptable_nat nf_nat_ipv4 nf_nat ip_tables ext4 mbcache jbd2 xfs md_mod i915 i2c_algo_bit iosf_mbi drm_kms_helper drm intel_gtt agpgart syscopyarea sysfillrect sysimgblt fb_sys_fops bonding x86_pkg_temp_thermal intel_powerclamp coretemp kvm_intel kvm crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel pcbc aesni_intel aes_x86_64 crypto_simd cryptd wmi_bmof mxm_wmi glue_helper intel_cstate intel_uncore intel_rapl_perf r8169 i2c_i801 i2c_core realtek ahci pata_jmicron libahci wmi video pcc_cpufreq backlight thermal acpi_pad button fan
2020-10-30,08:57:28,Alert,Yggdrasil,kern,kernel,page dumped because: nonzero mapcount
2020-10-30,08:57:28,Alert,Yggdrasil,kern,kernel,raw: 0000000000000000 0000000000000000 00000000ffbfffff 0000000000000000
2020-10-30,08:57:28,Alert,Yggdrasil,kern,kernel,raw: 02ffff0000000000 dead000000000100 dead000000000200 0000000000000000
2020-10-30,08:57:28,Emergency,Yggdrasil,kern,kernel,flags: 0x2ffff0000000000()
2020-10-30,08:57:28,Emergency,Yggdrasil,kern,kernel,page:ffffea000a74f340 count:0 mapcount:-4194304 mapping:0000000000000000 index:0x0
2020-10-30,08:57:28,Alert,Yggdrasil,kern,kernel,BUG: Bad page state in process ghb  pfn:29d3cd

Fehler.txt

Link to comment
20 minutes ago, Fidel84 said:

So hat etwas gedauert hab den Memtest86 durchlaufen lassen jeweils einzeln über den Arbeitsspeicher keine Fehler gefunden 

Hast du irgendwelche Plugins installiert oder ein Custom Unraid selbst?

 

Probier mal im Safe mode oder zumindest ohne Plugins zu starten?

Welche Hardware hast du genau verbaut (PCIe Karten, andere addon Karten,...), hast du evtl. einen SATA Port Multiplier dran?

USB Stick ist auch neu und ohne Fehler?

Link to comment

Also usb stik hatte noch nie Fehler und ist recht "frisch" 4Monate alt. 

Hab ein zusätzlichen sata controller drin aber der hatte von Anfang an ohne Probleme funktioniert und wurde erkannt und erkannte auch die Platten. 

 

Zz tritt der Fehler auch nur noch Sporadisch auf an manchen Tagen sogar gar nicht. 

Solange alles im Hintergrund funktioniert soll es halt so sein beobachte das weiter vieleicht lässt der sich ja doch noch provozieren und herausfinden woher der kommt. 

 

Danke für die bisherigen Ideen 

Link to comment
2 hours ago, Fidel84 said:

Also usb stik hatte noch nie Fehler und ist recht "frisch" 4Monate alt. 

Hab ein zusätzlichen sata controller drin aber der hatte von Anfang an ohne Probleme funktioniert und wurde erkannt und erkannte auch die Platten. 

 

Zz tritt der Fehler auch nur noch Sporadisch auf an manchen Tagen sogar gar nicht. 

Solange alles im Hintergrund funktioniert soll es halt so sein beobachte das weiter vieleicht lässt der sich ja doch noch provozieren und herausfinden woher der kommt. 

 

Danke für die bisherigen Ideen 

Hast du das zfs plugin drauf?

Link to comment

Heute Spammt mich das System mal wieder zu mit dem Fehler

zu der Hardware habs mal aus den iommu kopiert

IOMMU group 0:[8086:591f] 00:00.0 Host bridge: Intel Corporation Xeon E3-1200 v6/7th Gen Core Processor Host Bridge/DRAM Registers (rev 05)

IOMMU group 1:[8086:5912] 00:02.0 VGA compatible controller: Intel Corporation HD Graphics 630 (rev 04)

IOMMU group 2:[8086:a2af] 00:14.0 USB controller: Intel Corporation 200 Series/Z370 Chipset Family USB 3.0 xHCI Controller

IOMMU group 3:[8086:a2ba] 00:16.0 Communication controller: Intel Corporation 200 Series PCH CSME HECI #1

IOMMU group 4:[8086:a282] 00:17.0 SATA controller: Intel Corporation 200 Series PCH SATA controller [AHCI mode]

IOMMU group 5:[8086:a294] 00:1c.0 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #5 (rev f0)

IOMMU group 6:[8086:a295] 00:1c.5 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #6 (rev f0)

IOMMU group 7:[8086:a296] 00:1c.6 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #7 (rev f0)

IOMMU group 8:[8086:a297] 00:1c.7 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #8 (rev f0)

IOMMU group 9:[8086:a298] 00:1d.0 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #9 (rev f0)

IOMMU group 10:[8086:a2c8] 00:1f.0 ISA bridge: Intel Corporation 200 Series PCH LPC Controller (B250)

[8086:a2a1] 00:1f.2 Memory controller: Intel Corporation 200 Series/Z370 Chipset Family Power Management Controller

[8086:a2f0] 00:1f.3 Audio device: Intel Corporation 200 Series PCH HD Audio

[8086:a2a3] 00:1f.4 SMBus: Intel Corporation 200 Series/Z370 Chipset Family SMBus Controller

IOMMU group 11:[197b:2363] 01:00.0 SATA controller: JMicron Technology Corp. JMB363 SATA/IDE Controller (rev 03)

[197b:2363] 01:00.1 IDE interface: JMicron Technology Corp. JMB363 SATA/IDE Controller (rev 03)

IOMMU group 12:[10ec:8168] 02:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 15)

IOMMU group 13:[1b4b:9215] 03:00.0 SATA controller: Marvell Technology Group Ltd. Device 9215 (rev 11)

IOMMU group 14:[1b21:1080] 04:00.0 PCI bridge: ASMedia Technology Inc. ASM1083/1085 PCIe to PCI Bridge (rev 04)

 

als Plugins hab ich laufen

 

Community Applications

Dynamix Active Streams

Dynamix Cache Directories

Dynamix S3 Sleep

Dynamix SSD TRIM

Dynamix System Statistics

Fix Common Problems

Preclear Disks

Tips and Tweaks

Unassigned Devices und das +

unBALANCE

 

 

 

 

 

 

Link to comment

Hast du den Memtest auch mal über beide laufen lassen? Vielleicht ist es ja tatsächlich so, dass es nur dann auftritt, wenn der RAM im Dual Channel Modus läuft. bzw teste doch mal einige Tage nur mit einem RAM Modul und schau ob es dann nicht mehr passiert.

 

Auch hier ähnliche Fehlermeldungen und ebenfalls mit neuem RAM gelöst:

 

https://forums.unraid.net/topic/87683-unraid-crashing/?tab=comments#comment-815031

 

https://forums.unraid.net/bug-reports/stable-releases/crash-with-bug-bad-page-map-in-process-php7-r314/?tab=comments#comment-2441

 

Hattest du beide RAM-Module mal draußen? Einer hat auch davon geschrieben, dass er gelesen hat, dass neu reinstecken mal geholfen hätte (von wegen mangelhafter Kontakt).

Edited by mgutt
Link to comment
2 hours ago, Fidel84 said:

Fix Common Problems

Preclear Disks

Tips and Tweaks

unBALANCE

Könntest du diese Plugins mal vorübergehend deinstallieren und nach ein paar Tagen berichten ob sich was gebessert hat?

 

EDIT: hab mir mal dein log angesehen dieser Fehler:

Oct 30 14:37:44 Yggdrasil kernel: BUG: Bad page state in process kswapd0  pfn:285a9b

deutet eindeutig auf einen Hardware defekt hin aber ob es der RAM, CPU, Motherboard ist kann man nicht herauslesen.

 

kswapd0 ist für den virtuellen Arbeitsspeicher zuständig heißt jetzt aber nicht per se das es an deinem Arbeitsspeicher liegt...

  • Thanks 1
Link to comment

Also vor dem RAM test hatte sie jeweils komplett draußen und die Bänke durchgepustet. Dann eins eingebaut und den Memtest86 8.4 laufen lassen das vom unraid usb ist einfach nicht gestartet deswegen die neueste geholt. Nachdem der test ok war wieder ausgebaut den anderen rein und wieder laufen lassen. 

 

Werde morgen früh dann auch mal beide gleichzeitig laufen lassen und berichten. 

 

Das mit den Plugins ist auch kein Problem werde die löschen zZ werden diese kaum genutzt. 

 

Kleines Update nachdem der Fehler mir heute quasi jede Minute gemeldet wurde und ich ein Neustart gemacht habe hörte die Meldung/Fehler seit 2h auf (falls diese Info was bringt) 

 

 

deutet eindeutig auf einen Hardware defekt hin aber ob es der RAM, CPU, Motherboard ist kann man nicht herauslesen.

 

 

Das wird ja immer schlimmer 😭 aber hoffen wir mal auf das beste

 

 

Edited by Fidel84
  • Thanks 1
Link to comment
1 hour ago, ich777 said:

kswapd0 ist für den virtuellen Arbeitsspeicher zuständig heißt jetzt aber nicht per se das es an deinem Arbeitsspeicher liegt...

Ich habe viel dazu recherchiert und der Prozessname ist meiner Ansicht nach sogar unwichtig. Immer dann wenn "Bad Page state in process" auftaucht und das Problem gelöst wurde, hatte es was mit dem RAM zu tun. Alle anderen Meldungen, die ich dazu gefunden habe, endeten ungelöst (zumindest haben die betroffenen User nichts mehr gepostet). Könnte allerdings auch heißen, dass vielleicht was Schlimmeres kaputt war, was man nicht so eben ersetzt wie zB das Board, weshalb deswegen die Meldungen ausblieben. Zwei User habe ich jedenfalls noch angeschrieben, die nichts mehr dazu geschrieben haben. Mal sehen wie die das schlussendlich gelöst haben.

  • Thanks 1
Link to comment

Wollte erst morgen schreiben und auf eine Nummer sicher gehen. 

Seit 2d läuft und Startet der Server ohne Probleme nachdem ich den Neuen Arbeitsspeicher eingebaut hatte die log ist Sauben und er schreit nicht vor Fehlern.

Kann also auch bestätigen das dieser Fehler am Arbeitsspeicher liegt.

Verstehe zwar immernoch nicht wieso weil der Test war ja mehrfach sauber.

 

Danke nochmal an alle die hier geholfen haben 

 

  • Like 1
Link to comment
  • ich777 changed the title to [SOLVED] BUG: Bad page

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.