February 14, 20251 yr Hallo, heute morgen habe ich im Syslog folgende Fehlermeldungen gefunden. Feb 14 06:36:35 TheTwist kernel: mce: [Hardware Error]: Machine check events logged Feb 14 06:36:35 TheTwist kernel: [Hardware Error]: Corrected error, no action required. Feb 14 06:36:35 TheTwist kernel: [Hardware Error]: CPU:1 (19:21:2) MC11_STATUS[-|CE|-|-|-|SyndV|CECC|-|Poison|-]: 0x80ff4865000001b0 Feb 14 06:36:35 TheTwist kernel: [Hardware Error]: IPID: 0x0000000000000000, Syndrome: 0x0000000000000000 Feb 14 06:36:35 TheTwist kernel: [Hardware Error]: Bank 11 is reserved. Feb 14 06:36:35 TheTwist kernel: [Hardware Error]: cache level: RESV, tx: INSN, mem-tx: Wrong R4! Hat jemand eine idee was das gewesen sein könnte ? Danach gab es auch noch vereinzelnde Meldungen ich weiß aber nicht ob diese zusammenhängen. Feb 14 08:10:50 TheTwist kernel: usb 1-3: can't set config #1, error -71 Feb 14 08:10:51 TheTwist kernel: usb 1-3: device not accepting address 10, error -71 Feb 14 08:10:52 TheTwist kernel: usb usb1-port3: Cannot enable. Maybe the USB cable is bad? Feb 14 08:10:52 TheTwist kernel: usb usb1-port3: attempt power cycle Feb 14 08:10:54 TheTwist kernel: usb 1-3: device descriptor read/64, error -71 Dann beim Kopieren auf die USB Festplatte kamen solche Meldungen. Die Smartwerte sehe Okay aus. Feb 14 09:03:30 TheTwist ntfs-3g[62522]: ntfs_mst_post_read_fixup_warn: magic: 0x0000ff41 size: 4096 usa_ofs: 38859 usa_count: 54107: Invalid argument Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Corrupt index block signature: vcn 563 inode 603351 Feb 14 09:03:30 TheTwist ntfs-3g[62522]: ntfs_mst_post_read_fixup_warn: magic: 0x0000ff41 size: 4096 usa_ofs: 9910 usa_count: 2315: Invalid argument Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Corrupt index block signature: vcn 69 inode 603351 Feb 14 09:03:30 TheTwist ntfs-3g[62522]: ntfs_mst_post_read_fixup_warn: magic: 0x0000ff41 size: 4096 usa_ofs: 9910 usa_count: 2315: Invalid argument Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Corrupt index block signature: vcn 69 inode 603351 Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Failed to find place for new entry: Input/output error Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Failed to add entry to the index: Input/output error Evtl. wie in der Meldung oben ein defektes USB Kable ? Gehören all diese Meldungen zusammen ?
February 14, 20251 yr Author Jetzt habe ich sogar im LogFile einen call trace im LogFile ..... Feb 14 10:06:12 TheTwist kernel: ------------[ cut here ]------------ Feb 14 10:06:12 TheTwist kernel: Can't encode file handler for inotify: 255 Feb 14 10:06:12 TheTwist kernel: WARNING: CPU: 21 PID: 208725 at fs/notify/fdinfo.c:55 show_mark_fhandle+0x77/0xe6 Feb 14 10:06:12 TheTwist kernel: Modules linked in: cmac cifs asn1_decoder cifs_arc4 nls_ucs2_utils cifs_md4 dns_resolver vhci_hcd usbip_host usbip_core xt_CHECKSUM ipt_REJECT nf_reject_ipv4 ip6table_mangle iptable_mangle vhost_net vhost vhost_iotlb tap xt_nat veth ipvlan xt_conntrack nf_conntrack_netlink xfrm_user xfrm_algo xt_addrtype br_netfilter dm_crypt dm_mod nfsd auth_rpcgss oid_registry lockd grace sunrpc md_mod zfs(PO) spl(O) xt_tcpudp xt_mark tun nf_tables nfnetlink ip6table_nat ntfs3 tcp_diag inet_diag iptable_nat xt_MASQUERADE nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 wireguard curve25519_x86_64 libcurve25519_generic libchacha20poly1305 chacha_x86_64 poly1305_x86_64 ip6_udp_tunnel udp_tunnel libchacha ip6table_filter ip6_tables iptable_filter ip_tables x_tables bridge stp llc amd64_edac edac_mce_amd edac_core intel_rapl_common iosf_mbi kvm_amd kvm crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel sha512_ssse3 sha256_ssse3 sha1_ssse3 aesni_intel crypto_simd cryptd rapl acpi_cpufreq k10temp joydev input_leds Feb 14 10:06:12 TheTwist kernel: i2c_piix4 igb wmi_bmof ccp mxm_wmi nvme ahci i2c_algo_bit xpad libahci corsair_psu led_class i2c_core nvme_core tpm_crb tpm_tis tpm_tis_core tpm wmi button Feb 14 10:06:12 TheTwist kernel: CPU: 21 PID: 208725 Comm: lsof Tainted: P O 6.6.68-Unraid #1 Feb 14 10:06:12 TheTwist kernel: Hardware name: To Be Filled By O.E.M. X570 Taichi/X570 Taichi, BIOS P5.60 01/18/2024 Feb 14 10:06:12 TheTwist kernel: RIP: 0010:show_mark_fhandle+0x77/0xe6 Feb 14 10:06:12 TheTwist kernel: Code: ff 00 00 00 89 c1 74 04 85 c0 79 22 80 3d 6c ad 2c 01 00 75 5e 89 ce 48 c7 c7 6b 03 26 82 c6 05 5a ad 2c 01 01 e8 4f 75 d8 ff <0f> 0b eb 45 89 44 24 0c 8b 44 24 04 48 89 ef 31 db 48 c7 c6 a9 03 Feb 14 10:06:12 TheTwist kernel: RSP: 0018:ffffc90023a6fc10 EFLAGS: 00010286 Feb 14 10:06:12 TheTwist kernel: RAX: 0000000000000000 RBX: ffff8881055682d8 RCX: 0000000000000027 Feb 14 10:06:12 TheTwist kernel: RDX: 0000000082c1dcb0 RSI: ffffffff822451fd RDI: 00000000ffffffff Feb 14 10:06:12 TheTwist kernel: RBP: ffff8881083e57f8 R08: 0000000000000000 R09: ffffffff82c1dcb0 Feb 14 10:06:12 TheTwist kernel: R10: 00003fffffffffff R11: 0000000000000032 R12: ffff8881083e57f8 Feb 14 10:06:12 TheTwist kernel: R13: ffff8881083e57f8 R14: ffffffff812ed212 R15: ffff888105891678 Feb 14 10:06:12 TheTwist kernel: FS: 0000148390de3f00(0000) GS:ffff888ffed40000(0000) knlGS:0000000000000000 Feb 14 10:06:12 TheTwist kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 Feb 14 10:06:12 TheTwist kernel: CR2: 00000000004c5048 CR3: 0000000949b2e000 CR4: 0000000000750ee0 Feb 14 10:06:12 TheTwist kernel: PKRU: 55555554 Feb 14 10:06:12 TheTwist kernel: Call Trace: Feb 14 10:06:12 TheTwist kernel: <TASK> Feb 14 10:06:12 TheTwist kernel: ? __warn+0x99/0x11a Feb 14 10:06:12 TheTwist kernel: ? report_bug+0xd9/0x153 Feb 14 10:06:12 TheTwist kernel: ? show_mark_fhandle+0x77/0xe6 Feb 14 10:06:12 TheTwist kernel: ? handle_bug+0x53/0x7c Feb 14 10:06:12 TheTwist kernel: ? exc_invalid_op+0x13/0x60 Feb 14 10:06:12 TheTwist kernel: ? asm_exc_invalid_op+0x16/0x20 Feb 14 10:06:12 TheTwist kernel: ? __pfx_inotify_fdinfo+0x10/0x10 Feb 14 10:06:12 TheTwist kernel: ? show_mark_fhandle+0x77/0xe6 Feb 14 10:06:12 TheTwist kernel: ? __pfx_inotify_fdinfo+0x10/0x10 Feb 14 10:06:12 TheTwist kernel: ? srso_alias_return_thunk+0x5/0xfbef5 Feb 14 10:06:12 TheTwist kernel: ? seq_vprintf+0x2d/0x49 Feb 14 10:06:12 TheTwist kernel: ? srso_alias_return_thunk+0x5/0xfbef5 Feb 14 10:06:12 TheTwist kernel: ? seq_printf+0x53/0x6e Feb 14 10:06:12 TheTwist kernel: ? preempt_latency_start+0x2b/0x46 Feb 14 10:06:12 TheTwist kernel: ? srso_alias_return_thunk+0x5/0xfbef5 Feb 14 10:06:12 TheTwist kernel: inotify_fdinfo+0x83/0xaa Feb 14 10:06:12 TheTwist kernel: show_fdinfo.isra.0+0x66/0xab Feb 14 10:06:12 TheTwist kernel: seq_show+0x155/0x173 Feb 14 10:06:12 TheTwist kernel: seq_read_iter+0x171/0x353 Feb 14 10:06:12 TheTwist kernel: seq_read+0x91/0xbb Feb 14 10:06:12 TheTwist kernel: vfs_read+0xa7/0x1d1 Feb 14 10:06:12 TheTwist kernel: ? srso_alias_return_thunk+0x5/0xfbef5 Feb 14 10:06:12 TheTwist kernel: ? __do_sys_newfstat+0x34/0x5c Feb 14 10:06:12 TheTwist kernel: ksys_read+0x74/0xc0 Feb 14 10:06:12 TheTwist kernel: do_syscall_64+0x57/0x7b Feb 14 10:06:12 TheTwist kernel: entry_SYSCALL_64_after_hwframe+0x78/0xe2 Feb 14 10:06:12 TheTwist kernel: RIP: 0033:0x14839107b6ed Feb 14 10:06:12 TheTwist kernel: Code: 21 87 0e 00 f7 d8 64 89 02 b8 ff ff ff ff eb bb 66 2e 0f 1f 84 00 00 00 00 00 0f 1f 00 80 3d 59 0b 0f 00 00 74 17 31 c0 0f 05 <48> 3d 00 f0 ff ff 77 5b c3 66 2e 0f 1f 84 00 00 00 00 00 48 83 ec Feb 14 10:06:12 TheTwist kernel: RSP: 002b:00007ffcd421da48 EFLAGS: 00000246 ORIG_RAX: 0000000000000000 Feb 14 10:06:12 TheTwist kernel: RAX: ffffffffffffffda RBX: 000000000043f600 RCX: 000014839107b6ed Feb 14 10:06:12 TheTwist kernel: RDX: 0000000000000400 RSI: 0000000000447930 RDI: 0000000000000007 Feb 14 10:06:12 TheTwist kernel: RBP: 00001483911631f0 R08: 0000000000000001 R09: 0000000000000000 Feb 14 10:06:12 TheTwist kernel: R10: 0000000000000000 R11: 0000000000000246 R12: 00001483911630a0 Feb 14 10:06:12 TheTwist kernel: R13: 0000000000000000 R14: 0000000000001000 R15: 000000000043f600 Feb 14 10:06:12 TheTwist kernel: </TASK> Feb 14 10:06:12 TheTwist kernel: ---[ end trace 0000000000000000 ]--- Hier mal mein Diagnosefiles wenn jemand lust hat diese sich anzuschauen. thetwist-diagnostics-20250214-1011.zip
February 14, 20251 yr Community Expert 1 hour ago, Thorsten said: heute morgen habe ich im Syslog folgende Fehlermeldungen gefunden. Feb 14 08:10:50 TheTwist kernel: usb 1-3: can't set config #1, error -71 Feb 14 08:10:51 TheTwist kernel: usb 1-3: device not accepting address 10, error -71 Feb 14 08:10:52 TheTwist kernel: usb usb1-port3: Cannot enable. Maybe the USB cable is bad? Feb 14 08:10:52 TheTwist kernel: usb usb1-port3: attempt power cycle Feb 14 08:10:54 TheTwist kernel: usb 1-3: device descriptor read/64, error -71 Dann beim Kopieren auf die USB Festplatte kamen solche Meldungen. Die Smartwerte sehe Okay aus. Feb 14 09:03:30 TheTwist ntfs-3g[62522]: ntfs_mst_post_read_fixup_warn: magic: 0x0000ff41 size: 4096 usa_ofs: 38859 usa_count: 54107: Invalid argument Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Corrupt index block signature: vcn 563 inode 603351 Feb 14 09:03:30 TheTwist ntfs-3g[62522]: ntfs_mst_post_read_fixup_warn: magic: 0x0000ff41 size: 4096 usa_ofs: 9910 usa_count: 2315: Invalid argument Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Corrupt index block signature: vcn 69 inode 603351 Feb 14 09:03:30 TheTwist ntfs-3g[62522]: ntfs_mst_post_read_fixup_warn: magic: 0x0000ff41 size: 4096 usa_ofs: 9910 usa_count: 2315: Invalid argument Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Corrupt index block signature: vcn 69 inode 603351 Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Failed to find place for new entry: Input/output error Feb 14 09:03:30 TheTwist ntfs-3g[62522]: Failed to add entry to the index: Input/output error Evtl. wie in der Meldung oben ein defektes USB Kable ? Gehören all diese Meldungen zusammen ? Zu Deiner ersten Meldung kann ich nichts sagen, aber der zweite und dritte Abschnitt zuammen betrachtet könnten ja schon auf ein Problem mit dem USB Port/Kabel/Datenträger hindeuten.
February 14, 20251 yr Author Danke Dir für die Info. Ich habe die Fehler mit dem USB gefunden. Erstens das USB Case hatte einen Wackler im Stecker zweitens das Laufwerk mit NTFS hatte ein korruptes Filesystem. Habe die Festplatte formatiert mit xfs weil diese nur als Backup Platte läuft. Gerade wird sie neu bespielt. Schauen wir mal ob es nun wieder ohne Probleme läuft. Zum Call Trace habe ich folgenden Eintrag im Forum gefunden. https://forums.unraid.net/topic/182955-unraid-70-rc1-kernel-error-zfs-related/ Bleibt nur der erste Fehler über! Hat dazu jemand aus der Communtiy noch ne Idee was das sein könnte ? Edited February 14, 20251 yr by Thorsten
February 18, 20251 yr Author Hallo zusammen, heute ist leider wieder eine Hardware Error Meldung aufgetreten. Kann das auch am ECC RAM liegen ? Feb 18 22:18:39 TheTwist kernel: mce: [Hardware Error]: Machine check events logged Feb 18 22:18:39 TheTwist kernel: [Hardware Error]: Deferred error, no action required. Feb 18 22:18:39 TheTwist kernel: [Hardware Error]: CPU:1 (19:21:2) MC24_STATUS[-|-|-|-|-|-|Deferred|-|-]: 0x9090909090900000 Feb 18 22:18:39 TheTwist kernel: [Hardware Error]: IPID: 0x0000000000000000 Feb 18 22:18:39 TheTwist kernel: [Hardware Error]: Bank 24 is reserved. Feb 18 22:18:39 TheTwist kernel: [Hardware Error]: cache level: RESV, tx: INSN Ist das die gleiche Meldung wie meine erste ? - Wie kann man heraus lesen was das Problem ist. Der Server lief mehr als 11 Std. ohne Fehler und Probleme...
February 18, 20251 yr Author Was kann ich machen und den Fehler weiter auf dem Grund zu kommen? mcelog: ERROR: AMD Processor family 25: mcelog does not support this processor. Please use the edac_mce_amd module instead. Im Syslog steht auch auch das mcelog meinen Processor nicht unterstützt. Wie lade ich diese edac_mce_amd module unter Unraid ?
February 23, 20251 yr Author Hi, die letzen Tagen hatte ich keinen Fehler mehr gehabt. Nachdem ich die Frequenz des Speichers so eingestellt habe wie es im Mainboard Handbuch beschrieben steht. Bei 4 Bänken auf DDR4-1866 MHz. Doch heute Nacht ist wieder ein Fehler aufgetreten. Ich weiß nicht woher er kommt. Oder wie ich es weiter eingrenzen kann. Ein Speicher Test mit Memtest86+ lief mehrmals ohne Fehler durch. Ich verwende ECC Speicher auf einem Asrock Taichi X570 Mainboard mit einem Ryzen 9 5900x. eb 23 01:34:42 TheTwist kernel: mce: [Hardware Error]: Machine check events logged Feb 23 01:34:42 TheTwist kernel: [Hardware Error]: Deferred error, no action required. Feb 23 01:34:42 TheTwist kernel: [Hardware Error]: CPU:1 (19:21:2) MC24_STATUS[-|-|-|-|-|SyndV|UECC|Deferred|Poison|Scrub]: 0x81787b8d480c74ed Feb 23 01:34:42 TheTwist kernel: [Hardware Error]: IPID: 0x0000000000000000, Syndrome: 0x0000000000000000 Feb 23 01:34:42 TheTwist kernel: [Hardware Error]: Bank 24 is reserved. Feb 23 01:34:42 TheTwist kernel: [Hardware Error]: cache level: L1, tx: RESV Ich weiß nicht wie man aus dieser Meldung die Ursache eingrenzen könnte. Hat von Euch jemand ne Idee ? @Squid Hi squid do you know this error? I have seen in the forum that you could say the most about the mce error. What do you think is the CPU dying? I have tested the memory several times and no errors were detected. I have changed the memory setting from DDR4-2666 to DD4-1866 as it says in the manual for 4 banks. I use ECC memory. Bios is also the latest version. thetwist-diagnostics-20250223-1024.zip VG Thorsten Edited February 23, 20251 yr by Thorsten
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.