Jump to content

Kein zugriff nach Parity Check


sakistech

Recommended Posts

Hallo zusammen,

seit paar Tagen habe ich ein Problem mit meinem Server.

Ich starte den Server Morgens an, dann startet der Parity Check, in der Mittagspause greife ich per VPN auf den Server um zu gucken ob alles geht. der Parity-Check findet und korrigiert mehrere fehler und nach ca 10 Stunden (wenn ich wieder Heim bin) habe ich keinen Zugriff auf WebGUI und SSH, Container etc. dann hilft nur ein Hard-Reset, sprich Powerbutton gedrückt halten, dann geht das gleiche spiel wieder soll. Morgens starte ich den Server usw...

Das mache ich jetzt seit 2 Tagen.

Weiß einer woran das liegen kann?

 

Edit: hier noch ein aktueller log mit VPN zugriff.

grafik.thumb.png.ccae518cda179185d5f7b2c04e829ade.png

 

grafik.png.45ba94af298d1cb3613ec8c510707cfa.png

 

# btrfs dev stats /mnt/cache
[/dev/nvme0n1p1].write_io_errs    0
[/dev/nvme0n1p1].read_io_errs     0
[/dev/nvme0n1p1].flush_io_errs    0
[/dev/nvme0n1p1].corruption_errs  2
[/dev/nvme0n1p1].generation_errs  0

 

LG

Sakis

Edited by sakistech
Screenshot hinzugefügt
Link to comment

Wieder eins der Probleme mit btrfs und NVMe im RAID Verbund?

 

Was ist wenn du den Cache und so mal auf die Platten verschiebst so das dieser/die Cache Laufwerke frei ist/sind und dann Parity Check und/Reboot?

 

Dann liegt nichts mehr auf dem Cache und dieser ist dann aus der Gleichung raus.

Link to comment

das ist der letzte log bevor er abgestürtzt ist.

 

Jul  8 21:48:52 Server kernel: stack segment: 0000 [#1] SMP NOPTI
Jul  8 21:48:52 Server kernel: CPU: 13 PID: 22953 Comm: lsof Tainted: G           O      5.15.46-Unraid #1
Jul  8 21:48:52 Server kernel: Hardware name: Gigabyte Technology Co., Ltd. W480M VISION W/W480M VISION W, BIOS F21 11/23/2021
Jul  8 21:48:52 Server kernel: RIP: 0010:show_map_vma+0x25/0x134
Jul  8 21:48:52 Server kernel: Code: e9 1f af fb ff 0f 1f 44 00 00 41 55 41 54 49 89 fc 55 53 48 8b ae a0 00 00 00 48 89 f3 4c 8b 6e 40 48 8b 4e 50 48 85 ed 74 1d <48> 8b 45 20 4c 8b 86 98 00 00 00 48 8b 50 28 49 c1 e0 0c 48 8b 40
Jul  8 21:48:52 Server kernel: RSP: 0018:ffffc90000337db8 EFLAGS: 00010206
Jul  8 21:48:52 Server kernel: RAX: ffffffff8126a2fb RBX: ffff8881dc40a780 RCX: 0000000000100073
Jul  8 21:48:52 Server kernel: RDX: ffff888104f95118 RSI: ffff8881dc40a780 RDI: ffff888104f950f0
Jul  8 21:48:52 Server kernel: RBP: 5fff888189557900 R08: 0000000000000001 R09: 0000154de99cc000
Jul  8 21:48:52 Server kernel: R10: 0000000000004004 R11: 0000000000000001 R12: ffff888104f950f0
Jul  8 21:48:52 Server kernel: R13: ffff888189738880 R14: ffff888104f95118 R15: ffff888104f950f0
Jul  8 21:48:52 Server kernel: FS:  000014a6f64f3740(0000) GS:ffff88901e340000(0000) knlGS:0000000000000000
Jul  8 21:48:52 Server kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jul  8 21:48:52 Server kernel: CR2: 00000000004ba048 CR3: 000000024049e004 CR4: 00000000007706e0
Jul  8 21:48:52 Server kernel: PKRU: 55555554
Jul  8 21:48:52 Server kernel: Call Trace:
Jul  8 21:48:52 Server kernel: <TASK>
Jul  8 21:48:52 Server kernel: show_map+0xa/0xd
Jul  8 21:48:52 Server kernel: seq_read_iter+0x255/0x347
Jul  8 21:48:52 Server kernel: seq_read+0xfc/0x11f
Jul  8 21:48:52 Server kernel: vfs_read+0xa5/0x108
Jul  8 21:48:52 Server kernel: ksys_read+0x76/0xbe
Jul  8 21:48:52 Server kernel: do_syscall_64+0x80/0xa5
Jul  8 21:48:52 Server kernel: entry_SYSCALL_64_after_hwframe+0x44/0xae
Jul  8 21:48:52 Server kernel: RIP: 0033:0x14a6f67a93fe
Jul  8 21:48:52 Server kernel: Code: c0 e9 e6 fe ff ff 50 48 8d 3d 4e 53 0a 00 e8 59 ea 01 00 66 0f 1f 84 00 00 00 00 00 64 8b 04 25 18 00 00 00 85 c0 75 14 0f 05 <48> 3d 00 f0 ff ff 77 5a c3 66 0f 1f 84 00 00 00 00 00 48 83 ec 28
Jul  8 21:48:52 Server kernel: RSP: 002b:00007ffd1a597c48 EFLAGS: 00000246 ORIG_RAX: 0000000000000000
Jul  8 21:48:52 Server kernel: RAX: ffffffffffffffda RBX: 000000000042b2c0 RCX: 000014a6f67a93fe
Jul  8 21:48:52 Server kernel: RDX: 0000000000001000 RSI: 0000000000488940 RDI: 0000000000000004
Jul  8 21:48:52 Server kernel: RBP: 000014a6f687e520 R08: 0000000000000004 R09: 0000000000000000
Jul  8 21:48:52 Server kernel: R10: 000014a6f682eac0 R11: 0000000000000246 R12: 000000000042b2c0
Jul  8 21:48:52 Server kernel: R13: 0000000000000d68 R14: 000014a6f687d920 R15: 0000000000000d68
Jul  8 21:48:52 Server kernel: </TASK>
Jul  8 21:48:52 Server kernel: Modules linked in: xt_nat macvlan xt_CHECKSUM ipt_REJECT nf_reject_ipv4 xt_tcpudp ip6table_mangle ip6table_nat iptable_mangle vhost_net tun vhost vhost_iotlb tap xt_conntrack xt_MASQUERADE nf_conntrack_netlink nfnetlink xt_addrtype iptable_nat nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 br_netfilter xfs md_mod av201x(O) tbsecp3(O) gx1133(O) tas2101(O) i2c_mux dvb_core(O) videobuf2_vmalloc(O) videobuf2_memops(O) videobuf2_common(O) videodev(O) mc(O) efivarfs wireguard curve25519_x86_64 libcurve25519_generic libchacha20poly1305 chacha_x86_64 poly1305_x86_64 ip6_udp_tunnel udp_tunnel libchacha ip6table_filter ip6_tables iptable_filter ip_tables x_tables e1000e igc i915 iosf_mbi i2c_algo_bit ttm drm_kms_helper drm x86_pkg_temp_thermal intel_powerclamp coretemp kvm_intel gigabyte_wmi wmi_bmof kvm intel_wmi_thunderbolt crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel aesni_intel crypto_simd cryptd rapl intel_cstate intel_gtt nvme agpgart i2c_i801 i2c_smbus
Jul  8 21:48:52 Server kernel: syscopyarea input_leds intel_uncore nvme_core i2c_core ahci sysfillrect led_class sysimgblt libahci fb_sys_fops intel_pch_thermal thermal tpm_crb fan tpm_tis video tpm_tis_core wmi tpm backlight button acpi_pad acpi_tad [last unloaded: e1000e]
Jul  8 21:48:52 Server kernel: ---[ end trace a26f6622ce892f09 ]---
Jul  8 21:48:52 Server kernel: RIP: 0010:show_map_vma+0x25/0x134
Jul  8 21:48:52 Server kernel: Code: e9 1f af fb ff 0f 1f 44 00 00 41 55 41 54 49 89 fc 55 53 48 8b ae a0 00 00 00 48 89 f3 4c 8b 6e 40 48 8b 4e 50 48 85 ed 74 1d <48> 8b 45 20 4c 8b 86 98 00 00 00 48 8b 50 28 49 c1 e0 0c 48 8b 40
Jul  8 21:48:52 Server kernel: RSP: 0018:ffffc90000337db8 EFLAGS: 00010206
Jul  8 21:48:52 Server kernel: RAX: ffffffff8126a2fb RBX: ffff8881dc40a780 RCX: 0000000000100073
Jul  8 21:48:52 Server kernel: RDX: ffff888104f95118 RSI: ffff8881dc40a780 RDI: ffff888104f950f0
Jul  8 21:48:52 Server kernel: RBP: 5fff888189557900 R08: 0000000000000001 R09: 0000154de99cc000
Jul  8 21:48:52 Server kernel: R10: 0000000000004004 R11: 0000000000000001 R12: ffff888104f950f0
Jul  8 21:48:52 Server kernel: R13: ffff888189738880 R14: ffff888104f95118 R15: ffff888104f950f0
Jul  8 21:48:52 Server kernel: FS:  000014a6f64f3740(0000) GS:ffff88901e340000(0000) knlGS:0000000000000000
Jul  8 21:48:52 Server kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jul  8 21:48:52 Server kernel: CR2: 00000000004ba048 CR3: 000000024049e004 CR4: 00000000007706e0
Jul  8 21:48:52 Server kernel: PKRU: 55555554

 

Edited by sakistech
Link to comment
6 hours ago, sakistech said:

Darf man den Mover nutzen wärend parity Check läuft ?

Ja

 

8 hours ago, sakistech said:

der Parity-Check findet und korrigiert mehrere fehler

Das darf nicht sein. Ich habe nie Fehler. Weder nach einem Crash, noch wenn ich hart abschalte.

 

Als erstes solltest du mal alle Datenträger reparieren. Also xfs_repair im Array und scrub im Pool. Ansonsten lösen diese selbst die Crashes aus.

 

Dann musst du herausfinden warum der Server crasht. Die Kernel Fehler sind wie so oft wenig aussagekräftig.

 

Was hast du an Hardware verbaut?

 

Welches NVMe Modelle?

 

Nutzt du Stromspar-Mechanismen wie zb powertop?

 

Hast du zwei RAM Module verbaut, wenn ja nutze mal nur eines und nach dem nächsten Crash nur das andere (um RAM Fehler auszuschließen)?

 

 

Link to comment

Hier die ausgaben

# lsblk | grep sd
Spoiler

grafik.png.eb5a1fd0dc4f2fbc85d2f9fa99e4518d.png

 

xfs_repair -n /dev/sdd1
Spoiler

grafik.png.771e2a73304a98b5198ea165766050c1.png

 

xfs_repair -n /dev/sdc1
Spoiler

grafik.png.89f5a6537c6816914ec8351bfa0dab60.png

 

xfs_repair -n /dev/sdb1
Spoiler

grafik.png.3410b71888581e69010efc01dff6b6f7.png

 

Bei xfs_repair -n /dev/sdb1 (Parity) sucht und sucht er ohne ausgabe.

 

Meine Hardware.

 

// W480M Vision W

// Intel Xeon W-1290P

// Corsair RMx Series 2021 RM550x

// 2 x Kingston Server Premier DIMM 32GB

// Samsung SSD 970 EVO Plus 1TB

// 3 x WD Ultrastar DC HC530 14TB

// Unraid Version: 6.10.3

 

 

Edited by sakistech
Link to comment
8 hours ago, sakistech said:

Bei xfs_repair -n /dev/sdb1 (Parity) sucht und sucht er ohne ausgabe.

Die Parität hat keine Partition. Xfs_repair solltest du außerdem über die GUI ausführen. Array in den Wartungsmodus. Auf die Disk klicken und ohne -v ausführen.

Bei den Pools geht das ganz normal während das Array läuft.

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...