Jump to content

ZFS Pool hängt mit Fehler, wie lösen


stubennatter
Go to solution Solved by stubennatter,

Recommended Posts

Hallo,

 

habe zwei ZFS Pool und einer ist beschädigt durch einen reboot geworden. Aber der hängt seit Tagen und macht nix mehr. Wie kann man dies lösen?


 

 pool: fsp2
 state: DEGRADED
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Oct 14 11:36:17 2023
        220T scanned at 4.46G/s, 191T issued at 3.88G/s, 261T total
        49.6M resilvered, 73.32% done, 05:06:36 to go
config:

        NAME                                      STATE     READ WRITE CKSUM
        fsp2                                 DEGRADED     0     0     0
          raidz1-0                                DEGRADED 1.45K 1.24K     0
            ata-ST18000NM000J-2TV103_ZR5CJZEG     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CL9NE     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CPHVP     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CSXJ4     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CVH9N     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CW3JS     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CWN6K     ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_82T0A07EFJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_82T0A06YFJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_52G0A113FJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_62X0A0B9FJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_7280A02HFJDH  ONLINE   2.76K 3.52K     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_52G0A0R8FJDH  UNAVAIL  4.53K 4.86K     0
            ata-TOSHIBA_MG09ACA18TE_62X0A0PGFJDH  ONLINE   1.38K 1.49K     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_82T0A04AFJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_72A0A006FJDH  ONLINE   8.27K 8.89K     1  (awaiting resilver)

 

Danke.

Link to comment

Morgen,

ja HDD ist dran und wird auch bei unassigned devices als gemounted angezeigt und Status kann ich mir ansehen und grün

 

Disk Serial: TOSHIBA_MG09ACA18TE_52G0A0R8FJDH (sdbk) - SATA

Mount Point: fsp2 (mounted)

 

zpool status-v bringt folgende Meldung

errors: List of errors unavailable: pool I/O is currently suspended

Link to comment
14 minutes ago, stubennatter said:

ja HDD ist dran und wird auch bei unassigned devices als gemounted angezeigt und Status kann ich mir ansehen und grün

 

bei UAD mounted und ist nicht mehr im Pool ?

 

ich nutze jetzt kein zfs ... aber das hört sich für mich nicht ganz richtig an ... 

 

vielleicht mal ein screenshot deines Main Tabs wo die Platten gelistet sind und mounted sind ...

Link to comment
2 minutes ago, stubennatter said:

habe noch unraid 6.11.5 und zfs mit dem zfs plugin.

 

 

3 minutes ago, stubennatter said:

Da sind alle HDD's die im pool sind bei UAD gelistet, das passt.

dann ergibt das Sinn ;)

 

da bin ich dann komplett raus ... hatte das zwar auch mal mit dem plugin getestet, kann aber hierzu nichts produktives sagen ...

 

da können andere sicher ggf. besser helfen, wobei man langsam über ein Update nachdenken kann ... ;)

Link to comment
1 hour ago, stubennatter said:

errors: List of errors unavailable: pool I/O is currently suspended

 

Ich hätte als nächstes versucht, die Platte aus dem "UNAVAILABLE" Stauts zu bekommen =>  zpool online fsp2 ata-TOSHIBA_MG09ACA18TE_52G0A0R8FJDH

Wird aber vermutlich nicht klappen, weil der Pool suspended ist.

 

Kenne mich mit diesem ZFS Plugin nicht aus. Laufen über das Plugin die ZFS Pools unabhängig vom Unraid Array? Und ganz wichtig, hast du ein Backup oder ist das eine OP am offenen Herzen? ;)

Link to comment
9 hours ago, stubennatter said:

One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Oct 14 11:36:17 2023
        220T scanned at 4.46G/s, 191T issued at 3.88G/s, 261T total
        49.6M resilvered, 73.32% done, 05:06:36 to go

@JorgeB can you please take a look at this?

Link to comment

Mal schauen was JorgeB dazu meint. Wahrscheinlich wird es erst einmal auf einen Reboot hinauslaufen und der Resilver Prozess startet von vorne. Naturlich ohne Garantie, dass er dann durchläuft.

 

Mir persönlich ist das Layout mit so vielen Platten in einem Pool zu Hardcore. In einem Fehlerfall ist ja alleine für das Resilver (je nach Poolauslastung) 40+ Stunden Dauerstress aller Platten + Daumen drücken, dass nicht noch eine die Grätsche macht, angesagt :D

 

Link to comment

Syslog is showing issues with multiple disks like this:

 

Oct 18 12:55:12 ServerStation kernel: sd 8:0:61:0: Power-on or device reset occurred

 

This is usually a power/connection problem, check/replace cables or swap slots for the four affected disks:

 

17 hours ago, stubennatter said:
            ata-TOSHIBA_MG09ACA18TE_7280A02HFJDH  ONLINE   2.76K 3.52K     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_52G0A0R8FJDH  UNAVAIL  4.53K 4.86K     0
            ata-TOSHIBA_MG09ACA18TE_62X0A0PGFJDH  ONLINE   1.38K 1.49K     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_72A0A006FJDH  ONLINE   8.27K 8.89K     1  (awaiting resilver)

 

 

Then run a new scrub, if there are still read/write errors post new diags.

  • Like 1
Link to comment

the power problem was because I reboot the server for clean diagnostic and after that all disks runing and no UNAVAIL and log from each disk had no power problem, but scrub is still in progress and not changed %


 

  pool: fsp2
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Oct 14 11:36:17 2023
        27.8T scanned at 2.72G/s, 25.8T issued at 2.52G/s, 261T total
        34.2M resilvered, 9.88% done, 1 days 02:32:23 to go
config:

        NAME                                      STATE     READ WRITE CKSUM
        fsp2                                 ONLINE       0     0     0
          raidz1-0                                ONLINE   1.05K   876     0
            ata-ST18000NM000J-2TV103_ZR5CJZEG     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CL9NE     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CPHVP     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CSXJ4     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CVH9N     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CW3JS     ONLINE       0     0     0  (resilvering)
            ata-ST18000NM000J-2TV103_ZR5CWN6K     ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_82T0A07EFJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_82T0A06YFJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_52G0A113FJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_62X0A0B9FJDH  ONLINE       0     0     2  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_7280A02HFJDH  ONLINE       0     0     2  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_52G0A0R8FJDH  ONLINE   1.26K 1.22K     0  (awaiting resilver)
            ata-TOSHIBA_MG09ACA18TE_62X0A0PGFJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_82T0A04AFJDH  ONLINE       0     0     0  (resilvering)
            ata-TOSHIBA_MG09ACA18TE_72A0A006FJDH  ONLINE   2.54K 3.15K     2  (awaiting resilver)

 

Edited by stubennatter
Link to comment

hm okay

 

Oct 18 12:56:28 ServerStation kernel: sd 8:0:64:0: [sdet] 35156656128 512-byte logical blocks: (18.0 TB/16.4 TiB)
Oct 18 12:56:28 ServerStation kernel: sd 8:0:64:0: [sdet] 4096-byte physical blocks
Oct 18 12:56:28 ServerStation kernel: sd 8:0:64:0: [sdet] Write Protect is off
Oct 18 12:56:28 ServerStation kernel: sd 8:0:64:0: [sdet] Mode Sense: 7f 00 10 08
Oct 18 12:56:28 ServerStation kernel: sd 8:0:64:0: [sdet] Write cache: enabled, read cache: enabled, supports DPO and FUA
Oct 18 12:56:28 ServerStation kernel: sdet: sdet1 sdet9
Oct 18 12:56:28 ServerStation kernel: sd 8:0:64:0: [sdet] Attached SCSI disk
Oct 18 12:56:29 ServerStation  zed[41320]: zed_udev_monitor: skip /dev/sdet since it has a gpt partition already
Oct 18 12:56:31 ServerStation  zed[41320]: zed_udev_monitor: /dev/sdet9 sectors 16384 < 131072 (minimum)
Oct 18 12:56:31 ServerStation  zed[41320]: #011dev_name: /dev/sdet1
Oct 18 12:56:31 ServerStation  zed[41320]: #011path: /devices/pci0000:80/0000:80:03.1/0000:85:00.0/host8/port-8:1/expander-8:1/port-8:1:31/end_device-8:1:31/target8:0:64/8:0:64:0/block/sdet/sdet1
Oct 18 12:57:40 ServerStation  emhttpd: TOSHIBA_MG09ACA18TE_52G0A0R8FJDH (sdet) 512 35156656128
Oct 18 12:57:40 ServerStation  emhttpd: read SMART /dev/sdet

 

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...