Festplatte Löffel abgegeben ?


BUSTER

Recommended Posts

Hallo liebe Deutsche Community,

 

musste heute feststellen das eine 2 TB Festplatte von mir Probleme macht, 

Array has 1 Disk with read errors.. es ist die 2 TB Platte die Extern per USB angebunden ist, 

was kann ich machen ? gibt es irgendeine Möglichkeit diese zu retten ? diagnostik report habe ich als Anhang hochgeladen.

wäre für jeden brauchbaren tip Dankbar 

 

Jul 31 15:16:39 UnRaid kernel: md: disk5 read error, sector=3013787480
Jul 31 15:16:39 UnRaid kernel: md: disk5 read error, sector=3013787488
Jul 31 15:16:39 UnRaid kernel: md: disk5 read error, sector=3013787496
Jul 31 15:16:39 UnRaid kernel: md: disk5 read error, sector=3013787504
Jul 31 15:16:39 UnRaid kernel: md: disk5 read error, sector=3013787512
Jul 31 15:16:39 UnRaid kernel: md: disk5 read error, sector=3013787520

 

cYa BUSTER  

 

 

unraid-diagnostics-20210731-1529.zip

Edited by BUSTER
read error, sector=3013787480
Link to comment

So wie es aussieht, ist Dein Array verschlüsselt, ohne Parity und hat noch ne 256GB SSD drin?

 

md5 ist eine WDC_WD20_EARS-00MVWB0 ... aber eben kein Smart Report verfügbar, also schwer zu sagen.

IO-Errors sind erstmal das Interface...steigende re-allocated sectors wären ein Indiz für eine sterbende Disk.

Bei USB kann es auch ganz leicht das Interface sein.

 

...ab und an sieht man im Log, das an der DIsk auch das unassigned-Devices Plugin mit rumfummelt.

Hast Du die jetzt fest im Array oder nutzt Du die auch "mobil" ?

 

Wenn sie ins Array gehört, hole sie am besten aus dem Gehäuse raus und baue sie direkt per SATA ein, wenn das einfach geht

Dann kann man auch besser was erkennen....

Edited by Ford Prefect
  • Thanks 1
Link to comment

Hallo Ford Prefect,

 

Danke für deine hilfe, genau ich nutze noch kein Parity, alles an Festplatten sind Verschlüsselt, auch der 256GB NVMe Cache Drive, auch die 256GB SSD 

alles ist per USB 3.0 verbunden, es ist ein Mini PC der hier --> TechnoPC H385, somit habe ich keine Möglichkeit die HDD direkt per SATA anzuschließen, zu mindestens nicht bei diesem gerät, ich könnte es bei mein Sohn am PC direkt über SATA anschließen, der hat wiederum Windows 10 vermute das der keine XFS Luks Crypt Unterstützt ?

zu not könnte ich diesen denn mit eine Linux Live Distro Booten wenns was bringt ?

 

// EDIT: ich hab alles mal heruntergefahren USB Kabeln alle raus etwas staubig gewesen, alles wieder angeschlossen array gestartet und nun konnte ich auch ein SMART test machen mit der Platte, im Anhang das report. 

 

Letztes SMART Prüfergbnis: Ohne Fehler abgeschlossen :D ich wird daraus nicht schlau  :D :D 

 

//EDIT nochmal gleiche Fehler nach Paar Minuten :/

 

Datenträgerprotokoll

 

Jul 31 17:37:10 UnRaid kernel: sd 5:0:0:0: [sdf] 3907029168 512-byte logical blocks: (2.00 TB/1.82 TiB)
Jul 31 17:37:10 UnRaid kernel: sd 5:0:0:0: [sdf] Write Protect is off
Jul 31 17:37:10 UnRaid kernel: sd 5:0:0:0: [sdf] Mode Sense: 17 00 00 08
Jul 31 17:37:10 UnRaid kernel: sd 5:0:0:0: [sdf] No Caching mode page found
Jul 31 17:37:10 UnRaid kernel: sd 5:0:0:0: [sdf] Assuming drive cache: write through
Jul 31 17:37:10 UnRaid kernel: sdf: sdf1
Jul 31 17:37:10 UnRaid kernel: sd 5:0:0:0: [sdf] Attached SCSI disk
Jul 31 17:37:37 UnRaid emhttpd: WDC_WD20_EARS-00MVWB0_2010052700001487-0:0 (sdf) 512 3907029168
Jul 31 17:37:37 UnRaid kernel: mdcmd (6): import 5 sdf 64 1953514552 0 WDC_WD20_EARS-00MVWB0_2010052700001487-0:0
Jul 31 17:37:37 UnRaid kernel: md: import disk5: (sdf) WDC_WD20_EARS-00MVWB0_2010052700001487-0:0 size: 1953514552
Jul 31 17:37:37 UnRaid emhttpd: read SMART /dev/sdf
Jul 31 17:40:08 UnRaid sudo: root : TTY=pts/0 ; PWD=/root ; USER=root ; COMMAND=/sbin/fsck -Vt xfs /dev/sdf1
Jul 31 17:50:46 UnRaid kernel: blk_update_request: I/O error, dev sdf, sector 1989002496 op 0x0:(READ) flags 0x0 phys_seg 64 prio class 0
Jul 31 17:50:46 UnRaid kernel: blk_update_request: I/O error, dev sdf, sector 1989003008 op 0x0:(READ) flags 0x0 phys_seg 32 prio class 0

 

cYa BUSTER    

unraid-smart-20210731-1743.zip

Edited by BUSTER
read error, sector=3013787480
Link to comment

Da die Fehler wirklich überall auftauchen, sogar direkt im Boot-Bereich der HDD, würde ich sagen, dass das nicht an der HDD liegt, sondern eher am Kabel / der Verbindung:

 

Jul 31 13:22:26 UnRaid emhttpd: shcmd (498): /usr/sbin/cryptsetup luksClose md5
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=0
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=16
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 2, async page read
### [PREVIOUS LINE REPEATED 1 TIMES] ###
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=32
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 4, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=64
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 8, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=128
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 16, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=256
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 32, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=512
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 64, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=1024
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 128, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=2048
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 256, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=4096
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 512, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=8192
Jul 31 13:22:26 UnRaid emhttpd: shcmd (499): /usr/sbin/cryptsetup luksClose sdg1
Jul 31 13:22:26 UnRaid kernel: mdcmd (43): stop 

 

Dass keine SMART-Werte in den Logs stehen, ist auch komisch. So als könnte Unraid diese nicht wegen USB auslesen. Führe mal über das Web Terminal das Kommando aus, um dir die SMART Werte anzeigen zu lassen:

smartctl -A /dev/sdf

 

Nun versetz die Disk in den Spindown und check mit dem Kommando den Power-State:

hdparm -C /dev/sdf

 

2 hours ago, BUSTER said:

im Anhang das report. 

 

Hier aus deinem Report die SMART Werte. Die sind wichtig und stehen alle auf Null:

  5 Reallocated_Sector_Ct   PO--CK   200   200   140    -    0
  7 Seek_Error_Rate         -OSR-K   200   200   000    -    0
196 Reallocated_Event_Count -O--CK   200   200   000    -    0
197 Current_Pending_Sector  -O--CK   200   200   000    -    0
198 Offline_Uncorrectable   ----CK   200   200   000    -    0

 

Der hier bezieht sich auf die Verbindung zwischen Mainboard und HDD:

199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    21

 

Diesen gilt es zu beobachten. Der sollte nicht weiter steigen, weil das sonst bedeutet, dass weiterhin ein Verbindungsfehler vorhanden ist.

 

Meine Glaskugel sagt bis hier hin, dass USB schlafen geht und die Verbindung zur Platte kurz komplett weg ist. Nutzt du Stromsparmechanismen im BIOS oder hast du in Unraid powertop installiert oder sonst irgendwas in der Richtung eingestellt?

 

Dann allgemein: Verschlüsselung und USB und Array und kein Backup (?) sind eine ganz böse Kombination.

  • Thanks 1
Link to comment
12 hours ago, mgutt said:

Da die Fehler wirklich überall auftauchen, sogar direkt im Boot-Bereich der HDD, würde ich sagen, dass das nicht an der HDD liegt, sondern eher am Kabel / der Verbindung:

 






Jul 31 13:22:26 UnRaid emhttpd: shcmd (498): /usr/sbin/cryptsetup luksClose md5
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=0
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=16
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 2, async page read
### [PREVIOUS LINE REPEATED 1 TIMES] ###
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=32
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 4, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=64
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 8, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=128
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 16, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=256
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 32, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=512
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 64, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=1024
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 128, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=2048
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 256, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=4096
Jul 31 13:22:26 UnRaid kernel: Buffer I/O error on dev md5, logical block 512, async page read
Jul 31 13:22:26 UnRaid kernel: md: disk5 read error, sector=8192
Jul 31 13:22:26 UnRaid emhttpd: shcmd (499): /usr/sbin/cryptsetup luksClose sdg1
Jul 31 13:22:26 UnRaid kernel: mdcmd (43): stop 

 

Dass keine SMART-Werte in den Logs stehen, ist auch komisch. So als könnte Unraid diese nicht wegen USB auslesen. Führe mal über das Web Terminal das Kommando aus, um dir die SMART Werte anzeigen zu lassen:






smartctl -A /dev/sdf

 

Nun versetz die Disk in den Spindown und check mit dem Kommando den Power-State:






hdparm -C /dev/sdf

 

 

Hier aus deinem Report die SMART Werte. Die sind wichtig und stehen alle auf Null:






  5 Reallocated_Sector_Ct   PO--CK   200   200   140    -    0
  7 Seek_Error_Rate         -OSR-K   200   200   000    -    0
196 Reallocated_Event_Count -O--CK   200   200   000    -    0
197 Current_Pending_Sector  -O--CK   200   200   000    -    0
198 Offline_Uncorrectable   ----CK   200   200   000    -    0

 

Der hier bezieht sich auf die Verbindung zwischen Mainboard und HDD:






199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    21

 

Diesen gilt es zu beobachten. Der sollte nicht weiter steigen, weil das sonst bedeutet, dass weiterhin ein Verbindungsfehler vorhanden ist.

 

Meine Glaskugel sagt bis hier hin, dass USB schlafen geht und die Verbindung zur Platte kurz komplett weg ist. Nutzt du Stromsparmechanismen im BIOS oder hast du in Unraid powertop installiert oder sonst irgendwas in der Richtung eingestellt?

 

Dann allgemein: Verschlüsselung und USB und Array und kein Backup (?) sind eine ganz böse Kombination.

 

Moin mgutt,

 

danke für deine hilfe :)

 

wenn ich UnRaid neu starte bekomme ich info sehe --> Screenshot

 

 

SMART Werte

root@UnRaid:~# smartctl -A /dev/sdf
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.10.28-Unraid] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   083   064   006    Pre-fail  Always       -       184740262
  3 Spin_Up_Time            0x0003   091   091   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       39
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   072   060   045    Pre-fail  Always       -       17420699
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       1537 (53 79 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       16
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       1 1 1
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   040   035   040    Old_age   Always   FAILING_NOW 60 (Min/Max 60/60 #628)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       2
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       445
194 Temperature_Celsius     0x0022   060   065   000    Old_age   Always       -       60 (0 23 0 0 0)
195 Hardware_ECC_Recovered  0x001a   083   064   000    Old_age   Always       -       184740262
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       771h+16m+21.230s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       32827230064
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       16652753490

 

 

SpinDown 

 

/dev/sdf:
 drive state is:  standby

 

SpinUP

 

/dev/sdf:
 drive state is:  active/idle

 

Muss sagen wenn ich UnRaid neu starte, array anbinde, und nur den ruTorrent CT starte der auch nur auf die SDF1 zugewiesen ist läuft alles, ohne Probleme.

Starte jetzt nach und nach andere CT

 

NginxProxyManager --> rennt, keine Probleme mit SDF1

Bitwarden --> rennt, keine Probleme mit SDF1

Jellyfin --> rennt, keine Probleme mit SDF1

 

Info erhalten --> Screenshot hat aber nichts mit dem start von Jellyfin zu tun nehme ich an da dieser auf SDF nicht zugreift, (hatte nebenbei einen 11GB Torrent am Laden um zu testen das in der zeit etwas geschieben wird auf die SDF1)

 

Windows 11 VM Gestartet = gleiche Problem Festplatte ist ausgefallen, somit musste ich bei den Windows 11 Einstellungen nachschauen, und Voila warum auch immer habe ich die SDF Platte auch dem Windows 11 zugewiesen so das es auch über USB erreichbar sein soll bei Windows 11 :D keine ahnung warum da der Haken an war siehe --> Screenshot

hab den Haken da rausgenommen, UnRaid & Windows 11 erneut gestartet läuft alles wieder, Festplatte doch nicht Löffel abgegeben juhuu :)

 

Danke für euren Hilfen.

 

cYa BUSTER

 

 

 

 

 

Edited by BUSTER
  • Like 1
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.