Wiederherstellung sehr langsam


reinhard

Recommended Posts

Hallo,

habe ein System mit 14 Datenplatten, von denen 1 ausgefallen ist.

Die Wiederherstellung mit einer anderen Platte soll 60 Tage dauern.

Gleichzeitig zählt der SMART Start Stop Count ca alle 2 Minuten um eins hoch.

Habe bereits Kabel, Festplatte und SATA-Anschluß am Mainboard gewechselt, Problem bleibt bestehen.

Welche Möglichkeiten gibt es noch?

Besteht die Möglichkeit, genau die Dateien des emulierten Laufwerks zu sichern?

 

Für Hilfe wäre ich dankbar.

Reinhard

 

Link to comment
4 minutes ago, reinhard said:

habe ein System mit 14 Datenplatten, von denen 1 ausgefallen ist.

Die Wiederherstellung mit einer anderen Platte soll 60 Tage dauern.

Gleichzeitig zählt der SMART Start Stop Count ca alle 2 Minuten um eins hoch.

Hast du die Festplatte nicht getauscht? :/

 

5 minutes ago, reinhard said:

Habe bereits Kabel, Festplatte und SATA-Anschluß am Mainboard gewechselt, Problem bleibt bestehen.

Welche Möglichkeiten gibt es noch?

Wie meinst du das den SATA-Anschluss getauscht hast?

 

5 minutes ago, reinhard said:

Besteht die Möglichkeit, genau die Dateien des emulierten Laufwerks zu sichern?

Welche disk ist es?

Du kannst mittels dem Terminal zu der Platte navigieren zB disk5 mit dem kommando: 'cd /mnt/disk5' und dann alles auf eine andere Platte kopieren: 'cp -r * /mnt/WOHINDUWILLST'

Link to comment
1 minute ago, reinhard said:

Festplatte getauscht, SATA-Kabel getauscht, anderen SATA-Port am Mainboard verwendet.

Darf ich fragen welche Hardware du verwendest, hab auch gesehen aus deinen älteren posts das es bei dir öfter mal stromausfälle gibt...

Wieviele Datenplatten und Parity hast du, ist die Festplatte eine neue?

Hast du irgendwelche HBA's sprich SATA controller oder SATA Multiplier angeschlossen?

 

2 minutes ago, reinhard said:

Kann ich des Terminal aus der ferne Bedienen?

Du kannst das Terminal aus der ferne bedienen, welche Festplatte ist denn kaputt momentan oder was zeigt er dir an?

Geht der error counter von der neuen Festplatte hoch?

 

Wie hast du die neue Festplatte genau getauscht bzw. welche Schritte hast du durchgeführt?

Link to comment

hallo,

Stromausfall war nur damals, seit dem nicht mehr, habe zwischenzeitlich ältere Platten gegen neue getauscht und dabei keine Probleme gehabt.

 

Mainboard ist ein GAigabyte P55 UD5 mit 10 SATA-Schnittstellen

zusätzlich eine PCI Express Karte mit Marvell Chipsatz und einer SATA 3 Adapter Card, wobei die defekte Platte und die Ersatzplatten am Mainboard angeschlossen waren bzw. sind (Intel-Chipsatz)

 

error counter geht bei Ersatzplatte hoch und nach weiterem Tausch, jetzt eischließlich Kabel und SATA-Port, auch bei der nächsten Ersatzplatte. Beide sind gebraucht, aber laut SMART voll in Ordnung und wenig genutzt.

 

Link to comment
8 minutes ago, reinhard said:

Mainboard ist ein GAigabyte P55 UD5 mit 10 SATA-Schnittstellen

Intel 1te Generation oder?

 

8 minutes ago, reinhard said:

Beide sind gebraucht, aber laut SMART voll in Ordnung und wenig genutzt.

Das heißt aber nicht das die auch wirklich in Ordnung sind.

Also ich schätze mal du hast mehr als 10 Festplatten in deinem System wenn ich das so richtig lese.

Hast du schon mal versucht Unraid neu zu starten, das Array wird nicht automatisch starten solange die eine Festplatte defekt ist, kannst aber manuell starten.

 

Wie hast den Tausch genau durchgeführt?

  1. Array stop
  2. Defekte Platte raus
  3. Neue Platte rein
  4. Neue Platte dem Array slot zugewiesen wo die alte Platte war
  5. Array gestartet -> Rebuild startet

Bitte beachte auch das die Wiederherstellung nur so schnell funktioniert wie deine langsamste Platte im gesamten Array.

 

Kannst du mal einen Screenshot von deinem Array posten oder irgendwas, wäre zumindest hilfreich...

 

EDIT: Einen Luftstrom hast aber schon im Gehäuse bzw. das die Luft im Gehäuse umgewälzt wird?

Link to comment

Hallo,

 

ich starte das Array immer manuell, wenn der Rechner aus war. Tausch wie von Dir beschrieben. Parity 1 versehentlich beim Plattentausch getrennt.

Device sdf war 1. Ersatzplatte.

Habe aktuell die Wiederherstellung paussiert, spin-down steht auf 15 min.

mach für heute Schluß und schau mir morgen das mit dem Terminal an.

Danke und gute Nacht.

hier 2 Bilder

 

u3-1.thumb.JPG.d94ce7f3cb5871afb99c86455ffe5f44.JPG

u3-2.JPG

Link to comment
3 hours ago, reinhard said:

Gleichzeitig zählt der SMART Start Stop Count ca alle 2 Minuten um eins hoch.

 

WD Reds hatten mal einen Bug:

https://withblue.ink/2016/07/15/what-i-learnt-from-using-wd-red-disks-to-build-a-home-nas.html

 

WD Green parken ständig ihren Kopf:

https://www.reinhardweiss.de/german/wdidle3.htm

 

Davon was dabei, was dein Problem verursachen könnte?

 

3 hours ago, reinhard said:

Besteht die Möglichkeit, genau die Dateien des emulierten Laufwerks zu sichern?

 

Ja und das solltest du als erstes machen. Installiere dir Unassigned Devices (UD) und Unassigned Devices Plus (UD+) und aktivierst in dessen Einstellungen den Destructive Mode. Damit formatierst du die zweite Ersatzplatte und gibst sie im Netzwerk frei. Das geht über das + Zeichen und dann bei den Einstellungen "Share" aktivieren. Danach taucht die Platten im Netzwerk auf. Hier ein Beispiel mit einem USB Stick:

1207951884_2021-01-2701_15_12.png.2b91fccb2205cdd0446e14405ccdf55e.png

 

1965802716_2021-01-2701_17_07.png.33ca514db375438a4722ad3be90186b4.png

 

1868457880_2021-01-2701_16_40.png.31d7f00d5344161dfc404e97b0d32889.png

 

Jetzt aktivierst du noch in den Global Share Settings die Disk-Shares, um im Netzwerk direkt auf die disk3 zugreifen zu können:

2096371084_2021-01-2701_19_17.png.9384bdd392b3de8d8c7776e5dfc1dd72.png

 

1010053141_2021-01-2701_19_45.png.f05912239b450e29fc5bee852e8b133c.png

 

Achtung! Niemals Dateien von einem Share auf eine Disk oder andersherum kopieren! Immer nur von Disk zu Disk oder von Share zu Share! Es ist sonst ein Datenverlust möglich. Also von Disk3 auf Toshiba_HDWT360... wäre erlaubt.

 

Wenn diese Datensicherung beendet ist, kannst du diese Schritte wieder rückgängig machen. Also in den Global Share Settings die Disk Shares deaktivieren und die Ersatzplatte über UD unmounten.

 

3 hours ago, reinhard said:

error counter geht bei Ersatzplatte hoch und nach weiterem Tausch, jetzt eischließlich Kabel und SATA-Port, auch bei der nächsten Ersatzplatte. Beide sind gebraucht, aber laut SMART voll in Ordnung und wenig genutzt.

 

Was steht denn in den System Logs? Es gibt ja einen Grund für den ansteigenden Error Count. Hast du jemals vorher einen Parity Check gemacht?

 

Ich befürchte auch wegen der Anmerkung mit dem Stromausfall, dass dein XFS Dateisystem auf einer oder mehrerer Platten fehlerhaft ist. In dem Fall musst du das Array im Maintenance Mode starten, auf eine Disk klicken und den Check starten, am besten mit -nv statt -n:

IMG_20210127_003211.thumb.jpg.65a6ce01de53ce1556c0946126f0ac13.jpg

 

Solange "n" dabei ist, repariert er erstmal nichts, sondern zeigt nur evtl Fehler an. Ein Beispiel wie Fehler aussehen, findest du in diesem Video ab 04:30. Mach das mal mit allen Disks. Sollten Fehler dabei sein, kannst du sie reparieren, in dem du das "n" entfernst, also nur "-v".

 

Hattest du auch mal einen Port auf der SATA Karte probiert oder ist da keiner mehr frei?

Link to comment
9 hours ago, mgutt said:

Ich befürchte auch wegen der Anmerkung mit dem Stromausfall, dass dein XFS Dateisystem auf einer oder mehrerer Platten fehlerhaft ist.

...er hat aber BTRFS, siehe seinen Screenshot unten

 

11 hours ago, reinhard said:

ich starte das Array immer manuell, wenn der Rechner aus war. Tausch wie von Dir beschrieben. Parity 1 versehentlich beim Plattentausch getrennt.

Device sdf war 1. Ersatzplatte.

 

...Du bist sicher, dass die "sdr"/Disk3" nun eine neue Platte und nicht die alte Parity1 ist?...das könnte erklären, warum da kein Dateisystem gefunden wird.

 

11 hours ago, reinhard said:

u3-1.thumb.JPG.d94ce7f3cb5871afb99c86455ffe5f44.JPG

u3-2.JPG

 

Link to comment

Guten Morgen,
erstmal Danke für die Hinweise.
Betroffen ist nur die Disk3 im Array, von der die Daten emuliert werden und die den Effekt Stop/Start alle 2 Minuten zeigt.
Enable disk shares steht auf yes, Disk3 wird aber nicht als Share im Netz angezeigt. Alle anderen Platten werden angezeigt.
disk shares erlaubt wohl nur den Zugriff auf die Daten der physikalischen Laufwerke, nicht aber auf das emulierte Laufwerk?

 

Werde jetzt mal die Ersatzplatte mir Preclear Disk prüfen und vorformatieren und dann nochmal als Disk3 einsetzen.
zu XFS, kann mann im Betrieb von BTRFS nach XFS wechseln?

Link to comment
6 minutes ago, reinhard said:

kann mann im Betrieb von BTRFS nach XFS wechseln?

Nein. Also Daten verschieben, neu formatieren und dann zurück mit den Daten.

 

6 minutes ago, reinhard said:

disk shares erlaubt wohl nur den Zugriff auf die Daten der physikalischen Laufwerke, nicht aber auf das emulierte Laufwerk?

 

 

Habe ich nie getestet, aber kann sein. Siehst du denn das emulierte Laufwerk in der WebGUI? Weil in deinem letzten Screenshot war das ja nicht so.

Link to comment

Wenn ja und es trotzdem nicht über das Netzwerk zu sehen ist, dann öffne rechts oben das Terminal >_ und führe das aus:

cp -r /mnt/disk3 /mnt/disk12

 

Das Fenster muss durchgehend offen bleiben. Danach liegen die Dateien auf Disk12.

 

Um den Vorgang zu beschleunigen kannst du versuchen TurboWrite (reconstruct write) zu aktivieren:

1226395097_2021-01-2712_42_47.png.6f2a957817bc4039701885fc52c4811d.png

 

Ich weiß allerdings nicht ob das hilft, wenn das Ziel auch im Array liegt. Ansonsten wie gesagt mit einer über UD gemounteten Disk als Ziel probieren. Der Pfad wird dann irgendwas in Richtung "/mnt/disks/Toshiba..." lauten.

 

Wenn das fehlende Laufwerk gesichert wurde, kannst du danach immer noch herumprobieren das defekte Laufwerk zu ersetzen. Vor allem schau in die System Logs warum der Rebuild so langsam ist. Also ob da Fehler auftauchen. Wenn du mutig bist, kannst du auch über Tools -> New Config das Array komplett neu zuordnen (Mach vorher einen Screenshot von der Disk---Übersicht!) und die Parity weglassen. Dann ist das emulierte Laufwerk natürlich weg und du musst dich auf das Backup von zuvor verlassen können. 

Link to comment

 

Danke für den Hinweis. 

Unter "Unassigned Devices" habe ich aktuell eine Platte, welche ich mit Pre Clear behandle und dann als Disk3 - Ersatz verwende.

Wird 2 Tage dauern. (Zeit ist nicht mein Problem). Dann sollte eigentlich der Zugriff auf die emulierten Daten wieder klappen.

 

Nur zur Info: der oben genannte Stromausfall war damals tatsächlich wiederholte Überspannungen im Stromnetz. Das wurde von einer benachbarten Firma protokolliert und beanstandet. Der Fehler wurde durch den Stromanbieter beseitigt.

Link to comment

Ich habe gestern mal das Strom weg Szenario auf meiner Testmaschine getestet. Ergebnis war für die 2TB Parity Platte.

 

Unraid Parity check: 27-01-2021 11:03

Notice [TOWER] - Parity check finished (168538510 errors)
Duration: 7 hours, 52 minutes, 31 seconds. Average speed: 70.6 MB/s

 

Brauch der Rebuild genauso lange oder brauch der noch mehr Zeit hat das mal jemand getestet?

Link to comment
1 minute ago, mgutt said:

 

Du meinst du hast den Strom von der Parity gezogen und dann einen Parity Check gemacht? Das geht? ^^ Weil welche Parity will er dann noch abgleichen.

 

Das wollte ich auch noch testen aber gestern war erstmal Strom komplett weg auf dem Programm.

Link to comment
14 minutes ago, Smolo said:

Das wollte ich auch noch testen aber gestern war erstmal Strom komplett weg auf dem Programm.

Ah ok. Und dann hast du einen Parity Check gemacht und das Ergebnis waren 168538510 Fehler?! Das ist nicht normal. Bei einem Stromausfall ändert sich ja nicht der Inhalt auf der Disk bzw selbst wenn gerade eine Schreibprozess lief, wird ja auch parallel die Parität korrigiert. Da dürfte es wenn nur wenige Fehler geben. Hast du die Fehler auch korrigieren lassen (Write Corrections to parity ausgewählt)? Weil sonst ist die Parität immer noch kaputt.

 

Zu deiner eigentlichen Frage. Das ist sehr langsam. Ein Parity Check geht bei mir deutlich schneller, allerdings verwende ich ausschließlich schnelle 7200 U/min Laufwerke (DC HC520):

1915944855_2021-01-2713_32_46.png.16464869686672e55ae7dad5ec045aa3.png

 

Wie schnell das nun ist hängt von der CPU Single Core Leistung und von der durchschnittlichen HDD Geschwindigkeit der langsamsten Platte im Array ab. Und natürlich ob während dem Check noch auf das Array zugegriffen wird.

Link to comment
4 minutes ago, mgutt said:

Ah ok. Und dann hast du einen Parity Check gemacht und das Ergebnis waren 168538510 Fehler?! Das ist nicht normal. Bei einem Stromausfall ändert sich ja nicht der Inhalt auf der Disk bzw selbst wenn gerade eine Schreibprozess lief, wird ja auch parallel die Parität korrigiert. Da dürfte es wenn nur wenige Fehler geben. Hast du die Fehler auch korrigieren lassen (Write Corrections to parity ausgewählt)? Weil sonst ist die Parität immer noch kaputt.

 

Zu deiner eigentlichen Frage. Das ist sehr langsam. Ein Parity Check geht bei mir deutlich schneller, allerdings verwende ich ausschließlich schnelle 7200 U/min Laufwerke (DC HC520):

1915944855_2021-01-2713_32_46.png.16464869686672e55ae7dad5ec045aa3.png

 

Wie schnell das nun ist hängt von der CPU Single Core Leistung und von der durchschnittlichen HDD Geschwindigkeit der langsamsten Platte im Array ab. Und natürlich ob während dem Check noch auf das Array zugegriffen wird.

Ja, das Setting war gesetzt wie es im Standard vorgesehen ist.

 

Ich glaube die Platten waren zu dem Zeitpunkt sogar im Spin Down als ich den Strom weg genommen habe. Ich muss aber dazu sagen das es sich um alte Platten handelt die seit Jahren im Keller lagen das System meint aber es ist alles wieder in Ordnung. Im neuen System habe ich ja extra auf 2w Stromverbrauch gepfiffen und lieber die schnelle N300 von Toschiba statt einer WD Red Plus gewählt.

 

Danke für das Feedback.

Link to comment
Just now, Smolo said:

Ich muss aber dazu sagen das es sich um alte Platten handelt die seit Jahren im Keller lagen das System meint aber es ist alles wieder in Ordnung.

 

Auch das ist egal. Es darf einfach keine Parity Fehler geben. Ansonsten wäre die Parität ja sinnfrei. Wenn die Parität fehlerhaft ist, kannst du bei einem Ausfall ja die Daten nicht 1:1 wiederherstellen. Irgendwelche Dateien wären dann korrupt.

Link to comment

habe jetzt folgendes getan:

nRAID Server Preclear of disk Y9S0A0UBFB1G    [12:21:33 @ 134 MB/s] SUCCESS

Shutdown

Rechner eingeschaltet

Device 3 ist unassigned

Array Start, Disk 3 wird nicht emuliert, obige Frage gestellt

Array Stop

Device Disk 3 disk Y9S0A0UBFB1G zugewiesen, blaues Quadrat vor Disk3, Meldungen: grün Disk3 returned to normal operation und gelb Disk3 not ready, content being reconstructed

Array START

wärend Mounting Disks...: gelbes Dreieck vor Disk3 und Unmounttable: No file System rechts in gleicher Zeile

mit Beendigung des Mounting-Vorgangs Meldung gelb Disk3 drive not ready, content being reconstructed

 

Bild:

u3-15.thumb.JPG.da3d45a90271755e93a02b8acbe33981.JPG

 

Ergebnis: Rebuild soll 62 Tage dauern,

aktuell wird genau diese Toshiba Platte wieder alle 2 Minuten in den Ruhzustand geschickt und sofort wieder aufgeweckt.

 

Auf die angeblich emulierten Daten kann aktuell nicht zugegriffen werden!

 

Welche Möglichkeiten habe ich noch?

 

 

Link to comment

Systemlog:

Parity-Sync/Data-Rebuild in Pause

U3 root: error: /plugins/unassigned.devices/UnassignedDevices.php: wrong csrf_token

hab mal alle Fenster meines browsers geschlossen

 

Parity-Sync/Data-Rebuild in progress

in rot, (weitere gelbe und weiße Meldungen), laufend neu:

Jan 28 13:49:51 U3 kernel: ata9.00: exception Emask 0x10 SAct 0x6000000 SErr 0x4890000 action 0xe frozen
Jan 28 13:49:51 U3 kernel: ata9.00: irq_stat 0x08400040, interface fatal error, connection status changed
 

damit kann ich nichts anfangen. Pausiere erst mal wieder.

 

u3-16.thumb.JPG.63290df820994dbd65b90b087149c3c7.JPG

Danke für die Unterstützung

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.