Festplatte defekt-wie nun weiter


Go to solution Solved by hawihoney,

Recommended Posts

Hi, ich glaube eine meiner HDDs steigt aus, viele UDMA Error und SMART Errors beim lesen sagt das Protokoll. Jetzt habe ich einen Array von 6 Platten. Nummer drei scheint defekt zu sein. Ich habe jetzt eine gleich große Platte eingebaut. Wie ersetze ich jetzt quasi Platte Nummer 3 mit der noch nicht in den Array eingebundenen Platte Nummer 7 am elegantesten? Zuerst von Hand Platte 3 putzen und auf die anderen verteilen und anschließend aus dem Array entfernen und Platte 7 zu 3 in den Array einbauen? Oder gibt es da evtl. ein Tool, dass das für mich übernimmt. Danke im Voraus

Link to comment

Da brauchst du eigentlich nicht viel machen, wenn ich dich soweit richtig verstanden haben.

Es geht doch eigentlich nur darum eine defekte Festplatte zu tauschen, da übernimmt Unraid die Hauptarbeit.

 

Selbst musst du da überhaupt keine Formatierung vornehmen oder Daten verschieben.

Der Sinn der Parität ist es ja die Festplatte nahtlos austauschen zu können. 🙂

  1. Foto von der Festplatten-Belegung machen
  2. Server herunterfahren
  3. Alte Festplatte aus dem Server ausbauen
  4. Neue Festplatte in den Server einbauen
  5. Server hochfahren
  6. An Stelle/Position der nun fehlenden/defekten Festplatte die neue Festplatte auswählen
  7. Nochmal mit dem Foto abgleichen das auch alle anderen Festplatten am selben Platz sind
  8. Array starten und die Daten wiederherstellen lassen (passiert automatisch)
  9. Abschließenden nicht korrigierenden Parity-Check machen ob alles richtig beschrieben wurde.

Wenn die neue Festplatte schon im Server ist und läuft, noch einfacher:

  1. Foto von der Festplatten-Belegung machen
  2. Array stoppen
  3. An Stelle/Position der defekten Festplatte nun die neue Festplatte auswählen
  4. Nochmal mit dem Foto abgleichen das auch alle anderen Festplatten am selben Platz sind
  5. Array starten und die Daten wiederherstellen lassen (passiert automatisch)
  6. Abschließenden nicht korrigierenden Parity-Check machen ob alles richtig beschrieben wurde.

 

https://docs.unraid.net/legacy/FAQ/replacing-a-data-drive/

 

Edited by Rysz
Link to comment
Posted (edited)

Okay, eine Parity Platte hatte ich noch nicht verbaut ;-) Also ich muss das jetzt so ohne Parity machen. Es sind 100TB, und ich kaufe nach und nach monatlich eine 20er. Die jetzt, das sollte die Parity Platte werden, muss jetzt aber erstmal die defekte ersetzen. 

Edited by Linse77
Link to comment
Posted (edited)

Mein Problem existiert immernoch, aber ich scheine eine Lösung gefunden zu haben. Ich baue die neue Platte ins Array ein und verschiebe quasi alle Daten von Festplatte 3 auf Festplatte 7. Ich vergaß, warum UNRAID Unraid heißt, die Datei wird nicht verteilt sondern eine Datei liegt komplett auf einer Platte. 

 

Jedenfalls, jetzt habe ich einen SMART Test durchgeführt, kann mir den wer übersetzen? Unraid sagt, ohne Fehler abgeschlossen. Jedoch wenn ich mir den Downloade, zeigt er mir sehr wohl Errors an. Ich hatte mal ein ähnliches Problem, da verhalf mir der Tausch des Kabels....bin mir jetzt nicht so sicher. 

 

Edit: https://pastebin.com/8EqF3C7k

 

Vergessen den Report zu verlinken ;-)

Edited by Linse77
Link to comment
On 3/5/2024 at 5:30 PM, Rysz said:

Abschließenden nicht korrigierenden Parity-Check machen ob alles richtig beschrieben wurde.

 

Nur zur Info: Das ist wirklich nicht nötig. Kann man machen, wird aber nie einen Unterschied zeigen.

 

All das wird durch Unraid, das jeweilige Dateisystem, dem Controller und den Festplatten beim Schreiben automatisch erledigt. Das geht bis zum automatischen Schreiben von Reserve-Sektoren wenn ein Sektor als fehlerhaft erkannt wurde. Wenn der Parity-Check oder der Disk-Rebuild erfolgreich durchgelaufen ist, dann kannst Du Dir sicher sein, dass alles in Ordnung ist.

 

Link to comment
1 hour ago, Linse77 said:

Jedenfalls, jetzt habe ich einen SMART Test durchgeführt, kann mir den wer übersetzen? Unraid sagt, ohne Fehler abgeschlossen. Jedoch wenn ich mir den Downloade, zeigt er mir sehr wohl Errors an. Ich hatte mal ein ähnliches Problem, da verhalf mir der Tausch des Kabels....bin mir jetzt nicht so sicher. 

Edit: https://pastebin.com/8EqF3C7k

 

5 Reallocated_Sector_Ct   PO--CK   100   100   010    -    0
= es wurden im Rahmen des Betriebes keine fehlerhaften Sektoren gefunden und somit auch keine neu zugeordnet

 

196 Reallocated_Event_Count PO--CK   100   100   010    -    0
= es wurde im Rahmen des Betriebes keine Veranlassung für eine Neuzuweisung von Sektoren erkannt

 

197 Current_Pending_Sector  -O--CK   100   100   000    -    0
= es wurde im Rahmen des Betriebes keine Sektoren mit fraglichen/beschädigten Daten erkannt

 

Die Festplatte selber ist also bisher in Ordnung.


199 UDMA_CRC_Error_Count    -O--CK   200   200   000    -    14
= Es wurden 14 Probleme in der Signalübertragung zwischen Kontroller des PC und Kontroller auf der Festplatte erkannt. Meist Kabelprobleme.

 

Diverse:  Error 12 .... occurred at disk power-on lifetime: 4250 hours (177 days + 2 hours)
= Es gab im Betrieb mal jeweils einen einzelnen Fehler.
Da die Temperatur der Festplatte grob gesagt vollkommen okay ist: Die Verteilung der Fehler deutet (sehr unsicher interpretiert!!) auf die CRC Problemtik oben hin.

 

Du hast anscheinend ein Problem im Signalweg. Da skann auch durch Probleme in der Stromversorgung entstehen. 

 

ich schließe mich der Aussage von Hawihoney an, zuerst mal die Verkabelung zu prüfen/tauschen. Solltest Du Wechselrahmen oder so verwenden, kann das Problem auch dort liegen.

Edited by DataCollector
Kleine Ergänzung
  • Like 1
Link to comment
Posted (edited)
44 minutes ago, hawihoney said:

 

 

Kabelproblem - allgemein gesagt: Problem mit der Verbindung zur Platte.

 

Aha, ich habs mir fast gedacht. Hatte die Platte vorher "umgeklemmt", sprich vom Board an einen PCI Controller und genau andersrum die Ersatzplatte so geklemmt. Jetzt hat der SMART Test ewig gedauert, ich versuche jetzt mal die neue Platte zu testen, die jetzt quasi an dem defekten Kabel hängt. Nebenbei, gibt es SATA Kabel, jenseits der billgen, die genau sowas verhindern bzw besser machen im Sinne von mehr Qualität? Auf jedenfall schonmal vielen Dank!

 

Edit: Am Strom kann es meiner Meinung nach nicht liegen. Habe ein dickes Netzteil verbaut. Das hat 3 wenn nicht sogar 4 SATA Anschlüsse für Kabel mit jeweils 4 weiteren Anschlüssen. 

Edited by Linse77
Link to comment
Just now, Linse77 said:

gibt es SATA Kabel, jenseits der billgen, die genau sowas verhindern bzw besser machen im Sinne von mehr Qualität?

 

Da solche Probleme auch aufgrund von Kontaktschwierigkeiten/Oxidation/Staub an den Kontakten entstehen können, gibt es keine "Wunderkabel" die alle solchen Probleme lösen.

In gaaaanz selten Fällen ist auch wirklich einer der beteiligten Kontroller schuld, aber wie gesagt, das ist eher gaaaaaaaaaaaaanz selten.

 

bei dieser CRC Fehlermeldung betritt es eben den gesamten Signalweg von PC SATA Kontroller incl. der Steckverbindungen bis zum Festplattenkontroller.

  • Like 1
Link to comment

Hatte auch dauernd solche Fehler. Seltsamerweise nur auf einem der 2 Ports vom HBA.

Seit ich da aber ein neues Kabel drin habe (rund 1 Monat), gab es keine Fehler mehr!

 

War auch eine China-Kabel von Amazon, relativ günstig aber nicht billig... 

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.