Jump to content

Paritätsprüfung meldet Fehler aber bei Datenträger keine zu sehen ?


Megacayman

Recommended Posts

Hallo Gruppe,

 

ich habe vor 2 Wochen eine Western Digital Mybook Festplatte geshuckt.

Nach ~•10 Versuchen ist die Platte auch angelaufen nachdem ich den Pin für die 3,3 V abgeklebt habe dummerweise habe ich zwischenzweitlich einen SATA Adapter probiert der zu wenig Strom geliefert hat und  die Platte hat 2 oder 3  mal a  2 Minuten "knaxgeräusche" von sich gegeben.

 

Aber nach dem abkleben hat alles funktioniert.

 

Jetzt nach 2,5 Wochen wurde ein Paritycheck gemacht und es wurden bis jetzt 72 Fehler gefunden....

grafik.png.effef6279cd33d5dba79c0a4ab291d04.png

 

Wenn ich aber bei den Array Datenträgern schaue, ist bei keiner der Festplatten ein Fehler zu sehen, diese werden wohl parallel hier angezeigt wärend dem Scan wie ich rechargiert habe.

 

grafik.thumb.png.af9a21b8fb62f797d9b6f8aecf5c91c1.png

 

Ich weis ja nichtmal von welcher Platte die Fehler ausgehen, das sollte man ja hier sehen im Bild.

Kann es sein, dass es sich hier um einen Datenintegrationsfehler handelt weil  die Paritydaten nicht (richtig oder garnicht ) synchronisiert sind oder wie soll ich hier vorgehen ?

 

Danke für Infos und Tipps ob es sich hier überhaupt um einen Fehler handelt 😁

 

 

 

Link to comment
22 hours ago, Megacayman said:

ich habe vor 2 Wochen eine Western Digital Mybook Festplatte geshuckt.

Ich habe auch 2 MyBooks zerlegt. Die werkeln bei mir als Raid0 Verbund in einem Pool.

 

22 hours ago, Megacayman said:

Nach ~•10 Versuchen ist die Platte auch angelaufen nachdem ich den Pin für die 3,3 V abgeklebt habe

Ja, diese Pin3 Problematik schreckt mich auch sehr ab.

 

22 hours ago, Megacayman said:

dummerweise habe ich zwischenzweitlich einen SATA Adapter probiert der zu wenig Strom geliefert hat und  die Platte hat 2 oder 3  mal a  2 Minuten "knaxgeräusche" von sich gegeben.

Vermutlich hat sie wegen Unterversorgung resettet und die Köpfe in Sicherheit gebracht. Das klingt schon mal erschreckend 'hart', ist aber nicht gefährlich.

 

22 hours ago, Megacayman said:

Jetzt nach 2,5 Wochen wurde ein Paritycheck gemacht und es wurden bis jetzt 72 Fehler gefunden....

grafik.png.effef6279cd33d5dba79c0a4ab291d04.png

Naja, der ist also noch im Gange. Vielleicht werden es noch mehr.

 

22 hours ago, Megacayman said:

Wenn ich aber bei den Array Datenträgern schaue, ist bei keiner der Festplatten ein Fehler zu sehen,

Dort werden physikalische Fehler dargestellt (wenn ein Sektor nicht gelesen werden kann oder so).

Logische Datenfehler bei problemlos lesbaren Sektoren werden dort nicht angezeigt.

 

22 hours ago, Megacayman said:

diese werden wohl parallel hier angezeigt wärend dem Scan wie ich rechargiert habe.

Diese Annahme würde ich nicht bestätigen. Bei einem Paritycheck werden dort Paritätsfehler (=Dateninkonsistenz) nicht angezeigt.

 

22 hours ago, Megacayman said:

grafik.thumb.png.af9a21b8fb62f797d9b6f8aecf5c91c1.png

Ich weis ja nichtmal von welcher Platte die Fehler ausgehen, das sollte man ja hier sehen im Bild.

Es ist beim Paritätscheck nicht zu ermitteln, wo die Veränderung ist (eine oder mehrere Datenfestplette/n und/oder eine oder mehrere Paritätsfestplatte/n).

Man kann nur im Syslog den betroffenen Sektor sehen, aber das ist dann eben der Sektor aller Festplatten (die diesen Sektor haben).

Man müßte also von allen Festplatten herausbekommen, welche Dateien auf jeder Festplatte diesen Sektor belegen um dann jede Datei einzeln auf Korrektheit zu überprüfen.

Leider ist diese Detailanalyse in unraid nicht vorgesehen.  :(

 

Ich habe auch schon mehrfach hier gefragt, ob es eine Möglichkeit gibt anhand der Sektoren bei (in Deinem Fall) 3 Datenfestplatten herauszubekommen, welche Datei auf jeder der 3 Festplatten den betroffenen Sektor X belegt. Das Ergebnis würde dann 3 Dateinamen liefern (sofern der Sektor keine Logistikinfos enthält, wie Filetable oder so) und dann könnte man die gezielt prüfen. Aber bisher habe ich keine dahingehende Lösung/Übersetzung Sektorposition zu Dateien bekommen.

Und ich bin beiweitem nicht bewandert genug um das in unraid (oder Linux) zu realisieren.  😞

 

22 hours ago, Megacayman said:

Kann es sein, dass es sich hier um einen Datenintegrationsfehler handelt weil  die Paritydaten nicht (richtig oder garnicht ) synchronisiert sind

Das kann es sein, es kann aber auch sein, daß auf einer oder mehrere Datenfestplatten etwas verändert ist. Das kann man nicht sagen.

 

22 hours ago, Megacayman said:

oder wie soll ich hier vorgehen ?

Daten Deines Array mit Deinem letzten Backup/Checksummen vergleichen.

Etwas anderes bleibt Dir (meines Wissens) nicht übrig.

 

Generell:

Die Paritätsprüfung zeigt nur an, daß die Daten aller Festplatten im selben Sektor nicht die zugehörende Quersumme der Parität ergeben.

WO die Differenz her stammt, kann unraid nicht ermitteln oder anzeigen.

Auch sind diese Fehler keine Fehler, die in der Datenträgerübersicht angezeigt werden.

 

Und noch schlimmer: da man nicht einmal weiß ob die jeweilige Diskrepanz auf einer oder mehreren Datenfestplatten oder gar der/den Paritätsfestplatten existiert, kann man mit der Option die Fehler auf dem/den Paritätsdatenträger/n zu korrigieren sogar mehr Schaden anrichten, als vorher schon bestand.

 

Parität schützt nicht davor auch ein zusätzliches Backup in der Hand zu haben, wenn man Diskrepanzen sucht und beheben will.

 

Auch aus dem Grund bin ich dabei geblieben zusätzlich (auf Windows) manuell Checksummen zu errechnen und als begleitende Datei jedem Verzeichnis beizulegen.

Damit kann ich etwas schneller herausfinden, ob die Daten auf den Datenfestplatten noch korrekt sind.

 

Edited by DataCollector
Typos
  • Thanks 1
Link to comment
15 minutes ago, Megacayman said:

also kleines Feedback, ich habe einfach noch einen Paritätscheck gemacht und der war in Ordnung

Wenn der erste Paritätscheck die Fehler korrigieren durfte, ist es sehr logisch, daß ein kurz danach durchgeführter weiterer Paritätscheck die Fehler nicht mehr anzeigt.

 

15 minutes ago, Megacayman said:

und dann noch die Smart Selbsttests drübergejagt

Datenträgerfehler wurden ja schon vorher nicht erkannt, sonst hätte bei dem jeweiligen Datenträger der Fehlerzähler 'ausgeschlagen'.

 

15 minutes ago, Megacayman said:

und siehe da jetzt zeigt sie keine Fehler mehr auf dem Dashboard

...was absolut logisch ist, da die vorherig gemeldeten Paritätsfehler vermutlich in dem ersten Lauf schon abgearbeitet wurden.

 

Dennoch sagt das alles nichts dazu aus, ob da nun Dateien beschädigt sind oder nur die Parität falsch abgelegt wurde.

Link to comment
Just now, DataCollector said:

Dennoch sagt das alles nichts dazu aus, ob da nun Dateien beschädigt sind oder nur die Parität falsch abgelegt wurde.

Korrekt. Es könnte jetzt sein, dass Dateien auf Disk 2 korrupt sind und nun wurde einfach nur die Parität entsprechend dieser korrupten Daten angepasst. Der bessere Fall wäre natürlich, wenn die Parität kaputt war. Was aber nun kaputt ist, weiß man wie gesagt nicht.

Link to comment
3 hours ago, Megacayman said:

ich habe einfach noch einen Paritätscheck gemacht und der war in Ordnung und dann noch die Smart Selbsttests drübergejagt und siehe da jetzt zeigt sie keine Fehler mehr auf dem Dashboard

 

Die Parity Platte(n) wurden angepasst. Deshalb gibt es keine Fehler mehr.

 

Grundsätzlich hat die Daten-Festplatte immer Vorrang. Es wird nie beim Parity-Check auf eine Daten-Platte geschrieben (die technischen Ausnahmen wie das Schreiben auf Reserve-Sektoren lasse ich mal außen vor). Es wird immer nur auf der Parity-Platte korrigiert.

 

Beim Schreiben auf das Parity Protected Array werden die Platten in einer zeitlichen Abfolge bedient. Gibt es eine Differenz, dann ist "höchstwahrscheinlich" die Daten-Platte korrekt beschrieben und die Parity-Platte noch nicht. Selbst beim Abbruch des Schreibens auf die Daten-Platte gibt es dort "Selbstheilungsmechanismen" wie Transaktions-Logs die beim nächsten Boot einen konsistenten Zustand erzeugen.

 

Deshalb läuft das immer so ab und deshalb ist es genau so auch richtig. Die Daten-Platte hat immer Recht!

 

In extrem seltenen Ausnahmen, die eher durch Hardware-Fehler zu erklären sind, können die Daten auf der Daten-Platte defekt sein. Aber das läßt sich mit Bordmitteln nicht klären.

 

  • Like 1
Link to comment

Also hier mal von meinem besagten 3 Datenträger die Ergebnisse:

SMART Selbsttestverlauf:

grafik.png.01307158ee89b0d86f13493f06bf0eca.png

SMART Fehlerprotokoll:

grafik.png.cd4fc9cafe6b2d05137bf8bf23f0df89.png

 

Hier auch mal die Attribute:

grafik.thumb.png.72395ecfabe8952c10227dfdc848943a.png

 

Also eig habe ich nicht viel Auswahl was ich machen kann:

 

a) so weiterlaufen lassen und mir sagen "wenn was ist, die Partiyplatte rettets"

b) Platte ausbauen und 10 TB weniger haben da ich die  geshuckte nur mit Glück zurückgeben kann und dann aber wenn wieder die gleiche Externe bekomme die ich auch knacken müsste

c) das als Lerngeschenk sehen und nächstesmal lieber eine Platte mit Garantieverlängerung kaufen

 

Aber ich tendiere eig dazu, die Platte eingebaut lassen und im Auge behalten, meine Paritychecks werden alle zwei Wochen gemacht, vll dazwischen einfach immer mal Smarttests machen ob sich hier was ändert.

Was meint ihr ?

Edited by Megacayman
Link to comment
39 minutes ago, Megacayman said:

Also hier mal von meinem besagten 3 Datenträger die Ergebnisse:

SMART Selbsttestverlauf:

grafik.png.01307158ee89b0d86f13493f06bf0eca.png

SMART Fehlerprotokoll:

grafik.png.cd4fc9cafe6b2d05137bf8bf23f0df89.png

 

Hier auch mal die Attribute:

grafik.thumb.png.72395ecfabe8952c10227dfdc848943a.png

 

Also eig habe ich nicht viel Auswahl was ich machen kann:

Daten des Array mit dem Backup oder Checksummen vergleichen, die man vorherangefertigt und irgendwo abgelegt hat.

 

39 minutes ago, Megacayman said:

a) so weiterlaufen lassen und mir sagen "wenn was ist, die Partiyplatte rettets"

Moeglicherweise ist es nicht ganz angekommen: niemand sagt, daß deine festplatten einen physikalischen Defekt haben.

Die logischen Daten auf einer oder mehrere der Festplatten waren nicht okay.

 

39 minutes ago, Megacayman said:

b) Platte ausbauen und 10 TB weniger haben da ich die  geshuckte nur mit Glück zurückgeben kann und dann aber wenn wieder die gleiche Externe bekomme die ich auch knacken müsste

Die ausgebaute Festplatte ist nicht zwingend das Problem. Das kann in einem Kontroller, im Ram, in einem Softwareproblem oder einfach nur in unglücklichem Timing liegen.

 

39 minutes ago, Megacayman said:

c) das als Lerngeschenk sehen und nächstesmal lieber eine Platte mit Garantieverlängerung kaufen

Auch dies würde Dir nicht bei Paritätsfehlern helfen.

Deine Festplatten selber sind eigentlich nicht das Problem. Die Daten darauf sind betroffen.

 

Wenn Du darauf Daten hast, die Dir wichtig sind: Lege ausreichend oft Backups an!

 

39 minutes ago, Megacayman said:

Was meint ihr ?

Ich gewinne den Eindruck, daß Du meinst eine oder mehrere festplatten (vielleicht auch diese Ausgebaute) seien der Grund. Das mag sein, aber muß es nicht.

Sorge dafür, daß Du eine Überprüfungs-/Kontrollebene hast.

Checksummen helfen Veränderunegn an den Nutzdaten zu erkennen,

Backups helfen bei Veränderungen sogar den Originlzustand wieder herzustellen.

 

Link to comment

Danke für die Objektive Antwort.

 

Ja ich habe den Eindruck es hängt mit der Festplatte zusammen die ich jetzt eingebaut habe zuvor hatte ich ja bei keinem Prüfverfahren bei nichts Fehler,  zwar habe ich jetzt auch keine mehr aber trotzdem wüsste ich gerne warum das alles so zusammenhängen das erst ein paar Fehler gekommen sind als ich die Festplatte ein paar mal angeschlossen hatte wo sie nicht richtig anlief und dann schlussendlich funktioniert hat und mit Daten gefüttert wurde.

 

Gegebenenfalls hat es der Festplatte halt nicht gefallen, dass sie am Anfang mit zu wenig Strom versorgt wurde und diese komischen klackgeräusche von sich gegeben hat für ein zwei drei vier Minuten; und das war vielleicht noch im Fehlerprotokoll drinn?!

Link to comment
1 hour ago, Megacayman said:

Gegebenenfalls hat es der Festplatte halt nicht gefallen, dass sie am Anfang mit zu wenig Strom versorgt wurde und diese komischen klackgeräusche von sich gegeben hat für ein zwei drei vier Minuten; und das war vielleicht noch im Fehlerprotokoll drinn?!

Ich verstehe diesen Vorgang nicht:

Als was wird diese Festplatte benutzt? Parity oder als Datenfestplatte?

 

- Solltest Du sie von Anfang an als Parity vorgesehen haben und es kam bei der Erstellung der Parität zu den Ausfallgeräuschen, dann hast Du abgebrochen, sie stabil versorgt, dann neu Parity darauf erstellen lassen?  In dem Fall sollte der zweite Parityvorgang ja komplett von Vorne begonnen haben und es konnte zu keiner falschen Parityerstellung wegen dem vorherigen Problem gekommen sein.

 

- Solltest Du sie von Anfang an als Datenfestplatte vorgesehen haben stellt sich die Frage: Wurde sie sofort ins Array eingebaut und dann kam es zu den Knackgeräuschen als Du sie versucht hast zu befüllen?

Sollten die Fehler daher rühren spricht das gegen die Aussage von hawihoney, daß immer erst die Datenfestplatten geschrieben und danach die Parity korrigiert wird. Auch sollte das Verhalten der Festplatte da aber zu Datenträgerfehlermeldungen in unraid geführt haben (entweder eingeblendete Meldung oder in dem Fehlerzähler, der bei Dir ja auf Null stand/steht).

 

- ...von Anfang an als Datenfestplatte vorgesehen: Erst etwas beschrieben (vielleicht wirklich mit fehlerhaften Dateien), dann kam es zu den Geräuschen, abgebrochen, richtig versorgt, dann weiter befüllt, dann ins Array eingebunden?

Hier hätte man die Parität ja später erstellt/korrigiert. In dem Fall wäre die Parität mit den fehlerhaften Dateien erstellt worden. Da die Parität sich aber nicht um die Korrektheit/Inhalt der Dateien schert (es ist der Parität egal ob in einer Datei Programmcode oder Kauderwelsch drin ist), führt das auch nicht zu Paritätsfehlern.

 

Ich verstehe weiterhin nicht, woher Dein Paritätsproblem stammt und was Du (und wie) mit der ausgebauten Festplatte wirklich in welcher Reihenfolge gemacht hast, aber keines der von mir beschriebenen Szenarien führt (meiner bescheidenen Meinung nach) zu (so vielen) Paritätsfehlern.

Edited by DataCollector
Link to comment

@DataCollector

1 hour ago, DataCollector said:

Als was wird diese Festplatte benutzt? Parity oder als Datenfestplatte?

Datenfestplatte im Array

1 hour ago, DataCollector said:

kam bei der Erstellung der Parität zu den Ausfallgeräuschen

ne ne ich habe die Platte ausgebaut den Pin abgeklebt aber mein Stromversorgungskabel für die Platte war eine Verlängerung an einer Verlängerung was der Platte nicht gefallen hat 🙈 (ja ich weis doof) und sie " knackte" , daher habe ich sie abgeklemmt und mir kam, dass die Verlängerungen am ende Ärger machen was dann auch so war weil ohne Verlängerungen am "Mutterkabel" vom NT lief das Ding also betreibe ich sie jetzt so.

1 hour ago, DataCollector said:

Solltest Du sie von Anfang an als Datenfestplatte vorgesehen haben stellt sich die Frage: Wurde sie sofort ins Array eingebaut

genau das ist der Punkt , nein , hatte sie erst als unassigned device dann habe ich sie über die Konsole rein mit

 

wipefs -a /dev/adc (meine ausgebaute Platte) , dass ich die Platte ins Array schieben konnte.

 

Dann beim Paritätscheck kamen die vielen Fehler , dass ich noch einen gemacht was ich gelesen habe, bei welchem alles ok war also dem zweiten.

Anschliesend hab ich die Smart Tests noch gemacht und bis jetzt läuft alles .

 

 

Link to comment
2 hours ago, Megacayman said:

hatte sie erst als unassigned device

...mit Daten gefüllt oder nur genullt?

2 hours ago, Megacayman said:

dann habe ich sie über die Konsole rein mit

wipefs -a /dev/adc (meine ausgebaute Platte) ,

Ich habe gerade gelesen,d aß Wipefs nicht den Dateninhalt nullt/löscht, sondern nur die Signatur.

Somit enthielt die Festplatte vermutlich sehr viele Sektoren, die nicht genullt waren.

 

2 hours ago, Megacayman said:

dass ich die Platte ins Array schieben konnte.

Hast Du sie im Array wieder formatiert (kurzer Zeitraum oder 10+ Stunden lang)?

Wenn kurzer Zeitraum: dann hatte die Festplatte weiterhin Sektoren, die nicht "0" waren und somit stimmte die Parität an der Stelle nicht = Paritätsfehler!

Sollte unraid die Festplatte 10+ Stunden lang selber formatiert und vorbereitet haben, dann hat unraid die Festplatte in der Regel selber 'genullt' und es hätte wegen der Sektoren keine Paritätsfehler geben dürfen.

 

2 hours ago, Megacayman said:

Dann beim Paritätscheck kamen die vielen Fehler ,

Das geamte Vorgehen klingt mir, als hast Du unraid im Array einfach eine Festplatte mit beschriebenen (ungleich dem Wert 0) Sektoren unter geschoben und das ist dann eben bei der Paritätsprüfung aufgefallen.

Da<s würde zumindest alles erklären. Somit gibt es keinen wirklichen Hardwarefehler und unraid hat dann eben die Parität korrigiert, was in dem Fall auch richtig ist. )Ob natürlich dabei irgendein Fehler auf einer andere Datenfestplatte mit unter gegangen ist, weiß man nicht.

 

2 hours ago, Megacayman said:

Anschliesend hab ich die Smart Tests noch gemacht und bis jetzt läuft alles .

 

Aber wieder der gut gemeinte Hinweis: Wichtige Daten verdienen ein Backup.

Ich weiß, ich nerve! :)

  • Like 1
Link to comment
45 minutes ago, DataCollector said:

Ich habe gerade gelesen,d aß Wipefs nicht den Dateninhalt nullt/löscht, sondern nur die Signatur.

Somit enthielt die Festplatte vermutlich sehr viele Sektoren, die nicht genullt waren.

 

Das hat nichts miteinander zu tun. Unraid prüft die Unraid Signatur im MBR auf der Platte. Wenn die nicht existiert, dann wird die Platte von Unraid ohnehin komplett überschrieben. Wipefs erstellt meines Wissens nämlich keine Signatur - nur Preclear macht das.

 

Also wird eine neu hinzugefügte, mit Wipefs behandelte Platte, von Unraid komplett gecleared.

 

Eine mit Wipefs behandelte Austauschplatte wird hingegen komplett gesynct und neue, erweiterte Bereiche werden gecleared.

 

Ein Parity Mismatch kommt nicht durch das Hinzufügen/Austauschen einer Platte. Es sind die bestehenden Platten die eine Differenz aufweisen.

 

Link to comment

@DataCollector ja Wipefs  da die Platte doch sowiso leer war.

Mir fällt aber gerade ein, dass ich die Platte davor noch als ich sie eingehängt habe formatiert habe, danach kam mir , dass dies eig unnötig war da eh neu.

 

Dann hab ich das mit Wipefs gelesen , dass ich hätte gleich das machen können und die Platte ins  Array schieben können. 

Dann erster Parity Check viele Fehler dann einen hinterher und als der zweite dann keinen Fehler zeigte die SMART Werte prüfen lassen.

 

Soviel zur Reihenfolge.

 

Ich bin jetzt dezent verwirrt wie ich weiter vorgehen soll 😅 SMART Werte im Blick behalten und gut erstmal ? Also ist ja nicht so, dass die Platte 2 Stunden lang zu wenig Strom bekommen hat und geknaxt hat, waren ja nur paar Minuten.

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...