Jump to content

Server Crash - Stromausfall - Sync-Fehler


Expello
Go to solution Solved by hawihoney,

Recommended Posts

Hi zusammen,

 

leider hatte ich heute einen kleinen Crash (Stromausfall), ja ich weiss keine USV pecht gehabt. 🙂

Nun ist es so, das alles soweit wieder läuft, auch die Daten auf dem Array scheinen OK zu sein.


Ich habe mehrere große RAR Dateien vom Array über SMB geöffnet und einen CRC Check laufen lassen....sieht gut aus.

Es ist nur so das die Paritätsprüfung (läuft noch) doch einige Fehler ausgeworfen hat (Sync-Fehler erkannt: 25921).

Die Paritätsprüfung läuft aktuell ohne Korrekturen zu schreiben (also kein Haken gesetzt).

 

Mir fällt es jetzt schwer zu erkennen wo die Fehlerhaften Daten sind, auf dem Datenträger oder auf der Parität und vor allen Dingen welche Dateien sind betroffen?


Array Datenträger: (dient als Datengrab und Archiv für die Überwachungskameras)

 

Parität HDD 5TB
Datenträger 1 HDD 5TB
Datenträger 2 HDD 5TB

 

Pool Datenträger: (alle VMS und Docker)

 

Cache SSD 512GB


Im Prinzip läuft zwar alles wieder, aber wie soll ich mit den Fehlern umgehen?
Oder wird nach Ablauf der Prüfung eine Lösung vorgeschlagen?


Habt herzlich Dank!

Link to comment
1 hour ago, Expello said:

Mir fällt es jetzt schwer zu erkennen wo die Fehlerhaften Daten sind, auf dem Datenträger oder auf der Parität und vor allen Dingen welche Dateien sind betroffen?

 

Das Thema ist hier im Forum bestimmt schon 1000x hinterfragt worden:

 

1.) Nein, Unraid lässt nicht erkennen welche Dateien betroffen sind. Man sieht im syslog nur Tracks/Sektoren - denn nicht alles auf einer Festplatte gehört zu einer Datei (Metadaten. Verwaltungsinformationen, ...).

 

2.) Wenn man sich nicht sicher ist, dann spielt man ein Backup zurück.

 

3.) Allerdings scheinst Du nur gelesen zu haben (CRC Check) - das erzeugt keine neuen Dateien. Vermutlich hast Du das Problem schon länger oder etwas anderes hat massiv Daten geschrieben (25000 Sync Errors ist extrem viel). Schau Dir mal die SMART Werte der Platten an. Hast Du CRC Fehler?

 

4.) Es ist unerheblich ob eine Parity-Platte oder eine Daten-Platte betroffen ist. Wenn man kein Backup hat, dann bleibt einem nichts anderes übrig als den Parity-Check korrigierend laufen zu lassen. Die Parity-Platte muss zu den Daten-Platten passen. Durch Deinen nicht-korrigierenden Parity-Check hast Du nämlich im Moment folgendes Problem: Parity- und Daten-Platten passen nicht mehr zueinander. Wenn jetzt eine Daten-Platte ausfällt, dann wird diese garantiert mit Müll beschrieben.

 

Edited by hawihoney
  • Like 2
Link to comment

Vielen Dank für dein ausführliches Feedback!

 

Sorry das ich die Frage hier nochmal gestellt habe, aber die Antworten die ich gefunden habe, waren für mich irgendwie nicht hilfreich.

 

Die Paritätsprüfung läuft einmal im Monat und war stets Fehlerfrei. Die SMART Werte sind ebenfalls unauffällig, keine CRC Fehler etc..

 

Heißt konkret ich lasse in der nächste Runde die Paritätsprüfung mit Korrekturen schreiben laufen und lebe mit der Möglichkeit das danach einige Dateien weg oder nicht lesbar sind.

 

Hätte ich denn die Möglichkeit zu sagen das die Daten im Array ok sind und lasse mit dem Ist-Zustand die Parität neu schreiben? 

Ehrlich gesagt wäre das meine favorisierte Methode da ich ziemlich sicher bin das die Daten zu 99% ok sind.

 

Wie gehe ich am schlausten vor?

 

Herzlichen Dank 

Link to comment
2 hours ago, Expello said:

Hätte ich denn die Möglichkeit zu sagen das die Daten im Array ok sind und lasse mit dem Ist-Zustand die Parität neu schreiben?

 

Die Garantie kann Dir niemand geben. ABER: Der Ablauf der vier Operationen beim Schreiben fängt immer mit der Datenplatte an. Denn erst nach Kenntnis des beschriebenen Blocks auf der Daten-Platte kann der gleiche Block auf der Parity-Platte beschrieben werden. Zudem haben moderne Dateisysteme eine Art Transaktions-Log, das beim nächsten Boot abgearbeitet wird und nur vollständige Änderungen aufspielt. Lass einfach die Korrektur der Parity zu, damit das Array in sich schlüssig wird.

 

Was mich nur nervös machen würde sind die über 20.000 Sync Fehler. Das ist für einen simplen Stromausfall viel zu viel. Jeder Schreibvorgang wird nämlich mit minimalem zeitlichem Versatz in der Parity abgebildet. Deshalb meine Fragen nach der Vergangenheit oder CRC-Fehlern. Hattest Du mehr als einen Stromausfall, o.ä.

 

  • Upvote 1
Link to comment

Ja du hast schon recht die Anzahl der Fehler ist recht hoch, aber ich prüfe seit knapp zwei Stunden die Daten auf dem Array und habe nicht eine defekte Datei gefunden.

 

Und es gab keine weiteren Vorfälle...einmal im Monat läuft wie gesagt die Paritätsprüfung und diese war immer Fehler...aber das hatte ich ja oben bereits erwähnt.

 

Ich habe halt nur angst das die Parität hin ist, warum auch immer und er mir bei der Paritätsprüfung mit Korrekturen schreiben mir die Daten auf dem Array zerhaut. Ausser die Prio hat das Array und er korrigiert die Paritäts HDD...aber so viel ich darüber auch lese, ich kriege die Information nicht so in mein Gehirn das ich es wirklich verstehen würde.

 

So richtig weiss ich nicht was ich machen soll.

 

 

 

Link to comment
26 minutes ago, Expello said:

Ich habe halt nur angst das die Parität hin ist, warum auch immer und er mir bei der Paritätsprüfung mit Korrekturen schreiben mir die Daten auf dem Array zerhaut

 

Hab den Satz nicht verstanden ABER bei einem Parity-Check wird nur die Parity geändert. Die Daten-Platten haben immer Vorzug. So muss das auch sein.

 

Link to comment
8 minutes ago, hawihoney said:

 

Hab den Satz nicht verstanden ABER bei einem Parity-Check wird nur die Parity geändert. Die Daten-Platten haben immer Vorzug. So muss das auch sein.

 

 

ahhh das ist doch mal ne Aussage, da die Daten ja scheinbar (manuelle Prüfung) ok sind...durfte das damit ja erledigt sein.

 

Warte den Durchlauf jetzt ab und starte nochmal mit Korrekturen schreiben.... danke dir herzlich.

Link to comment
  • Solution
8 hours ago, Expello said:

das ist doch mal ne Aussage

 

Wie der Name schon sagt: Beim Parity-Check wird die Parity gecheckt 😉

 

1. Bei Lesefehlern von Daten-Platten werden die Parity-Platten und die anderen Daten-Platten verwendet um den betreffenden Block auf der Daten-Platte erneut zu schreiben - ggfs. auf einen Reserve-Block - was dann wiederum ggfs. die Parity-Platte aktualisiert. Der Lesefehler wird vermerkt aber es passiert nichts weiter. Entsteht aber im Nachhinein, beim erneuten Schreiben des Blocks, ein Schreibfehler, dann wird die Platte disabled und in der Folge emuliert.

 

2. Bei Schreibfehlern wird die Platte disabled und emuliert.

 

3. Du hast Sync-Fehler während des Parity-Checks. Die Inhalte von Daten-Platten und Parity-Platten passen also nicht zusammen. Dann wird, sofern nicht abgeschaltet, die Parity-Platte aktualisiert.

 

Edited by hawihoney
  • Like 2
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...