Wie schlimm steht es um meine Festplatte :-(

guybrush2012 · July 15, 2022

Hallo,

so meine erste Päritätserstellung läuft noch (ca. 90%) und Unraid sagt mir das meine Festplatte im Array Fehler hat.
Wahrscheinlich werden die Fehler in der Parität übernommen 😞

Wie Schlimm steht es um meine Festplatte? Ist Sie schwer Krank??? Liegt Sie schon in Intensivstation??? 😪

😪

image.png.8205ebe7fca77b84fc86769a90f66626.png

Sollte ich Sie schnell ersetzen? Die Daten sind korrupt richtig?

Edited July 15, 2022 by guybrush2012

Ford Prefect · July 15, 2022

21 minutes ago, guybrush2012 said:

Wie Schlimm steht es um meine Festplatte? Ist Sie schwer Krank??? Liegt Sie schon in Intensivstation??? 😪

...auf jeden Fall hat die Disk gerade nicht ihre beste Zeit.

Pending Sectors sind erstmal nur ein Indikator...wenn die zunehmen und nicht stabil bleiben/in hoher Zahl vorkommen ist die Disk nicht mehr gesund.

Aus eiem pending Sector wird im Zweifel ein reallocated Sector...die DIsk mapped diese Sektoren auf einen reserve-platz, wenn ein sektor mhrfach erfolglos ist/war.

Wenn das auch häfig passiert, sagt Pille immer: "He is dead, Jim!".

21 minutes ago, guybrush2012 said:

Sollte ich Sie schnell ersetzen?

...siehe oben...wenn Du Backups hast, mach nochmal ein/zwei preclear durchläufe und beobachte...wenn das stabil bleibt, kann das lange gutgehen.

21 minutes ago, guybrush2012 said:

Die Daten sind korrupt richtig?

Nein, nicht notwendigerweise...die Parity geht über die ganze Disk, roh/binär auf Setor-Ebene, nicht über Files.

Wenn die Platte nicht sehr voll ist und auch nie war und wenn der Fehler gegen Ende des Parity Checks auftrat, ist vielleicht ein "leerer" Sektor betroffen.

Du musst gegen ein Backup vergleichen.

Edited July 15, 2022 by Ford Prefect

mgutt · July 15, 2022

7 minutes ago, guybrush2012 said:

Wie Schlimm steht es um meine Festplatte? Ist Sie schwer Krank??? Liegt Sie schon in Intensivstation??? 😪

Der Inhalt 2er Sektoren steht auf Pending, weil die Sektor-Checksumme nicht mehr zu den Daten passt. Dadurch hat der Parity Check parallel auch die Parität an die "neuen" Daten angepasst.

Aus dem Grund sollte man die Einstellung "Write corrections to parity disk:" deaktivieren. Denn die Parität kann sich vom Prinzip nur ändern, wenn eine Disk kaputte Sektoren hat.

Jedenfalls steht noch nicht fest, dass der Sektor verloren ist, weshalb er noch auf "Pending" steht. Erst wenn ein erweiterter SMART Check einen Schreibtest macht, wird SMART den Sektor entweder freigeben oder aufgeben und stattdessen einen Ersatzsektor verwenden. Das ist dann der Reallocated Count.

Für die Gesundheit der Platte ist es auf jeden Fall ein schlechtes Zeichen. Ich bin da sehr empfindlich und würde direkt tauschen.

17 minutes ago, guybrush2012 said:

Die Daten sind korrupt richtig?

Ja, von 2 Sektoren. Ein Sektor ist üblicherweise 512 Bytes groß (siehe unten). Es können wenn "nur" wenige oder keine Dateien betroffen sein, aber ja wenn es von Dateien genutzte Sektoren sind, dann sind diese korrupt.

root@Tower:~# for i in /dev/sd?; do echo $i; smartctl -a $i | grep -i physical; done                      /dev/sda
/dev/sdb                                             Sector Size:      512 bytes logical/physical
/dev/sdc                                             Sector Size:      512 bytes logical/physical

guybrush2012 · July 15, 2022

36 minutes ago, Ford Prefect said:

...siehe oben...wenn Du Backups hast, mach nochmal ein/zwei preclear durchläufe und beobachte...wenn das stabil bleibt, kann das lange gutgehen.

Reicht es denn nicht, wenn ich...

1. die Platte aus dem Array nehme

2. Sie mit Unassigned Devices lösche

3. Im Array wieder hinzufüge

4. Die Wiederherstellung vom Parity starte

Dann wird doch die HDD wieder beschrieben. Tauchen dann keine Fehler auf, ist alles gut.

Oder mache ich da einen Denkfehler?

guybrush2012 · July 15, 2022

32 minutes ago, mgutt said:
Ja, von 2 Sektoren. Ein Sektor ist üblicherweise 512 Bytes groß (siehe unten). Es können wenn "nur" wenige oder keine Dateien betroffen sein, aber ja wenn es von Dateien genutzte Sektoren sind, dann sind diese korrupt.
root@Tower:~# for i in /dev/sd?; do echo $i; smartctl -a $i | grep -i physical; done                      /dev/sda
/dev/sdb                                             Sector Size:      512 bytes logical/physical
/dev/sdc                                             Sector Size:      512 bytes logical/physical

Verstehe. Wenn ich von der HDD ein Backup z.B. mit deinem Rsync Script machen kann und diese übertragen werden, sind wohl die Daten nicht betroffen oder?

Denke ich werde mir die Toshiba Enterprise Capacity MG08ACA 16TB, 512e, SATA 6Gb/s.
Die soll ja ganz gut sein.

Parität ist fertig. 🙄

image.png.1934f10dbbe57c109dc1ebbc882a8625.png

mgutt · July 15, 2022

4 minutes ago, guybrush2012 said:

Wenn ich von der HDD ein Backup z.B. mit deinem Rsync Script machen kann und diese übertragen werden, sind wohl die Daten nicht betroffen oder?

Das kann man nicht auf die Art ermitteln. Du kannst nur die Dateien mit denen aus einem Backup vergleichen. Oder wir versuchen an Hand deiner Logs die IDs der Sektoren zu ermittelt und an Hand derer die betroffenen Dateien.

mgutt · July 15, 2022

13 minutes ago, guybrush2012 said:

Dann wird doch die HDD wieder beschrieben. Tauchen dann keine Fehler auf, ist alles gut.

Da die Parität angepasst wurde, werden die betroffenen Sektoren mit den selben korrupten Daten überschrieben.

DataCollector · July 16, 2022

3 hours ago, mgutt said:

Das kann man nicht auf die Art ermitteln. Du kannst nur die Dateien mit denen aus einem Backup vergleichen. Oder wir versuchen an Hand deiner Logs die IDs der Sektoren zu ermittelt und an Hand derer die betroffenen Dateien.

Nur als Ergänzung gedachter Kommentar:

An dieser Stelle sei wieder auf das Plugin "File integrity" verwiesen, welches nicht heilen, aber korrupte Dateien im Prüflauf finden kann.

(Wenn es zuverlässig funktioniert).

Es wurde ja geschaffen um eine ungewollte Veränderung von Dateien aufzuspüren (Bitrot).

guybrush2012 · July 16, 2022

Der Erwerterter Smarttest ist mit Fehler Abgebrochen.

WDC_WD40EFRX-68N32N0_WD-WCC7K6KYD0YJ-20220716-1044.txt

6 hours ago, DataCollector said:

Nur als Ergänzung gedachter Kommentar:

An dieser Stelle sei wieder auf das Plugin "File integrity" verwiesen, welches nicht heilen, aber korrupte Dateien im Prüflauf finden kann.

(Wenn es zuverlässig funktioniert).

Es wurde ja geschaffen um eine ungewollte Veränderung von Dateien aufzuspüren (Bitrot).

Hab den eben gestartet. Mich würde schon interessieren welche daten Korrupt sind, da womöglich diese Daten auf mein Backup womöglich auch korrupt sind 😞

Sollte ich irgendwas besonderes einstellen?

Übrigens es dauert nochmal ca. 4 Std. Nachdem ich Parity erstellt hab und den erweiterten smarttest, gebe ich Ihr bestimmt damit den Gnadenstoß 😁

mgutt · July 16, 2022

10 minutes ago, guybrush2012 said:

Der Erwerterter Smarttest ist mit Fehler Abgebrochen.

Dh der hat den gar nicht bis zum Ende durchgeführt?!

SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       20%     15301         6244436384
# 2  Extended offline    Aborted by host               90%     15295         -

Oder hast du den abgebrochen?

mgutt · July 16, 2022

10 minutes ago, guybrush2012 said:

Hab den eben gestartet. Mich würde schon interessieren welche daten Korrupt sind,

Poste mal die Logs vom Parity Check

DataCollector · July 16, 2022

13 minutes ago, guybrush2012 said:

Hab den eben gestartet.

Hattest Du ihn schon installiert und jetzt den Prüflauf gestartet?

13 minutes ago, guybrush2012 said:

Mich würde schon interessieren welche daten Korrupt sind,

Das Tool File Integrity (FI) baut darauf auf, daß man vorher schon einmal die Checksummen aufgebaut (Build) hat und jetzt diese Prüfen könnte um jetzt herauszufinden, welche Datei nicht mehr der damaligen Checksumme entspricht.

Wenn Du jetzt erst den Build anstößt, kann das Tool nichts finden, weil es ja den jetzigen Zustand als OK ansieht und den als Checksumme für jede Datei ablegt.

13 minutes ago, guybrush2012 said:

da womöglich diese Daten auf mein Backup womöglich auch korrupt sind 😞

Für den Zweck habe ich nebenher noch Checksummen, die ich unter Windows erzeuge. Bei Bedarf kann ich so auch mit einem Windows Batchlauf prüfen ob da etwas nicht wie vorher war.

13 minutes ago, guybrush2012 said:

Sollte ich irgendwas besonderes einstellen?

Wenn Du jetzt erst anfängst, ist es für das Auffinden der nun beschädigten dateien zu spät. Da kann Dir FI nicht helfen.

Es wäre aber vielleicht für Dich interessant es für zukünftige Fälle für jede Disk ein Build anzulegen und das Tool im Hintergrund laufen zu lassen.

Hier meine Einstellungen:

guybrush2012 · July 16, 2022

11 minutes ago, mgutt said:

Dh der hat den gar nicht bis zum Ende durchgeführt?!

SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       20%     15301         6244436384
# 2  Extended offline    Aborted by host               90%     15295         -

Oder hast du den abgebrochen?

Nöö, icb hab geschlafen... der ist abgebrochen. 🙄

11 minutes ago, mgutt said:

Poste mal die Logs vom Parity Check

Wo finde ich diesen Log?

guybrush2012 · July 16, 2022

11 minutes ago, DataCollector said:

Hattest Du ihn schon installiert und jetzt den Prüflauf gestartet?

Das Tool File Integrity (FI) baut darauf auf, daß man vorher schon einmal die Checksummen aufgebaut (Build) hat und jetzt diese Prüfen könnte um jetzt herauszufinden, welche Datei nicht mehr der damaligen Checksumme entspricht.

Wenn Du jetzt erst den Build anstößt, kann das Tool nichts finden, weil es ja den jetzigen Zustand als OK ansieht und den als Checksumme für jede Datei ablegt.

Verstehe, dann bringt es nichts mehr. Ich werde nicht mehr herausfinden ob, welche, wichtige oder unwichtige Dateien betroffen sind ^^
So ist das leben eben.

Ich tendiere immer mehr in Zukunft komplett auf SSDs zu setzen und die Platten die ich noch habe aussterben zu lassen.
Klar ist der Preis um ein vielfaches höher, aber da hat man sowas wie Current pending sector nicht mehr.

Das man nichtmal auslesen kann, welcher defekte sector zu welche Datei gehört, sieht man wie primitiv diese dinger sind 😅

Bisher dachte ich das es ausreicht Dateien zu lesen bzw. zu Kopieren und wenn defekte sektoren Datei sind, es zu einem Kopierfeher kommt.

Edited July 16, 2022 by guybrush2012

DataCollector · July 16, 2022

17 minutes ago, guybrush2012 said:

Wo finde ich diesen Log?

Die Frage hatte ich auch.

Ich vermute er meint diese rudimentäre Information, wenn man im Main-Tab unten unter Check auf History klickt. Aber darin sehe ich bei mir nur ein paar statistische Infos.

Mich hätte eher interessiert, wenn der ParityCehck (PC) an einer Stelle (beispielsweise Sektor xyz) beim Check einen Fehler findet, daß er dann auch angibt, welche Dateien auf den ganzen geprüften Festplatten dort auf deren Sektor xyz liegen, so daß man nicht gleich den ganzen Datenbestand der fraglichen/aller Disks anzweifeln und püfen muß.

mgutt · July 16, 2022

23 minutes ago, guybrush2012 said:

Wo finde ich diesen Log?

Ganz normal in den syslogs

DataCollector · July 16, 2022

14 minutes ago, guybrush2012 said:

Verstehe, dann bringt es nichts mehr. Ich werde nicht mehr herausfinden ob, welche, wichtige oder unwichtige Dateien betroffen sind ^^
So ist das leben eben.

Korrekt. Hier heißt es 'Vorbereitung ist die halbe Miete'.

Solange Du keinen als korrekt verifizierten Backupstand hast, kannst Du auch daran nicht ermitteln welche Dateien betroffen sind.

Das habe ich (in der Windowswelt) schon vor 21 Jahren (ca. 2001) gelernt, als ich Daten aus einer verstorbenen Festplatte per professionellem Tool (Ontrack für fast 250 Euro (oder waren es nch DM?)) herausgekratzt habe und dann vor ca. 60GB geretteten Dateien stand und jede einzelne prüfen mußte ob diese noch den korrekten Inhalt enthielt (Spoiler: ca 45% der Daten waren defekt).

Seit dem liebe ich Checksummen. Selbst eine simple CRC32 Checksumme (auch bekannt als *.sfv) ist hilfreich um eine einfache Veränderung zu finden. Natürlich sind diese einfachen Checksummen nicht dagegen gefeit, daß an genau den falschen Stellen mehrere Bits kippen und dann die Datei rein zufällig doch die korrekte Chesumme hätte. Aber das ist eine seeeehr geringe Wahrscheinlichkeit.

Wenn man sich dagegen absichern will, muß man etwas kompliziertere Checksummen nehmen (MD5 ist besser, Diverse blake verfahren sollen noch besser sein, SHA512 oder hoeher sind wohl dahingehend super zuverlässig, aber auch für sowas zu rechenintensiv).

14 minutes ago, guybrush2012 said:

Ich tendiere immer mehr in Zukunft komplett auf SSDs zu setzen

Das mag flotter sein, aber vor Datenverlust nicht schützen.

Nur sind SSD ein Buch mit 7 Siegeln und wenn darin etwas schief geht kann es sein, daß der Kontroller nicht einmal die standardtisierten Smartwerte anpasst. Es gibt SSD, da fallen Fehler erst auf, wenn die/dadurch dass die SSD verstorben ist.

Es gibt prof. SSD, die intern selber mit zusätzlichen Fehlerkorrekturen (also weit ueber den Consumer ECC Check hinaus) arbeiten, aber da bist Du im seeehr hochpreisigen professionellen Enterprise Bereich.

14 minutes ago, guybrush2012 said:

Klar ist der Preis um ein vielfaches höher, aber da hat man sowas wie Current pending sector nicht mehr.

Wie kommst du auf das schmale Brett?

Ob ein Sektor einer mechanischen Festplatte einen fraglichen Status hat (pending) oder der eingebaute Kontroller einen moeglicherweise defekten Block einer Speicherzelle noch auf Zuverlässigkeit prüfen und ausmappen muss (pendig) macht wenig unterschied.

Nur unterliegen Flashspeicher schon bauartbedingt einem Schreibverschleiß. Es ist also nicht die Frage ob eine Speicherzelle ausfällt, sondern nur wann.

(Auch einer der Gründe, warum SSD im Overprovisioningbereich Leerzellen haben.)

Und bei Backups: Auch sind SSD als Langzeitdatenspeicher (Jahre) ohne Stromversorgung nicht so gut geeignet.

14 minutes ago, guybrush2012 said:

Das man nichtmal auslesen kann, welcher defekte sector zu welche Datei gehört, sieht man wie primitiv diese dinger sind 😅

Solche Logs waren bei SCSI üblich, hat man aber bei SATA nicht mit übernommen. Aber endgültig als defekte Sektoren gekennzeichnete Stellen sind zu finden.

Die Chance eine defekte Speicherzelle in einer SSD zu finden hast Du hingegen gar nicht, weil der Kontroller als abstrahierende Schicht alles verschleiert.

14 minutes ago, guybrush2012 said:

Bisher dachte ich das es ausreicht Dateien zu lesen bzw. zu Kopieren und wenn defekte sektoren Datei sind, es zu einem Kopierfeher kommt.

Die Welt der digitalen Datenspeicher ist leider etwas komplizierter.

guybrush2012 · July 16, 2022

24 minutes ago, DataCollector said:

Das habe ich (in der Windowswelt) schon vor 21 Jahren (ca. 2001) gelernt, als ich Daten aus einer verstorbenen Festplatte per professionellem Tool (Ontrack für fast 250 Euro (oder waren es nch DM?)) herausgekratzt habe und dann vor ca. 60GB geretteten Dateien stand und jede einzelne prüfen mußte ob diese noch den korrekten Inhalt enthielt (Spoiler: ca 45% der Daten waren defekt).

In der guten alten Commodore C64 und Amiga Zeit konntest du ein sektor auf der Diskette anklicken und die Datei die betroffen war ermitteln 😁

Zu Thema SSD oder HDD.

Meinst Ihr ich soll mir dann lieber ein HDD nochmal zulegen anstatt ein paar SSDs?

Ich habe hier so alte SSDs, mir ist noch nie eine Ausgefallen, zudem sind die vieeelll Robuster gegen wärme, kälte, stürze etc. 🙂

@mgutt

syslog ist erstellt

syslog.txt

Edited July 16, 2022 by guybrush2012

DataCollector · July 16, 2022

1 hour ago, guybrush2012 said:

Zu Thema SSD oder HDD.

Meinst Ihr ich soll mir dann lieber ein HDD nochmal zulegen anstatt ein paar SSDs?

Das kommt auf Deinen Geldbeutel, Anwendungszweck, etc... an

Nur um mal ins Extrem zu gehen, damit Du siehst, dass es sehr auf den Anwendungszweck und Geldbeutel ankommt:

Wenn ich mein ca. 400TB Array in SSD bereitstellen wollte müßte ich viel geld und Technik haben:

Laut Geizhals ist aktuell die Kingston NV1 NVMe PCIe SSD 2TB, M.2 SNVS/2000G die günstigste SSD im Preis/Größenverhältnis mit 134,90 Euro Stück.

Das bedeutet 200DatenSSD + 2Parity = 202 *134,90Euro = 24249,80 Euro.

Dann bleibt aber das Problem, daß ich irgendwie 202 NVMe anbinden muß und unraid im Array ja nur max 28-2 Devices erlaubt.

Und da unraid im Array kein Trim unterstützt wird das auch eine schleichend langsamer werdende Sache.

Alternativ bei 28 Datendevices (weil unraid im Array ja nicht mehr kann) kommen nur SSD ab 14,3TB in Frage. Da es solche Größen nicht gibt, also 16TB. Da ist die Billigste:

Intel SSD D5-P5316 15.36TB, U.2 SSDPF2NV153TZN1 zu Stückpreisen von 2343,10 Euro.

Mit 2 ParitätsSSD lande ich dann also bei 70295,70 Euro (und weiß imme rnoch nicht, wie ich 30 NVMe/U2 SSD anbinden soll und das TrimProblem bleibt auch.

SATA ist auch keine Lösung, weil da bei SSD bei 8TB Schluß ist.

Wenn man mir also das Geld (und etwas mehr für die Anbindung so vieler NVMe) schenkt und ich genug Zeit zum Aufbau habe, dann könnte ich auf SSD setzen. Aber ne, das ist nicht der Fall.

Was Du machen willst/sollst, mußt Du selber für Dich und Deine Situation entscheiden.

1 hour ago, guybrush2012 said:

Ich habe hier so alte SSDs, mir ist noch nie eine Ausgefallen, zudem sind die vieeelll Robuster gegen wärme, kälte, stürze etc. 🙂

Wenn Du genug hast um mit max 28 im Array die gewümschte Kapazität zu erreichen und Du soviel Energie da rein stecken willst: mach es.

Aber wie gesagt: unraid kann im Array kein Trim. Und gerade (zu) alte SSD sind oft noch nicht so weit, daß sie sich ohne Trim selber ausreichend optimieren um möglichst wenig Geschwindigkeitsverlust zu haben.

Achja, die Parität sollte mit internem Garbage Collection nicht die eigene Parität kaputt machen. mgutt hat dazu ja schon öfters was geschrieben.

Und vor Datenverlust schützt Dich das auch nicht.

Vielleicht solltest Du vielleicht ein geeignetes Backupsystem aufsetzen. Das hilft vielleicht besser.

mgutt · July 16, 2022

1 minute ago, DataCollector said:

Dann bleibt aber das Problem, daß ich irgendwie 202 NVMe anbinden muß

Genau das ist das Hauptproblem. Die PCIe Switche kann man gar nicht bezahlen und was die an Strom verballern auch nicht. Daher setze ich auf SATA bis es irgendwann mal Boards gibt, die 8x M.2 erlauben, falls es das überhaupt jemals geben wird.

Ich kaufe aktuell die 8TB QVO gebraucht im Schnitt für 400 €. Also 50 € pro TB. Damit kommst du von deinen 70k bzw 27k immerhin runter auf ~20k 😅

Bleibt aber das Problem woher man genug SATA Buchsen bekommt. Mein Plan sind aktuell 8x SATA Onboard + 12 SATA Ports per 2x ASM1166 Karten. Dann hätte ich immerhin 18x8TB + 2x Parität = 144TB. Das reicht mir erst mal. Außerdem möchte ich 3x 8TB M.2 NVMe als Parität und Disk1 verwenden, um den Flaschenhals der QVO zu umgehen und gänzlich auf einen Cache Pool verzichten zu können.

DataCollector · July 16, 2022

48 minutes ago, mgutt said:

Genau das ist das Hauptproblem. Die PCIe Switche kann man gar nicht bezahlen und was die an Strom verballern auch nicht. Daher setze ich auf SATA bis es irgendwann mal Boards gibt, die 8x M.2 erlauben, falls es das überhaupt jemals geben wird.

Bei den Boards, 2 PCIe elektrisch x16 Slots per Bifurcation auf x4x4x4 könnten schon helfen. Aber da bist Du im etwas stromschluckenden Serverbereich.

Oder einen PCIe x16 aufg x4x4x4x4 Splitten, 2 M.2 auf dem Board und dann noch 2 PCIex4 Slots..... Aber das ist dann schon eher eine Bastelei

Alternativ auf etwas Geschwindigkeit verzichen und U.2 2Lane Switche nehmen. Da wird jedes Device zwar nur mit 2 Kanes angebunden (Bei PCIe 3.0 nur 2GByte/s aber das sollte immer noch ausreichend und sehr flott sein). Und, ja Du sagtest es ja schin PCIe Switche schlucken Strom.

Und weil ich eben sehr viel Platz will/brauche (ca. 400TB) kommen in aktueller Lage eben nur Festplatten in Frage.

25*18TB HDD gibt es aktuell schon für rund 7000 Euro. So schön wie SSD sind, in aktueller Situation lieber ein paar Stück als Cache davor schalten und der Rest eben als 'preisgünstigeren' Festplattenplatz.

48 minutes ago, mgutt said:

Ich kaufe aktuell die 8TB QVO gebraucht im Schnitt für 400 €. Also 50 € pro TB. Damit kommst du von deinen 70k bzw 27k immerhin runter auf ~20k 😅

Ja, hatten wir in Deinen 10Zoll ServerBereich ja schon mal kommuniziert.

48 minutes ago, mgutt said:

Bleibt aber das Problem woher man genug SATA Buchsen bekommt.

Da ich nicht auf jedes Watt schaue, sehe ich meien Lösung mit dem Adapteckontroller (sieeh Signatur) als einen brauchbaren Kompromiss zwischen Kosten (als Gebrauchtware!), Aufwand, Kompatibilität (HBA) zu unraid, PCIE Port sparsamkeit und Portanzahl.

Aber solange man nicht unbedingt in die tiefsten C States und PCIe Slots sparen will, kann man ja auch mit ein paar SATA Kontrollern schon einiges reissen.

48 minutes ago, mgutt said:

Mein Plan sind aktuell 8x SATA Onboard + 12 SATA Ports per 2x ASM1166 Karten.

Im Falle eines ICH: 2GByte/s Onboard : 8 = 250Mbyte/s bei gleichzeitiger Nutzung

Die ASM1166 schaffen dann ja eher so 330 MByte/s pro SATA Port.

Wie ich (glaube ich von Dir) ja schon las sind dann aber die tiefen C States bei den meisten Boards futsch.

Da wirst Du dann so einiges zu optimieren haben.

48 minutes ago, mgutt said:

Außerdem möchte ich 3x 8TB M.2 NVMe als Parität und Disk1 verwenden,

Das wird nicht billig

Hast Du schon mal nachgeprüft ob/welche SSDs Dir bei Parität mit ihrem Garabge Collection nicht in die Suppe spucken?

mgutt · July 17, 2022

20 hours ago, DataCollector said:

Hast Du schon mal nachgeprüft ob/welche SSDs Dir bei Parität mit ihrem Garabge Collection nicht in die Suppe spucken?

Ich glaube das Problem ist nur bei sehr billigen SSDs präsent. Die guten haben ausreichend freien Platz außerhalb des regulären Speicherplatzes. Zumindest habe ich noch nicht erlebt, dass die Performance massiv eingebrochen ist.

DataCollector · July 17, 2022

On 7/16/2022 at 11:51 AM, mgutt said:

Ganz normal in den syslogs

Okay, nur, damit ich es verstehe (und da ich heutre morgen wieder einen passenden Fall habe)

Ich habe heute Morgen mal meinen 2nd Server neu starten müßen (Main Tab> Reboot), weil er sich über 15 Minuten weigerte das Array zu stoppen.

Es liefen keine VM und kein Docker. Die hatte ich mit Absicht vorher alle gestoppt und alle Disks waren im Modus Spindown, als ich Array stoppen wollte.

Doch unraid zeigte nur die ganze Zeit unten links an, daß er versucht etwas zu unmounten. Es besserte sich aber nichts und ich habe dann im Main Tab den reboot Button benutzt.

Danach startete unraid und führt nun wieder einen Paritycheck aus.

Es ist also etwas beim Reboot schief gelaufen.

Das Array besteht aktuell aus 6 Datendisks und 2 Paritydisks.

So, nun schaue ich (während Paritycheck läuft) nach und im Main Tab sind schon 5 Error verzeichnet (Screenshot1).

Also bin ich neugierig und im Syslog soll ja etwas dazu stehen.

Nunja, es steht etwas, aber damit kann ich nicht viel anfangen (Screenshot2).

Ich weiß, das hängt primär mit meiner Unwissen über unraid und Linux zusammen, doch vielleicht kann jemand mit Fachwissen mir erklären, wie ich aus den Informationen des Syslog nun herausfinde, welche Dateien auf den 6 Datenfestplatten nun an den dort gelisteten Sektoren liegen, so daß ich diese Dateien auf Korrektheit überprüfen und ggf. fehlerhafte Dateien austauschen kann (sofern diese Dateien defekt waren und nicht nur die Parität (wobei ich dann auch nicht weiß, welche der beiden Paritäten falsch gewesen sein könnte)).

Ich vermute mal, daß die grünen Meldungen zu den 5 Sync Errors corrected gehören:

Jul 17 10:14:36 UR-Shipon kernel: md: recovery thread: PQ corrected, sector=1186987928

Jul 17 10:14:36 UR-Shipon kernel: md: recovery thread: PQ corrected, sector=1186987936

Jul 17 10:14:36 UR-Shipon kernel: md: recovery thread: PQ corrected, sector=1186987944

Jul 17 10:14:36 UR-Shipon kernel: md: recovery thread: PQ corrected, sector=1186987952

Jul 17 10:14:36 UR-Shipon kernel: md: recovery thread: PQ corrected, sector=1186987960

Persönliche Meinung: Systemmeldungen sind gut, aber ich würde mir wünschen, daß sie etwas userfreundlicher aufbereitet ausgegeben werden könnten.

Was ist ein PQ?

Ich habe schon hier im Forum mit "kernel md recovery thread PQ corrected sector" gesucht, bekomme aber irgendwie nur Diskussionen, die sich um Themen wie Gehäuse, Power Supply, Mutmnaßungen und Systemcrashes drehen.

Screenshot1 Main Tab

Screenshot2 Syslog

hawihoney · July 17, 2022

2 hours ago, DataCollector said:

PQ

Dual Parity. P+Q. Nennt man so.

Nachtrag zur Recherche: Zunächst einmal ist das vom Dateisystem abhängig - die Du ja im Array fröhlich mixen kannst. Dann wird ja nur festgestellt, dass der kalkulierte Wert der Datenplatten nicht zur Parity passt. Datenplatten haben dabei Vorrang, also wird die Parity überschrieben. Willst Du dann wissen was sich an der Stelle geändert hat, müsste Unraid mit einer weiteren Binäroperation feststellen, welche der Datenplatten abweicht. Und dann springt noch die Verschlüsselung in den Weg. Das ist Forensik. Würde mich wundern wenn die Methode für jedes Dateisystem irgendwo frei verfügbar ist.

Edited July 17, 2022 by hawihoney

DataCollector · July 17, 2022

1 hour ago, hawihoney said:

Dual Parity. P+Q. Nennt man so.

Aha. Danke

1 hour ago, hawihoney said:

Nachtrag zur Recherche: Zunächst einmal ist das vom Dateisystem abhängig

alle Datenfestplatten sind xfs encrypted

1 hour ago, hawihoney said:

Dann wird ja nur festgestellt, dass der kalkulierte Wert der Datenplatten nicht zur Parity passt. Datenplatten haben dabei Vorrang, also wird die Parity überschrieben.

Mir ist bekannt, daß der nur Sektoren berechnet und nicht entscheiden kann, wo die Abweichung ist.

Aber es kennt die Sektoren ja und kann somit mitteilen welche Dateien auf den 6 Datenfestplatten auf diesen Sektoren liegen (also eben woirklich alle 6 Dateien). Dann braucht man nicht auf allen 6 Festplatten die 2Mio anderen Dateien drum herum auch mit zu überprüfen, sondern könnte sich auf die 6 Dateien pro korrigiertem Sektor beschränken.

1 hour ago, hawihoney said:

Willst Du dann wissen was sich an der Stelle geändert hat,

Das wäre zwar schön, aber das geht nur mit Parität ja nicht. Deshalb wäre es ja schön zu erfahren, das an der Stelle der Datenfestplatten ist um die dann manuell betrachten zu können.

1 hour ago, hawihoney said:

Und dann springt noch die Verschlüsselung in den Weg.

Die Verschluesselung wird ja von unraid on the fly entschlüsselt. Schließlich springt der paritycheck ja nur an, wenn die Passphrase/key eingegeben ist. Somit wären alle Werkzeuge da um die Belegung des jeweiligen Sektors der Datenfestplatten zu den Dateien zuordnen und anzeigen zu können.

1 hour ago, hawihoney said:

Das ist Forensik. Würde mich wundern wenn die Methode für jedes Dateisystem irgendwo frei verfügbar ist.

Den Inhalt eines Sektores einer Datei zuzuordnen obliegt den Dateisystem/Verwaltung auf der Festplatte. Wenn die nicht weiß in welchem Sektor welche datei liegt, wer dann?

Wie schlimm steht es um meine Festplatte :-(

Recommended Posts

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Link to comment

Join the conversation