Jump to content

Server stürzt nach Spindown der Platten ab


Go to solution Solved by DataCollector,

Recommended Posts

Nachdem ich meine Maschine jetzt wieder halbwegs laufen habe, ist mir ein Phänomen aufgefallen:

Ich lasse die Platten nach 15 Minuten in den Standby fahren, damit der Stromverbrauch sich in Grenzen hält. Das geht auch soweit gut - anscheinend bis auf die Parity-Disc.

 

Ich hab' da 3 x 4TB - 1 x 10 TB im Array und 1x 1 TB Cache-SSD. Gestern lief der Parity-Check an - alle anderen Platten waren die meiste Zeit im Standby. Und kurz nach dem der Parity-Check heute morgen fertig war, fror der Server ein. Keine Reaktion durch gar nichts mehr. Einfach aus. Das war letztlich schon mal der Grund dafür, dass ich ihn hart ausschalten und neustarten musste und was mir vermutlich das Dateisystem auf einer der Datenplatten zerschossen hat. 

Und ich hege die Vermutung, dass es mit dem Spindown der Parity-Disc zusammenhängt. In den Logs kann ich dazu nichts finden. Da steht freundlicherweise gar nichts drin, was vor dem Neustart passiert ist. Auch in den Diagnosedaten kann ich dazu nichts finden. 

 

Kennt dieses Phänomen hier jemand? Kann es Platten geben, die schlicht nicht ausgehen dürfen, weil sie damit dann den ganzen Server zum Absturz bringen? 

Link to comment
1 hour ago, Mephistopheles said:

Kennt dieses Phänomen hier jemand? Kann es Platten geben, die schlicht nicht ausgehen dürfen, weil sie damit dann den ganzen Server zum Absturz bringen? 

nope, einzige was es gibt "in der Richtung" sind diverse Stromsparmechanismen ... sofern aktiv, die mal deaktivieren ...

 

BIOS, powertop, ...

 

und eine diagnostics sag manchmal mehr als 1000 Worte ;)

Link to comment
  • Solution
Posted (edited)
2 hours ago, Mephistopheles said:

Gestern lief der Parity-Check an - alle anderen Platten waren die meiste Zeit im Standby. Und kurz nach dem der Parity-Check heute morgen fertig war, fror der Server ein. Keine Reaktion durch gar nichts mehr. Einfach aus.

 

Fror er ein (lief also weiter und zeigte keine Reaktion) oder war er aus (Power down)?

 

2 hours ago, Mephistopheles said:

Das war letztlich schon mal der Grund dafür, dass ich ihn hart ausschalten und neustarten musste und was mir vermutlich das Dateisystem auf einer der Datenplatten zerschossen hat. 

 

Da beim Paritycheck in der Regel von den Datenplatten nur gelesen wird und der Paritycheck ja auch recht lange dauert, sehe ich nicht, warum dadurch auf den Datenfestplatte ein Schreibvorgang noch offen sein sollte, der dann beim harten Ausschalten in irgendeiner Form das Dateisystem zerschießen könnte.

 

2 hours ago, Mephistopheles said:

Und ich hege die Vermutung, dass es mit dem Spindown der Parity-Disc zusammenhängt. In den Logs kann ich dazu nichts finden. Da steht freundlicherweise gar nichts drin, was vor dem Neustart passiert ist. Auch in den Diagnosedaten kann ich dazu nichts finden. 

 

Das ist logisch, da der Syslog ja bei jedem Start neu erstellt wird. Wenn das alte Log nach einem Neustart vorhanden sein soll bleibt nur das Syslog über den Syslog Server auf den USB Stick schreiben zu lassen. (Achtung! Wenn man das zu lange machen läßt verschleißt der USB Stick recht schnell).

 

2 hours ago, Mephistopheles said:

Kennt dieses Phänomen hier jemand?

 

Ich nicht und der simple Spindown der Parity ließe sich ja auch simulieren um zu sehen, ob die Kiste dann direkt abschmiert/einfriert/ausgeht.

 

2 hours ago, Mephistopheles said:

Kann es Platten geben, die schlicht nicht ausgehen dürfen, weil sie damit dann den ganzen Server zum Absturz bringen? 

 

In der beschriebenen/vermuteten Form: Nein.  (da stimme ich alturismo vollkommen zu)

 

Es gibt anders herum (SAS) Festplatten die unraid nicht zum Spindown bewegen kann, aber das ist ein anderes Thema.

 

Edited by DataCollector
Typos
  • Like 1
  • Thanks 1
Link to comment

Ich denke, ich habe den Fehler identifizieren können. Es lag gar nicht am Array, sondern am Cache. 

Ich hatte den globalen Spindown auf 15 Minuten gesetzt. Und anscheinend hat die Cache-SSD sich dann gedacht, dass sie auch mal runterfährt. Auf der läuft dann aber auch alles andere (also alle Docker-Container und Anwendungen). Wenn ich die Platten im Array separat vom Cache steuere läuft wieder alles, wie gewohnt. Dafür hab' ich die nächste Baustelle aufgerissen - aber das ist ein ganz anderes Thema. 😯 

Link to comment
9 minutes ago, Mephistopheles said:

Und anscheinend hat die Cache-SSD sich dann gedacht, dass sie auch mal runterfährt. Auf der läuft dann aber auch alles andere (also alle Docker-Container und Anwendungen).

Hm, merkwürdig. Es ist zwar korrekt, das sich die Cache-SSD(s) auch an die globalen Einstellungen (z.B. nach 15 Minuten Spindown) halten. Aber wenn sie in Benutzung sind (z.B. Docker's aktiv sind) sollte das nicht passieren.

Bei mir gehen die in den "Spindown", wenn ich den Docker-Dienst deaktiviere. Sonst nicht.

  • Like 1
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...