Jump to content

Server geht ohne erkenntlichen Grund aus | Anmeldung nun als "Tower"


Dextoo
Go to solution Solved by Dextoo,

Recommended Posts

Guten Morgen zusammen,

 

ich habe seit knapp einer Woche ein Sorgenkind zu Hause. Mein Server geht mal früher und mal später einfach aus. Manchmal direkt nach dem Boot, dem Start des Array oder der Docker. Wieder manchmal funktioniert alles ein paar Stunden bis einen Tag und er ist wieder aus.

  • Syslog auf Flash Drive aktiviert
  • VMs deaktiviert (erster Verdacht)
  • USB-Stick getauscht. Dieser hatte soweiso einmal Probleme gehabt und ist schon älter.
  • In anderen USB-Slot gesteckt
  • Server im abgesicherten Modus gestartet. Lief einige Zeit ohne Probleme
    • Automatischer Start des Array deaktiviert
  • Ales Platten mit Self-Test geprüft, keine Probleme
    • Docker wieder aktiviert. Alle im Autostart gehen an. Dabei geht der Server aus
  • Danach Server neu gestartet. Ping geht durch. Anmeldemaske kommt nicht. Bildsignal wird ebenfalls nicht ausgegebn.
  • Neustart: Login nun als Tower über http, anstatt https(?) Logindaten werden nicht genommen.

 

Im Anhang habe ich einmal den syslog und Diagnostics vom Stick gezogen.

 

Ich hoffe mir kann jemand helfen.
Vielen Dank schon einmal!

syslog nas-diagnostics-20220927-1302.zip

Link to comment
2 hours ago, Ford Prefect said:

Hast Du mal einen/zwei Memtest laufen lassen?

Erster Test lief ohne Probleme der zweite läuft, bisher auch ohne Auffälligkeiten.

 

Gibt es eine Lösung bezüglich des Login? "Tower" ist der Standardname, aber den habe ich geändert. Meine Daten nimmt er wie gesagt nicht mehr.

Link to comment
1 hour ago, Dextoo said:

Das mache ich wie immer. Normalerweise https://[feste IP]. Jetzt geht nur noch http://[feste IP]. Dann kommt auch ein anderer Name. Hier steht jetzt "Tower", eigentlich habe ich ihn ganz simpel "NAS" genannt. Wenn ich dann Benutzer und Passwort eintrage komme ich nicht rein.

grafik.png.d1238701a3e989f6486e00f0d0e999dd.png

Das konnte ich durch ein Backup, welches ich gestern erstellt habe lösen.

 

Das Problem mit dem Abstrz/aus gehen ist und bleibt immer noch da...

Link to comment
2 hours ago, Dextoo said:

Dann kommt auch ein anderer Name. Hier steht jetzt "Tower", eigentlich habe ich ihn ganz simpel "NAS" genannt.

Dann ist vermutlich neue Stick auch hinüber oder irgendwas anderes mit USB stimmt nicht, denn der Name wird in einer Textdatei auf dem Stick gespeichert. Die Datei verschwindet ja nicht einfach so.

Link to comment

...dann hat es Deine Config zerschossen...zumindest teilweise.

Einfach ausgehen deutet auf ein HW-Problem hin.

Die üblichen Verdächtigen sind NT, RAM....vielleicht nochmal den Sitz der Stromversorgungen prüfen und dass eine Kabel gepetzt sind, an scharfen Kanten.

Hast Du mal am Gehäuse was verändert und dabei Säge/Dremel/Feile benutzt, was Metallspäne ins Innere befördert...nicht hilfreich.

 

ansonsten bin ich eher ratlos.

Link to comment
1 hour ago, mgutt said:

Dann ist vermutlich neue Stick auch hinüber oder irgendwas anderes mit USB stimmt nicht, denn der Name wird in einer Textdatei auf dem Stick gespeichert. Die Datei verschwindet ja nicht einfach so.

Das wäre natürlich sehr schlecht. Man kann doch nur einmal im Jahr den Stick wechseln...

 

 

1 hour ago, Ford Prefect said:

Die üblichen Verdächtigen sind NT, RAM....vielleicht nochmal den Sitz der Stromversorgungen prüfen und dass eine Kabel gepetzt sind, an scharfen Kanten.

Hast Du mal am Gehäuse was verändert und dabei Säge/Dremel/Feile benutzt, was Metallspäne ins Innere befördert...nicht hilfreich.

Ich schau mir das morgen bzw. am Wochenende einmal an. Am Gehäuse habe ich nichts bearbeitet.

 

Vielen Dank @mgutt und @Ford Prefect. Jetzt wird das erst einmal liegen gelassen. Sonst werde ich noch kirre :D

Link to comment

@Dextoo Klingt sehr ähnlich zu meinem Problem: 

Ich konnte bei mir noch nicht debuggen, was im Fehlerfall passiert. Aber ich versuche das mal zu verifizieren, ob sich das NAS anpingen lässt im Fehlerfall. ( Bzw. über irgendeine IP doch erreichbar ist ). Von gestern auf heute lief MemTest fehlerfrei durch und der Fehler lässt sich nicht auf Kommando reproduzieren. CMOS-Batterie habe ich gestern getauscht und Unraid auf aktuelle Stable Version geupdated und schaue jetzt mal, wie es sich weiterhin verhält.

So wie ich es in den Logs sehe, haben wir zumindest eine unterschiedliche HW... Evtl. ist es ja doch kein HW defekt :-? Ich halte dich auf dem laufenden

 

 

Edited by elgatobavaria
  • Thanks 1
Link to comment
On 2/9/2023 at 10:03 AM, Dextoo said:

Mein Server geht mal früher und mal später einfach aus.

Was meinst du mit aus, ganz aus oder musst du ihn Hard Resetten und danach wieder an schalten?

 

Wenn sich dein System aufhängt dann bitte stell bei den Docker Einstellungen von macvlan auf ipvlan um zum testen.

 

14 hours ago, Dextoo said:

Das wäre natürlich sehr schlecht. Man kann doch nur einmal im Jahr den Stick wechseln...

Ich vermute du verwendest diesen Stick:

Bus 002 Device 004: ID 05dc:a205 Lexar Media, Inc. JumpDrive

Soweit ich sehe ist das ein superkleiner Stick, ich würd dir eher sowas empfehlen:

https://www.amazon.de/Transcend-JetFlash-Extreme-Speed-32GB-USB-Stick/dp/B002WE6CN6/

 

Wenn du was schnelles willst dann kannst du auch eine M2 SSD in einem externen USB Gehäuse nehmen, würd ich aber nicht empfehlen weil das teuer ist und das einrichten muss manuell gemacht werden, zumindest das aufspielen von Unraid.

 

Was machst du denn hier im go file:

bash /boot/custom/etc/rc.d/S20-init.rsyncd
bash /boot/custom/etc/rc.d/S20-init.rsyncd

 

Bitte upgrade dein System vorher mal auf 6.11.5

Link to comment
5 minutes ago, ich777 said:

Was meinst du mit aus, ganz aus oder musst du ihn danach wieder an schalten?

Ich muss ihn danach wieder anschalten.

 

6 minutes ago, ich777 said:

Ich vermute du verwendest diesen Stick:

Bus 002 Device 004: ID 05dc:a205 Lexar Media, Inc. JumpDrive

Soweit ich sehe ist das ein superkleiner Stick, ich würd dir eher sowas empfehlen:

https://www.amazon.de/Transcend-JetFlash-Extreme-Speed-32GB-USB-Stick/dp/B002WE6CN6/

Auf den Transcend (8GB Version) habe ich gewechselt. Habe die Empfelung hier vor einiger Zeit schon einmal gesehen und ihn dann als Reserve ins Lager gepackt.

 

8 minutes ago, ich777 said:

Was machst du denn hier im go file:

bash /boot/custom/etc/rc.d/S20-init.rsyncd
bash /boot/custom/etc/rc.d/S20-init.rsyncd

 

Bitte upgrade dein System vorher mal auf 6.11.5

Da bin ich mir jetzt nicht ganz sicher was du meinst. Soweit kenne ich mich da nicht aus 😅 Version dürfte schon die 6.11.5 sein.

 

Ich werde am Samstag noch einmal eine aktuelle Syslog + Diagnostics ziehen. Die hier angehängten habe ich lediglich auf dem Stick gefunden als ich wirklich gar nicht mehr rein kam...

Link to comment
23 hours ago, ich777 said:

Naja, ich würd eher mal dort ansetzen was da drin steht, das sollte da nicht drin stehen, wer hat denn das hinzugefügt?

Habe mir das noch einmal angeschaut. Da habe ich (Mitte/Ende 2021) den Rsync Deamon aktiviert, da eine Freundin von ihrer Synology zu mir Dateien kopieren wollte. Ich habe die zwei Zeilen einmal ausgetragen.

On 2/10/2023 at 10:47 AM, ich777 said:

Was machst du denn hier im go file:

bash /boot/custom/etc/rc.d/S20-init.rsyncd
bash /boot/custom/etc/rc.d/S20-init.rsyncd

 

 

Ich habe noch einmal alle Stecker geprüft und im Safe Mode gestartet. Array ist aus. Im ANhang eine aktuelle Log+Diagnostics. Was mich trotzdem noch wundert: Beim Memtest kam nichts negatives heraus und außerdem ist die Hardware 5+ Stunden gelaufen. Ohne Probleme...

nas-diagnostics-20230211-1049.zip syslog

Link to comment
22 hours ago, Dextoo said:

Neuer Stand: War jetzt knapp 24 Stunden im Safe Mode mit deaktiviertem Array. Starte das Array Server geht aus. Tausche nun doch einmal das Netzteil aus.

Sorry für die späte Rückmeldung, ich kann aus deinen Diagnostics nicht wirklich was erkennen außer das du im Safe Mode bist.

 

Sollte der Server wirklich aus gehen wenn du was machst das evtl. mehr Strom braucht dann ist es mit sicherheit das Netzteil.

Haben die Platten geschlafen und mussten die hoch fahren als du das Array gestartet hast?

 

Wir haben sogar das gleiche System (zumindest CPU & Motherboard):

 

 

Welchen RAM hast du denn verbaut? Ist das ein No-Name? Ich würd auch kontrollieren ob dein SAS controller richtig funktioniert, hat der auch ausreichend Luftstrom drüber, vergiss nicht das ist Server Hardware und braucht ordentlich Airflow drüber.

Link to comment
  • Solution

Neuer bzw. finaler Stand. Es war, wie schon sehr früh von vielen vermutet, das Netzteil. Ich habe am Montag einmal ein altes ausgemustertes von einem Kumpel angeschlossen. Der Server läuft seitdem ohne Probleme so wie vor der ganzen Problematik. Array, Docker und VMs laufen. Ich werde das bisher genutzte zum Händler/Hersteller zur Überprüfung schicken. Solange kann ich das provisorische nutzen.

 

Vielen Dank an alle für die Tipps und Vorschläge! ❤️

  • Like 3
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...