Sporadisch reagiert der Server nicht mehr! Scheint aber noch an zu sein.


UNRA1DUser

Recommended Posts

Hi,

 

von gestern auf heute gab es wieder dieses Phänomen. Webinterface und sämtliche Server plötzlich nicht mehr erreichbar.

Auf dem Bildschirm wird nichts angezeigt -> Siehe Bild. Syslog habe ich wieder angehangen. Netzwerkinterface Blinkt. Server ist warm und zieht Strom (laut meiner Steckdose + App)

 

Reset Knopf musste ich drücken, damit ich den Server neustarten konnte.

 

 

Screenshot 2023-01-23 080536.png

syslog_23.01.2023

Link to comment
1 hour ago, hawihoney said:

Probier doch mal ohne die ganzen Powersave Einstellungen. Einfach mal testen.

Das hat bei mir auch geholfen. Ich hatte ständig mal Hänger ohne das wirklich was in den Logs stand. Ohne die Stromspareinstellungen läuft er ohne Probleme durch.

Wahrscheinlich habe ich durch die ganzen Neustarts mehr verbraucht wie durch die Laufzeit mit Powersaves.

  • Like 1
Link to comment
20 hours ago, hawihoney said:

Probier doch mal ohne die ganzen Powersave Einstellungen. Einfach mal testen.

 

 

19 hours ago, i-B4se said:

Das hat bei mir auch geholfen. Ich hatte ständig mal Hänger ohne das wirklich was in den Logs stand. Ohne die Stromspareinstellungen läuft er ohne Probleme durch.

Wahrscheinlich habe ich durch die ganzen Neustarts mehr verbraucht wie durch die Laufzeit mit Powersaves.

 

Ich kann gerne mal unter Settings -> Tips and Tweaks -> Normal CPU Scaling Governor: auf Performance stellen. Oder meint ihr ALLE Powersave Einstellungen?

Ich habe auch das Dynamix S3 Sleep Plugin installiert. Nutze dieses aber nicht.

 

Folgendes habe ich im powertop script hinterlegt:

 

#!/bin/bash


# -------------------------------------------------
# disable haveged as we trust /dev/random
# https://forums.unraid.net/topic/79616-haveged-daemon/?tab=comments#comment-903452
# -------------------------------------------------
#/etc/rc.d/rc.haveged stop

# -------------------------------------------------
# Set power-efficient CPU governor
# -------------------------------------------------
/etc/rc.d/rc.cpufreq powersave

# -------------------------------------------------
# Enable power-efficient ethernet
# -------------------------------------------------

# enable IEEE 802.3az (Energy Efficient Ethernet): Could be incompatible to LACP bonds!
for i in /sys/class/net/eth?; do dev=$(basename $i); [[ $(echo $(ethtool --show-eee $dev 2> /dev/null) | grep -c "Supported EEE link modes: 1") -eq 1 ]] && ethtool --set-eee $dev eee on; done

# Disable wake on lan
for i in /sys/class/net/eth?; do ethtool -s  $(basename $i) wol d; done

# -------------------------------------------------
# powertop tweaks
# -------------------------------------------------

# Enable SATA link power management
echo med_power_with_dipm | tee /sys/class/scsi_host/host*/link_power_management_policy

# Runtime PM for I2C Adapter (i915 gmbus dpb)
echo auto | tee /sys/bus/i2c/devices/i2c-*/device/power/control

# Autosuspend for USB device
echo auto | tee /sys/bus/usb/devices/*/power/control

# Runtime PM for disk
echo auto | tee /sys/block/sd*/device/power/control

# Runtime PM for PCI devices
echo auto | tee /sys/bus/pci/devices/????:??:??.?/power/control

# Runtime PM for ATA devices
echo auto | tee /sys/bus/pci/devices/????:??:??.?/ata*/power/control

 

Screenshot 2023-01-26 113851.png

Screenshot 2023-01-26 114012.png

Link to comment
19 hours ago, i-B4se said:

Jup, ich würde alles ausschalten und erstmal laufen lassen. Evtl. auch mal nach den Bios-Settings schauen.

Und sollte der Server ohne abstürze laufen, dann würde ich die Einstellungen nach und nach aktivieren.

Ich wundere mich halt nur etwas, da ich die gesamten PowerSave Settings von beginn an verwendet habe und alles funktioniert hat. Nie Probleme gehabt. Und nun nach einigen Unraid Updates oder anderen Veränderungen ist der Server manchmal nicht mehr erreichbar. Angeschaltet ist dieser trotzdem noch!

Link to comment
On 1/26/2023 at 11:35 AM, UNRA1DUser said:

Müsste so zwischen 8:00 Uhr bis 11 Uhr liegen.

 

Ein Server Neustart fängt immer mit dem String "Linux Version" an. Davor siehst du, dass der letzte Log-Eintrag um 06:36 Uhr war, aber keine Fehler zu sehen:

 

image.thumb.png.e6496b1f56922993ad3f390dcc657fe5.png

 

Ich nehme an, dass du am Monitor auch nichts mehr eingeben kannst, also das Bild eingefroren ist?

 

Liste mal bitte deine Hardware auf.

 

Ansonsten geht in so einer Situation tatsächlich nur von günstig nach teuer alles deaktivieren / durchtauschen. zB kann so ein Verhalten auch an einem defekten USB-Stick liegen. Es kann aber auch der RAM sein. Oder das Netzteil. Oder.... 

 

Spontan hätte ich gesagt im Safe Mode starten und Docker und VM deaktivieren und einfach mal warten, ob es so auch passiert.

Link to comment
On 1/27/2023 at 6:59 PM, mgutt said:

Ich nehme an, dass du am Monitor auch nichts mehr eingeben kannst, also das Bild eingefroren ist?

 

Korrekt. Ich kann nichts mehr eingeben. Bild ist eingefroren.

 

On 1/27/2023 at 6:59 PM, mgutt said:

Liste mal bitte deine Hardware auf.

 

- Intel Xeon W-1290P, 10C/20T, 3.70-5.30GHz, tray

- Gigabyte W480M Vision W (LGA 1200/Intel W480/Micro-ATX/Dual M.2/SATA 6Gbps/USB 3.2 Gen 2/Dual Intel LAN/Multi-GPU support/ECC memory support/Motherboard)

- 4x32GB Kingston Server Premier ECC DDR4-2933 DIMM CL21 Single

- 550 Watt Corsair RMx Series RM550x Modular 80+ Gold

- 2TB Samsung 970 Evo Plus M.2 2280 PCIe 3.0 x4 3D-NAND TLC (MZ-V7S2T0BW)

- 2x 12TB WD Red Plus WD120EFBX 256MB 3.5" (8.9cm) SATA 6Gb/s

- Noctua NH-P1 passiver CPU-Kühler

- Noctua NF-A20 PWM chromax.black.swap Lüfter - 200mm, schwarz

- Noiseblocker NB-eLoop B14-3 140x 140x 29mm 1400 U/min 28.5 dB(A) schwarz/weiß

- Thermaltake Core V21 Matx Mesh Stackable Case with 200 mm Fan, Black

 

USB STICK -> SanDisk Ultra Fit USB 3.1 Flash-Laufwerk 64 GB (Für Laptops, Spielkonsolen und Auto-Audiosysteme, Plug-and-Stay, 130 MB/s Lesen, SecureAcess Software) Schwarz

 

Kann es am Stick liegen, da dieser 64 GB hat anstatt max 32GB ?

 

Memtest kann ich gerne noch mal durchführen. Netzteil wird es denke ich nicht sein, da der Server trotzdem immer an bleibt. CPU Benchmark kann ich bestimmt über unraid auch machen oder?

 

 

Edited by UNRA1DUser
Link to comment
55 minutes ago, UNRA1DUser said:

Kann es am Stick liegen, da dieser 64 GB hat anstatt max 32GB ?

An der Größe eher nicht. Ich denke die 32GB hat man gewählt weil Windows bei FAT32 da sein Limit hatte. Aber es schadet natürlich nicht einfach mal irgendeinen kleineren USB 2.0 Stick zu nehmen.

Link to comment
1 hour ago, UNRA1DUser said:

Kann es am Stick liegen, da dieser 64 GB hat anstatt max 32GB ?

 

und vor allem nicht an einen schnellen USB Port hängen ... ich hatte den anfangs auch und ist leider abgeraucht mit Komplettcrash ;)

 

der ist halt super klein, schnell, ... aber halt mal die Hand an, der kocht wenn da was passiert ... ;)

Link to comment
37 minutes ago, mgutt said:

An der Größe eher nicht. Ich denke die 32GB hat man gewählt weil Windows bei FAT32 da sein Limit hatte. Aber es schadet natürlich nicht einfach mal irgendeinen kleineren USB 2.0 Stick zu nehmen.

Ich habe mir mal die USB Version als 32 GB Stick bestellt.

 

25 minutes ago, alturismo said:

und vor allem nicht an einen schnellen USB Port hängen ... ich hatte den anfangs auch und ist leider abgeraucht mit Komplettcrash ;)

 

der ist halt super klein, schnell, ... aber halt mal die Hand an, der kocht wenn da was passiert ... ;)

 

Das werde ich auch mal probieren.

Edited by UNRA1DUser
Link to comment
  • 2 weeks later...

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.