Jump to content

Unraid Server hängt sich auf nach shutdown Windows VM


Go to solution Solved by alturismo,

Recommended Posts

Hallo zusammen,

 

ich konnte mir bisher immer alles aus bestehenden Topics herauslesen, diesmal finde ich aber nichts relevantes zu meinem Problem.

 

Mein Unraid Server läuft schon ein paar Monate. Vorletzte Woche habe ich ein Hardware-Upgrade auf i5-12400 und nun auch GTX 1660 Super gemacht. Diese habe ich auch erfolgreich meiner Windows 11 VM durchgereicht, funktionierte grundsätzlich bis heute Mittag alles wunderbar und auch so schnell wie ich mir das vorstellte.

Ich habe trotzdem heute mittels CPU-Pinning die Cores 5-12 der Win-VM zugewiesen und die Docker (Plex und BOINC) sowie die Ubuntu-VM auf die Cores 3 und 4 gepinnt, 0 und 1 sind frei.

Und nun fingen die Probleme an, da ich bei der ursprünglichen Zuordnung (wahrscheinlich - ich weiß es nach 4 Stunden Fehlersuche einfach nicht mehr) vermutlich beim apply der Zuordnung vor Beendigung des Vorgangs die Seite im GUI verlassen habe.

 

Seitdem habe ich das Problem, dass ich die Windows VM zwar runterfahren kann, jedoch danach die WebGUI nicht mehr funktioniert. Außerdem kann ich den Server nicht mehr runterfahren, der bleibt einfach nach dem Befehl irgendwo hängen. Das sowohl reboot über die GUI als auch über die Shell.

Rudimentär kann ich die GUI nach herunterfahren der VM noch nutzen, indem ich den Browser komplett schließe und die IP neu aufrufe. Gehe ich danach aber auf Seiten, die mit VMs zu tun haben (VM-Manager, Reiter VM), dann hängt sich die GUI wieder auf. Außerdem wird im Dashboard kein Eintrag bei den vorandenen Docker-Containern, noch bei den VMs angezeigt. Die entsprechenden Kacheln sind einfach leer.

 

In dem Zustand (also wenn ich nur die VM beenden wollte, nicht beim reboot oder shutdown des kompletten Servers) funktioniert aber trotzdem noch alles, die Linux-VM läuft, Docker laufen, NAS-Funktionen sind in Ordnung.

 

Den Server kann ich nur noch mit dem Reset-Knopf neu starten. Danach funktionieren ALLE Funktionen ganz normal, auch die Windows VM - bis ich wie gesagt die Windows VM herunterfahre oder neu starten möchte. Auch funktioniert ein reboot (EDIT: nein, ein reboot funktioniert nicht, der Rechner meldet die Netzwerkkarte ab (am Switch keine Lampe mehr) und bleibt dann stehen) oder das Array offline zu nehmen solange, wie die Windows VM nicht gestartet ist.

 

Bisher habe einiges probiert, CPU-Pinning und -isolation ganz deaktivieren, alle möglichen Plugins deinstallieren (VM-Backup, Unassigned Devices, die ganzen Monitoring Plugins).

 

Ich hab jetzt einfach keine Idee mehr weiter, deswegen hoffe ich auf eure Hilfe.

 

Danke schonmal und viele Grüße

Heiko

tower-diagnostics-20240107-1721.zip

Edited by HeikoH78
Ergänzung
Link to comment
  • Solution
12 hours ago, HeikoH78 said:

Ich hab jetzt einfach keine Idee mehr weiter, deswegen hoffe ich auf eure Hilfe.

 

nachdem das CPU Pinning deaktiviert ist.

 

Bios, check ob above 4G ... aktiviert ist und rbar aktiviert ist.

Bios, check ob primary GPU iGPU ist und multi Monitor enabled ist.

 

dann, mein erster Ansatz wäre mal die GPU komplett und im multifunction mode durchzureichen, Video, Audio, USB, USB

multifunction, findest du oben rechts über die Suche.

 

kurze Erklärung, Original, die GPU, Audio, USB, USB sitzen auf einem Bus, die Standard VM splittet die ...

mit multifunction führen wir für die VM wieder zusammen als 1 Gerät wie im Original.

 

Beispiel, Original (Rahmen) Bus 05, slot 00, function 1, 2, ... multifunction so dann auch nach Anpassung (nur halt am Bus 06) 

image.png.e0744e662efe210f1733e2b6fa56bb94.png

einfach einlesen ... Standard wäre das (ohne multifunction) dann 2, 3, 4 Geräte bei Dir.

 

dann, du hast einen Fehler im syslog wo ich sehe, kann aber jetzt nicht wirklich zuordnen ...

wäre mein letzter Ansatz, syslinux (Flash, Start Parameter) folgendes ergänzen (wirklich allerletzter Ansatz)

 

split_lock_detect=off

 

da dies dein letzter Eintrag im syslog war ...

 

image.thumb.png.fde5a5c3d6ac49e6e142b99d2b6d8a47.png

 

du hast auch bereits einen call trace beim Start wo etwas nicht rund läuft, daher Bios oben ...

 

image.thumb.png.767e18fcae8b3f27b3bc30df9101e988.png

Link to comment
1 hour ago, alturismo said:

nachdem das CPU Pinning deaktiviert ist.

 

Bios, check ob above 4G ... aktiviert ist und rbar aktiviert ist.

Bios, check ob primary GPU iGPU ist und multi Monitor enabled ist.

 

dann, mein erster Ansatz wäre mal die GPU komplett und im multifunction mode durchzureichen, Video, Audio, USB, USB

multifunction, findest du oben rechts über die Suche.

 

kurze Erklärung, Original, die GPU, Audio, USB, USB sitzen auf einem Bus, die Standard VM splittet die ...

mit multifunction führen wir für die VM wieder zusammen als 1 Gerät wie im Original.

 

Beispiel, Original (Rahmen) Bus 05, slot 00, function 1, 2, ... multifunction so dann auch nach Anpassung (nur halt am Bus 06) 

image.png.e0744e662efe210f1733e2b6fa56bb94.png

einfach einlesen ... Standard wäre das (ohne multifunction) dann 2, 3, 4 Geräte bei Dir.

 

dann, du hast einen Fehler im syslog wo ich sehe, kann aber jetzt nicht wirklich zuordnen ...

wäre mein letzter Ansatz, syslinux (Flash, Start Parameter) folgendes ergänzen (wirklich allerletzter Ansatz)

 

split_lock_detect=off

 

da dies dein letzter Eintrag im syslog war ...

 

image.thumb.png.fde5a5c3d6ac49e6e142b99d2b6d8a47.png

 

du hast auch bereits einen call trace beim Start wo etwas nicht rund läuft, daher Bios oben ...

 

 

Hallo Alturismo,

 

vielen Dank für deine Antwort!

 

Ich glaube du hast mich auf die richtige Fährte geführt.

 

Quote

Bios, check ob above 4G ... aktiviert ist und rbar aktiviert ist.

Bios, check ob primary GPU iGPU ist und multi Monitor enabled ist.

 

Die erste Einstellung gibts bei mir nicht, ich glaube das war in älteren Boards noch drin. Rbar lief, primary GPU habe ich aktiv gesetzt (wobei ich hier nicht glaube, dass es die Einstellung war, da es vorher vor der Spielerei mit CPU Pinning funktioniert hat) und Multi Monitor gibts wieder nicht im BIOS.

Aber mir ist noch eingefallen, dass meine RAMs zusammengewürfelt sind, d.h. 2x Kingston Fury 8GB mit 3200 MHz und guten Timings @1,35V und 1x Crucial 16GB mit 3200 MHz und schlechteren Timings @1,20V. Ich hab die Timings mal auf moderat gelassen, aber die Spannung auf 1,30V angehoben.

Weitere Änderungen habe ich nicht gemacht.

 

Die weiteren Änderung, sprich die Durchreichung der GPU als Multifunction Device hatte ich gestern schon probiert, das hatte ich im englischen Teil des Forums gefunden.

 

Also entweder lags an der primary GPU oder an der Ram-Spannung, auf jeden Fall läufts jetzt wieder - zum Glück und vielen Dank für deine Tipps.

 

Ich hab die Diagnostics nochmal angehängt, die split-lock Hinweise kommen sicher noch immer.

 

Viele Grüße

Heiko

 

tower-diagnostics-20240108-0816.zip

  • Like 1
Link to comment
6 minutes ago, HeikoH78 said:

Also entweder lags an der primary GPU oder an der Ram-Spannung, auf jeden Fall läufts jetzt wieder - zum Glück und vielen Dank für deine Tipps.

 

denke primary, da kamen wahrscheinlich auch die kernel traces her ...

 

RAM sollte im Server immer "moderat" laufen, nicht übertakten, daher wird auch immer dringendst vom XMP abgeraten.

 

Erklärung, primary setzt die iGPU als erste ein und wird von Unraid dann auch clean eingenommen während die NV "frei" bleibt solange die nicht explizit im Host (Docker, LXC, ...) genutzt wird, ohne Primary kann es "tückisch" werden ... multi monitor ist nicht bei jedem BIOS aktiv, wenn primary = on soll das nur weitergeben dass es mehrere gibt ... aber das wird bei deinem BIOS anscheinend nicht benötigt da die Funktion nicht existent ist, sprich, geht von Haus aus ;)

 

above 4G und rbar hängen in der Regel auch zusammen, rbar geht ohne above 4G nicht ...

 

multifunction, solltest du am Schluss trotzdem einrichten, ist immer besser für die VM ... aber bedenken, der manuelle Eingriff in die XML ist weg sowie ich per GUI beispielsweise Cores isoliere ;) daher "am Schluss" wenn ich mit allem fertig bin ...

Link to comment

Das hab ich falsch ausgedrückt, d.h. multifunction habe ich gestern eingerichtet und auch so gelassen, da es im ersten Moment keine Auswirkungen hatte.

Ich kanns jetzt nicht direkt ausprobieren - aber was meinst du mit „der manuelle Eingriff in die XML ist weg … sowie ich … Cores isoliere“? Ich meinte eigentlich, dass das noch funktionierte, als ich mit der CPU-isolation gespielt habe. Das wird doch direkt in die XML eingetragen, oder? 

Link to comment
15 minutes ago, HeikoH78 said:

Das wird doch direkt in die XML eingetragen, oder? 

ja, aber verliert sich gerne nach jeder GUI Änderung wieder ... sollte mal "fixed" werden ... vielleicht ist es das auch mittlerweile ;)

ich hab meine VM's seit einiger Zeit nicht mehr justieren müssen, laufen einfach wie Sie sollen ...

 

17 minutes ago, HeikoH78 said:

Das hab ich falsch ausgedrückt, d.h. multifunction habe ich gestern eingerichtet und auch so gelassen

perfekt

 

kannst ja nochmal schauen ob sich was ändert nach GUI edit, ansonsten, viel Spaß mit allem jetzt 👍

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...