Hallo Ich habe einen alten Tower ausgegraben auf dem ich Unraid istalliert habe um auf diesem ein paar Docker Container laufen lassen wollte.
Leider bin ich dabei auf ein Problem gestoßen. Ich kann die Grafikkarte nicht in Docker nutzen.
Eigentlich ist das ja total einfach und auf meinem anderen Server funktioniert das auch wunderbar. Aber auf dem neuen habe ich irgendwas vergessen einzurichten. oder er ist einfach zu alt für so ein vorhaben.
mein erstes problem ist das ich IOMMU nicht aktiv bekomme. ich finde die Einstellung im Bios nicht. Aber eigentlich ist das ja nur relevant wenn ich Hardware in eine VM durchreichen möchte. ODER???
So habe ich den server eingerichtet:
1. UNRAID installiert, CA-Plugin istaliert,
2.Nvidia plugin installiert
3. GPU statistics installiert, unraid neu gestartet
4. Docker aktiviert und 2 Docker zum testen installiert: ( Jellyfin und XMRig)
Nachträglich rumprobiert und 2 sachen eingefügt. aber ich glaube das hat mit meinem Problem nix zutun.
im go file:
echo 0 > /sys/class/vtconsole/vtcon0/bind
echo 0 > /sys/class/vtconsole/vtcon1/bind
echo efi-framebuffer.0 > /sys/bus/platform/drivers/efi-framebuffer/unbind
loadkeys de-latin1
in der syslinux config:
kernel /bzimage
append amd_iommu=on iommu=pt initrd=/bzroot
das war auf meinem anderen Server so eingestellt. (wieso weis ich nicht mehr genau.)
Bei der Parametrierung der Docker Container bin ich mir zu 100% sicher das diese richtig ist. Da ich das 1 zu 1 von meinem anderen Server übernommen habe.(abgesehen von der GPU ID) Die Grafikkarte war auch schonmal in dem anderen server verbaut und hat dort mit den gleichen Containern wunderbar funktioniert.
Die Grafikkarte wird auch vom unraid erkannt. Das Plugin gpu statistics gibt auch korrekt aus. (anhand der sich ändernden Lüfterdrehzahl kann man auch erkennen das der Treiber funktionieren müsste. )
Gebe ich im Docker Container nvidia-smi ein kommt auch eine Ausgabe das die Grafikkarte vorhanden ist
Ausgabe im Jellyfin Container:
root@a69840e217d0:/# nvidia-smi
Fri Jan 5 00:30:07 2024
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 545.29.06 Driver Version: 545.29.06 CUDA Version: 12.3 |
|-----------------------------------------+----------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+======================+======================|
| 0 NVIDIA GeForce GTX 960 Off | 00000000:02:00.0 Off | N/A |
| 0% 37C P0 27W / 130W | 0MiB / 4096MiB | 0% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+
+---------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=======================================================================================|
| No running processes found |
+---------------------------------------------------------------------------------------+
Starte ich aber ein Video welches trankodiert werden muss kommt ein Fehler. Im Unraid log konnte ich aber nicht auffälliges finden.
[01:11:57] [ERR] [162] Jellyfin.Api.Helpers.TranscodingJobHelper: FFmpeg exited with code 1
[01:11:57] [ERR] [162] Jellyfin.Server.Middleware.ExceptionMiddleware: Error processing request. URL GET /videos/42d5f33b-c5f2-878e-d89a-ffd7ae46ccdd/hls1/main/0.ts.
Meine Hardware:
Model: Custom
M/B: BIOSTAR Group N68S3+ s/n None
BIOS: American Megatrends Inc. Version 080015 Dated 08/26/2010
CPU: AMD Athlon™ II X3 425 @ 2700 MHz
HVM: Enabled
IOMMU: Disabled
Cache: L1-Cache: 384 KiB, L2-Cache: 1536 KiB, L3-Cache: 0 KiB
Memory: 10 GiB Other (max. installable capacity 16 GiB*)
Network: bond0: fault-tolerance (active-backup), mtu 1500
Kernel: Linux 6.1.64-Unraid x86_64
OpenSSL: 1.1.1v
Uptime:
Ausgabe NVIDIA Treiber:
Nvidia Driver Version: 545.29.06
Open Source Kernel Module: No
Installed GPU(s): 0:
NVIDIA GeForce GTX 960
02:00.0
GPU-6a73df87-c81e-9369-8667-67b62127c476
tower-diagnostics-20240105-1005.zip