RTX 3060 Ti im nvidia-persistenced wird bis zu 60°C und Strom verbrach geht auf 15W


Recommended Posts

Hallo Leute,

 

kennt jemand das Phänomen das die Grafikkarte im Ruhezustand immer Wärmer wird und dann statt 7 Watt ca. 14-16 Watt zieht. Hab das Problem vorerst mit einem zusätzlichen Lüfter an der Grafikkarte gelöst der permanent läuft. So bleibt die Karte bei unter 40°C und zieht 9-10 Watt.

Edited by Syrincs
Link to comment
17 minutes ago, Syrincs said:

kennt jemand das Phänomen das die Grafikkarte im Ruhezustand immer Wärmer wird und dann statt 7 Watt ca. 14-16 Watt zieht. Hab das Problem vorerst mit einem zusätzlichen Lüfter an der Grafikkarte gelöst der permanent läuft. So bleibt die Karte bei unter 40°C und zieht 9-10 Watt.

Nein

 

17 minutes ago, Syrincs said:

Hab das Problem vorerst mit einem zusätzlichen Lüfter an der Grafikkarte gelöst der permanent läuft. So bleibt die Karte bei unter 40°C und zieht 9-10 Watt.

wie du den Verbrauch einer GPU mit einem zusätzlichen Lüfter löst ... Respekt ;) denke da läuft was anderes schief, sorry .. aber das passt nicht zusammen.

 

wo holst du die idle Werte her ? nvidia-smi ?

 

und als "Pro Tipp", VM mit der Karte mal starten und wieder ausmachen ... sollte helfen, wenn nicht dann müsste man schauen was auf der Karte passiert im idle ... wobei ich eher glaube das hier was mit deiner Konfiguration (KDE, ... Dockers ...) hängt.

Link to comment
16 minutes ago, alturismo said:

Nein

 

wie du den Verbrauch einer GPU mit einem zusätzlichen Lüfter löst ... Respekt ;) denke da läuft was anderes schief, sorry .. aber das passt nicht zusammen.

 

wo holst du die idle Werte her ? nvidia-smi ?

 

und als "Pro Tipp", VM mit der Karte mal starten und wieder ausmachen ... sollte helfen, wenn nicht dann müsste man schauen was auf der Karte passiert im idle ... wobei ich eher glaube das hier was mit deiner Konfiguration (KDE, ... Dockers ...) hängt.

Hey die idle verbrauch zeigt mir unraid. und im gesamtverbrauch sieht man es auch ( gemessen mit Tasmota und einer Nous A1T  zwischen Steckdose). Roter strich ohne Lüfter für die Grafikkarte danach mit Lüfter.

image.thumb.png.4b8d44d8d8347af5f74924e0da37d0ad.png

 

 

image.png.123632be2b544e5c6ef6b0b74665b0f7.png

Link to comment
2 minutes ago, alturismo said:

dazwischen ein Neustart ?

Ja musste ich damit ich den Lüfter einbauen konnte. Aber ich hab den Server auch so in den letzten Tagen mal neu gestartet. Und seit der Lüfter läuft wird die Grafikkarte auch nicht mehr so warm und der verbrauch geht auch nicht hoch. Das Problem lässt sich auch reproduzieren indem ich den Lüfter einfach abstecken. 

Link to comment
7 minutes ago, Syrincs said:

Das Problem lässt sich auch reproduzieren indem ich den Lüfter einfach abstecken. 

nur für mein Verständnis, du baust einen zusätzlichen Lüfter ein, angeschlossen am Mainboard (oder sep. Lüftersteuerung), welcher per se auch separat Strom verbraucht ... und dadurch wird deine GPU kühler (das verstehe ich noch) und dadurch verbraucht deine GPU im idle weniger Strom (da bin ich normal raus weil physikalisch ... ) außer die Kartenlüfter würden durch Ihre höhere Drehzahl soviel mehr verbrauchen ... sorry ... halte mal den Lüfter an mit dem Finger, wenn das dann wirklich so ist ... wäre ich doch sehr überrascht ;)

 

aber ... wer weiß wer weiß ...

Link to comment
11 minutes ago, ich777 said:

Das ergibt überhaupt keinen Sinn, kannst du bitte deine Diagnostics posten?

tower-diagnostics-20240326-1117.zip

Hier die Diagnostik. 

Ob es Sinn macht ist ja nicht die Frage mein System läuft wenn es alles im idle ist ohne jeglichen Lüfter. Die Gehäuse Lüfter sind vom Mainboard gesteuert wenn der Prozessor 55°C erreicht. Da die Grafikkarte aus irgend einem Grund im Idle wärmer wird und auch somit mehr Strom zieht (warum auch immer) und die Lüfter der Karte nicht anfangen zu laufen. Hab ich gedacht wenn ich einen Lüfter der langsam stendig dreht und so die Karte Kühlt wenn die Lüfter der Karte nicht drehen bleibt die Karte vieleicht bei den 7 Watt die sie im Idle zieht nachdem sie in den P8 versetzt wurde. Die 7 Watt hab ich damit nicht halten können jedoch schwankt sie nun bei 9-10 Watt. Und so ein Lüfter nimmt vieleicht 0,5 Watt wenn er langsm dreht dadurch spare ich schon fast 10 Watt. Ich bin gerade auf Arbeit und kann den Lüfter nicht anhalten aber ich mach mal paar Screenshots wenn die GPU in den Ile versetzt wird und die Lüfter von der karte noch nach laufen und dann Ausgehen.

Link to comment

@Syrincs aus dem go file:

Bitte das & aus dieser Zeile entfernen:

nvidia-persistenced &

(das ist ein Hintergrunddienst selbst und braucht kein &)

 

Ich würde im go file mal alles auskommentieren speziell die power saving measurements für PCIe Geräte damit du mal wirklich realistisch testen kannst.

Du machst da drin so viele custom sachen die oft gar nicht nötig sind und es wäre nicht das erste mal das ich Probleme im Zusammenhang mit deinen Einträgen sehe.

 

Diese Zeile finde ich sehr sehr lustig :D xD :P :

# -------------------------------------------------
# Set power-efficient CPU governor
# -------------------------------------------------

Das kommt nämlich immer auf deine Workload an.

 

Darf ich fragen warum du das hier machst:

pcie_acs_override=downstream,multifunction vfio_iommu_type1.allow_unsafe_interrupts=1

 

  • Like 1
Link to comment
8 minutes ago, Syrincs said:

Den Lüfter hab ich hier drauf gebaut, bzw Aufgelegt und zwischen CPU Kühlkörper geklemmt.

Was sind die screenshots die du hier gepostet hast, versteh ich nicht bzw. könntest du mal Beschreiben was die Aussagen?

Link to comment
2 minutes ago, ich777 said:

Was sind die screenshots die du hier gepostet hast, versteh ich nicht?

Wollte zeigen was die karte nach dem versetzen in den P8 macht funktioniert jedoch nicht so dadurch das der separate Lüfter ja weiter kühlt :D

Link to comment
10 minutes ago, ich777 said:

@Syrincs aus dem go file:

Bitte das & aus dieser Zeile entfernen:

nvidia-persistenced &

(das ist ein Hintergrunddienst selbst und braucht kein &)

 

Ich würde im go file mal alles auskommentieren speziell die power saving measurements für PCIe Geräte damit du mal wirklich realistisch testen kannst.

Du machst da drin so viele custom sachen die oft gar nicht nötig sind und es wäre nicht das erste mal das ich Probleme im Zusammenhang mit deinen Einträgen sehe.

 

Diese Zeile finde ich sehr sehr lustig :D xD :P :

# -------------------------------------------------
# Set power-efficient CPU governor
# -------------------------------------------------

Das kommt nämlich immer auf deine Workload an.

 

Darf ich fragen warum du das hier machst:

pcie_acs_override=downstream,multifunction vfio_iommu_type1.allow_unsafe_interrupts=1

 

Aus der Go datei hab ich schon mal alles raus genommen. der Verbrauch war dann jedoch höher darum hab ich es wieder aufgenommen. 

 

image.png.2085df4ba8193b77aa6fa6456bf0db2d.png

Keine Ahnung was das ist ob das von irgendwelchen versuchen vergessen wurde. Wo ich ein Problem hatte und es mir ergoogelt hatte oder ob das von den Versuchen jetzt mit der Grafikkarte stammt :S 

 

Link to comment
37 minutes ago, Syrincs said:

Hier die Diagnostik. 

du willst es wohl nicht hören ... war bei deinem letzten Thread schonmal ein Thema ...

 

image.thumb.png.c760c3694422328ef120801bef88015c.png

 

ich bin jetzt soweit erstmal raus, bereinige erstmal den ganzen Kram, prüfe nochmals was wirklich passiert wenn du den Lüfter mal anhältst ... usw usw ...

 

Thema, PCI ACS und alles was damit zusammenhängt auch bitte bereinigen ;)

Link to comment
2 hours ago, Syrincs said:

Keine Ahnung was das ist ob das von irgendwelchen versuchen vergessen wurde.

Das sind alles sachen die das Verhalten beeinflussen können das momentan bei dir auftritt.

 

2 hours ago, Syrincs said:

der Verbrauch war dann jedoch höher darum hab ich es wieder aufgenommen. 

Da wäre es mal interessant ws du da raus genommen hast, einfach alles vermute ich oder?

Über welchen Zeitraum war dann der Verbrauch höher?

 

Mir sieht das eher nach einer Platte aus die evtl. läuft vom Verbrauch her und nicht der Grafikkarte.

Link to comment
Posted (edited)
7 minutes ago, ich777 said:

Das sind alles sachen die das Verhalten beeinflussen können das momentan bei dir auftritt.

 

Da wäre es mal interessant ws du da raus genommen hast, einfach alles vermute ich oder?

Über welchen Zeitraum war dann der Verbrauch höher?

 

Mir sieht das eher nach einer Platte aus die evtl. läuft vom Verbrauch her und nicht der Grafikkarte.

ich nehme es alles raus und lasse den Server übernachte laufen, dann melde ich mich morgen mit Erkenntnissen zurück.

 

Aber eine der HDD´s läuft definitiv nicht. Außer Unraid zeigt falsche Sachen an. die HDD´s sind alle grau und gehen auch nach ihrer vorgegebenen Zeit in den Schlafmodus.

Edited by Syrincs
Link to comment

So jetzt weis ich auch wieso ich mein Server von Arbeit aus nicht mehr erreicht habe. Ich hab alles raus genommen aus der Go Datei. Und das andere was ich777 noch geschrieben hatte.
Blöd gut Foto gemacht.

pcie_acs_override=downstream,multifunction vfio_iommu_type1.allow_unsafe_interrupts=1

image001.png

Nun hab ich diesen Fehler und der Server bleibt hängen.0df8775da90068d3e5d032e689a8a230.jpg


Gesendet von iPhone mit Tapatalk

Link to comment
Posted (edited)
42 minutes ago, Syrincs said:
So jetzt weis ich auch wieso ich mein Server von Arbeit aus nicht mehr erreicht habe. Ich hab alles raus genommen aus der Go Datei. Und das andere was ich777 noch geschrieben hatte.
Blöd gut Foto gemacht.

pcie_acs_override=downstream,multifunction vfio_iommu_type1.allow_unsafe_interrupts=1

image001.png

Nun hab ich diesen Fehler und der Server bleibt hängen.0df8775da90068d3e5d032e689a8a230.jpg


Gesendet von iPhone mit Tapatalk


Wie bekomme ich die Zeilen wieder auf die Stelle auf dem Stick?

 

Hat sich erledigt hab die Datei gefunden und diese zeile wieder eingefügt.


Gesendet von iPhone mit Tapatalk

Edited by Syrincs
Link to comment
1 hour ago, Syrincs said:

Hat sich erledigt hab die Datei gefunden und diese zeile wieder eingefügt.

weißt du auch was die macht ?

 

die versucht "mit Gewalt" iommu zu splitten, kann gut gehen, kann issues machen ...

 

daher, aus machen ... was jetzt sicherlich dazwischen funkt sind deine passthrough devices ... da diese dann "anders" liegen ...

 

das nutzt man NUR wenn man default Probleme hat, dann weiß man aber auch warum man das für welches device gemacht hat ...

ich schätze eher, du hast es einfach mal aktiviert weil ... in nem Video gesehen, weil "alles an immer besser ist", weil ...

 

in einer ruhigen Minute, überlegen was alles per vfio pass eingesetzt ist, notieren.

 

1/ VM Dienst stop

2/ Bild der devices machen

3/ default setzen

4/ Array autostart aus

5/ Neustart

6/ prüfen wie die devices jetzt unter tools/devices gelistet sind, Vergleich zu 2/

7/ devices jetzt mit neuen Adressen zuweisen (oder vfio bind, oder ...)

8/ schauen ob alles geht oder ob es "klemmt"

 

Beispiel, je nach Board hängen diverse Geräte an einem Bus in einer iommu group, man will aber ein device davon per passthrough nutzen ... dann kann man versuchen mit ACS override und den diversen Settings das zu erzwingen ... wie eingangs erwähnt, kann gut gehen, kann ....

 

wenn nicht unbedingt notwendig, nicht machen ... daher ist das auch default OFF

 

Ich hoffe es ist halbwegs verständlich ...

Link to comment
Posted (edited)
1 hour ago, alturismo said:

weißt du auch was die macht ?

 

die versucht "mit Gewalt" iommu zu splitten, kann gut gehen, kann issues machen ...

 

daher, aus machen ... was jetzt sicherlich dazwischen funkt sind deine passthrough devices ... da diese dann "anders" liegen ...

 

das nutzt man NUR wenn man default Probleme hat, dann weiß man aber auch warum man das für welches device gemacht hat ...

ich schätze eher, du hast es einfach mal aktiviert weil ... in nem Video gesehen, weil "alles an immer besser ist", weil ...

 

in einer ruhigen Minute, überlegen was alles per vfio pass eingesetzt ist, notieren.

 

1/ VM Dienst stop

2/ Bild der devices machen

3/ default setzen

4/ Array autostart aus

5/ Neustart

6/ prüfen wie die devices jetzt unter tools/devices gelistet sind, Vergleich zu 2/

7/ devices jetzt mit neuen Adressen zuweisen (oder vfio bind, oder ...)

8/ schauen ob alles geht oder ob es "klemmt"

 

Beispiel, je nach Board hängen diverse Geräte an einem Bus in einer iommu group, man will aber ein device davon per passthrough nutzen ... dann kann man versuchen mit ACS override und den diversen Settings das zu erzwingen ... wie eingangs erwähnt, kann gut gehen, kann ....

 

wenn nicht unbedingt notwendig, nicht machen ... daher ist das auch default OFF

 

Ich hoffe es ist halbwegs verständlich ...

Ok das gehe ich mal durch. Jetzt hab ich erst mal das Gafikkarten Problem in Bildern und ich hänge die Dagnostic von den jetzigen einstellungen an.

 

grafik.thumb.png.4312a0a236eeddafbd59f3493582f91f.png

image.png

image (1).png

image (2).png

image (3).png

Outlook-hcyvx4ry.png

image (4).png

image (5).png

tower-diagnostics-20240326-1941.zip

Edited by Syrincs
Link to comment
Posted (edited)

1. erledigt

2.

PCI-Geräte und IOMMU-Gruppen

Warnung: Das System wurde mit der PCIe-ACS erzwingen Einstellung gestartet. Die untenstehende Liste spiegelt nicht die Art und Weise wider, wie IOMMU Geräte normalerweise gruppieren würde.
Um die Standard IOMMU-Gruppen für deine Hardware anzuzeigen, muss auf der VM Manager Seite die PCIe-ACS erzwingen Einstellung auf Deaktiviert gestellt werden.

IOMMU group 0:[1022:14ea] 00:01.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 1:[1022:14ed] 00:01.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14ed

IOMMU group 2:[1022:14ed] 00:01.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14ed

IOMMU group 3:[1022:14ea] 00:02.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 4:[1022:14ee] 00:02.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14ee

IOMMU group 5:[1022:14ee] 00:02.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14ee

IOMMU group 6:[1022:14ea] 00:03.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 7:[1022:14ea] 00:04.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 8:[1022:14ea] 00:08.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 9:[1022:14eb] 00:08.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14eb

IOMMU group 10:[1022:14eb] 00:08.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14eb

IOMMU group 11:[1022:14eb] 00:08.3 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14eb

IOMMU group 12:[1022:790b] 00:14.0 SMBus: Advanced Micro Devices, Inc. [AMD] FCH SMBus Controller (rev 71)

[1022:790e] 00:14.3 ISA bridge: Advanced Micro Devices, Inc. [AMD] FCH LPC Bridge (rev 51)

IOMMU group 13:[1022:14f0] 00:18.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f0

[1022:14f1] 00:18.1 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f1

[1022:14f2] 00:18.2 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f2

[1022:14f3] 00:18.3 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f3

[1022:14f4] 00:18.4 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f4

[1022:14f5] 00:18.5 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f5

[1022:14f6] 00:18.6 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f6

[1022:14f7] 00:18.7 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f7

IOMMU group 14:[10de:2486] 01:00.0 VGA compatible controller: NVIDIA Corporation GA104 [GeForce RTX 3060 Ti] (rev a1)

IOMMU group 15:[10de:228b] 01:00.1 Audio device: NVIDIA Corporation GA104 High Definition Audio Controller (rev a1)

IOMMU group 16:[144d:a80c] 02:00.0 Non-Volatile memory controller: Samsung Electronics Co Ltd NVMe SSD Controller S4LV008[Pascal]

[N:0:1:1] disk Samsung SSD 990 PRO 1TB__1 /dev/nvme0n1 1.00TB

IOMMU group 17:[1022:43f4] 03:00.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Upstream Port (rev 01)

IOMMU group 18:[1022:43f5] 04:00.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

IOMMU group 19:[1022:43f5] 04:01.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

IOMMU group 20:[1022:43f5] 04:02.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

IOMMU group 21:[1022:43f5] 04:0c.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

IOMMU group 22:[1022:43f5] 04:0d.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

IOMMU group 23:[c0a9:540a] 05:00.0 Non-Volatile memory controller: Micron/Crucial Technology P2 [Nick P2] / P3 / P3 Plus NVMe PCIe SSD (DRAM-less) (rev 01)

IOMMU group 24:[1b21:1064] 06:00.0 SATA controller: ASMedia Technology Inc. ASM1064 Serial ATA Controller (rev 02)

[1:0:0:0] disk ATA WDC WD7500BPVX-2 1A01 /dev/sdb 750GB

[4:0:0:0] disk ATA ST500LM012 HN-M5 0003 /dev/sdc 500GB

IOMMU group 25:[10ec:8125] 07:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8125 2.5GbE Controller (rev 05)

IOMMU group 26:[1022:43fa] 08:00.0 USB controller: Advanced Micro Devices, Inc. [AMD] Device 43fa (rev 01)

Bus 001 Device 001 Port 1-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 001 Device 002 Port 1-2 ID 0b05:19af ASUSTek Computer, Inc. AURA LED Controller

Bus 001 Device 003 Port 1-3 ID 0461:4d0f Primax Electronics, Ltd HP Optical Mouse

Bus 001 Device 004 Port 1-4 ID 0461:0010 Primax Electronics, Ltd HP PR1101U / Primax PMX-KPR1101U Keyboard

Bus 001 Device 005 Port 1-6 ID 0bb4:2910 HTC (High Tech Computer Corp.) Slim Line

Bus 002 Device 001 Port 2-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

IOMMU group 27:[1022:43f6] 09:00.0 SATA controller: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset SATA Controller (rev 01)

[25:0:0:0] disk ATA TOSHIBA MG08ACA1 0103 /dev/sdd 16.0TB

[26:0:0:0] disk ATA TOSHIBA MG08ACA1 0103 /dev/sde 16.0TB

[27:0:0:0] disk ATA ST1000LM024 HN-M 0002 /dev/sdf 1.00TB

[28:0:0:0] disk ATA TOSHIBA MQ01ABD1 1A /dev/sdg 1.00TB

IOMMU group 28:[144d:a80c] 0a:00.0 Non-Volatile memory controller: Samsung Electronics Co Ltd NVMe SSD Controller S4LV008[Pascal]

[N:2:1:1] disk Samsung SSD 990 PRO 1TB__1 /dev/nvme2n1 1.00TB

IOMMU group 29:[1002:15bf] 0b:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Phoenix1 (rev 05)

IOMMU group 30:[1002:1640] 0b:00.1 Audio device: Advanced Micro Devices, Inc. [AMD/ATI] Rembrandt Radeon High Definition Audio Controller

IOMMU group 31:[1022:15c7] 0b:00.2 Encryption controller: Advanced Micro Devices, Inc. [AMD] Family 19h (Model 74h) CCP/PSP 3.0 Device

IOMMU group 32:[1022:15b9] 0b:00.3 USB controller: Advanced Micro Devices, Inc. [AMD] Device 15b9

Bus 003 Device 001 Port 3-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 004 Device 001 Port 4-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

IOMMU group 33:[1022:15ba] 0b:00.4 USB controller: Advanced Micro Devices, Inc. [AMD] Device 15ba

Bus 005 Device 001 Port 5-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 006 Device 001 Port 6-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

IOMMU group 34:[1022:15e3] 0b:00.6 Audio device: Advanced Micro Devices, Inc. [AMD] Family 17h/19h HD Audio Controller

IOMMU group 35:[1022:14ec] 0c:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 14ec

IOMMU group 36:[1022:1502] 0c:00.1 Signal processing controller: Advanced Micro Devices, Inc. [AMD] AMD IPU Device

IOMMU group 37:[1022:14ec] 0d:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 14ec

IOMMU group 38:[1022:15c0] 0d:00.3 USB controller: Advanced Micro Devices, Inc. [AMD] Device 15c0

Bus 007 Device 001 Port 7-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 008 Device 001 Port 8-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

IOMMU group 39:[1022:15c1] 0d:00.4 USB controller: Advanced Micro Devices, Inc. [AMD] Device 15c1

Bus 010 Device 001 Port 10-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 009 Device 001 Port 9-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

 

 

CPU-Thread-Verknüpfungen

Pair 1:cpu 0 / cpu 6

Pair 2:cpu 1 / cpu 7

Pair 3:cpu 2 / cpu 8

Pair 4:cpu 3 / cpu 9

Pair 5:cpu 4 / cpu 10

Pair 6:cpu 5 / cpu 11

 

USB-Geräte

Bus 001 Device 001 Port 1-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 001 Device 002 Port 1-2ID 0b05:19af ASUSTek Computer, Inc. AURA LED Controller

Bus 001 Device 003 Port 1-3ID 0461:4d0f Primax Electronics, Ltd HP Optical Mouse

Bus 001 Device 004 Port 1-4ID 0461:0010 Primax Electronics, Ltd HP PR1101U / Primax PMX-KPR1101U Keyboard

Bus 001 Device 005 Port 1-6ID 0bb4:2910 HTC (High Tech Computer Corp.) Slim Line

Bus 002 Device 001 Port 2-0ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 003 Device 001 Port 3-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 004 Device 001 Port 4-0ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 005 Device 001 Port 5-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 006 Device 001 Port 6-0ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 007 Device 001 Port 7-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 008 Device 001 Port 8-0ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 009 Device 001 Port 9-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 010 Device 001 Port 10-0ID 1d6b:0003 Linux Foundation 3.0 root hub

 

3. Default setzen / Wie?

 

grafik.thumb.png.4c1d4581ebaad89eec38bc359a411415.png

grafik.png.aab2b2b1aa3c0f6994537963a62e2b09.png

 

6.

 

PCI-Geräte und IOMMU-Gruppen

IOMMU group 0:[1022:14ea] 00:01.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 1:[1022:14ed] 00:01.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14ed

IOMMU group 2:[1022:14ed] 00:01.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14ed

IOMMU group 3:[1022:14ea] 00:02.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 4:[1022:14ee] 00:02.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14ee

IOMMU group 5:[1022:14ee] 00:02.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14ee

IOMMU group 6:[1022:14ea] 00:03.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 7:[1022:14ea] 00:04.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 8:[1022:14ea] 00:08.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14ea

IOMMU group 9:[1022:14eb] 00:08.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14eb

IOMMU group 10:[1022:14eb] 00:08.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14eb

IOMMU group 11:[1022:14eb] 00:08.3 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 14eb

IOMMU group 12:[1022:790b] 00:14.0 SMBus: Advanced Micro Devices, Inc. [AMD] FCH SMBus Controller (rev 71)

[1022:790e] 00:14.3 ISA bridge: Advanced Micro Devices, Inc. [AMD] FCH LPC Bridge (rev 51)

IOMMU group 13:[1022:14f0] 00:18.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f0

[1022:14f1] 00:18.1 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f1

[1022:14f2] 00:18.2 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f2

[1022:14f3] 00:18.3 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f3

[1022:14f4] 00:18.4 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f4

[1022:14f5] 00:18.5 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f5

[1022:14f6] 00:18.6 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f6

[1022:14f7] 00:18.7 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 14f7

IOMMU group 14:[10de:2486] 01:00.0 VGA compatible controller: NVIDIA Corporation GA104 [GeForce RTX 3060 Ti] (rev a1)

[10de:228b] 01:00.1 Audio device: NVIDIA Corporation GA104 High Definition Audio Controller (rev a1)

IOMMU group 15:[144d:a80c] 02:00.0 Non-Volatile memory controller: Samsung Electronics Co Ltd NVMe SSD Controller S4LV008[Pascal]

[N:0:1:1] disk Samsung SSD 990 PRO 1TB__1 /dev/nvme0n1 1.00TB

IOMMU group 16:[1022:43f4] 03:00.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Upstream Port (rev 01)

IOMMU group 17:[1022:43f5] 04:00.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

[c0a9:540a] 05:00.0 Non-Volatile memory controller: Micron/Crucial Technology P2 [Nick P2] / P3 / P3 Plus NVMe PCIe SSD (DRAM-less) (rev 01)

[N:1:1:1] disk CT1000P3SSD8__1 /dev/nvme1n1 1.00TB

IOMMU group 18:[1022:43f5] 04:01.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

[1b21:1064] 06:00.0 SATA controller: ASMedia Technology Inc. ASM1064 Serial ATA Controller (rev 02)

[1:0:0:0] disk ATA WDC WD7500BPVX-2 1A01 /dev/sdb 750GB

[4:0:0:0] disk ATA ST500LM012 HN-M5 0003 /dev/sdc 500GB

IOMMU group 19:[1022:43f5] 04:02.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

[10ec:8125] 07:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8125 2.5GbE Controller (rev 05)

IOMMU group 20:[1022:43f5] 04:0c.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

[1022:43fa] 08:00.0 USB controller: Advanced Micro Devices, Inc. [AMD] Device 43fa (rev 01)

Bus 001 Device 001 Port 1-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 001 Device 002 Port 1-2 ID 0b05:19af ASUSTek Computer, Inc. AURA LED Controller

Bus 001 Device 003 Port 1-3 ID 0461:4d0f Primax Electronics, Ltd HP Optical Mouse

Bus 001 Device 004 Port 1-4 ID 0461:0010 Primax Electronics, Ltd HP PR1101U / Primax PMX-KPR1101U Keyboard

Bus 001 Device 005 Port 1-6 ID 0bb4:2910 HTC (High Tech Computer Corp.) Slim Line

Bus 002 Device 001 Port 2-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

IOMMU group 21:[1022:43f5] 04:0d.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset PCIe Switch Downstream Port (rev 01)

[1022:43f6] 09:00.0 SATA controller: Advanced Micro Devices, Inc. [AMD] 600 Series Chipset SATA Controller (rev 01)

[25:0:0:0] disk ATA TOSHIBA MG08ACA1 0103 /dev/sdd 16.0TB

[26:0:0:0] disk ATA TOSHIBA MG08ACA1 0103 /dev/sde 16.0TB

[27:0:0:0] disk ATA ST1000LM024 HN-M 0002 /dev/sdf 1.00TB

[28:0:0:0] disk ATA TOSHIBA MQ01ABD1 1A /dev/sdg 1.00TB

IOMMU group 22:[144d:a80c] 0a:00.0 Non-Volatile memory controller: Samsung Electronics Co Ltd NVMe SSD Controller S4LV008[Pascal]

[N:2:1:1] disk Samsung SSD 990 PRO 1TB__1 /dev/nvme2n1 1.00TB

IOMMU group 23:[1002:15bf] 0b:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Phoenix1 (rev 05)

IOMMU group 24:[1002:1640] 0b:00.1 Audio device: Advanced Micro Devices, Inc. [AMD/ATI] Rembrandt Radeon High Definition Audio Controller

IOMMU group 25:[1022:15c7] 0b:00.2 Encryption controller: Advanced Micro Devices, Inc. [AMD] Family 19h (Model 74h) CCP/PSP 3.0 Device

IOMMU group 26:[1022:15b9] 0b:00.3 USB controller: Advanced Micro Devices, Inc. [AMD] Device 15b9

Bus 003 Device 001 Port 3-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 004 Device 001 Port 4-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

IOMMU group 27:[1022:15ba] 0b:00.4 USB controller: Advanced Micro Devices, Inc. [AMD] Device 15ba

Bus 005 Device 001 Port 5-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 006 Device 001 Port 6-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

IOMMU group 28:[1022:15e3] 0b:00.6 Audio device: Advanced Micro Devices, Inc. [AMD] Family 17h/19h HD Audio Controller

IOMMU group 29:[1022:14ec] 0c:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 14ec

IOMMU group 30:[1022:1502] 0c:00.1 Signal processing controller: Advanced Micro Devices, Inc. [AMD] AMD IPU Device

IOMMU group 31:[1022:14ec] 0d:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 14ec

IOMMU group 32:[1022:15c0] 0d:00.3 USB controller: Advanced Micro Devices, Inc. [AMD] Device 15c0

Bus 007 Device 001 Port 7-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 008 Device 001 Port 8-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

IOMMU group 33:[1022:15c1] 0d:00.4 USB controller: Advanced Micro Devices, Inc. [AMD] Device 15c1

Bus 010 Device 001 Port 10-0 ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 009 Device 001 Port 9-0 ID 1d6b:0002 Linux Foundation 2.0 root hub

 

 

CPU-Thread-Verknüpfungen

Pair 1:cpu 0 / cpu 6

Pair 2:cpu 1 / cpu 7

Pair 3:cpu 2 / cpu 8

Pair 4:cpu 3 / cpu 9

Pair 5:cpu 4 / cpu 10

Pair 6:cpu 5 / cpu 11

 

USB-Geräte

Bus 001 Device 001 Port 1-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 001 Device 002 Port 1-2ID 0b05:19af ASUSTek Computer, Inc. AURA LED Controller

Bus 001 Device 003 Port 1-3ID 0461:4d0f Primax Electronics, Ltd HP Optical Mouse

Bus 001 Device 004 Port 1-4ID 0461:0010 Primax Electronics, Ltd HP PR1101U / Primax PMX-KPR1101U Keyboard

Bus 001 Device 005 Port 1-6ID 0bb4:2910 HTC (High Tech Computer Corp.) Slim Line

Bus 002 Device 001 Port 2-0ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 003 Device 001 Port 3-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 004 Device 001 Port 4-0ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 005 Device 001 Port 5-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 006 Device 001 Port 6-0ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 007 Device 001 Port 7-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 008 Device 001 Port 8-0ID 1d6b:0003 Linux Foundation 3.0 root hub

Bus 009 Device 001 Port 9-0ID 1d6b:0002 Linux Foundation 2.0 root hub

Bus 010 Device 001 Port 10-0ID 1d6b:0003 Linux Foundation 3.0 root hub

 

SCSI-Geräte

[0:0:0:0]disk Intenso Slim Line PMAP /dev/sda 31.0GB

[1:0:0:0]disk ATA WDC WD7500BPVX-2 1A01 /dev/sdb 750GB

[4:0:0:0]disk ATA ST500LM012 HN-M5 0003 /dev/sdc 500GB

[25:0:0:0]disk ATA TOSHIBA MG08ACA1 0103 /dev/sdd 16.0TB

[26:0:0:0]disk ATA TOSHIBA MG08ACA1 0103 /dev/sde 16.0TB

[27:0:0:0]disk ATA ST1000LM024 HN-M 0002 /dev/sdf 1.00TB

[28:0:0:0]disk ATA TOSHIBA MQ01ABD1 1A /dev/sdg 1.00TB

[N:0:1:1]disk Samsung SSD 990 PRO 1TB__1 /dev/nvme0n1 1.00TB

[N:1:1:1]disk CT1000P3SSD8__1 /dev/nvme1n1 1.00TB

[N:2:1:1]disk Samsung SSD 990 PRO 1TB__1 /dev/nvme2n1 1.00TB

Edited by Syrincs
Link to comment
Posted (edited)

Also ohne diese zeile startet der server wieder nicht.

 


append pcie_acs_override=downstream,multifunction vfio_iommu_type1.allow_unsafe_interrupts=1

 

Kann man nochwas zurücksetzen, damit es ohne diese zeile funktioniert?

 

 

Fehler erkannt :) hab das append mal mit drin gelassen und der Server startet.

 

Dann sollte es jetzt alles raus sein !?

tower-diagnostics-20240326-2121.zip

Noochmal die Dignostic

 

grafik.thumb.png.ac2b9a40807f2b17bcc3c24616237415.png

Edited by Syrincs
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.