Jump to content

Erlaubt der neue Linux Kernel stromsparende AMD Server?


mgutt

Recommended Posts

52 minutes ago, Pete0 said:

Aber ich lese immer wieder Berichte von Käufern, dass die Dinger stinken und da mein Server in der Wohnung steht, schreckt mich das sehr ab.

 

Das hast du eigentlich immer ... das verflüchtigt sich sehr schnell. Ist ja meistens auch nur das frisch in China geschlüpfte Kunststoff-Gehäuse. Die Zellen sind heute doch alle geschlossen und Wartungsfrei. 

Link to comment
On 7/29/2023 at 11:40 AM, Pete0 said:

@kdwg

Über eine SUV habe ich oft nachgedacht. So eine kleine APC zum sauber Runterfahren würde ja schon reichen. Aber ich lese immer wieder Berichte von Käufern, dass die Dinger stinken und da mein Server in der Wohnung steht, schreckt mich das sehr ab.

 

Ich nutze Powertop Autotune. OOM sagt mir gar gerade nichts.

schalte am besten das logging ein und amstelle von autotune setze die powertop parameter einzeln.

Wenn es weiterhin auftritt, sollte man es mit  Infos  wieder stabil bekommen. Meine Kiste ist damals auch häufiger abgeschmiert bzw eingefroren.

 

 

Im Standby ist cyberpower erstaunlich effizient

Edited by kdwg
Link to comment
On 7/27/2023 at 8:25 PM, Pete0 said:

Hat jemand von euch schonmal Probleme bekommen bei der Nutzung von amd_pstate?

In den letzten 2 Wochen habe ich bereits zwei unsaubere Neustarts gehabt und musste jedes mal wieder Parity Prüfen.

 

Ich kann Hardware nicht ausschließen, möchte aber nicht sofort losrennen und neue - und teure - Hardware kaufen gehen.

Den ersten Neustart hatte ich nach update auf 6.12.3 und den zweiten nachdem der Server 8 Tage aktiv war.

Beide male war aber der Server wieder am laufen aber das Array Offline.

 

Wenn ein Hardwaredefekt vorliegt, z. B. Netzteil, würde der Rechner nach einem Fehler nicht aus bleiben?

So ein Problem hatte ich letztens auch. Kam von der Arbeit wieder und random war mein Server neugestartet.

Auch habe ich in letzter Zeit immer mal wieder eine art "lockup". Also die webui friert komplett ein und reagiert gar nicht mehr, auch über konsole  oder ssh keine verbindung mehr, aber zum beispiel game server die darauf laufen arbeiten noch problemlos weiter. Nur ein hard-reset hilft, was natürlich einen parity check auslöst...

Link to comment
43 minutes ago, Joly0 said:

So ein Problem hatte ich letztens auch. Kam von der Arbeit wieder und random war mein Server neugestartet.

Auch habe ich in letzter Zeit immer mal wieder eine art "lockup". Also die webui friert komplett ein und reagiert gar nicht mehr, auch über konsole  oder ssh keine verbindung mehr, aber zum beispiel game server die darauf laufen arbeiten noch problemlos weiter. Nur ein hard-reset hilft, was natürlich einen parity check auslöst...

Haben manche Container  CPU pinning gesetzt ?

Bei mir früher eher ohne zugriff, Schrödingers Container. Einziger Ausweg hard reset.


Und die Problematik gibt es seit Umstieg zu amd-pstate/bzw 6.12.x ? Zuvor stabil ?


 

@Joly0

Funktioniert das logging ?

Edited by kdwg
Link to comment
11 minutes ago, kdwg said:

Haben manche Container  CPU pinning gesetzt ?

Bei mir früher eher ohne zugriff, Schrödingers Container. Einziger Ausweg hard reset.


Und die Problematik gibt es seit Umstieg zu amd-pstate/bzw 6.12.x ? Zuvor stabil ?


 

@Joly0

Funktioniert das logging ?

Nope, kein Container hat pinning und die VM´s die laufen (ist nur HomeAssistant) laufen auf anderen cores als core 0, den ja Unraid nutzt.

Auch mit 6.11 so probleme gehabt, da hatte ich aber auch schon mehr oder weniger den amd-pstate benutzt (ging da ja auch, aber bisschen anders). Allerdings hatte ich ende letztes jahr auch auf am5 umgestellt, könnte also auch hardware probleme sein.

 

Was meinst du mit logging? Der System-log generell funktioniert, nur bringts mir nichts, wenn ich nicht auf die webui oder per ssh, sftp oder sonst wie auf den server komme und mir die holen kann während mein server nix mehr macht. Nach nem restart ist der ja wieder auf null gesetzt

Link to comment

Ich habe mal unter "Settings->Network Services->Syslog Server" die einstellung "Mirror syslog to flash" aktiviert. Aber das verhalten ist sehr sehr random, kommt manchmal über 2-3 wochen nicht und dann random einfach wieder oder manchmal auch nach 1-2 tagen direkt wieder. Aber vllt kann man dem ja so auf den grund gehen

Link to comment

Das Logging meinte ich. Am besten vor dem reboot mit einem Client vom Flashdrive ziehen

 

 

Auch wenn inzwischen etwas andere Hardware läuft:

 

 

Ist spät, noch ein Input:

Eventuell Kernel Parameter "rcu_nocb" ansehen

 

Ist AM5 inzwischen eigentlich von unRAID supported / als stable getestet ? 

Edited by kdwg
Link to comment

Um mein Problem zu analysieren habe ich ein USB Stick mit 32GB in einen bestehenden Raspberry Pi getan und darauf rsyslog eingerichtet, und unRAID in den Einstellung so konfiguriert, dass es dorthin loggen soll. Damit ebenen die Logs nach einem Neustart erhalten bleiben. Hat in Summe 20 MInuten gedauert und kann ich auf empfehlen, wenn du noch ein anderes Gerät in deinem Heimnetz hast.

Link to comment

Ok, idk. Ist schon wieder passiert. Webui komplett unerreichbar, ping geht noch, aber per ssh oder übers maus und tastatur geht kein login mehr, nur noch "login: timed out after 60 seconds" aber alles andere geht noch ohne probleme. Zum beispiel game server der darauf läuft funktioniert noch ganz normal ohne probleme

 

Edit

Nachdem ich einen der gameserver heruntergefahren habe, gings auf einmal wieder

Edited by Joly0
Link to comment
  • 3 weeks later...

So, ich greife das Thema nochmal auf nach langer Zeit :)

 

Unraid-Version 6.12.3

 

Folgendes steht in der syslinux drinnen:

 

nmi_watchdog=0 modprobe.blacklist=k10temp,sp5100_tco,acpi_cpufreq idle=halt nowatchdog amd_pstate=passive[/CODE]


 

Der P-State-Treiber muss nicht mehr gesondert geladen werden.

 

In Corefreq alles registriert bis auf den cpu-freq Treiber, der will weiterhin mit folgender Fehlermeldung nicht:

 

grafik.png.e031e24a132e6be3a0e2aff0a3d57e30.png

 

Im Kernel-Fenster wird er mir mit "amd-pstate" angezeigt, was ich jetzt mal nicht als Problem ansehe:

 

grafik.png.a67b406569f46cd06af862479704d8e9.png

 

CPPC wurde ja mittlerweile in ein eigenes Fenster ausgelagert und ist aktiviert:

 

grafik.png.7ddd847e411ba71b3e38740f5c94d884.png

 

Das TGT habe ich auf den kleinstmöglichen Wert "1" gesetzt:

 

grafik.png.3eedd7df36d4bd61771231d1dfc55a8a.png

 

Die Kerne gehen mit diesen Einstellungen laut Corefreq auch in C4:C6:

 

grafik.png.78f3a60da62e95ee891ee351a8def936.png

 

Die Leistungsaufnahme zeigt mir Corefreq damit im Leerlauf wie folgt an:

 

grafik.png.3956cf65029a1a6f7369c861f3386217.png

 

 

Muss mal mein Stromverbrauchsmessgerät suchen, keine Ahnung in welcher Umzugskiste sich das versteckt hält.

 

Vielleicht mag mal jemand seine Coreqfreq Power-Werte reinstellen um vergleichen zu können :)

 

Link to comment
1 hour ago, CyrIng said:

Thanks. The main culprit was "amd_pstate=passive". After removing that from syslinux.cfg, everything's missing:

 

grafik.png.c2365ab81ff0995ce0825014a1db426d.png

 

I can register everything now:

 

grafik.png.52abb002f9de42cb6ed04dcab66524d0.png

 

But now the governor is missing:

 

grafik.png.d293695d79a83d18d670ae01f1f999e7.png

 

CPPC needs to be enabled manually and appears "green" afterwards.

 

 

Seems like I'm getting slightly lower power consumption stats:

 

grafik.png.5ad0b02261cb74c7ed42b0882cb20eff.png

 

Btw: How do I make all of these things persistent after reboots? I've created a corefreqk.conf in /boot/config/modprobe.d/, yet nothing changes.

 

This is what it looks like as of right now:

 



Idle_Route=1 Register_ClockSource=1 Register_CPU_Freq=1 Register_Governor=1 Register_CPU_Idle=1[/CODE]

 

Link to comment
1 hour ago, Pillendreher said:

How do I make all of these things persistent

@ich777 is now providing changes to his Plugin for parameters. 

 

1 hour ago, Pillendreher said:

the governor is missing

This is a kernel requirement to register a Governor before a CPU-Idle handler. 

You have to follow that order with CoreFreq. 

Link to comment
17 minutes ago, Pillendreher said:

CPU is not run by pstate

Ryzen Processors remain p-state driven in any case. 

 

Contrary to mainline kernel drivers which automatically select p-states, CoreFreq provides you a mean to submit manually the  "Frequency IDs" (see TGT target) or to  reprogram P1, P2 p-state's coefficient of frequency (COF) 

 

When CoreFreq is CPU-Idle master will offer you two features :

1. "Idle route" : asm functions in which kernel will be asked to Idle. Halt, Monitor-Mwait, I/O mwait. Route can be selected from the UI window [Settings] 

2. C-States Limit from UI window [Kernel]

Those low C-States counters are unfortunately not specified by AMD thus I'm measuring the TSC time spent by kernel within each state. 

  • Like 1
Link to comment
  • 3 months later...
  • 2 weeks later...
On 11/20/2023 at 2:18 PM, RandiGetSomeCandy said:

Hallo,

 

verstehe ich das damit richtig, dass ein stromsparender Betrieb moeglich ist, da Linux nun einen 5900X in C6 (oder was auch immer) versetzen kann? Wenn ja, was muss ich dafuer machen? 

Gruss

Randi

Würde ich auch gerne wissen, liebäugle gerade mit einem Ryzen 5 oder Ryzen 3 Pro der 4xxx Serie...Oder ich stelle komplett auf ein i3 12100 System um, obwohl ich dann ECC RAM verliere...aber mein Ryzen 1700 System ist jetzt bei 60W Idle...

Link to comment
4 minutes ago, RandiGetSomeCandy said:

Hab mir jetzt nen Intel 12700 bestellt. Kommt Montag. Teste es mit dem Setup und hoffe auf 30 - 35W im idle ...

bitte bedenken, die angegebenen Werte hier im Idle beziehen sich in der regel immer mit Festplatten im spindown ...

 

und ja, mit Intel wirst du da normal sicher hinkommen ;)

Link to comment
5 minutes ago, alturismo said:

bitte bedenken, die angegebenen Werte hier im Idle beziehen sich in der regel immer mit Festplatten im spindown ...

Festplatten sind im Spinndown. Sobald die hochkommen springt es ja von 60 - 65 auf 80 - 85W. Halt nur beim Lesen von Daten. Noch nichtmal ohne echte Last auf der CPU (abseits von den SMB-/Netzwerk-Traffik-Berechnungen und der Grundlast natuerlich).

 

5 minutes ago, alturismo said:

und ja, mit Intel wirst du da normal sicher hinkommen ;)

87vg62.jpg

Spoiler

xD

 

Edited by RandiGetSomeCandy
  • Like 1
Link to comment

Das Geraffel kam heute schon:
Ausm Stand raus 25 - 30 Watt weniger. iGPU kann auch wunderbar Transcoden fuer nur 3 Watt extra. Einfach nur krank! corefreq laeuft noch nicht - muss mich auch ins BIOS bissl einarbeiten und hoffe da auch noch etwas rausholen zu koennen. Insgesamt bin ich mega zufrieden! Vielleicht doch auf ein Pico-P Netzteil umstellen, um da nochmal bissl zu sparen. Mal schauen.

 

Aber allein mit "nur" 25 Watt Unterschied werden sich die Mehrkosten bereits in einem Jahr amortisiert haben - gut, dass ich noch in den 14 Tagen innerhalb des Kaufes der CPU und des Boards bin - auch wenn ich ein echt schlechtes Gewissen habe 😅

Edited by RandiGetSomeCandy
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...