Jump to content

DDR4 ECC Empfehlung - D3644


Recommended Posts

52 minutes ago, mgutt said:

Hat denn jetzt jemand anders mit dem Board den Test auch mal bestätigt? Wäre ja nett zu wissen, ob nur dein Board eine Macke hatte oder das einfach ein BIOS Bug ist, der bei jedem auftritt.

Es gab hier weiter oben Berichte von erfolgreichen Tests, sodass man eher davon ausgeht, dass das Board grundsätzlich funktioniert. 

Mein Exemplar, meine ich, wurde als Deal für knapp 190EUR eingestellt und 1 Tag später verkauft. 

Jetzt hätte ich bloß gerne mein Geld zurück, bis jetzt ignoriert man meine Nachfragen komplett, obwohl ich mein Board im Laden vor 2 Wochen abgegeben habe. War definitiv mein letzter Kauf von Hardware vor Ort 🤦‍♂️

Link to comment

Ok, ich hatte wohl unrecht, das war nicht mein Board, das als Deal verkauft wurde.

 

Denn der Verkäufer hat sich nun gemeldet mit einer Mitteilung, dass das Board funktioniert, keine Fehler kommen und ich das Board im Laden abholen soll. Ich gehe davon aus, dass sie es niemals in einem ECC-Setup getestet haben (und schon garnicht mit memtest86) - habe ich aber nachgefragt was sie mit "keine Fehler" meinen - und das nachdem ich vor Ort war und 2 Leute die ECC-Fehler bezeugt haben. Eigentlich unfassbar.

 

Meine Frage wäre so langsam, was ich machen soll. Hatte jemand einen ähnlichen Fall mit einem Hardware-Laden? Ich meine, der Verkäufer will offenbar nichts tun außer mir im Prinzip klarmachen, dass das Board funktioniert.

Edited by ServerUngeek
Link to comment

Jo bleibt eigentlich nichts mehr übrig. Ich glaube ich werde da ein letztes Mal anrufen und fragen, ob sie vorhaben irgendwas zu tun ansonsten bleibt mir nur die Option mit der Fristsetzung übrig. Es ist schon faszinierend, dass ein ziemlich großer Händler, der so lange auf dem Markt ist, sich dermaßen anstellt. Die sind so unfassbar dumm. Ich meine, das spricht sich doch rum und sie haben viel mehr Schaden als die 200 EUR, weil ich bei denen nie wieder was kaufen werde und paar andere Leute auch nicht.

 

Aber was soll man sagen, sie haben auch tonnenweise negative Bewertungen bei Google. Laut einigen Bewertungen, drohen sie den Verfassern und behaupten nachher gegenüber Google, der Käufer hatte bei denen nix gekauft bzw. die kennen ihn nicht. WTF ist das eigentlich.

 

Problem ist halt, die meinen aufrichtig, dass sie recht haben nehme ich mal an. Windows läuft auf dem Ding und gut ist, der Käufer - ich also - denkt sich irgendwas aus. Sowas wirds schon sein. Und mir am Anfang schnell mal zu beweisen versuchen, dass das Board halt alt ist und die 9. Generation von Intel nicht unterstützt. Wie peinlich ist das denn eigentlich.

Edited by ServerUngeek
Link to comment
  • 3 months later...
On 4/16/2023 at 10:24 AM, mgutt said:

Hat denn jetzt jemand anders mit dem Board den Test auch mal bestätigt? Wäre ja nett zu wissen, ob nur dein Board eine Macke hatte oder das einfach ein BIOS Bug ist, der bei jedem auftritt.

Hallo,

 

ich konnte die Ergebnisse von ServerUngeek bestätigen für folgende Konfiguration:

BIOS

VendorFUJITSU // American Megatrends Inc.

VersionV5.0.0.13 R1.28.0 for D3644-B1x

 

CPU TypeIntel Core i3-9100 @ 3.60GHz

CPU Clock3692 MHz [Turbo: 4102.6 MHz]

 

SPD #032GB DDR4 2Rx8 ECC PC4-25600

Vendor Part InfoKingston / 9965745-039.A00G

 

Kingston Server Premier 32GB 3200MT/s DDR4 ECC CL22 DIMM 2Rx8 Serverspeicher Hynix C - KSM32ED8/32HC

 

Ich habe 2 dieser Module. Das von ServerUngeek beschriebene Bild kann ich bestätigen für alle Kombinationen (2 oder 1 Modul in allen Slot). Dh. im Test 0 und 1 bekomme ich beim ersten Start von memtest86 ECC Fehler angezeigt. Wiederhole ich den Test (ohne reboot) werden keine Fehler ausgewiesen.  Wiederhole ich den Test nach einem reset werden keine Fehler ausgewiesen. Nach einem Neustart anch poer off tauchen allerdings dieselben Fehler wieder auf. Bspw ("Test: 1" in der folgenden Liste steht für test 0 und "Test: 2" für test 1) :

 

2023-08-18 08:45:06 - [ECC Errors] Test: 2, (Channel,Slot,Rank,Bank,Row,Col): (1,0,2,0,1EF00,0), ECC Corrected: Yes, Syndrome: 0000, Channel-Slot: 1-0

2023-08-18 08:45:06 - [ECC Errors] Test: 2, (Channel,Slot,Rank,Bank,Row,Col): (0,0,2,0,1EF00,8), ECC Corrected: Yes, Syndrome: 0000, Channel-Slot: 0-0

2023-08-18 08:45:04 - [ECC Errors] Test: 1, (Channel,Slot,Rank,Bank,Row,Col): (1,0,2,0,1CE80,8), ECC Corrected: Yes, Syndrome: 0000, Channel-Slot: 1-0

2023-08-18 08:45:04 - [ECC Errors] Test: 1, (Channel,Slot,Rank,Bank,Row,Col): (0,0,2,0,1CE80,8), ECC Corrected: Yes, Syndrome: 0000, Channel-Slot: 0-0

2023-08-18 08:45:02 - [ECC Errors] Test: 1, (Channel,Slot,Rank,Bank,Row,Col): (1,0,2,0,1AE00,0), ECC Corrected: Yes, Syndrome: 0000, Channel-Slot: 1-0

2023-08-18 08:45:02 - [ECC Errors] Test: 1, (Channel,Slot,Rank,Bank,Row,Col): (0,0,2,0,1AE00,8), ECC Corrected: Yes, Syndrome: 0000, Channel-Slot: 0-0

2023-08-18 08:45:00 - [ECC Errors] Test: 1, (Channel,Slot,Rank,Bank,Row,Col): (1,0,2,0,18D80,0), ECC Corrected: Yes, Syndrome: 0000, Channel-Slot: 1-0

2023-08-18 08:45:00 - [ECC Errors] Test: 1, (Channel,Slot,Rank,Bank,Row,Col): (0,0,2,0,18D80,8), ECC Corrected: Yes, Syndrome: 0000, Channel-Slot: 0-0

2023-08-18 08:44:58 - [ECC Errors] Test: 1, (Channel,Slot,Rank,Bank,Row,Col): (1,0,2,0,16D00,0), ECC Corrected: Yes, Syndrome: 0000, Channel-Slot: 1-0

 

 

Ich verwende die gleichen Ram-Module wie Onotop in seinem am 2.4. geposteten report, der keine ECC-Fehler ausweist also 32 GB-Module ECC von Kingston.

 

Ich Vergleich zur Konfiguartion von ONOTOP ergeben sich bei mir folgende Abweichungen:

 

                     Onotop                                                  Meine Konfiguration

CPU               Intel Core i3-8100                                  Intel Core i3-9100

Bios               V5.0.0.13 R1.26.0 for D3644-B1x             V5.0.0.13 R1.28.0 for D3644-B1x

Memtest        V10.3 Free                                             V10.6 Free

 

Ich interpretiere das Ganze wie folgt: Meine RAM-Module sind in Ordnung (Argument: Bei einer Wiederholung des Tests ohne Reboot, tauchen die Fehler nicht auf). Ich vermute, dass der i3-9100 in Abweichung von dem i3-8100 (den Onotop einsetzt) für das "Fehler-Bild" verantwortlich ist. Ich glaube nicht, dass es an der Version von memtest liegt - ich finde allerdings die Version 10.3 nicht mehr auf der Homepage vom memtest und kann das deshalb nicht verifizieren.

 

Auffällig ist, dass die ECC-Fehler nur im Test 0 und 1 ausgewiesen werden. Bei diesen Tests abweichend von den übrigen Tests ist nach der Erläuterung von Memtest (https://www.memtest86.com/tech_individual-test-descr.html) nur ein CPU core im Einsatz:

 

Test 0 [Address test, walking ones, 1 CPU]

Tests all address bits in all memory banks by using a walking ones address pattern. This test is performed by a single CPU core.

Test 1 [Address test, own address, 1 CPU]

Each address is written with its own address and then is checked for consistency. In theory previous tests should have caught any memory addressing problems. This test should catch any addressing errors that somehow were not previously detected. This test is performed by a single CPU core.

Test 2 [Address test, own address]

Same as test 1 but the testing is done using multiple CPUS, if applicable.

 

Test 1 und 2 machen an sich das gleiche nur, dass bei Test 2 mehrere cores zum Einsatz kommen.

 

 

@ServerUngeek: Du beschreibt, dass Du mehrere CPUs getestet hat, läßt aber offen, ob es sich dabei um i3-9100 oder i3-8100 gehandelt hat. Wenn Du wie onotop den i3-8100 getestet hast, ist meine These erschüttert. Welche Version von Memtest hast Du verwendet?

 

 

 

 

 

 

 

  • Like 1
Link to comment
1 hour ago, UrRa_346798ze said:

 Ich vermute, dass der i3-9100 in Abweichung von dem i3-8100 (den Onotop einsetzt) für das "Fehler-Bild" verantwortlich ist. Ich glaube nicht, dass es an der Version von memtest liegt - ich finde allerdings die Version 10.3 nicht mehr auf der Homepage vom memtest und kann das deshalb nicht verifizieren.
 

 

 

Ich bin mit meinen Überlegungen einen Schritt weiter. Evt. liegt ein cold boot Problem vor. Über derartige Probleme ist im Forum von memtest86 berichtet worden:

https://forums.passmark.com/memtest86/48365-ecc-errors-only-on-cold-boot

 

EIn Moderator hat dort folgendes gepostet:

Quote

Unfortunately the UEFI memory map and ECC handling are complex, and their functionality is largely keep secret by Intel.
Most of the bad behaviour are BIOS bugs or undocumented changes by Intel in a new CPU family.

 

 

Das könnte meine These, dass das "Fehlerbild" in meinem Fall am i3-9100 liegt (während onotop mit seinem i3-8100 kein Problem hat) stützen.

 

Ich habe daher im Memtest Forum unter https://forums.passmark.com/memtest86/55775-1-test-test-0-and-test-1-only-after-cold-boot-not-after-repeat-reset

einen Beitrag gepostet, um der Sache weiter auf den Grund zu gehen.

 

Link to comment

Na also.... bin doch nicht der einzige Doofe 😄

Ich hab mit mehreren CPUs und RAM-Modulen getestet, darunter 2 Xeons (auch die Generation vor i3-9100) und i3-9100, mit i3-8100 habe ich nicht getestet. Es hat alles keine Besserung gebracht. Die vergeudetet Lebenszeit fürs ewige Testen hätte ich übrigens gerne erstattet bekommen. Nach ewigem Hin und Her, das sage und schreibe 2 Monate dauerte, wurde mir der Kaufpreis erstattet, nachdem das Mainboard wohl zu Fujitsu? eingesendet wurde. Angeblich aus Kulanz. Ich persönlich glaube nicht mal, dass man sich die Mühe gemacht hat das Problem irgendwie nachzuvollziehen. Ich hab schon gar nicht mehr damit gerechnet. 
Wie dem auch sei, der Fehler ist nervig, bin schon längst umgestiegen, hab etwas mehr Idle-Verbrauch als beim Fujitsu aber immer noch unter 10 Watt mit 3 SSDs und 2 RAM-Modulen.

Edited by ServerUngeek
Link to comment
  • 2 weeks later...
On 8/18/2023 at 1:32 PM, UrRa_346798ze said:

 

 

 

Ich habe daher im Memtest Forum unter https://forums.passmark.com/memtest86/55775-1-test-test-0-and-test-1-only-after-cold-boot-not-after-repeat-reset

einen Beitrag gepostet, um der Sache weiter auf den Grund zu gehen.

 

Zusammenfassung des Thread nach intensiven Tests mit memtest86:

 

Mein Fazit:

"Therefore it might be that the operating system loggs few corrected ECC Errors after cold boot - that`s it. Right?"

 

Einschätzung von metest86 Moderator:

"That is our understanding of the issue yes. But it depends on what comes first in the boot process. Writing to the RAM, or reading errors from the memory controller.
Ultimately it is a BIOS bug however and the vendor (Kontron / Fujitsu) should fix it."

 

Habe jetzt Kontron um einen BIOS-Update  gebeten.

 

PS: im True-NAS-Forum wird auch über das Problem berichtet unter community/threads/how-to-eliminate-the-culprit-of-my-bad-build.110557/

 

 

 

  • Upvote 3
Link to comment
  • 2 months later...
On 8/28/2023 at 12:28 PM, UrRa_346798ze said:

Zusammenfassung des Thread nach intensiven Tests mit memtest86:

 

Mein Fazit:

"Therefore it might be that the operating system loggs few corrected ECC Errors after cold boot - that`s it. Right?"

 

Einschätzung von metest86 Moderator:

"That is our understanding of the issue yes. But it depends on what comes first in the boot process. Writing to the RAM, or reading errors from the memory controller.
Ultimately it is a BIOS bug however and the vendor (Kontron / Fujitsu) should fix it."

 

Habe jetzt Kontron um einen BIOS-Update  gebeten.

 

PS: im True-NAS-Forum wird auch über das Problem berichtet unter community/threads/how-to-eliminate-the-culprit-of-my-bad-build.110557/

 

 

 

 

Ich bekomme mit dem selben Board, i3-8100 und 2x Kingston KSM26ED8/32HC das selbe Fehlerbild. Kann man das ganze dann einfach ignorieren bis Kontron es evtl. mal fixt oder hat es Auswirkungen auf die ECC Funktionalität?

Link to comment
  • 3 months later...

Das Mainboard ist ja wieder erhältlich. Ich frage mich eigentlich eine Sache: wenn es sich um ein Bios-Bug handelt, wie kann es sein, dass die Nutzer der früheren Mainboards über keine solche Fehler berichtet hatten? Entweder hat sich etwas an der Hardware geändert oder sie haben niemals richtig einen memtest laufen lassen. Denn ich hatte auch ältere Bios eingespielt und das Ergebnis war immer gleich.

 

Und auf die Frage des letzten Teilnehmers einzugehen: ignorieren kann man das natürlich schon, mir wäre es wahrscheinlich niemals aufgefallen, hätte ich damals nciht mit Truenas angefangen (bin sowieso auf eine andere Lösung umgestiegen) und Truenas hat mir halt den Bildschirm nach dem Boot mit den ECC-Fehlern vollgeknallt. Ich finde alleine das super nervig.

Edited by ServerUngeek
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...