Hardware errors im log...


DerTom

Recommended Posts

Hallo zusammen,

durch 'Fix Common Problems' wurde ich soeben auf Fehlermeldungen zu meinem Server aufmerksam gemacht. 

Das sind die entsprechenden Einträge im log:

 

Jan  6 18:55:52 Halut kernel: pcieport 0000:00:01.3: AER: Corrected error received: 0000:10:00.0
Jan  6 18:55:52 Halut kernel: nvme 0000:10:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
Jan  6 18:55:52 Halut kernel: nvme 0000:10:00.0:   device [15b7:5011] error status/mask=00000001/0000e000

Jan  8 02:51:51 Halut kernel: mce: [Hardware Error]: Machine check events logged
Jan  8 02:51:51 Halut kernel: [Hardware Error]: Corrected error, no action required.
Jan  8 02:51:51 Halut kernel: [Hardware Error]: CPU:1 (19:21:2) MC13_STATUS[Over|CE|MiscV|AddrV|-|-|CECC|-|Poison|-]: 0xccccccccc35d5b00
Jan  8 02:51:51 Halut kernel: [Hardware Error]: Error Addr: 0x0000000000000000
Jan  8 02:51:51 Halut kernel: [Hardware Error]: IPID: 0x0000000000000000
Jan  8 02:51:51 Halut kernel: [Hardware Error]: Bank 13 is reserved.
Jan  8 02:51:51 Halut kernel: [Hardware Error]: cache level: RESV, tx: INSN

Jan  8 04:30:06 Halut root: Fix Common Problems: Error: Machine Check Events detected on your server ** Ignored
Jan  8 04:30:06 Halut root: mcelog: ERROR: AMD Processor family 25: mcelog does not support this processor.  Please use the edac_mce_amd module instead.

 

Wenn ich die Meldungen richtig verstehe, dann handelt es sich um Fehler, die bereits entsprechend korrigiert wurden und ich somit nicht tätig werden muss. Ist diese Wertung so richtig?

Viele Grüße!

Link to comment
5 minutes ago, DerTom said:
Jan  6 18:55:52 Halut kernel: pcieport 0000:00:01.3: AER: Corrected error received: 0000:10:00.0
Jan  6 18:55:52 Halut kernel: nvme 0000:10:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
Jan  6 18:55:52 Halut kernel: nvme 0000:10:00.0:   device [15b7:5011] error status/mask=00000001/0000e000

Der part ist ein Fehler im Stromsparmodus deiner eingesetzten NVME (ich vermute Mal eine Western Digital?)

Das hatten wir hier schon:

https://forums.unraid.net/topic/121146-nvme-aer-corrected-error-und-pcie-bus-error/?do=findComment&comment=1108543

Link to comment
54 minutes ago, jj1987 said:

Der part ist ein Fehler im Stromsparmodus deiner eingesetzten NVME (ich vermute Mal eine Western Digital?)

Das hatten wir hier schon:

https://forums.unraid.net/topic/121146-nvme-aer-corrected-error-und-pcie-bus-error/?do=findComment&comment=1108543

Hallo @jj1987

vielen Dank für den Link. Habe mal die Firmware der (ja tatsächlich) WD NVME aktualisiert. Mal abwarten...

Link to comment

Es handelt sich um eine WD Black SN850. Die neue Firmware hat leider nicht so viel gebracht - Fehler ist wieder da.

Ich werde also mal schauen müssen, was in den Thread, den jj1987 genannt hat, noch  als Lösung angeboten wird. 

Zur Hardware:
Ryzen 9 5950x

ASRock x570 taichi

64 GB ECC RAM

RX5700

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.