Probleme mit SAS Controller


Recommended Posts

Hallo,

 

beim Booten meines Unraid Server (v6.9.2, Supermicro X8DT3) aus dem ausgeschalteten Zustand passiert es immer wieder, dass keine der SATA-HDDs erkannt wird. Wenn ich dann nochmals reboote (also warm reboot) werden die HDDs fast immer erkannt. Das ganze passiert mir bei drei Controllern, von denen der aktuelle ein "Broadcom / LSI SAS2308 PCI-Express Fusion-MPT SAS-2 (rev 05)" ist. Die anderen beiden habe ich wieder ausgebaut.

 

Hat jemand ein ähnliches Phänomen? Irgendeine Idee, woran das Problem liegen könnte? Danke für die Hilfe! :)

unraid-diagnostics-20210511-2055.zip

Link to comment

Was genau sind das für Controller-Karten?

 

Bei Dir im syslog steht

mpt2sas_cm0: LSISAS2308: FWVersion(20.00.07.00), ChipRevision(0x05), BiosVersion(07.39.02.00)

 

...aber wenn ich den Basis LSISAS2308 bei Broadcom anschaue, ist Dein BIOS älter, aber die Firmware neuer als die letzte: https://www.broadcom.com/products/storage/host-bus-adapters/sas-9300-8i

Ist der Original oder wurde mal geflasht, wenn ja womit?...sieht ja fast aus wie einen SAS2 Firmware auf einem SAS3 Controller

 

Edit: OK, ist ein LSI SAS 2 9207-8i (steht in der system/lspci.xt).

Dann ist das zumindest nicht falsch, P20-Firmware und BIOS.

 

Bootest Du mit UEFI Bios und CMS-Mode aktiv?

Was ist, wenn Du das CMS-Option an/aus schaltest?

 

Edited by Ford Prefect
Link to comment

Danke, Fort Prefect! Das Board ist ein Supermicro X8DT3-LN4F, das kann noch kein UEFI.

 

Ich werde die nächsten Tage mal die SAS Controller durchwechseln und werde das dann posten.

 

Ich habe aber irgendwie die Befürchtung, dass es ein Problem zwischen Motherboard und SAS Controller ist, weil das Problem nur selten auftritt (30%?), nur nach einem Kaltstart auftritt, dafür aber bei drei SAS Controllern.

 

Hast Du noch eine Idee, was ich probieren kann?

Link to comment

...Andere Slots durchprobiert und Energiesparen bzw ASPM auf aus, für PCIe.

Ausserdem Fast-Boot usw beim Kaltstart deaktivieren und das Standard Post Programm zulassen.

Es fehlen nur die Disks? Der Controller postet aber beim Kaltstart? Wenn, dann im Controller BIOS evtl. nach Timings suchen und zB staggered spinup/ spinup groups aktivieren.
Evtl. Braucht das System einfach mehr Zeit zum aufwachen....

Gesendet von meinem SM-G960F mit Tapatalk

  • Thanks 1
Link to comment
On 5/12/2021 at 9:11 PM, Ford Prefect said:

@Raki72 das MB hat doch einen on-board SAS (1068E)?...ist der deaktiviert? : https://www.thomas-krenn.com/de/wiki/X8DT3-F_SAS_Raid

 

Ja, den hab ich jetzt auch per Jumper deaktiviert. War vorher an. Das hat leider auch nichts gebracht. Aaaaaber...

 

Ich habe alle deine Tipps befolgt (anderer Slot, Quick POST, Power Savings, Timings hoch) und war dann so genervt, als es noch immer nichts gebracht hat, dass ich QPI aus Neugierde auf slow gesetzt habe. Zumindest weiss ich jetzt, dass das einen Server wirklich sehr langsam macht. 😉

Aber egal, nachdem ich QPI wieder auf Fast gesetzt hatte, scheint irgendwas "Klick" gemacht zu haben. Der POST, den ich schon vorher von Quick auf Normal umgestellt hatte, zeigte auf einmal einen Memory Test an (also das langsame Hochzählen auf 96 GB RAM). Es taucht auch direkt vor dem Boot Prompt auf einmal eine Zusammenfassung aller PCI Devices auf. Wie schon gesagt, ich hatte den POST schon Tage vorher umgestellt und hatte auch schon mehrfach Strom ein/aus, Delete NVRAM und BIOS Settings auf Optimized oder Fails Safe gestellt. Aber erst nach dem QPI Wechsel scheint das BIOS kapiert zu haben, dass es sich komplett reseten soll.

 

Seither gehen auch der Controller und alle HDDs immer an, egal ob nach Strom aus oder nach einem Warm Reboot.

 

Also, das Ganze ist irgendwie schwer nachzuvollziehen. Aber es funktioniert jetzt. Ich werde mir noch die Arbeit machen und die BIOS Settings vorher / nachher vergleichen und wenn ich irgendwas interessantes finde, poste ich es hier.

 

@Ford Prefect Vielen Dank für die Hilfe! 👍

Link to comment
  • 3 weeks later...

Also, jetzt hab ich das Problem wirklich gelöst.

 

Durch die vorher genannten Massnahmen habe ich die Wahrscheinlichkeit, dass der SAS Controller beim Booten hängen bleibt von 50% auf 10% reduzieren können. Schön war das aber trotzdem nicht. Also bin ich heute nochmals tiefer in die Materie eingestiegen und festgestellt, dass diese Problem wohl nur bei Multi-CPU Systemen mit vielen HDDs auftritt: https://techreport.com/forums/viewtopic.php?t=121373#p1391884

 

Das Problem war dann mit einem beherzten "sas2flash -o -e 5" schnell gelöst. Damit habe ich den Boot-Teil der Firmware des SAS-Controllers gelöscht und seither gibt es 0% Bootprobleme. SIEG! 😁

  • Thanks 1
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.