Skip to content
View in the app

A better way to browse. Learn more.

Unraid

A full-screen app on your home screen with push notifications, badges and more.

To install this app on iOS and iPadOS
  1. Tap the Share icon in Safari
  2. Scroll the menu and tap Add to Home Screen.
  3. Tap Add in the top-right corner.
To install this app on Android
  1. Tap the 3-dot menu (⋮) in the top-right corner of the browser.
  2. Tap Add to Home screen or Install app.
  3. Confirm by tapping Install.

Unraid startet immer mal neu

Featured Replies

Hallo, ich habe schon einige Zeit einen Unraid Server am laufen. Leider macht dieser nach ein paar Stunden (zwischen 2 und 15 immer wieder einen Neustart. 

 

Die Neustarts traten schon vor einigen Tagen auf. Ein Aktualisierung auf 7.0.0 brachte keine Abhilfe.

 

Hardware: Gigabyte Technology Co., Ltd. Z790 UD AX

CPU: i5-14500

RAM: 64 GiB DDR5

mehrere ASM1166 erweiterungskraten

25 HDDs

und 4 Cache Laufwerke in 2 Pools

 

darauf laufen ca. 16 Docker Container

die VM's und alle Plugins habe ich schon deaktiviert (ausser Community)

 

Die letzten Einträge im Log vor dem Neustart sind :

 

Jan 15 04:54:26 ServerDaniel emhttpd: read SMART /dev/sdz
Jan 15 04:54:53 ServerDaniel emhttpd: spinning down /dev/sdx
Jan 15 04:54:55 ServerDaniel emhttpd: read SMART /dev/sdr
Jan 15 04:57:46 ServerDaniel kernel: __vm_enough_memory: pid: 3016165, comm: PMS Butler, not enough memory for the allocation
Jan 15 04:57:46 ServerDaniel kernel: __vm_enough_memory: pid: 3016165, comm: PMS Butler, not enough memory for the allocation
Jan 15 04:57:46 ServerDaniel kernel: PMS Butler[3016165]: segfault at 646e756f4668 ip 000014cf6420bd0f sp 000014cf5ae063d8 error 4 in ld-musl-x86_64.so.1[14cf641c4000+53000] likely on CPU 1 (core 0, socket 0)
Jan 15 04:57:46 ServerDaniel kernel: Code: 00 00 00 48 8b 44 24 f8 48 89 47 20 0f 28 44 24 e8 0f 11 47 10 0f 28 44 24 d8 0f 11 07 48 85 f6 74 05 8b 06 89 47 10 31 c0 c3 <f6> 47 10 0f 75 10 b9 10 00 00 00 31 c0 f0 0f b1 0f 9b 85 c0 74 07
Jan 15 05:00:01 ServerDaniel crond[2630]: exit status 127 from user root /usr/local/emhttp/plugins/tips.and.tweaks/scripts/rc.tweaks set_turbo on &> /dev/null
Jan 15 05:03:37 ServerDaniel emhttpd: spinning down /dev/sdt
Jan 15 05:09:04 ServerDaniel emhttpd: spinning down /dev/sdh
Jan 15 05:09:20 ServerDaniel emhttpd: spinning down /dev/sdl
Jan 15 05:09:45 ServerDaniel emhttpd: spinning down /dev/sdm
Jan 15 05:09:51 ServerDaniel emhttpd: spinning down /dev/sdf
Jan 15 05:09:56 ServerDaniel emhttpd: spinning down /dev/sdy
Jan 15 05:10:12 ServerDaniel emhttpd: spinning down /dev/sdr
Jan 15 05:10:17 ServerDaniel emhttpd: spinning down /dev/sdk
 

Anbei noch die Diagnostic. Vielleicht kann jemand helfen.

 

serverdaniel-diagnostics-20250115-0719.zip

Edited by dw131

Solved by dw131

20 minutes ago, dw131 said:

Anbei noch die Diagnostic. Vielleicht kann jemand helfen.

 

harte Neustarts sind (leider) in der Regel Hardware Themen welche fast nicht "softwareseitig" zu finden sind, sprich, logs und co helfen da meist nicht ...

 

einzige Fehler wo man sieht

 

Jan 15 04:31:33 ServerDaniel kernel: traps: PMS Butler[2243716] general protection fault ip:1501f1d70d0f sp:1501e14c03d8 error:0 in ld-musl-x86_64.so.1[1501f1d29000+53000]
Jan 15 04:45:18 ServerDaniel kernel: PMS Butler[2947023]: segfault at 69 ip 000014ca4a869d0f sp 000014ca409873d8 error 4 in ld-musl-x86_64.so.1[14ca4a822000+53000] likely on CPU 13 (core 25, socket 0)
Jan 15 04:57:46 ServerDaniel kernel: PMS Butler[3016165]: segfault at 646e756f4668 ip 000014cf6420bd0f sp 000014cf5ae063d8 error 4 in ld-musl-x86_64.so.1[14cf641c4000+53000] likely on CPU 1 (core 0, socket 0)

@JorgeB may a hint what this could be ?

 

ansonsten wird das schwierig ... Standards wie

 

memtest

cpustress Tests

PSU noch ausreichend, noch voll funktionsfähig ...

Hardware abziehen und laufen lassen

kurz, langer Weg ... viel Trial & Error mit Hardware tauschen, testen, testen, testen, ...

 

dann hast du powertop aktiv, würde ich auch mal deaktivieren, manche Hardware mag das einfach nicht wirklich ... gerade bei so einem breiten Sys ...

 

beispielsweise der Controller mag das meist gar nicht

06:00.0 SATA controller [0106]: ASMedia Technology Inc. ASM1064 Serial ATA Controller [1b21:1064] (rev 02)
	Subsystem: ZyDAS Technology Corp. Device [2116:2116]
	Kernel driver in use: ahci
	Kernel modules: ahci

 

sorry ... aber das wird schwer

  • Author

OK ich werde verschiedene Dinge versuchen und mich einlesen. Kann man wenigstens irgendwo ausschalten, dass nach einem Absturz ein Parity Check durchgeführt wird? Der läuft dann nämlich in Dauerschleife wenn ich den Neustart nicht mitbekomme...

 

Den ASM1064 hatte ich auch schon im Verdacht. Ich habe mit jetzt schon zum testen eine ASM1166 für pci x1 bestellt mal sehen...

Edited by dw131

5 minutes ago, dw131 said:

Kann man wenigstens irgendwo ausschalten, dass nach einem Absturz ein Parity Check durchgeführt wird?

abbrechen ...

 

dazu, parity tuning installieren und Regeln einstellen wann dieser nur zu erfolgen hat (wird dann pausiert) sodass du dann abbrechen kannst da du ja nicht perm davor sitzt ;)

 

sollte man aber NUR machen wenn man sich sicher ist das während eines Crashes nichts auf das array geschrieben wurde.

2 hours ago, alturismo said:

may a hint what this could be ?

 

Difficult to say, I would start with memtest, or since memtest is only definitive if it finds errors, and if there are multiple RAM sticks, run the server with just one, if the same try with a different one, that will basically rule out the RAM. 

  • Author

Memtest hat kein Ergebnis gebracht. Ich habe nochmal intensiv überlegt was ich denn geändert haben könnte, damit das Verhalten ausgelöst werden könnte. Mir ist eingefallen das ich SMB kurz bevor de Probleme losgingen aktiviert hatte. Habe es jetzt wieder deaktiviert. Bis jetzt läuft der Server. Ich berichte weiter..

 

 

EDIT: SMB war es schonmal nicht...

Edited by dw131

Immer wenn meine Rechner oder die von Freunden, Bakannten so ein Theater gemacht haben war es das Netzteil.
 

  • Author
On 1/16/2025 at 2:12 PM, mikiunraid said:

Immer wenn meine Rechner oder die von Freunden, Bakannten so ein Theater gemacht haben war es das Netzteil.
 

Ich habe jetzt erstmal meine USV außer Betrieb genommen. Jetzt läuft der Server schon 24 Stunden. Die hatte ich eigentlich ausgeschlossen, weil ich noch andere Geräte dran hatte, welche keine Probleme gemacht haben. Komische Sache.

  • Author
  • Solution

USV war es nicht. Reboot nach 2 Tagen, jetzt tausche ich das Netzteil und danach das Board.

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

Account

Navigation

Search

Search

Configure browser push notifications

Chrome (Android)
  1. Tap the lock icon next to the address bar.
  2. Tap Permissions → Notifications.
  3. Adjust your preference.
Chrome (Desktop)
  1. Click the padlock icon in the address bar.
  2. Select Site settings.
  3. Find Notifications and adjust your preference.