Skip to content
View in the app

A better way to browse. Learn more.

Unraid

A full-screen app on your home screen with push notifications, badges and more.

To install this app on iOS and iPadOS
  1. Tap the Share icon in Safari
  2. Scroll the menu and tap Add to Home Screen.
  3. Tap Add in the top-right corner.
To install this app on Android
  1. Tap the 3-dot menu (⋮) in the top-right corner of the browser.
  2. Tap Add to Home screen or Install app.
  3. Confirm by tapping Install.

Bitte um Hilfe bei Crashs/Freezes!

Featured Replies

Hallo Community,

mein System leidet seit Tagen an Freezes und Abstürzen. Ich hatte das problem auf eine array disk mit btrfs fehlern eingegrenzt. Habe das Array neu aufgesetzt und spiele die Daten von den alten btrfs disks auf Neue mit xfs. Wenn ich von einer der alten disks kopiere kommt immer nach einer unterschiedliche zeitspanne call traces. Dann friert das System ein und ist nicht mehr erreichbar. Da hilft dann nur noch hard reset.

Ich hoffe ihr könnt mit den Infos etwas anfangen und mir bei meinen problemen behilflich sein!

hightower-diagnostics-20241101-2239.zip

Solved by alturismo

  • Community Expert
28 minutes ago, kannbert101 said:

mein System leidet seit Tagen an Freezes

 

Was bedeutet das? EInfreiren udn auch nach längerer Zeit (halbe Stunde) keinerlei weitere Reaktion   oder "ruckelt" es bei der Bearbeitung nur und geht nach einiger Zeit (normal?) weiter?

 

28 minutes ago, kannbert101 said:

und Abstürzen.

Was meinst Du damit?

PC aus? PC rebootet neu? PC scheint sich einfach nicht mehr zu 'bewegen' (siehe oben auch Frage zu Freezes und wieviel Zeit wurde gewartet?)

Kann auf einem lokal angeschlossenen Monitor noch etwas gesehen werden, wenn man auf einer lokal angeschlossenen Tastatur mal Return oder Leertaste drückt?

Drehen die Lüfter ungewöhnlich stark hoch?

Zeigen die Festplatten LED(S) Aktivität an?

 

Abstürze sind blöd. Wenn es wirklich ein absturz ist (keinerlei PC Reaktion mehr, stehende Bildschirmanzeige, Tastendrücke (abgesehen von Reset oder Powertaster) bewirken gar nichts...) kann das auch auf ein Hardwareproblem hindeuten.

 

28 minutes ago, kannbert101 said:

Ich hatte das problem auf eine array disk mit btrfs fehlern eingegrenzt. Habe das Array neu aufgesetzt und spiele die Daten von den alten btrfs disks auf Neue mit xfs.

...Dann friert das System ein und ist nicht mehr erreichbar. Da hilft dann nur noch hard reset.

 

Also auch lokal nichts zu sehen auf dem Monitor und auf lokalen Tastendruck der Tastatur auch nichts?

Was zeigt der lokale Bildschim an?

 

 

Zu Deiner DIagnostics:

 

Hast Du die alte btrfs Disk nicht zwischenzeitlich versucht zu reparieren?

 

Ich lese im LOG:

"Nov  1 21:44:21 Hightower kernel: BTRFS info (device sdc1): bdev /dev/sdc1 errs: wr 0, rd 0, flush 0, corrupt 4, gen 0"
 

Corrupt 4 deutet für mich darauf hin,. daß die btrfs Struktur noch nicht (wieder) 100%ig okay ist.

Ich weiß nicht, ob das Deine Freezes verursacht, aber sowas kann ggf. schon mal bremsen.

 

Mit dieser Meldung kann ich nichts anfangen, klingt aber nicht gesund:

"Nov  1 21:35:53 Hightower root: error: /plugins/usb_manager/USBDevices.php: wrong csrf_token
### [PREVIOUS LINE REPEATED 3 TIMES] ###"

 

 

Deine Syslog scheint übrigens recht frisch zu sein.

Vielleicht hilft es, wenn Du den Syslog Mirror mal das Log auf den Stick schreiben läßt und nach einem solcher Freezes/Abstürzen dann das dort gesicherte Log hier mal mitlieferst. Dann kann man vielleicht mehr sehen, was da kurz vor dem "Crash" passiert ist.

 

  • Author

Hallo DataCollector,

danke für die schnelle Antwort.

 

Hatte gerade wieder ein Freeze

 

26 minutes ago, DataCollector said:

Was bedeutet das? EInfreiren udn auch nach längerer Zeit (halbe Stunde) keinerlei weitere Reaktion

Ja, das System friert ein und zeigt keine Reaktionn.

 

27 minutes ago, DataCollector said:

Abstürze sind blöd. Wenn es wirklich ein absturz ist (keinerlei PC Reaktion mehr, stehende Bildschirmanzeige, Tastendrücke (abgesehen von Reset oder Powertaster) bewirken gar nichts...) kann das auch auf ein Hardwareproblem hindeuten.

Genau diese Symptome habe ich.

 

Die defekte btrfs disk (sdc) habe ich aus dem array genommen. Ist aber noch angeschlossen, jedoch nicht gemountet.

 

Anbei auch die langzeit syslog. Hoffe es hilft.

 

 

syslog-127.0.0.1 (1).log syslog-127.0.0.1(2).log

  • Community Expert
24 minutes ago, kannbert101 said:

Die defekte btrfs disk (sdc) habe ich aus dem array genommen. Ist aber noch angeschlossen, jedoch nicht gemountet.

 

Du hast die Disk also nicht repariert?

Wenn ich Deinen ursprünglichen Beitrag richtig verstanden habe, traten diese Probleme auf, wenn Du von dort ind Array kopierst.

Zumindest unter der Voraussetzung kann es durch Fehler im Dateisystem zu Problemen kommen.

 

 

24 minutes ago, kannbert101 said:

Anbei auch die langzeit syslog. Hoffe es hilft.

 

Wenn ich Deinen Zeitpunkt des Beitrages und die Syslog 2 Datei richtig interpretiere, hast Du den Freeze/Absturz wohl so gegeh 02.11.2024 01:15 Uhr gemerkt und dann resettet.

 

Ich kann auch mit den darauf vielen Call Trace nichts anfangen, aber eigentlich geht es ja auch um die Zeit davor. Und da sehe ich nichts auffälliges, außer, daß DIUch die App "Fix Common Problems" mit massig Warnungen beglücken will.

===

Nov  1 23:27:00 Hightower root: Fix Common Problems Version 2024.10.02
Nov  1 23:27:01 Hightower root: Fix Common Problems: Warning: Plugin Update Check not enabled
Nov  1 23:27:01 Hightower root: Fix Common Problems: Warning: Docker Update Check not enabled
Nov  1 23:27:01 Hightower root: Fix Common Problems: Warning: Plugin unassigned.devices.plg is not up to date
Nov  1 23:27:01 Hightower root: Fix Common Problems: Warning: No destination (browser / email / agents set for Warning level notifications
Nov  1 23:27:05 Hightower root: Fix Common Problems: Other Warning: Mover logging is enabled
Nov  1 23:27:06 Hightower root: Fix Common Problems: Other Warning: Background notifications not enabled
Nov  2 01:16:44 Hightower kernel: general protection fault, probably for non-canonical address 0xbfff8894ecbb5048: 0000 [#1] PREEMPT SMP NOPTI
Nov  2 01:16:44 Hightower kernel: CPU: 0 PID: 11223 Comm: tokio-runtime-w Tainted: P           O       6.1.106-Unraid #1
Nov  2 01:16:44 Hightower kernel: Hardware name: ASUS System Product Name/TUF GAMING Z790-PLUS WIFI, BIOS 0806 11/22/2022
===

 

Leider kann ich aber auch keinen wirklichen Grund sehen. Dazu bin ich wohl noch nicht bewandert genug. Sorry!

  • Solution
5 hours ago, kannbert101 said:

Ich hoffe ihr könnt mit den Infos etwas anfangen und mir bei meinen problemen behilflich sein!

 

naja ... beim koieren von btrfs zu array jetzt, da friert das Sys ein ..

 

mal ein paar Anmerkungen

 

du nutzt nen 13900k, aufgrund der ganzen Instabilitäten gab es sicherlich ein paar BIOS Updates ... und du nutzt eins von 2022, würde ich mal updaten ...

 

 ASUSTeK COMPUTER INC. - TUF GAMING Z790-PLUS WIFI
BIOS Information
	Vendor: American Megatrends Inc.
	Version: 0806
	Release Date: 11/22/2022

 

dabei auch rbar, above 4g und KEIN xmp einstellen

 

gerade im Zusammenhang da dein Plex Server auch rege in use ist ... und frigate und ... 

 

image.thumb.png.840c58f3c08884f654edbbcf9bfd676d.png

 

dann, du nutzt keinerlei hardware passthrough, warum setzt du dann diese settings ? Grund ?

 

pcie_acs_override=multifunction vfio_iommu_type1.allow_unsafe_interrupts=1

 

und wieso setzt du dies hier ? sind Geräte in aspm gegangen wo du nicht wolltest ?

 

pcie_aspm=off

 

und ja, jede Menge btrfs Fehler und call Traces

 

Oct 30 22:02:54 Hightower kernel: BTRFS warning (device sdh1): csum failed root 5 ino 99173 off 80054521856 csum 0x6c2811e3 expected csum 0x38a9583a mirror 1
Oct 30 22:02:54 Hightower kernel: BTRFS error (device sdh1): bdev /dev/sdh1 errs: wr 0, rd 0, flush 0, corrupt 13, gen 0
Oct 31 00:44:39 Hightower kernel: BUG: Bad page state in process rsync  pfn:39ecd0
Oct 31 00:44:39 Hightower kernel: page:00000000563be972 refcount:0 mapcount:0 mapping:000000008c91f512 index:0x1 pfn:0x39ecd0
Oct 31 00:44:39 Hightower kernel: invalid mapping:4000000000000000
...
..
.
Oct 31 00:44:39 Hightower kernel: Call Trace:
Oct 31 00:44:39 Hightower kernel: <TASK>
Oct 31 00:44:39 Hightower kernel: dump_stack_lvl+0x44/0x5c
Oct 31 00:44:39 Hightower kernel: bad_page+0xcc/0xe4
Oct 31 00:44:39 Hightower kernel: check_new_pages+0xb0/0xbc
Oct 31 00:44:39 Hightower kernel: __rmqueue_pcplist+0x2ea/0x472
Oct 31 00:44:39 Hightower kernel: ? post_alloc_hook+0x13/0x5f
...
..
.

 

dann schalte mal zumindest während dem debugging das mover logging aus ...

 

du verschiebst Unmengen an Daten, surveillance ... (Frigate) >> was auch recht sinnfrei ist, das belastet ja alles doppelt ... und warum hebst du die auf ?

das wird meist über ne separate disk gemacht und fertig ... frigate und ca. sind bekanntermaßen "Plattenfresser" ... dann schiebst du das Ganze noch ins array ...

 

Gleiches bei Bakups ... du erstellst mit UrBackup Win 11 Backups auf dem Cache um diese dann ins Array zu verschieben ... egal, 

 

so macht log reading nicht viel Spaß weil es unnötig viele Einträge hat.

 

BIOS Update machen, btrfs Stück für Stück lösen, vielleicht vorher die btrfs disks /dev/sdh scrubben, repair, .. könnte auch helfen.

  • Author

Hallo und ein riesen Dank an die schnellen Anmerkungen.

 

6 hours ago, alturismo said:

du nutzt nen 13900k, aufgrund der ganzen Instabilitäten gab es sicherlich ein paar BIOS Updates ... und du nutzt eins von 2022, würde ich mal updaten ...

Habe ich jetzt gemacht 😅

 

6 hours ago, alturismo said:

dann, du nutzt keinerlei hardware passthrough, warum setzt du dann diese settings ? Grund ?

 

pcie_acs_override=multifunction vfio_iommu_type1.allow_unsafe_interrupts=1

Ich hatte eine Winn 11 VM mit dGPU auf einer separaten SSD laufen. Wegen der Instabilitäten habe ich diese in einen anderen PC geschoben, damit ich damit arbeiten kann.

 

6 hours ago, alturismo said:

und wieso setzt du dies hier ? sind Geräte in aspm gegangen wo du nicht wolltest ?

 

pcie_aspm=off

Ich hatte vor ca. einem halben Jahr schon einmal leichte Instabilitäten. Ich habe mir eingebildet damit lief es ohne Probleme. Kann auch das MACVLAN Problem gewesen sein. Jedenfalls lief es damit stabiler. Jedoch war das System meist unter "Volllast" mit ca 250-400W.

Aber immerhin stabil 🙃!

 

6 hours ago, alturismo said:

du verschiebst Unmengen an Daten, surveillance ... (Frigate) >> was auch recht sinnfrei ist, das belastet ja alles doppelt ... und warum hebst du die auf ?

Habe eine retention von 30 Tagen. Da sammelt sich einiges an Daten in der Zeit. Meinst du die frigate aufnahmen besser auf eine separate disk außerhalb vom array?

 

6 hours ago, alturismo said:

BIOS Update machen, btrfs Stück für Stück lösen, vielleicht vorher die btrfs disks /dev/sdh scrubben, repair, .. könnte auch helfen.

das scrubbing läuft. Ich hatte das schon einmal probiert, jedoch kam es dabei auch zu solchen freezes.

  • Author

Scrubbing läuft. Die vormalige /dev/sdh ist jetzt die /dev/sdd. Dabei kamm diese Fehlermeldung:

 

Nov  2 12:29:44 Hightower nginx: 2024/11/02 12:29:44 [error] 30090#30090: *2921 upstream timed out (110: Connection timed out) while reading upstream, client: 192.168.20.33, server: , request: "GET /plugins/unassigned.devices/include/fsck.php?device=/dev/sdd1&fs=btrfs&luks=&serial=ST20000NM007D-3DJ103_ZVT5XDWG&mountpoint=/mnt/disks/ZVT5XDWG&check_type=ro&type=Done HTTP/1.1", upstream: "fastcgi://unix:/var/run/php5-fpm.sock:", host: "192.168.20.2", referrer: "http://192.168.20.2/Main"

29 minutes ago, kannbert101 said:

Habe eine retention von 30 Tagen. Da sammelt sich einiges an Daten in der Zeit. Meinst du die frigate aufnahmen besser auf eine separate disk außerhalb vom array?

 

 

Antwort von vorhin ändert sich nicht ... ;)

 

6 hours ago, alturismo said:

das wird meist über ne separate disk gemacht und fertig ... frigate und ca. sind bekanntermaßen "Plattenfresser" ... dann schiebst du das Ganze noch ins array ...

 

30 minutes ago, kannbert101 said:

Ich hatte eine Winn 11 VM mit dGPU auf einer separaten SSD laufen. Wegen der Instabilitäten habe ich diese in einen anderen PC geschoben, damit ich damit arbeiten kann.

 

und warum hast du es da gebraucht ? ... das ist ein Problemlöser ... um nicht zusagen ein "Hack" ... welcher Gruppen aufteilt die es so nicht gibt und dabei kann es gerne eher zu Problemen führen ... aber egal ... wird seine Gründe haben.

 

Gleiches gilt für aspm_off

 

30 minutes ago, kannbert101 said:

Scrubbing läuft. Die vormalige /dev/sdh ist jetzt die /dev/sdd. Dabei kamm diese Fehlermeldung:

 

das ist "nur" Webserver Thema ... wird ein socket oder so gerade nicht gepasst haben, Unraid webui ... hat jetzt nichts mit den crashes oder btrfs zu tun.

  • Author

Danke @alturismo!

Der Hinweis doch endlich mal ein BIOS Update zu machen hat die Probleme gelöst!

  • Author

Danke für die Info. Da werde ich wohl auch einen MemTest durchführen müssen. 

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

Account

Navigation

Search

Search

Configure browser push notifications

Chrome (Android)
  1. Tap the lock icon next to the address bar.
  2. Tap Permissions → Notifications.
  3. Adjust your preference.
Chrome (Desktop)
  1. Click the padlock icon in the address bar.
  2. Select Site settings.
  3. Find Notifications and adjust your preference.