Jump to content

Unraid friert ein und ist nicht mehr erreichbar.


VK28.01
Go to solution Solved by alturismo,

Recommended Posts

Hallo,

ich habe seit ein paar Tagen das Thema, dass der Unraid Server (6.12.2) in unregelmäßigen Abständen einfriert und nicht mehr zu erreichen ist; weder über die GUI erreichbar, noch via Terminal gepingt werden kann. Resette ich ihn, moppert er beim ersten Start beim Start von Container herum; insbesondere Nginx meldet beim Aufruf von Vaultwarden "bad Gateway".

Ein weiterer Reset löst das Docker-Problem bis zum nächsten Absturz.

Da ich eine Fritz!Box habe (die ich nicht tauschen kann), läuft Docker auf macvlan.

Vor den Wechsel auf 6.12 hatte ich keine derartigen Probleme.  

 

Ich habe im Log folgende Warnungen bzw. Fehler gefunden:

gestern:

Jul  4 18:14:07 Tower kernel: BTRFS info (device loop2): using crc32c (crc32c-intel) checksum algorithm

Jul  4 18:14:07 Tower kernel: BTRFS info (device loop2): using free space tree

Jul  4 18:14:07 Tower root: mount: /var/lib/docker: can't read superblock on /dev/loop2.

Jul  4 18:14:07 Tower root:        dmesg(1) may have more information after failed mount system call.

Jul  4 18:14:07 Tower root: mount error

Jul  4 18:14:07 Tower kernel: BTRFS info (device loop2): enabling ssd optimizations

Jul  4 18:14:07 Tower kernel: BTRFS info (device loop2): start tree-log replay

Jul  4 18:14:07 Tower kernel: BTRFS warning (device loop2): log replay required on RO media

Jul  4 18:14:07 Tower kernel: BTRFS error (device loop2): open_ctree failed

Jul  4 18:14:07 Tower emhttpd: shcmd (52854): exit status: 1

 

heute:

Jul  5 17:17:27 Tower kernel: docker0: port 5(veth49b268b) entered blocking state

Jul  5 17:17:27 Tower kernel: docker0: port 5(veth49b268b) entered forwarding state

Jul  5 17:17:40 Tower kernel: pcieport 0000:00:1c.4: AER: Corrected error received: 0000:00:1c.4

Jul  5 17:17:40 Tower kernel: pcieport 0000:00:1c.4: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)

Jul  5 17:17:40 Tower kernel: pcieport 0000:00:1c.4:   device [8086:a394] error status/mask=00000001/00002000

Jul  5 17:17:40 Tower kernel: pcieport 0000:00:1c.4:    [ 0] RxErr                 

Jul  5 17:21:15 Tower ool www[26466]: /usr/local/emhttp/plugins/dynamix/scripts/rsyslog_config

Jul  5 17:21:17 Tower rsyslogd: [origin software="rsyslogd" swVersion="8.2102.0" x-pid="26575" x-info="https://www.rsyslog.com"] start

Jul  5 17:21:38 Tower kernel: pcieport 0000:00:1c.4: AER: Corrected error received: 0000:00:1c.4

Jul  5 17:21:38 Tower kernel: pcieport 0000:00:1c.4: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)

Jul  5 17:21:38 Tower kernel: pcieport 0000:00:1c.4:   device [8086:a394] error status/mask=00000001/00002000

Jul  5 17:21:38 Tower kernel: pcieport 0000:00:1c.4:    [ 0] RxErr   

 

Anbei auch noch ein Sylog, indem ich aber nichts relevantes sehe.

 

Ich habe derweil das Dockimage neu angelegt und den USB Port auf einen 2.0 Port gewechselt. Ohne Erfolg.

 

Der PCI-Bus Fehler oben gibt mir zu denken, da ich vor ein paar Wochen einen 2.5Ethernet-PCI Karte eingebaut habe....aber das ist auch nur stochern im Neben

 

 

 

 

 

 

 

 

Bildschirmfoto 2023-07-05 um 17.41.43.png

syslog-20230705-172532.txt

Link to comment
  • Solution
53 minutes ago, VK28.01 said:

Anbei auch noch ein Sylog, indem ich aber nichts relevantes sehe.

 

 

dein Problem fängt auch hier an ...

 

Jul  5 17:13:45 Tower kernel: ------------[ cut here ]------------
Jul  5 17:13:45 Tower kernel: WARNING: CPU: 6 PID: 743 at net/netfilter/nf_conntrack_core.c:1210 __nf_conntrack_confirm+0xa4/0x2b0 [nf_conntrack]
Jul  5 17:13:45 Tower kernel: Modules linked in: veth macvlan xt_nat xt_tcpudp xt_conntrack xt_MASQUERADE nf_conntrack_netlink nfnetlink xfrm_user xfrm_algo iptable_nat nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 xt_addrtype br_netfilter xfs dm_crypt dm_mod md_mod zfs(PO) zunicode(PO) zzstd(O) zlua(O) zavl(PO) icp(PO) zcommon(PO) znvpair(PO) spl(O) bluetooth ecdh_generic ecc tcp_diag inet_diag nct6775 nct6775_core hwmon_vid ip6table_filter ip6_tables iptable_filter ip_tables x_tables efivarfs bridge stp llc i915 x86_pkg_temp_thermal intel_powerclamp coretemp kvm_intel kvm crct10dif_pclmul crc32_pclmul crc32c_intel ghash_clmulni_intel sha512_ssse3 iosf_mbi drm_buddy i2c_algo_bit ttm aesni_intel drm_display_helper crypto_simd cryptd rapl mei_hdcp mei_pxp drm_kms_helper wmi_bmof mxm_wmi intel_cstate drm intel_uncore intel_gtt r8169 ftdi_sio agpgart i2c_i801 mei_me ahci syscopyarea i2c_smbus sysfillrect sysimgblt mei i2c_core usbserial libahci realtek fb_sys_fops thermal fan video wmi backlight

 und endet entweder aktuell im downgrade zu 6.11 oder docker br0 aufgeben und alle in die bridge, ipvlan umstellen ...

Link to comment
9 hours ago, VK28.01 said:

Hoffentlich löst ein baldiges Update das Problem.

Achtung, Ironie an: Nene... Unraid macht alles richtig. Es liegt an allen anderen. DIE müssen sich anpassen ;) 

Bin echt mal gespannt... Aber ich bekam hier auch schon zu hören: Geht doch alles, stell halt auf ipvlan um.

 

Ärger mich über mich selbst das bescheuerte Update durchgeführt zu haben. Vorallem, weil ich danach die Docker geupdated habe. Komm nur noch mit viel Aufwand wieder auf die super funktionierende 6.11.5 zurück. Jetzt leb ich halt mit ipvlan!

Werd evtl unraid wieder sterben lassen und geh zurück zu qnap.

Link to comment

@warp760

Aber wenn es dich doch so sehr stört, warum machst du dann keinen Bugreport auf?

Hier in der deutschen Sektion versucht die Community zu helfen. Die Mods geben beistimmt auch einiges weiter, aber es wird eher gesehen wenn ein offizieller Thread aufgemacht wird.

Mit allen Angaben die benötigt werden. 

Es bringt nichts wenn man sich ständig beschwert und droht wieder zu QNAP zu wechseln.

Im richtigen Leben bringt es auch nichts die Probleme seinen Freunden zu erzählen, sondern man muss damit auch zum Handwerker/Hersteller/etc.

  • Like 1
Link to comment

Zumal ja offensichtlich auch Unify Probleme mit IPVLAN hat. Da sollte "man" dann vielleicht auch einen Bug Report aufmachen. Bislang war das ja nur in Zusammenhang mit AVM bekannt, die da aber leider offensichtlich keinen Handlungsbedarf sehen...

Edited by jj1987
Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...