Verbindungsabbrüche
-
Echt? Wie kann ich herausfinden, ob ein Hardwaredefekt vorliegt (die Herstellergarantie dürfte sehr bald zu Ende sein...)?
Ist ein Selbstbau aus einem Supermicro X11SBA-LN4F Board (hat eine integrierte N3700 CPU) mit 4GB Arbeitsspeicher.
-
x86 Hardware teste ich immer mit memtest86 und danach Prime, jeweils min. 48 Stunden.
Aber schau doch erst mal generell nach der Auslastung deiner Box/Prozesse/Packages.-Rico
-
Beim Arbeitsspeicher sieht gut aus: teilweise sind um die 60% frei und in den schlimmsten Fällen immer noch ca. 25% - dürfte also im Rahmen liegen?
Bei der CPU sehe ich so auf den ersten Blick keine Auffälligkeiten. Die Last ist recht konstant und dann kommt der Absturz.
Für mich sind aber die ganzen Werte, die unter Status/Monitoring/System-Processor ausgegeben werden recht unverständlich. Wo kann ich dessen Bedeutung nachlesen?Ansonsten habe ich hin und wieder per Kommandozeile mit "top" die Auslastung in bestimmten Situationen beobachtet. Normalerweise (also bei normalem täglichen Bedarf) werden so 70-90% Idle angezeigt. Um die CPU sehr gut auszulasten, muss man schon mal ordentlich was machen.
Packages habe ich von den anspruchsvollen lediglich pfBlocker und nTop, wobei der letztere seit 2-3 Monaten ausgeschaltet ist und nur bei Bedarf eingeschaltet und verwendet wird.
Ansonsten sind noch Acme, Avahi (aus), Cron (unbenutzt), openvpn-client-export, RRD_Summary, Shellcmd und Status_Traffic_Totals installiert. Ich denke mal, dass diese das System nicht wirklich beanpruchen dürften. -
Ich habe nochmal eine kleine Korrektur an der dhclient vorgenommen, die finale Version hier: 0_1547227517977_dhclient_20190111.zip
Hat aber mit deinem Box Absturz Thema nichts zu tun.-Rico
-
@Rico
Danke! Mal eine Frage: angenommen, durch deinen Patch würde die Sache tatsächlich besser werden, was passiert danach (außer der Tatsache, dass ich dir unendlich dankbar dafür wäre)?
Mit jedem Upgrade der pfSense könnte es ja dazu kommen, dass beim dhclient Neuerungen/Verbesserungen hinzukommen und die Datei geupdated wird. Ok, man könnte diese dann immer noch austauschen, aber irgendwann könnte auch mal ein Update kommen, wo die Datei nicht mehr kompatibel sein wird. Was dann?
Ich möchte eigentlich darauf hinaus, ob du dir nicht evtl. vorstellen könntest, deinen Patch an die pfSense Entwickler weiterzuleiten, damit dieser eingepflegt wird oder ist so etwas unüblich? -
Ein funktionierender Patch ist ja, da er sich aber auf das FreeBSD-src Repository bezieht meinen die Devs das muss von FreeBSD Seite gefixt werden, was vom Prinzip her ja auch korrekt ist.
Das FreeBSD-src Repository soll denke ich mal so weit wie möglich original bleiben, Änderungen kommen nur von FreeBSD selbst da rein (im Optimalfall).-Rico
-
@un1que said in Verbindungsabbrüche:
Ist ein Selbstbau aus einem Supermicro X11SBA-LN4F Board
Diese Supermicro Board hatte bis zur rev 1.01 arge Probleme mit der LAN-Ports 2-4!
Diese hängen an PCIe 2.0 x1. Eine optimale Lösung sieht meiner Meinung nach
anders aus.Spielt das o.g. das Problem hier eine Rolle?
LG
-
@rico said in Verbindungsabbrüche:
Ein funktionierender Patch ist ja, da er sich aber auf das FreeBSD-src Repository bezieht meinen die Devs das muss von FreeBSD Seite gefixt werden, was vom Prinzip her ja auch korrekt ist.
Das FreeBSD-src Repository soll denke ich mal so weit wie möglich original bleiben, Änderungen kommen nur von FreeBSD selbst da rein (im Optimalfall).-Rico
Dann lässt sich bei pfSense wohl tatsächlich nichts machen. Magst du vllt. deine Version des Patches bei FreeBSD hochladen (evtl. in den bereits existierenden Bug Report), wenn ich mit dem Testen fertig bin? Ich kann mich dort auch mal eben Registrieren und eine "Empfehlung" aussprechen, falls das die Sache irgendwie beschleunigen sollte (keine Ahnung wie das ganze funktioniert ).
@Gladius
Ja, die Probleme mit den ersten Revisionen des Supermicro Boards kenne ich, siehe hier: https://forum.netgate.com/topic/97216/ständige-verbindungsabbrüche-pfsense-hinter-kabelmodem
Aber ich habe damals ein Austauschboard der Rev. 1.02 bekommen.@gladius said in Verbindungsabbrüche:
Spielt das o.g. das Problem hier eine Rolle?
Ich glaube nicht. Schließlich bin ich nicht der einzige mit diesem Problem (siehe Anfang des Threads und hier). Das liegt auf jeden Fall daran, wie Unitymedia (evtl. auch andere Liberty Global ISP's) mit den DHCP Requests und deren Beantwortung umgeht (mehr dazu in dem o.g. Thread) und der Tatsache, dass man bei pfSense es nicht mit Boardmitteln fixen kann.
Oder meintest du mein Problem mit den sporadischen Abstürzen? -
Schaue doch erst mal ob es damit jetzt überhaupt stabil läuft, dann sehen wir weiter.
Eine Sorge nach der Anderen.-Rico
-
Hmm, habe heute wieder einen Absturz gehabt, das muss irgendwie zusammenhängen. Sowas kam zwar auch früher vor, aber definitiv nicht so oft. Damals, wenn’s hochkommt, 1 mal in einem, zwei, drei.... Monaten. Jetzt schon zum zweiten Mal innerhalb von 3 Tagen.
Was ich noch komisch finde, sind diese Einbrüche (kann jetzt aber nicht sagen, ob sie vor den "Manipulationen" am dhclient vorhanden waren):
V.a. der heutige zwischen ca. 5 und 8 Uhr, genau gegen Ende dieses Einbruches ist die pfSense neugestartet.Subjektiv kommt es mir jetzt vor, dass ab und zu das Internet für ein paar Sekunden ausfällt / unbenutzbar ist (evtl. genau zu diesen Zeiten?): die Seiten laden ohne Ende, Internetradio stoppt.
Hast du evtl. eine Idee, @Rico?
-
So langsam gehen mir auch die Ideen aus.
Aber tausche mal wieder zurück auf die original dhclient und schaue ob die Abstürze dann verschwiden.
Du hattest nun die letzte Version vom 11.01. genommen?-Rico
-
Ja, genau, nachdem mir die pfSense das letzte mal abgestürzt ist, habe ich zur Sicherheit nochmal die allerletzte Version heruntergeladen bzw. aufgespielt.
Ok, probiere ich gleich mal wieder mit der originalen.
-
@Rico
Leider tritt das Problem auch mit der originalen dhclient Datei auf, vllt. hat sich auch etwas "verstellt", jedenfalls kam das vorher -subjektiv gesehen- nicht so oft vor.Nun, irgendwas müsste ich ja jetzt tun, um das Problem mit den Abstürzen in den Griff zu bekommen. Habe ins Log des IPMI reingeschaut (frag mich nicht, wieso ich nicht früher darauf gekommen bin) und habe dort lauter solche Einträge gefunden:
BIOS POST Progress #0x00 BIOS POST Progress Error-Unrecoverable video controller failure. - Assertion
Eine solche Meldung kommt mit jedem Bootvorgang seit Mitte Dezember hinzu. Ich frage mich jedoch, ob das etwas kritisches darstellt (also z.B. auf einen Hardwaredefekt hinweist) oder eher Einstellungssache des BIOS ist? Im Internet finde ich leider nichts dazu…
P.S. Ach ja, habe gestern mal vorsichtshalber ein BIOS Update aufgespielt, k.A. ob’s was bringt. Mal sehen.
-
Wenn du wie beschrieben nur die dhclient Binary ausgetauscht hattest kann es daran 100% nicht liegen, wie sollte das etwas verstellen an System oder Config?
Zu dem Fehler mit dem Supermicro Board kann ich nichts sagen, kenne weder das Board noch diesen Fehler.
Hast du nicht eine andere Maschine zur Verfügung auf die du mal deine aktuelle pfSense Config recovern kannst?-Rico
-
@rico said in Verbindungsabbrüche:
Wenn du wie beschrieben nur die dhclient Binary ausgetauscht hattest kann es daran 100% nicht liegen, wie sollte das etwas verstellen an System oder Config?
Das ist mir durchaus bewusst und so meinte ich es auch nicht. Ich habe eher Richtung anderweitiger Installationen (Packages) oder sonstiger vorgenommener Einstellungen gedacht.
Zu dem Fehler mit dem Supermicro Board kann ich nichts sagen, kenne weder das Board noch diesen Fehler.
Ok, verstehe ich. Mal ein anderer Ansatz: sind die Beep-Töne, die beim Start auf Fehler hinweisen, einigermaßen universell? Bringt es etwas, wenn ich den Fehlercode poste?
Hast du nicht eine andere Maschine zur Verfügung auf die du mal deine aktuelle pfSense Config recovern kannst?
-Rico
Ähm, ich habe hier noch so ein ähnliches Board (jedoch mit nur einem Realtek NIC), evtl. könnte ich mir noch eine PCIe-Karte mit einem Intel-NIC besorgen... aber dann müsste ich viele Dinge umstrukturieren (LAN und WLAN laufen bei mir getrennt, über 2 NIC's).
Ich warte jetzt noch ein paar Tage bzw. bis zum nächsten Absturz, habe gestern nämlich noch RAM ausgetauscht, da ich hier passende und vor ein paar Monaten getestete Module rumliegen hatte.
-
Also mal davon abgesehen dass sich das zum Ende hin sehr nach HW Problemen liest, statt nach Software, wollte ich da noch möglichst kurz zwei drei Punkte loswerden:
@Rico Herzlichen Dank für den Einsatz und das Compilieren und mittesten. Das ist mehr Einsatz als so mancher zeigt, egal in welchem Subforum/Reddit. Da wird dann lieber über Devs gewettert.
Ansonsten hab ich auch viel halbe Wahrheiten gelesen. Dass in diesem Fall OPNsense da schneller reagiert hat, mag durchaus richtig (und gut!) sein. Ist allerdings auch wenig verwunderlich, da durch NL/DE als großes Verbreitungsgebiet da viel mehr Leute theoretisch testen könnten - und es vielleicht auch tun. Aber da bin ich auch enttäuscht von den Usern hier. Da wird über die Devs gescholten und gewettert, dass denen alles egal ist etc. etc. ohne mal über deren Prioritäten nachzudenken und die Tatsache, dass die das bei sich vielleicht schlicht nicht nachstellen konnten weil das wieder eine typische deutsche Baustelle ist/war? Und wenn man dann sowohl das Ticket wie auch Upstream einen Fix gefunden hat -> warum nicht einfach mal das Ticket aktualisieren und drauf hinweisen? Das Ticket war btw auf "Future Fix" geflaggt, weshalb es dann auch bei Bugs einer spezifischen Version nicht auftaucht. Aber anstatt sich die betroffenen vielleicht im Redmine anmelden und da reporten - lieber mal auf die Entwickler schimpfen. Ist irgendwie typisch deutsch geworden, diese Schimpferei. Schade das. Ich schreibe hier ausdrücklich niemanden spezifisch rein, denn es hätte jeder Betroffene, der einen der Threads gelesen hatte machen können. Hat aber niemand.
Lange Rede kurzer Sinn: Abwarten, ob es jemand vom Dev Team aufgreift, ich habe mit meinem Redmine Account gerade das Ticket aktualisiert und auch den Fix von FreeBSD verlinkt und darauf hingewiesen, dass es schön wäre, wenn das jemand in einen Snapshot bauen würde, damit man es für ein Future Release testen und ausrollen kann. Dann muss man das auch zukünftig nicht händisch bauen.
Ansonsten könnte theoretisch @Rico auch einen Pull Request einreichen - gebaut hat ers ja anscheinen schonmal ;) Wäre also einen Versuch wert und seis nur, dass mans ggf. als Kommentar aufs Ticket dazu schreibt, damit man das ganze Thema nochmal anschiebt. Wenn aber 2 Jahre lang auch niemand mehr auf das Ticket reagiert wundert mich nicht, dass das keine Priorität hatte.Grüße
Jens -
Da ich von dem Problem überhaupt nicht betroffen bin kann ich selbst leider nichts testen und habe von dem her auch keine Requests eingereicht oder weitere Kommentare geschrieben.
Da muss einer ran der das Problem hat, im Optimalfall ohne weitere Nebenkriegsschauplätze.-Rico
-
@Rico Geht mir leider - trotz Unitymedia ;) - auch so, daher kann ich da auch so gar nichts zu sagen. Leider. Und da der Patch auch Upstream nicht wirklich durch ist, halten die Entwickler erstmal die Füße still, da es schon einmal Probleme nach einem Patch des DHClients gab und das dann effektiv sehr viele betroffen hatte. Da kann ich Zurückhaltung schon verstehen, wenn man einen wichtigen Dienst auf WAN Seite nicht kaputt-patchen möchte. Schade, dass sich da auf das FreeBSD Ticket hin kaum was tut und die betroffene Menge anscheinend doch sehr gering ist.
-
@jegr said in Verbindungsabbrüche:
Also mal davon abgesehen dass sich das zum Ende hin sehr nach HW Problemen liest, statt nach Software
Nicht ganz korrekt. Das Problem mit dem DHCP Client ist schon mal ein Softwareproblem, was u.a. weiter oben durch mehrere Nutzer bestätigt wurde. Mein Hardwareproblem kam leider dazwischen, was für einige Irritationen sorgte, mehr nicht.
Ist aber hoffentlich nicht mehr relevant.@Rico Herzlichen Dank für den Einsatz und das Compilieren und mittesten. Das ist mehr Einsatz als so mancher zeigt, egal in welchem Subforum/Reddit.
Da gebe ich dir absolut Recht. @Rico ist mein Held und ich bin ihm unendlich dankbar, dass er sich als unbetroffener in diese Sache so reingehangen und mir eine Problemlösung angeboten hat.
Aber da bin ich auch enttäuscht von den Usern hier. Da wird über die Devs gescholten und gewettert, dass denen alles egal ist etc. etc. ohne mal über deren Prioritäten nachzudenken und die Tatsache, dass die das bei sich vielleicht schlicht nicht nachstellen konnten weil das wieder eine typische deutsche Baustelle ist/war?
Du magst Recht haben, ich habe einfach meinen Frust rausgelassen, weil mich das in den letzten (Feier-)Tagen so massiv geärgert hat und ich das Gefühl hatte, dass sich keiner dafür interessiert (was auch teilweise ja stimmt - wohl mehr tatsächlich aufgrund der Problematik, dass nur eine Handvoll Nutzer betroffen ist und sich dann auch kaum einer zu Wort meldet).
Das Problem bei mir persönlich ist einfach, dass ich die ganzen Prozesse der Softwareentwicklung, Bugmeldung und -behebung nicht wirklich verstehe und es mir unmöglich ist bei solch technischen Angelegenheiten auch noch in Englisch die Problemstellung zusammenzufassen und an der richtigen Stelle (redmine, FreeBSD) kundzutun bzw. generell bei solchen technischen Talks mitzumischen.Lange Rede kurzer Sinn: Abwarten, ob es jemand vom Dev Team aufgreift, ich habe mit meinem Redmine Account gerade das Ticket aktualisiert und auch den Fix von FreeBSD verlinkt und darauf hingewiesen, dass es schön wäre, wenn das jemand in einen Snapshot bauen würde, damit man es für ein Future Release testen und ausrollen kann. Dann muss man das auch zukünftig nicht händisch bauen.
Ich danke auch dir recht herzlich dafür, dass du die Möglichkeiten nutzt, um hier Hilfe zu organisieren. Nur leider sieht man, dass es unendlich schwer sein wird etwas zu erreichen.
@rico said in Verbindungsabbrüche:
Da muss einer ran der das Problem hat, im Optimalfall ohne weitere Nebenkriegsschauplätze.
Ich glaube, ich habe meine Hardwareprobleme wieder im Griff und werde die Sache weiter beobachten. Die Abstürze, die nach ein paar Stunden auftraten, sind wohl wieder verschwunden und die pfSense läuft nun fast 2 Tage ohne Probleme. Ich werde jetzt nichts mehr daran verstellen und die Sache einfach weiter beobachten. Sobald es irgendwelche Neuigkeiten gibt, melde ich mich unverzüglich.
@jegr said in Verbindungsabbrüche:
@Rico Geht mir leider - trotz Unitymedia ;) - auch so, daher kann ich da auch so gar nichts zu sagen. Leider.
Naja, falls du die Provider-FritzBox hast, kannst du das, denke ich, sehr einfach nachstellen. Unitymedia hat vor ein paar Wochen den Bridge-Modus Menüpunkt auf eigenen Geräten wieder sichtbar gemacht, sodass du diesen einrichten und mit einer dahintergeschalteten pfSense testen könntest.
Das Problem tritt eben dann auf, sobald die pfSense eine IP direkt von UM bezieht und nicht hinter doppeltem NAT mit einer festen IP hängt. -
Testest du jetzt wieder mit gepatchter dhclient oder der Originalen?
-Rico