Verbindungsabbrüche
-
Und das Problem hattest du vorher noch nie?
-Rico
-
Sehr selten, aber hin und wieder schon paar mal gehabt. Deswegen habe ich das nur mit Vorsicht erwähnt. Es sollte nicht heißen, dass es am dhclient liegt, wollte es vollständigkeitshalber nur erwähnt haben.
Ich werde die Sache weiter beobachten und nur, wenn das Problem jetzt immer wieder auftreten sollte, könnte es einen Zusammenhang geben. Aber hoffen wir mal, dass es lediglich eine Einzelaktion war.
-
Das hört sich auch eher nach Hardware extrem überlastet oder defekt an.
Was für eine Box hast du überhaupt?-Rico
-
Echt? Wie kann ich herausfinden, ob ein Hardwaredefekt vorliegt (die Herstellergarantie dürfte sehr bald zu Ende sein...)?
Ist ein Selbstbau aus einem Supermicro X11SBA-LN4F Board (hat eine integrierte N3700 CPU) mit 4GB Arbeitsspeicher.
-
x86 Hardware teste ich immer mit memtest86 und danach Prime, jeweils min. 48 Stunden.
Aber schau doch erst mal generell nach der Auslastung deiner Box/Prozesse/Packages.-Rico
-
Beim Arbeitsspeicher sieht gut aus: teilweise sind um die 60% frei und in den schlimmsten Fällen immer noch ca. 25% - dürfte also im Rahmen liegen?
Bei der CPU sehe ich so auf den ersten Blick keine Auffälligkeiten. Die Last ist recht konstant und dann kommt der Absturz.
Für mich sind aber die ganzen Werte, die unter Status/Monitoring/System-Processor ausgegeben werden recht unverständlich. Wo kann ich dessen Bedeutung nachlesen?Ansonsten habe ich hin und wieder per Kommandozeile mit "top" die Auslastung in bestimmten Situationen beobachtet. Normalerweise (also bei normalem täglichen Bedarf) werden so 70-90% Idle angezeigt. Um die CPU sehr gut auszulasten, muss man schon mal ordentlich was machen.
Packages habe ich von den anspruchsvollen lediglich pfBlocker und nTop, wobei der letztere seit 2-3 Monaten ausgeschaltet ist und nur bei Bedarf eingeschaltet und verwendet wird.
Ansonsten sind noch Acme, Avahi (aus), Cron (unbenutzt), openvpn-client-export, RRD_Summary, Shellcmd und Status_Traffic_Totals installiert. Ich denke mal, dass diese das System nicht wirklich beanpruchen dürften. -
Ich habe nochmal eine kleine Korrektur an der dhclient vorgenommen, die finale Version hier: 0_1547227517977_dhclient_20190111.zip
Hat aber mit deinem Box Absturz Thema nichts zu tun.-Rico
-
@Rico
Danke! Mal eine Frage: angenommen, durch deinen Patch würde die Sache tatsächlich besser werden, was passiert danach (außer der Tatsache, dass ich dir unendlich dankbar dafür wäre)?
Mit jedem Upgrade der pfSense könnte es ja dazu kommen, dass beim dhclient Neuerungen/Verbesserungen hinzukommen und die Datei geupdated wird. Ok, man könnte diese dann immer noch austauschen, aber irgendwann könnte auch mal ein Update kommen, wo die Datei nicht mehr kompatibel sein wird. Was dann?
Ich möchte eigentlich darauf hinaus, ob du dir nicht evtl. vorstellen könntest, deinen Patch an die pfSense Entwickler weiterzuleiten, damit dieser eingepflegt wird oder ist so etwas unüblich? -
Ein funktionierender Patch ist ja, da er sich aber auf das FreeBSD-src Repository bezieht meinen die Devs das muss von FreeBSD Seite gefixt werden, was vom Prinzip her ja auch korrekt ist.
Das FreeBSD-src Repository soll denke ich mal so weit wie möglich original bleiben, Änderungen kommen nur von FreeBSD selbst da rein (im Optimalfall).-Rico
-
@un1que said in Verbindungsabbrüche:
Ist ein Selbstbau aus einem Supermicro X11SBA-LN4F Board
Diese Supermicro Board hatte bis zur rev 1.01 arge Probleme mit der LAN-Ports 2-4!
Diese hängen an PCIe 2.0 x1. Eine optimale Lösung sieht meiner Meinung nach
anders aus.Spielt das o.g. das Problem hier eine Rolle?
LG
-
@rico said in Verbindungsabbrüche:
Ein funktionierender Patch ist ja, da er sich aber auf das FreeBSD-src Repository bezieht meinen die Devs das muss von FreeBSD Seite gefixt werden, was vom Prinzip her ja auch korrekt ist.
Das FreeBSD-src Repository soll denke ich mal so weit wie möglich original bleiben, Änderungen kommen nur von FreeBSD selbst da rein (im Optimalfall).-Rico
Dann lässt sich bei pfSense wohl tatsächlich nichts machen. Magst du vllt. deine Version des Patches bei FreeBSD hochladen (evtl. in den bereits existierenden Bug Report), wenn ich mit dem Testen fertig bin? Ich kann mich dort auch mal eben Registrieren und eine "Empfehlung" aussprechen, falls das die Sache irgendwie beschleunigen sollte (keine Ahnung wie das ganze funktioniert ).
@Gladius
Ja, die Probleme mit den ersten Revisionen des Supermicro Boards kenne ich, siehe hier: https://forum.netgate.com/topic/97216/ständige-verbindungsabbrüche-pfsense-hinter-kabelmodem
Aber ich habe damals ein Austauschboard der Rev. 1.02 bekommen.@gladius said in Verbindungsabbrüche:
Spielt das o.g. das Problem hier eine Rolle?
Ich glaube nicht. Schließlich bin ich nicht der einzige mit diesem Problem (siehe Anfang des Threads und hier). Das liegt auf jeden Fall daran, wie Unitymedia (evtl. auch andere Liberty Global ISP's) mit den DHCP Requests und deren Beantwortung umgeht (mehr dazu in dem o.g. Thread) und der Tatsache, dass man bei pfSense es nicht mit Boardmitteln fixen kann.
Oder meintest du mein Problem mit den sporadischen Abstürzen? -
Schaue doch erst mal ob es damit jetzt überhaupt stabil läuft, dann sehen wir weiter.
Eine Sorge nach der Anderen.-Rico
-
Hmm, habe heute wieder einen Absturz gehabt, das muss irgendwie zusammenhängen. Sowas kam zwar auch früher vor, aber definitiv nicht so oft. Damals, wenn’s hochkommt, 1 mal in einem, zwei, drei.... Monaten. Jetzt schon zum zweiten Mal innerhalb von 3 Tagen.
Was ich noch komisch finde, sind diese Einbrüche (kann jetzt aber nicht sagen, ob sie vor den "Manipulationen" am dhclient vorhanden waren):
V.a. der heutige zwischen ca. 5 und 8 Uhr, genau gegen Ende dieses Einbruches ist die pfSense neugestartet.Subjektiv kommt es mir jetzt vor, dass ab und zu das Internet für ein paar Sekunden ausfällt / unbenutzbar ist (evtl. genau zu diesen Zeiten?): die Seiten laden ohne Ende, Internetradio stoppt.
Hast du evtl. eine Idee, @Rico?
-
So langsam gehen mir auch die Ideen aus.
Aber tausche mal wieder zurück auf die original dhclient und schaue ob die Abstürze dann verschwiden.
Du hattest nun die letzte Version vom 11.01. genommen?-Rico
-
Ja, genau, nachdem mir die pfSense das letzte mal abgestürzt ist, habe ich zur Sicherheit nochmal die allerletzte Version heruntergeladen bzw. aufgespielt.
Ok, probiere ich gleich mal wieder mit der originalen.
-
@Rico
Leider tritt das Problem auch mit der originalen dhclient Datei auf, vllt. hat sich auch etwas "verstellt", jedenfalls kam das vorher -subjektiv gesehen- nicht so oft vor.Nun, irgendwas müsste ich ja jetzt tun, um das Problem mit den Abstürzen in den Griff zu bekommen. Habe ins Log des IPMI reingeschaut (frag mich nicht, wieso ich nicht früher darauf gekommen bin) und habe dort lauter solche Einträge gefunden:
BIOS POST Progress #0x00 BIOS POST Progress Error-Unrecoverable video controller failure. - Assertion
Eine solche Meldung kommt mit jedem Bootvorgang seit Mitte Dezember hinzu. Ich frage mich jedoch, ob das etwas kritisches darstellt (also z.B. auf einen Hardwaredefekt hinweist) oder eher Einstellungssache des BIOS ist? Im Internet finde ich leider nichts dazu…
P.S. Ach ja, habe gestern mal vorsichtshalber ein BIOS Update aufgespielt, k.A. ob’s was bringt. Mal sehen.
-
Wenn du wie beschrieben nur die dhclient Binary ausgetauscht hattest kann es daran 100% nicht liegen, wie sollte das etwas verstellen an System oder Config?
Zu dem Fehler mit dem Supermicro Board kann ich nichts sagen, kenne weder das Board noch diesen Fehler.
Hast du nicht eine andere Maschine zur Verfügung auf die du mal deine aktuelle pfSense Config recovern kannst?-Rico
-
@rico said in Verbindungsabbrüche:
Wenn du wie beschrieben nur die dhclient Binary ausgetauscht hattest kann es daran 100% nicht liegen, wie sollte das etwas verstellen an System oder Config?
Das ist mir durchaus bewusst und so meinte ich es auch nicht. Ich habe eher Richtung anderweitiger Installationen (Packages) oder sonstiger vorgenommener Einstellungen gedacht.
Zu dem Fehler mit dem Supermicro Board kann ich nichts sagen, kenne weder das Board noch diesen Fehler.
Ok, verstehe ich. Mal ein anderer Ansatz: sind die Beep-Töne, die beim Start auf Fehler hinweisen, einigermaßen universell? Bringt es etwas, wenn ich den Fehlercode poste?
Hast du nicht eine andere Maschine zur Verfügung auf die du mal deine aktuelle pfSense Config recovern kannst?
-Rico
Ähm, ich habe hier noch so ein ähnliches Board (jedoch mit nur einem Realtek NIC), evtl. könnte ich mir noch eine PCIe-Karte mit einem Intel-NIC besorgen... aber dann müsste ich viele Dinge umstrukturieren (LAN und WLAN laufen bei mir getrennt, über 2 NIC's).
Ich warte jetzt noch ein paar Tage bzw. bis zum nächsten Absturz, habe gestern nämlich noch RAM ausgetauscht, da ich hier passende und vor ein paar Monaten getestete Module rumliegen hatte.
-
Also mal davon abgesehen dass sich das zum Ende hin sehr nach HW Problemen liest, statt nach Software, wollte ich da noch möglichst kurz zwei drei Punkte loswerden:
@Rico Herzlichen Dank für den Einsatz und das Compilieren und mittesten. Das ist mehr Einsatz als so mancher zeigt, egal in welchem Subforum/Reddit. Da wird dann lieber über Devs gewettert.
Ansonsten hab ich auch viel halbe Wahrheiten gelesen. Dass in diesem Fall OPNsense da schneller reagiert hat, mag durchaus richtig (und gut!) sein. Ist allerdings auch wenig verwunderlich, da durch NL/DE als großes Verbreitungsgebiet da viel mehr Leute theoretisch testen könnten - und es vielleicht auch tun. Aber da bin ich auch enttäuscht von den Usern hier. Da wird über die Devs gescholten und gewettert, dass denen alles egal ist etc. etc. ohne mal über deren Prioritäten nachzudenken und die Tatsache, dass die das bei sich vielleicht schlicht nicht nachstellen konnten weil das wieder eine typische deutsche Baustelle ist/war? Und wenn man dann sowohl das Ticket wie auch Upstream einen Fix gefunden hat -> warum nicht einfach mal das Ticket aktualisieren und drauf hinweisen? Das Ticket war btw auf "Future Fix" geflaggt, weshalb es dann auch bei Bugs einer spezifischen Version nicht auftaucht. Aber anstatt sich die betroffenen vielleicht im Redmine anmelden und da reporten - lieber mal auf die Entwickler schimpfen. Ist irgendwie typisch deutsch geworden, diese Schimpferei. Schade das. Ich schreibe hier ausdrücklich niemanden spezifisch rein, denn es hätte jeder Betroffene, der einen der Threads gelesen hatte machen können. Hat aber niemand.
Lange Rede kurzer Sinn: Abwarten, ob es jemand vom Dev Team aufgreift, ich habe mit meinem Redmine Account gerade das Ticket aktualisiert und auch den Fix von FreeBSD verlinkt und darauf hingewiesen, dass es schön wäre, wenn das jemand in einen Snapshot bauen würde, damit man es für ein Future Release testen und ausrollen kann. Dann muss man das auch zukünftig nicht händisch bauen.
Ansonsten könnte theoretisch @Rico auch einen Pull Request einreichen - gebaut hat ers ja anscheinen schonmal ;) Wäre also einen Versuch wert und seis nur, dass mans ggf. als Kommentar aufs Ticket dazu schreibt, damit man das ganze Thema nochmal anschiebt. Wenn aber 2 Jahre lang auch niemand mehr auf das Ticket reagiert wundert mich nicht, dass das keine Priorität hatte.Grüße
Jens -
Da ich von dem Problem überhaupt nicht betroffen bin kann ich selbst leider nichts testen und habe von dem her auch keine Requests eingereicht oder weitere Kommentare geschrieben.
Da muss einer ran der das Problem hat, im Optimalfall ohne weitere Nebenkriegsschauplätze.-Rico