Verbindungsabbrüche


  • LAYER 8 Rebel Alliance

    Schaue mir das morgen nochmal an und baue den entsprechend um.
    Du bist auf pfSense 2.4.4 ?

    -Rico



  • @Rico
    Oh, das wäre echt super lieb von dir! Ja, habe die Version 2.4.4_1 drauf.


  • LAYER 8 Rebel Alliance

    Anbei die Datei auf Basis von dem von dir verlinkten Patch.
    [DOWNLOAD ENTFERNT]

    -Rico



  • @Rico
    Super, vielen Dank dafür! Ich probiere es heute Nachmittag aus und sage Bescheid, ob alles geklappt hat.



  • @Rico
    Hmm, irgendetwas läuft wohl nicht rund. Was mir als allererstes aufgefallen ist - diese Meldungen (connection closed ist doch nicht normal oder?):

    Jan 9 14:33:03 	dhclient 	17460 	exiting.
    Jan 9 14:33:03 	dhclient 	17460 	connection closed
    Jan 9 14:33:03 	dhclient 	17460 	bound to [IP] -- renewal in 1561 seconds.
    

    Danach hat es mehrere Anläufe gebraucht, bis ich "supersede dhcp-server-identifier 255.255.255.255" in die Option modifiers eingetragen habe und es endlich lief.

    Kürzlich ist die Verbindung einfach weggebrochen und ich bekam keine IP mehr, auch Renew half nicht weiter. Nach einem Restart kommen zwar wieder die o.g. Meldungen, aber es läuft wieder.
    Keine Ahnung, ob das nicht evtl. wieder mal an Unitymedia gelegen hat, weil ich jetzt wieder eine neue IP habe, obwohl sich diese sehr selten ändert. Ich schaue mal weiter.

    *edit:
    Ne, wird wohl nix. Soeben schon wieder einen Ausfall gehabt, wo sich nichts mehr tat und nur durch einen Neustart beheben lies.


  • LAYER 8 Rebel Alliance

    Ist völlig normal wenn z.B. das Interface down geht, oder du eine Option bei dem Interface änderst und dann Save/Apply machst.
    Ich habe gerade mit der original dhclient von pfSense 2.4.4-p2 in den WAN Option modifiers 'supersede dhcp-server-identifier 255.255.255.255' eingetragen, Save/Apply gemacht und auch die Meldung im Log erhalten:

    Jan 9 18:40:24 	dhclient 	90445 	connection closed
    Jan 9 18:40:24 	dhclient 	90445 	exiting. 
    

    -Rico



  • @Rico
    Ja gut, aber ich meinte einen kompletten Verbindungsverlust nach einem gewissen Zeitraum, wo sich das Interface nicht mehr erholt und nur noch auf Down steht. Auch nach längerem Warten passiert nichts.


  • LAYER 8 Rebel Alliance

    Und das war nun zum ersten mal überhaupt der Fall?
    Kann mir kaum vorstellen dass der dhclient generell dafür verantwortlich sein kann dass ein Interface komplett down ist.

    -Rico



  • @Rico
    Ja, genau, früher hatte ich so etwas noch nie. Jetzt passierte es aber schon 2 mal innerhalb von lediglich ein paar Stunden (habe dann aber auch die originale Datei zurückkopiert, da ich mir einen längeren Ausfall nicht erlauben kann, wenn ich aus dem Haus gehe).

    Das Problem war, dass die Internetverbindung ganz wegbrach und das ohne irgendwelche Logeinträge. Beim ersten mal habe ich es nicht sofort gemerkt und nachdem die Sense fast eine halbe Stunde ohne Internetverbindung auch nicht per Renew eine IP gezogen hat, musste ich neustarten. Beim nächsten mal wieder dieselbe Geschichte. Vielleicht verhakt sich etwas, sodass irgendwann gar keine Requests mehr rausgehen?


  • LAYER 8 Rebel Alliance

    Nochmal damit testen: [DOWNLOAD ENTFERNT]

    -Rico



  • @Rico
    Danke, das sieht auf den ersten Blick besser aus: keine "connection closed" oder "exiting." Einträge mehr im Log. Ich werde das jetzt mal weiter beobachten und bei allen Auffälligkeiten berichten.

    edit: Ach, mir ist gerade noch folgendes eingefallen:

    1. Soll ich jetzt libcasper.so.1 und libcap_syslog.so.1 aus der alten ZIP Datei übernehmen oder ganz weglassen?
    2. Hattest du deinen letzten Beitrag editiert? In meiner Benachrichtigungsmail steht was von "0_1547128287746_dhclient.zip" und hier im Forum "0_1547138580460_dhclient.zip", beim Download kommt jedoch die Datei: "1547138582931-dhclient.zip". Die letztgenannte ist hoffentlich die richtige?

  • LAYER 8 Rebel Alliance

    Die so.1 Files solltest du mit der Neuen nicht mehr brauchen.
    Ja ich hatte nach dem Posten noch ein Problem gefunden, dann editiert und neu hochgeladen. Die Dateinamen werden vom Board so generiert, weiß nicht was da beim Editieren nun schief ging.
    Welche Größe hatte deine Zip denn jetzt?

    -Rico



  • @Rico
    Ok, habe ich mir schon gedacht. Die Zip ist 49KB und die dhclient Datei nach dem Entpacken 113KB groß.


  • LAYER 8 Rebel Alliance

    Dann sollte es eigentlich passen, hier zur Sicherheit aber nochmal: [DOWNLOAD ENTFERNT]
    Die anderen Downloads weiter oben entferne ich zur Sicherheit alle da es damit wohl nicht funktioniert und bevor die ein anderer lädt und probiert...

    -Rico



  • @Rico
    Alles klar, danke nochmal. Ich melde mich.



  • @Rico
    Hmm, heute gab es einen Absturz, k.A. ob es damit zusammenhängt. Ich werde die Sache weiter beobachten.


  • LAYER 8 Rebel Alliance

    Absturz inwiefern? Was steht in den Logs dazu?

    -Rico



  • Die pfSense hat nicht mehr reagiert und hat sich nach einer Weile neugestartet. Ich sehe nichts, außer den beim Start angelegten Logs. Damit geht doch der Boot-Vorgang los oder?
    kernel boot file is /boot/kernel/kernel


  • LAYER 8 Rebel Alliance

    Status > System Logs

    -Rico



  • Ja, das meinte ich. Es geht damit los (wenn ich mich nicht irre, sind das aber bereits die Logs, die beim Bootvorgang angelegt werden oder?):

    Jan 11 12:44:44 	kernel 		current process = 82667 (pfctl)
    Jan 11 12:44:44 	kernel 		processor eflags = interrupt enabled, resume, IOPL = 0
    Jan 11 12:44:44 	kernel 		= DPL 0, pres 1, long 1, def32 0, gran 1
    Jan 11 12:44:44 	kernel 		code segment = base 0x0, limit 0xfffff, type 0x1b
    Jan 11 12:44:44 	kernel 		frame pointer = 0x28:0xfffffe0114fdf440
    Jan 11 12:44:44 	kernel 		stack pointer = 0x28:0xfffffe0114fdf320
    Jan 11 12:44:44 	kernel 		instruction pointer = 0x20:0xffffffff80d72f70
    Jan 11 12:44:44 	kernel 		fault code = supervisor read data, page not present
    Jan 11 12:44:44 	kernel 		fault virtual address = 0x18
    Jan 11 12:44:44 	kernel 		cpuid = 3; apic id = 06
    Jan 11 12:44:44 	kernel 		Fatal trap 12: page fault while in kernel mode
    Jan 11 12:44:44 	syslogd 		kernel boot file is /boot/kernel/kernel 
    

    Danach kommt halt das und der Rest:

    Jan 11 12:44:44 	kernel 		FreeBSD 11.2-RELEASE-p4 #2 b00c407ba5d(RELENG_2_4_4): Mon Nov 26 11:41:48 EST 2018
    Jan 11 12:44:44 	kernel 		FreeBSD is a registered trademark of The FreeBSD Foundation.
    Jan 11 12:44:44 	kernel 		The Regents of the University of California. All rights reserved.
    Jan 11 12:44:44 	kernel 		Copyright (c) 1979, 1980, 1983, 1986, 1988, 1989, 1991, 1992, 1993, 1994
    Jan 11 12:44:44 	kernel 		Copyright (c) 1992-2018 The FreeBSD Project. 
    

  • LAYER 8 Rebel Alliance

    Und das Problem hattest du vorher noch nie?

    -Rico



  • Sehr selten, aber hin und wieder schon paar mal gehabt. Deswegen habe ich das nur mit Vorsicht erwähnt. Es sollte nicht heißen, dass es am dhclient liegt, wollte es vollständigkeitshalber nur erwähnt haben.

    Ich werde die Sache weiter beobachten und nur, wenn das Problem jetzt immer wieder auftreten sollte, könnte es einen Zusammenhang geben. Aber hoffen wir mal, dass es lediglich eine Einzelaktion war.


  • LAYER 8 Rebel Alliance

    Das hört sich auch eher nach Hardware extrem überlastet oder defekt an.
    Was für eine Box hast du überhaupt?

    -Rico



  • Echt? Wie kann ich herausfinden, ob ein Hardwaredefekt vorliegt (die Herstellergarantie dürfte sehr bald zu Ende sein...)?

    Ist ein Selbstbau aus einem Supermicro X11SBA-LN4F Board (hat eine integrierte N3700 CPU) mit 4GB Arbeitsspeicher.


  • LAYER 8 Rebel Alliance

    x86 Hardware teste ich immer mit memtest86 und danach Prime, jeweils min. 48 Stunden.
    Aber schau doch erst mal generell nach der Auslastung deiner Box/Prozesse/Packages.

    -Rico



  • Beim Arbeitsspeicher sieht gut aus: teilweise sind um die 60% frei und in den schlimmsten Fällen immer noch ca. 25% - dürfte also im Rahmen liegen?

    Bei der CPU sehe ich so auf den ersten Blick keine Auffälligkeiten. Die Last ist recht konstant und dann kommt der Absturz.
    Für mich sind aber die ganzen Werte, die unter Status/Monitoring/System-Processor ausgegeben werden recht unverständlich. Wo kann ich dessen Bedeutung nachlesen?

    Ansonsten habe ich hin und wieder per Kommandozeile mit "top" die Auslastung in bestimmten Situationen beobachtet. Normalerweise (also bei normalem täglichen Bedarf) werden so 70-90% Idle angezeigt. Um die CPU sehr gut auszulasten, muss man schon mal ordentlich was machen.

    Packages habe ich von den anspruchsvollen lediglich pfBlocker und nTop, wobei der letztere seit 2-3 Monaten ausgeschaltet ist und nur bei Bedarf eingeschaltet und verwendet wird.
    Ansonsten sind noch Acme, Avahi (aus), Cron (unbenutzt), openvpn-client-export, RRD_Summary, Shellcmd und Status_Traffic_Totals installiert. Ich denke mal, dass diese das System nicht wirklich beanpruchen dürften.


  • LAYER 8 Rebel Alliance

    Ich habe nochmal eine kleine Korrektur an der dhclient vorgenommen, die finale Version hier: 0_1547227517977_dhclient_20190111.zip
    Hat aber mit deinem Box Absturz Thema nichts zu tun.

    -Rico



  • @Rico
    Danke! Mal eine Frage: angenommen, durch deinen Patch würde die Sache tatsächlich besser werden, was passiert danach (außer der Tatsache, dass ich dir unendlich dankbar dafür wäre)?
    Mit jedem Upgrade der pfSense könnte es ja dazu kommen, dass beim dhclient Neuerungen/Verbesserungen hinzukommen und die Datei geupdated wird. Ok, man könnte diese dann immer noch austauschen, aber irgendwann könnte auch mal ein Update kommen, wo die Datei nicht mehr kompatibel sein wird. Was dann?
    Ich möchte eigentlich darauf hinaus, ob du dir nicht evtl. vorstellen könntest, deinen Patch an die pfSense Entwickler weiterzuleiten, damit dieser eingepflegt wird oder ist so etwas unüblich?


  • LAYER 8 Rebel Alliance

    Ein funktionierender Patch ist ja, da er sich aber auf das FreeBSD-src Repository bezieht meinen die Devs das muss von FreeBSD Seite gefixt werden, was vom Prinzip her ja auch korrekt ist.
    Das FreeBSD-src Repository soll denke ich mal so weit wie möglich original bleiben, Änderungen kommen nur von FreeBSD selbst da rein (im Optimalfall).

    -Rico



  • @un1que said in Verbindungsabbrüche:

    Ist ein Selbstbau aus einem Supermicro X11SBA-LN4F Board

    Diese Supermicro Board hatte bis zur rev 1.01 arge Probleme mit der LAN-Ports 2-4!
    Diese hängen an PCIe 2.0 x1. Eine optimale Lösung sieht meiner Meinung nach
    anders aus.

    0_1547285943904_X11SBA-LN4F.png

    Mehr dazu hier.

    Spielt das o.g. das Problem hier eine Rolle?

    LG



  • @rico said in Verbindungsabbrüche:

    Ein funktionierender Patch ist ja, da er sich aber auf das FreeBSD-src Repository bezieht meinen die Devs das muss von FreeBSD Seite gefixt werden, was vom Prinzip her ja auch korrekt ist.
    Das FreeBSD-src Repository soll denke ich mal so weit wie möglich original bleiben, Änderungen kommen nur von FreeBSD selbst da rein (im Optimalfall).

    -Rico

    Dann lässt sich bei pfSense wohl tatsächlich nichts machen. Magst du vllt. deine Version des Patches bei FreeBSD hochladen (evtl. in den bereits existierenden Bug Report), wenn ich mit dem Testen fertig bin? Ich kann mich dort auch mal eben Registrieren und eine "Empfehlung" aussprechen, falls das die Sache irgendwie beschleunigen sollte (keine Ahnung wie das ganze funktioniert 😕 ).

    @Gladius
    Ja, die Probleme mit den ersten Revisionen des Supermicro Boards kenne ich, siehe hier: https://forum.netgate.com/topic/97216/ständige-verbindungsabbrüche-pfsense-hinter-kabelmodem
    Aber ich habe damals ein Austauschboard der Rev. 1.02 bekommen.

    @gladius said in Verbindungsabbrüche:

    Spielt das o.g. das Problem hier eine Rolle?

    Ich glaube nicht. Schließlich bin ich nicht der einzige mit diesem Problem (siehe Anfang des Threads und hier). Das liegt auf jeden Fall daran, wie Unitymedia (evtl. auch andere Liberty Global ISP's) mit den DHCP Requests und deren Beantwortung umgeht (mehr dazu in dem o.g. Thread) und der Tatsache, dass man bei pfSense es nicht mit Boardmitteln fixen kann.
    Oder meintest du mein Problem mit den sporadischen Abstürzen?


  • LAYER 8 Rebel Alliance

    Schaue doch erst mal ob es damit jetzt überhaupt stabil läuft, dann sehen wir weiter.
    Eine Sorge nach der Anderen. ☺

    -Rico



  • Hmm, habe heute wieder einen Absturz gehabt, das muss irgendwie zusammenhängen. Sowas kam zwar auch früher vor, aber definitiv nicht so oft. Damals, wenn’s hochkommt, 1 mal in einem, zwei, drei.... Monaten. Jetzt schon zum zweiten Mal innerhalb von 3 Tagen.

    Was ich noch komisch finde, sind diese Einbrüche (kann jetzt aber nicht sagen, ob sie vor den "Manipulationen" am dhclient vorhanden waren):
    0_1547480739820_monitoring.png
    V.a. der heutige zwischen ca. 5 und 8 Uhr, genau gegen Ende dieses Einbruches ist die pfSense neugestartet.

    Subjektiv kommt es mir jetzt vor, dass ab und zu das Internet für ein paar Sekunden ausfällt / unbenutzbar ist (evtl. genau zu diesen Zeiten?): die Seiten laden ohne Ende, Internetradio stoppt.

    Hast du evtl. eine Idee, @Rico?


  • LAYER 8 Rebel Alliance

    So langsam gehen mir auch die Ideen aus.
    Aber tausche mal wieder zurück auf die original dhclient und schaue ob die Abstürze dann verschwiden.
    Du hattest nun die letzte Version vom 11.01. genommen?

    -Rico



  • Ja, genau, nachdem mir die pfSense das letzte mal abgestürzt ist, habe ich zur Sicherheit nochmal die allerletzte Version heruntergeladen bzw. aufgespielt.

    Ok, probiere ich gleich mal wieder mit der originalen.



  • @Rico
    Leider tritt das Problem auch mit der originalen dhclient Datei auf, vllt. hat sich auch etwas "verstellt", jedenfalls kam das vorher -subjektiv gesehen- nicht so oft vor.

    Nun, irgendwas müsste ich ja jetzt tun, um das Problem mit den Abstürzen in den Griff zu bekommen. Habe ins Log des IPMI reingeschaut (frag mich nicht, wieso ich nicht früher darauf gekommen bin) und habe dort lauter solche Einträge gefunden:

    BIOS POST Progress #0x00	BIOS POST Progress	Error-Unrecoverable video controller failure. - Assertion
    

    Eine solche Meldung kommt mit jedem Bootvorgang seit Mitte Dezember hinzu. Ich frage mich jedoch, ob das etwas kritisches darstellt (also z.B. auf einen Hardwaredefekt hinweist) oder eher Einstellungssache des BIOS ist? Im Internet finde ich leider nichts dazu…

    P.S. Ach ja, habe gestern mal vorsichtshalber ein BIOS Update aufgespielt, k.A. ob’s was bringt. Mal sehen.


  • LAYER 8 Rebel Alliance

    Wenn du wie beschrieben nur die dhclient Binary ausgetauscht hattest kann es daran 100% nicht liegen, wie sollte das etwas verstellen an System oder Config?
    Zu dem Fehler mit dem Supermicro Board kann ich nichts sagen, kenne weder das Board noch diesen Fehler.
    Hast du nicht eine andere Maschine zur Verfügung auf die du mal deine aktuelle pfSense Config recovern kannst?

    -Rico



  • @rico said in Verbindungsabbrüche:

    Wenn du wie beschrieben nur die dhclient Binary ausgetauscht hattest kann es daran 100% nicht liegen, wie sollte das etwas verstellen an System oder Config?

    Das ist mir durchaus bewusst und so meinte ich es auch nicht. Ich habe eher Richtung anderweitiger Installationen (Packages) oder sonstiger vorgenommener Einstellungen gedacht.

    Zu dem Fehler mit dem Supermicro Board kann ich nichts sagen, kenne weder das Board noch diesen Fehler.

    Ok, verstehe ich. Mal ein anderer Ansatz: sind die Beep-Töne, die beim Start auf Fehler hinweisen, einigermaßen universell? Bringt es etwas, wenn ich den Fehlercode poste?

    Hast du nicht eine andere Maschine zur Verfügung auf die du mal deine aktuelle pfSense Config recovern kannst?

    -Rico

    Ähm, ich habe hier noch so ein ähnliches Board (jedoch mit nur einem Realtek NIC), evtl. könnte ich mir noch eine PCIe-Karte mit einem Intel-NIC besorgen... aber dann müsste ich viele Dinge umstrukturieren (LAN und WLAN laufen bei mir getrennt, über 2 NIC's).

    Ich warte jetzt noch ein paar Tage bzw. bis zum nächsten Absturz, habe gestern nämlich noch RAM ausgetauscht, da ich hier passende und vor ein paar Monaten getestete Module rumliegen hatte.


  • Rebel Alliance Moderator

    Also mal davon abgesehen dass sich das zum Ende hin sehr nach HW Problemen liest, statt nach Software, wollte ich da noch möglichst kurz zwei drei Punkte loswerden:

    @Rico Herzlichen Dank für den Einsatz und das Compilieren und mittesten. Das ist mehr Einsatz als so mancher zeigt, egal in welchem Subforum/Reddit. Da wird dann lieber über Devs gewettert.

    Ansonsten hab ich auch viel halbe Wahrheiten gelesen. Dass in diesem Fall OPNsense da schneller reagiert hat, mag durchaus richtig (und gut!) sein. Ist allerdings auch wenig verwunderlich, da durch NL/DE als großes Verbreitungsgebiet da viel mehr Leute theoretisch testen könnten - und es vielleicht auch tun. Aber da bin ich auch enttäuscht von den Usern hier. Da wird über die Devs gescholten und gewettert, dass denen alles egal ist etc. etc. ohne mal über deren Prioritäten nachzudenken und die Tatsache, dass die das bei sich vielleicht schlicht nicht nachstellen konnten weil das wieder eine typische deutsche Baustelle ist/war? Und wenn man dann sowohl das Ticket wie auch Upstream einen Fix gefunden hat -> warum nicht einfach mal das Ticket aktualisieren und drauf hinweisen? Das Ticket war btw auf "Future Fix" geflaggt, weshalb es dann auch bei Bugs einer spezifischen Version nicht auftaucht. Aber anstatt sich die betroffenen vielleicht im Redmine anmelden und da reporten - lieber mal auf die Entwickler schimpfen. Ist irgendwie typisch deutsch geworden, diese Schimpferei. Schade das. Ich schreibe hier ausdrücklich niemanden spezifisch rein, denn es hätte jeder Betroffene, der einen der Threads gelesen hatte machen können. Hat aber niemand.

    Lange Rede kurzer Sinn: Abwarten, ob es jemand vom Dev Team aufgreift, ich habe mit meinem Redmine Account gerade das Ticket aktualisiert und auch den Fix von FreeBSD verlinkt und darauf hingewiesen, dass es schön wäre, wenn das jemand in einen Snapshot bauen würde, damit man es für ein Future Release testen und ausrollen kann. Dann muss man das auch zukünftig nicht händisch bauen.
    Ansonsten könnte theoretisch @Rico auch einen Pull Request einreichen - gebaut hat ers ja anscheinen schonmal ;) Wäre also einen Versuch wert und seis nur, dass mans ggf. als Kommentar aufs Ticket dazu schreibt, damit man das ganze Thema nochmal anschiebt. Wenn aber 2 Jahre lang auch niemand mehr auf das Ticket reagiert wundert mich nicht, dass das keine Priorität hatte.

    Grüße
    Jens


  • LAYER 8 Rebel Alliance

    Da ich von dem Problem überhaupt nicht betroffen bin kann ich selbst leider nichts testen und habe von dem her auch keine Requests eingereicht oder weitere Kommentare geschrieben.
    Da muss einer ran der das Problem hat, im Optimalfall ohne weitere Nebenkriegsschauplätze. 😉

    -Rico


Log in to reply