Ständige Verbindungsabbrüche - pfSense hinter Kabelmodem



  • Hallo,

    seit einiger Zeit bin ich froher Besitzer eines selbstgebauten pfSense Routers. Im Großen und Ganzen bin ich sehr zufrieden damit, allerdings habe ich ein nerviges Problem, das alles gute zunichte macht.

    Wenn die pfSense direkt an mein Kabelmodem (Cisco EPC3208) angeschlossen wird, dann verliert pfSense ständig die Internetverbindung - das Ganze in unregelmäßigen Zeitabständen, meist aber nach ca. 2h. Unten werde ich System Logs des Gateways anhängen.
    Ich habe bereits viel im Internet recherchiert, aber keine brauchbare Anleitung gefunden, wie ich es lösen kann.

    Zuvor hing eine FritzBox 7490 am Kabelmodem und es lief immer problemlos (von daher kann man einen Hardwaredefekt des Modems ausschließen). Wenn ich die pfSense hinter die FritzBox geklemmt habe, lief es auch problemlos (somit auch kein Hardwareproblem der pfSense Hardware). Sobald diese direkt ans Modem angeschlossen wird, so habe ich eben das beschriebene Problem. Es hilft dann nur ein Neustart oder das Aus- und wieder Einschalten des WAN Interfaces in der pfSense.
    Ich gehe davon aus, dass es irgendein Kommunikationsproblem zwischen Modem und pfSense gibt und nach einiger Zeit, wenn bspw. die öffentliche IP Adresse erneuert werden soll, die Anfrage der pfSense scheitert und die somit davon ausgeht, dass die alte nun ungültig geworden ist!?

    Ich sehe auch direkt einen Unterschied im WebGUI des Modems zwischen der FritzBox und der pfSense. Ich habe dort einen Menüpunkt, wo in einer Tabelle die öffentliche IP Adresse und die MAC Adresse des angeschlossenen Routers angezeigt wird.
    Bei der FritzBox stand dort auch eine private 192.168.100.10 IP Adresse mit der MAC des Modems (soweit ich mich erinnern kann) und eine weitere 192.168.100.100 mit der MAC Adresse der FritzBox.
    Bei der angeschlossenen pfSense habe ich diese beiden Einträge nicht mehr.

    Habt ihr einen Rat für mich?
    Sollte ich noch etwas wichtiges vergessen haben, könnt ihr gerne Fragen stellen. Ich werde diese selbstverständlich gerne beantworten.

    Mar 26 15:17:45	dpinger		send_interval 500ms loss_interval 2000ms time_period 60000ms report_interval 0ms data_len 0 alert_interval 1000ms latency_alarm 500ms loss_alarm 20% dest_addr 8.8.8.8 bind_addr [MEINE_ÖFFTLICHE_IP] identifier "WAN_DHCP "
    Mar 26 15:16:01	dpinger		send_interval 500ms loss_interval 2000ms time_period 60000ms report_interval 0ms data_len 0 alert_interval 1000ms latency_alarm 500ms loss_alarm 20% dest_addr 8.8.8.8 bind_addr [MEINE_ÖFFTLICHE_IP] identifier "WAN_DHCP "
    Mar 26 15:15:06	dpinger		WAN_DHCP 8.8.8.8: Alarm latency 21692us stddev 3028us loss 22%
    Mar 26 12:10:31	dpinger		send_interval 500ms loss_interval 2000ms time_period 60000ms report_interval 0ms data_len 0 alert_interval 1000ms latency_alarm 500ms loss_alarm 20% dest_addr 8.8.8.8 bind_addr [MEINE_ÖFFTLICHE_IP] identifier "WAN_DHCP "
    Mar 26 12:10:30	dpinger		send_interval 500ms loss_interval 2000ms time_period 60000ms report_interval 0ms data_len 0 alert_interval 1000ms latency_alarm 500ms loss_alarm 20% dest_addr 8.8.8.8 bind_addr [MEINE_ÖFFTLICHE_IP] identifier "WAN_DHCP "
    


  • Ist es ein Cisco EPC3208 oder ein Cisco EPC3208G?



  • Ja, es ist definitiv das Kabelmodem EPC3208, kein Gateway.

    Ich bin jetzt zufällig auf folgenden Thread gestoßen, wo es um das Mainboard von Supermicro geht, welches auch ich im Einsatz habe (X11SBA-LN4F). Dort wird auf den letzten Seiten das Thema diskutiert, dass das MB wohl ein Problem mit einigen NIC's hätte - Watchdog timeout. Für mich ist das nur schwer nachvollziehbar, aber meine Verbindungsabbrüche könnten ja tatsächlich daran liegen oder?
    Ich würde mich freuen, wenn jemand mit mehr Ahnung sich die letzten paar Seiten dort durchlesen und mir sagen könnte, ob es wirklich auch die Ursache meines Problems ist.



  • Es hat den Anschein, als wäre das auch Dein Problem.

    Hast Du das mal probiert um zumindest einen Unterschied feststellen zu können (in der Häufigkeit der Abbrüche)?
    @endy66:

    … increasing the mbuf size to 1000000.



  • Also, das mit mbuf habe ich dort auch gelesen und wollte es ausprobieren (obwohl es nicht allen geholfen hat und derjenige, bei dem es anfangs ging, meinte, dass man dafür mindestens 8GB RAM bräuchte).
    Habe hier gefunden, wo ich es einrichten soll, doch unter "Tunable Name" finde ich statt dem Namen "kern.ipc.nmbclusters" nur "kern.ipc.maxsockbuf" (evtl. liegt es daran, dass ich die 2.3-BETA habe?). Dort ist der Wert allerdings bereits bei 4262144. Da es ums erhöhen des Wertes auf 1Mio ging, habe ich es sein gelassen, weil ich davon ausging, dass es nicht das Richtige ist.

    Habe mittlerweile herausbekommen, dass sich die größere Auslastung der Internetleitung auf der Häufigkeit der Abbrüche auswirkt. Wo ich ja anfangs von Abständen wie 2h und mehr sprach und es danach sogar über Nacht problemlos lief (da habe ich aber so ziemlich alle Verbraucher ausgeschaltet), so habe ich heute die pfSense sogar dazu bekommen, die Verbindung bereits nach nur einigen Minuten zu verlieren (so in etwa 10-20).
    Manchmal ging es nach einigen Minuten von alleine wieder und manchmal musste ich selbst nach ca. 10-20 Minuten eingreifen. Dabei war dann ein paar mal sogar die Oberfläche nicht mehr erreichbar gewesen.

    Könnte man das Problem evtl. zunächst dadurch lösen, wenn man den Watchdog (im Bios?) deaktiviert? Kann man so etwas überhaupt machen?
    Ach ja, wo sehe ich die Version meiner Hardware, im Bios?

    Hat jemand Erfahrungen mit Supermicro Reparaturaufträgen? Wie genau richte ich es an - direkt über den Hersteller oder Händler? Wie sollte ich den Fall am besten beschreiben, damit man sofort weiß, um welches Problem es sich handelt?



  • Hast du die BETA Version bereits als verursacher ausschließen können? Sprich mal die STABLE Version probiert, ob es dort auch auftritt.



  • Ja, mit der STABLE habe ich angefangen und erst später die BETA installiert. Auch dort hatte ich diese nervigen Aussetzer.

    Kann jetzt nur noch einmal sagen, dass es wirklich sehr stark von der Auslastung der Leitung abhängt. Seit meiner letzten Antwort in der Nacht (wo ich beim Testen bereits nach einigen Minuten die Abbrüche hatte), wurde das Internet nur unbedeutend beansprucht - also nur etwas surfen, das schlimmste ist ein Stream seit rund einer Stunde mit bis zu 12 Mbit und es gab in der Zeit nur einen einzigen Abbruch (vor rund 3,5 Stunden).



  • Hier ist auch ein Beitrag welcher die watchdog timeouts bestätigt : https://www.reddit.com/r/homelab/comments/41ucwf/is_it_time_to_build_your_own_router/

    Wenn möglich würde ich vielleicht sogar das Board umtauschen…



  • Ne, leider kann ich das MB nicht mehr zurückschicken, das habe ich jetzt schon etwas länger. Mir bleibt wohl nur die Möglichkeit der Reparatur.

    In diesem Zusammenhang, würde ich mich freuen, wenn mir jemand die Antwort auf die oben gestellten Fragen geben kann:

    Hat jemand Erfahrungen mit Supermicro Reparaturaufträgen? Wie genau richte ich es an - direkt über den Hersteller oder Händler? Wie sollte ich den Fall am besten beschreiben, damit man sofort weiß, um welches Problem es sich handelt?



  • Moin,
    eine kleine PCI-X Netzwerkkarte für ein paar Euro könnte auch weiter helfen oder USB to Ethenet Adapter

    Gruß

    Keule



  • @keule:

    … oder USB to Ethenet Adapter

    Huh?
    DAS lass mal lieber, wenn der Plan ist, dass es stabil läuft.



  • Ne, das mit USB oder PCIe Karten wäre mir zu umständlich (zumal ich so etwas nicht habe). Das Problem wurde ja hier und an einigen anderen Stellen bereits angesprochen. Ich habe mich letztendlich direkt an Supermicro gewandt, doch leider eine Antwort bekommen, dass sie keine RMA Anfragen von Privatkunden bearbeiten können. Mit dieser Begründung mit dem Händler in Verbindung gesetzt und es wird nun über diesen abgewickelt.

    Mal sehen, wie es läuft. Ich melde mich später, wenn alles erledigt ist.



  • Wie ich gesagt habe, melde ich mich nach der Reparatur wieder. Leider hat sich das ganze doch sehr hingezogen, da ich das MB sogar 2 mal einschicken musste (nach dem 1. Ersatz, wurde es nicht besser) und zwischendurch verreist war, aber mittlerweile habe ich ein anderes MB der neuen Revision 1.02 und siehe da - mein Problem scheint gelöst zu sein!

    Nachdem ich nun das System wieder zusammengebaut habe, läuft es nun mit denselben Einstellungen seit 2,5 Tagen ohne jegliche Aussetzer.

    Ist aber schon ärgerlich, dass so etwas einem Serverboard passiert und man das Problem nicht schon früher gefixt hat.


  • Moderator

    Freut uns trotzdem zu hören, auch wenn es schade ist, dass das Board wohl der Verursacher war. Immerhin scheint man hier dazugelernt und das Board einer Revision unterzogen zu haben - deren Ergebnis du schlußendlich erhalten hast. Hoffentlich ist das dann auch das Ende für diese Fehler :)