[Solved] Massive Latenzen und Packteloss mit Telekom VDSL Anschluss
-
Wir haben das ganze bei verschiedenen Kunden ja auch im Einsatz, in dieser oder ähnlicher Konfiguration und nirgends mit der Telekom Probleme außer Packet Loss etc. aber keine Hohe Latenz bei so gut wie keiner Last. Und dabei ist es egal ob wir hinter Routern, FritzBoxen oder Modems stehen. Daher irritiert mich das Problem sehr und schon allein weil die Konfiguration nicht unüblich ist würde das IMHO viel häufiger hier aufschlagen, wenn es ein generelles Problem wäre. Deshalb habe ich da eher die Verkabelung (ggf. auch Verkabelung der Dose oder des DSLs) in Verdacht als die Software Seite. Ansonsten wäre eigentlich nur noch Hardware der pfSense (also Interfaces o.ä.) denkbar, was aber auch seltsam wäre.
Gruß
-
Vielen Dank für eure zahlreichen Meldungen. Wir haben die Fritzbox nun durch ein DrayTek Vigor165 ausgetauscht. Dies lief solange, bis Last auf die Backupleitung kommt.
Parallel dazu haben wir einen weiteren Standort mit zwei Glasfaserleitungen angebunden. Auch bei diesem haben wir die Latenzprobleme, so das ein Bug oder ein Fehler der pfSense für uns nun feststeht. Die Frage ist nur, woran es liegt. Wir werden weiter recherchieren, weshalb die pfSense Instanzen solch einen Mist seit einigen Monaten bauen.
Aktuell verwenden wir Hardware von AxiomTek die Modellreihen NA345R sowie NA342R. Parallel zum "lokalen" Betrieb haben wir einige IPSEC Tunnel sowie etliche VPN Nutzer (Bis zu 20) welche unsere Firewall parallel belasten. Als letzte Instanz überlegen wir, die Hardware gegen stärkere auszutauschen.
-
@Beliarsfire said in Massive Latenzen und Packteloss mit Telekom VDSL Anschluss:
so das ein Bug oder ein Fehler der pfSense für uns nun feststeht.
Schwierig, damit dürftet ihr ziemlich alleine stehen (bzgl. feststehen), denn MultiWAN Umgebungen sind jetzt nicht gerade selten und wäre da ein Bug "Standard" wäre das schon wie die sprichwörtliche Sau durchs Dorf getrieben worden. Daher würde ich da eher eine offene Haltung bewahren und andere Fehler nicht spezifisch ausschließen.
Zusätzlich wäre es aber sicher nicht verkehrt, dass im englischen Teil und/oder als Redmine Ticket / Support Case (je nachdem was für Möglichkeiten) aufzumachen.
Wenn das jetzt schon der zweite oder mehr Cluster oder Setup ist, wo das auftritt, würde ich aber auch ein generelles Konfigurationsproblem nicht ausschließen, denn wie gesagt: wir könnten hier sicherlich aus dem Stand weg ein Dutzend Kunden mit Dual- oder mehr WAN anschauen, bei denen teils sogar LoadBalancing (nicht nur Failover) läuft und beide Leitungen aktiv genutzt werden ohne dass eine mit hohen Latenzen austickt.
Ich habe leider auch noch nichts gelesen, was eigentlich eure pfSense Box(en) sind, also konkrete Hardware und ob hier bspw. immer das gleiche Interface im Spiel war, dass das Problem geworfen hat. Das wäre für mich ebenfalls noch ein Punkt, den ich da abklopfen würde.
Würde mich trotzdem freuen mehr zu erfahren bzw. zu lesen, ob und wie es sich lösen lies.
Grüße
-
Wir werden die Tage einen unsere Dell Server, die ordentliche Hardware haben, testweise mit ner pfSense bespielen und diesen aktiv einsetzen. Anschließend sollte sich herausfinden lassen, ob unsere Hardware schlichtweg nicht mit der Firma mitgewachsen ist.
-
@Beliarsfire said in Massive Latenzen und Packteloss mit Telekom VDSL Anschluss:
AxiomTek die Modellreihen NA345R sowie NA342R. Parallel zum "lokalen" Betrieb haben wir einige IPSEC Tunnel sowie etliche VPN Nutzer (Bis zu 20) welche unsere Firewall parallel belasten.
AxiomTek NA342R: Intel Celeron processor J1900 (Bay Trail)
AxiomTek NA345R: Intel Celeron N3350 or Atom x5-E3940 processor (Apollo Lake)Naja, die leistungsfähigste Hardware ist das nicht gerade.
Habt ihr nicht zufällig noch irgendwo einen alten Xeon Server herumstehen? Den würde ich kurz mit NICs aufrüsten und einmal probieren.(zu langsam geschrieben, schon beantwortet)Für mich klingt das danach, dass in der "Übertragungskette" ein Flaschenhals die maximale Kapazität erreicht und dann die Pakete nicht mehr ordentlich abgearbeitet werden. Sowas wie BufferBloat oder so... Hast Du Limiter konfiguriert?
Wie die NICs innerhalb der AxiomTeks angebunden sind ist nicht bekannt, oder?
Die WANs sind nicht zufällig beide auch noch PPPoE in der pfSense? Das allein würde jeweils schon die Performance eines CPU-Kerns kosten. -
@jahonix said in Massive Latenzen und Packteloss mit Telekom VDSL Anschluss:
Für mich klingt das danach, dass in der "Übertragungskette" ein Flaschenhals die maximale Kapazität erreicht und dann die Pakete nicht mehr ordentlich abgearbeitet werden. Sowas wie BufferBloat oder so... Hast Du Limiter konfiguriert?
Da würde ich mich anschließen, vielleicht auch je nach Durchsatz Interrupt Problem? Ich kenne zwar die Bandbreite nicht aber bei "2 Glasfasern" muss ich an >100 Mbit/s denken und da wäre ein J1900 schon ein bisschen schwach. Der Apollo Lake wäre da knapp aber ohne Zusatzkrams müsste ers auch noch gut schaffen. Sobald aber Filter oder gar Shaper ins Spiel kommen wirds böse.
-
Auf jeden Fall mal hier einen Thread auf englisch mit guter Problembeschreibung öffnen: https://forum.netgate.com/category/21/routing-and-multi-wan
Da gibt es dann mit etwas Glück auch Feedback von Entwicklern und/oder Netgate Support. ;-)-Rico
-
Ich habe so eben die pfSense testweise auf einem unserer Dell Server (32 Kerne, 64GB RAM, 6x 500 GB HDD) installiert. Sollte es bei diesem Gerät problemlos laufen, so dürfte die Hardware unser Störfaktor sein.
Angebunden an den pfSense"n sind an einem Standort zwei Glasfasleitungen (1 Gigabit und 500 Mbit) sowie einmalig mit 1 Gigabit angebunden.
-
Wir sind gespannt :)
-
Hallo,
nach einigen Testtagen haben wir die Fehlerursache lokalisiert. Unsere Hardware war schlichtweg den gestiegenen Anforderungen der letzten Jahre nicht mehr gewachsen. Die aktuelle Konfiguration läuft problemlos mit unserem Dell Server. Dort dümpelt die CPU bei 0% - 2% herum - Im Vergleich zur unserer "alten Firewall", dort waren es zwischen 30% - 85%.Sobald wir die Freigabe unserer Geschäftsführung haben, planen wir zwei XG-1537 anzuschaffen. Mal schauen, ab wann wir damit an den Start gehen können.
Das Problem kann also als gelöst betrachtet werden.
Vielen Dank für eure zahlreichen Antworten. :)