Cortes conectividad muy extraños
-
Buenos días.
Tenemos un XG-7100-1U en producción hace meses y de un tiempo a esta parte por momentos tenemos pérdida de conectividad pero de forma bastante peculiar. Os detallo la situación:
-Como WAN una fibra con HGU Movistar en modo bridge e IP fija.
-Como LAN un puerto de fibra trunk contra una red de switches Cisco SG350X.
-Me conecto desde nuestra oficina levantando una VPN l2tp.
-Monitoreo vía VPN varias ips detrás del Netgate sin problema, estable 100%
-Monitoreo la ip pública del Netgate y por momentos sube la latencia llegando a cortar.
-Monitoreo IPs públicas conocidas desde la LAN del Netgate y también por momentos sube la latencia y llega a cortar.
-En los momentos que sube la latencia también sube incluso desde los diagnósticos de la propia interfaz del pfsense.Lo que me desconcierta es que en ningún momento experimento problemas con la conexión VPN y no me sube la latencia contra los equipos monitorizados a través de la VPN con lo que descarto caída de la conexión a inernet. Algo extraño ocurre con el PFsense, doy por hecho que está relacionado con algún evento en la red local porque estos problemas sólo se dan en momentos de horario laboral.
¿Alguna idea de qué puede estar pasando? No veo nada raro a nivel logs, no hay problemas de saturación de ancho de banda ni subidas de CPU
Muchas gracias.
Saludos.
-
@pv-0 Puede que lo que te vaya a decir, no sea el caso, pero hace unos años, tuvimos un problema similar al tuyo donde un cliente que tenía conexión de fibra donde la conexión de fibra se utilizaba un dispositivo como el que te voy a mostrar que no recuerdo bien si se llamaba yibi o gibi, no recuerdo pero mira:
Si utilizas algo similar, revisa la velocidad de conexión, ya que tuvimos que bajarla debido a que pasaba ese tipo de situación que estás describiendo.En caso que no sea tu caso, por favor detalla si lo que te deja el ISP es fibra pura o te dejaron un router de fibra y cómo te lo configuraron.
Otra cosa, ese netgate XG-7100 que adquiriste, tiene 32 GB eMMC onboard y se puede expandir con SSD. Revisa el espacio asignado a Cache o similares a ver si no se está saturando, pero creo que más que todo, el problema podría ser el dispositivo propio del ISP al pfSense.
Saludos.
-
@brujonic antes de nada agradecer tu ayuda.
Aclaro lo que me preguntas. El ISP es Movistar, tenemos un acceso FTTH con router HGU en modo monopuesto, de aquí por cobre a una ethernet del NetGate configurada como PPPoE, con lo que éste asume la IP pública en su interfaz.
Respecto al XG-7100 ya tiene instalado el SSD de 256GB. Te dejo un pantallazo por si aclara algo más, incluso cuando tengo problemas en el dashboard veo todo igual.
Ayer tarde tuve otro corte y pude hacer algunas comprobaciones más en caliente. El resumen es que sólo consigo que recupere su estado normal tirando la interfaz de fibra que comunica con la LAN del cliente, o esperando a que estabilice sólo. Lo malo que no consigo saber qué eventos pueden estar ocurriendo en esa LAN para dejar "tonto" al NetGate.
Gracias de nuevo.
-
Por si ayuda en algo. Acabamos de sufrir otra caída. Revisando logs del PFsense me llaman la atención los siguientes, que se repitieron varias veces mientras estaba en fallo:
Mar 26 09:53:13 dhcpd 87743 3 bad IP checksums seen in 5 packets
Mar 26 09:53:13 dhcpd 87743 reuse_lease: lease age 84 (secs) under 25% threshold, reply with unaltered, existing lease for 192.168.4.124
Gracias de nuevo.
-
@pv-0 Revisa la configuración PPPoE del dispositivo y luego consultas con el ISP si todo está bien parametrizado, ya que es ahí donde considero puede estar el problema. Te dejo una captura de pantalla.
Esos datos, debes configurarlo con ayuda del ISP a ver si todo está bien.Ahora, con respecto a esas dos líneas de log que muestras, la primera (dhcpd 87743 3 bad IP checksums seen in 5 packets), si buscas en internet (Filtro Google) hay respuestas de que no se pudo realizar bien la negociación de la cabecera de paquetes IP y al realizar el chequeo de esa cabecera, esta no es correcta. Incluso en una respuesta en el foro de inglés de pfSense hablan de fallo en la interfaz de red (Unable to get DHCP IP!), así que revisa lo que podás del filtro dado.
Con respecto al segundo evento (dhcpd 87743 reuse_lease: lease age 84 (secs) under 25% threshold, reply with unaltered, existing lease for 192.168.4.124), te pregunto. ¿Estas usando una IP fija a un equipo y esa es la IP asignada? Si es así, puede que ese sea el problema de todo, ya que al parecer no puede liberarlo y está excediendo el tiempo de uso.
Si tenes equipos con IP fija, cómo se las estás asignando? por medio del pfSense con su MAC ADDRESS o directamente en el equipo? Si es en el equipo o en varios equipos, puede que esa IP fija asignada, el pfSense también se la esté asignando a otro equipo y por lo tanto las cabeceras IP de negociación estén fallando.
En ese caso, si tenes, por ejemplo, servidores de dominio, centrales telefónicas, serividores FTP, etc, es mejor que dejes las primeras IPs reservadas para eso y no dentro del rango que reparte pfSense. Por ejemplo en la IP LAN que usas es 192.168.4.X. Si tengo servidores y son menos de 10, utilizaría de la 192.168.4.2 hasta la 192.168.4.10 y configuraría el DHCP para repartir a partir de la 192.168.4.11 en adelante. De esa forma el DHCP asignará el resto de IPs a los equipos de la red y los anteriores NO los tomará en cuenta para repartir y estarían asignados manualmente a esos equipos sin que esas IP sean asignadas a otros equipos dentro del rango del DHCP.
Revisa eso a ver cómo te va. Saludos y seguimos.