Reinicios inesperados



  • He tenido problemas de reinicios en mi pfSense, creo que son problemas de memoria, memoria física, creo que pueda estar dañada la memoria RAM en ciertos sectores de esta, y cuando se utilizan creo que se inhibe y se apaga, el disco duro parece tener buen estado aún, y temperatura tampoco es, ya he pedido la memoria, y por si acaso le ha dado mantenimiento de pastas térmicas al micro y al puente norte de la tarjeta madre, pero los días aquí han estado más frescos que de costumbre, y no parece ir por ese lado, pero por si acaso lo he hecho. Los log no me dicen nada, tengo un problema con unas Wan, el modem de la compañía que me da servicio son muy corrientes y aún no me llegan los que he encargado para reemplazarlos, también he pedido memorias nuevas, pero de entrada, quisiera saber si puedo tener alguna solución cuando se apague, por ejemplo, poner otro equipo haciendo una especie de ping watchdog que cuando detecte que se ha caído le mande un wake up, eso imagino que solucionaría mi problema de manera temporal en lo que encuentro si el problema es efectivamente la RAM o algún otro problema, pero estoy muy seguro que es un detalle físico

    Mar 4 21:11:40 	check_reload_status 		updating dyndns OPT5_DHCP
    Mar 4 21:11:40 	check_reload_status 		Restarting ipsec tunnels
    Mar 4 21:11:40 	check_reload_status 		Restarting OpenVPN tunnels/interfaces
    Mar 4 21:11:40 	check_reload_status 		Reloading filter
    Mar 4 21:11:41 	php-fpm 	89681 	/rc.dyndns.update: MONITOR: OPT5_DHCP is available now, adding to routing group Balanceo 187.157.253.185|192.168.2.87|OPT5_DHCP|187.976ms|346.615ms|0.0%|none
    Mar 4 21:12:34 	check_reload_status 		updating dyndns OPT5_DHCP
    Mar 4 21:12:34 	check_reload_status 		Restarting ipsec tunnels
    Mar 4 21:12:34 	check_reload_status 		Restarting OpenVPN tunnels/interfaces
    Mar 4 21:12:34 	check_reload_status 		Reloading filter
    Mar 4 21:12:35 	php-fpm 	89681 	/rc.dyndns.update: MONITOR: OPT5_DHCP is down, omitting from routing group Balanceo 187.157.253.185|192.168.2.87|OPT5_DHCP|564.75ms|603.135ms|1%|down
    Mar 4 21:12:44 	check_reload_status 		updating dyndns OPT4_DHCP
    Mar 4 21:12:44 	check_reload_status 		Restarting ipsec tunnels
    Mar 4 21:12:44 	check_reload_status 		Restarting OpenVPN tunnels/interfaces
    Mar 4 21:12:44 	check_reload_status 		Reloading filter
    Mar 4 21:12:45 	php-fpm 	89681 	/rc.dyndns.update: MONITOR: OPT4_DHCP is down, omitting from routing group Balanceo 187.130.126.65|192.168.18.66|OPT4_DHCP|573.57ms|756.189ms|0.0%|down
    Mar 4 21:20:56 	syslogd 		kernel boot file is /boot/kernel/kernel
    Mar 4 21:20:56 	kernel 		Copyright (c) 1992-2016 The FreeBSD Project. 
    
    
    
    Mar 5 10:47:47 	check_reload_status 		updating dyndns OPT4_DHCP
    Mar 5 10:47:47 	check_reload_status 		Restarting ipsec tunnels
    Mar 5 10:47:47 	check_reload_status 		Restarting OpenVPN tunnels/interfaces
    Mar 5 10:47:47 	check_reload_status 		Reloading filter
    Mar 5 10:47:48 	php-fpm 	16228 	/rc.dyndns.update: MONITOR: OPT4_DHCP is down, omitting from routing group Balanceo 187.130.126.65|192.168.18.66|OPT4_DHCP|532.78ms|601.454ms|0.0%|down
    Mar 5 10:49:07 	check_reload_status 		updating dyndns OPT4_DHCP
    Mar 5 10:49:07 	check_reload_status 		Restarting ipsec tunnels
    Mar 5 10:49:07 	check_reload_status 		Restarting OpenVPN tunnels/interfaces
    Mar 5 10:49:07 	check_reload_status 		Reloading filter
    Mar 5 10:49:08 	php-fpm 	32261 	/rc.dyndns.update: MONITOR: OPT4_DHCP is available now, adding to routing group Balanceo 187.130.126.65|192.168.18.66|OPT4_DHCP|358.696ms|272.758ms|0.0%|delay
    Mar 5 12:38:31 	syslogd 		kernel boot file is /boot/kernel/kernel
    Mar 5 12:38:31 	kernel 		Copyright (c) 1992-2016 The FreeBSD Project.
    Mar 5 12:38:31 	kernel 		Copyright (c) 1979, 1980, 1983, 1986, 1988, 1989, 1991, 1992, 1993, 1994
    Mar 5 12:38:31 	kernel 		The Regents of the University of California. All rights reserved.
    Mar 5 12:38:31 	kernel 		FreeBSD is a registered trademark of The FreeBSD Foundation. 
    

    Estos son los dos reinicios, como yo lo veo, solo hay problemas con las Wan porque se caen debido a los ping altos que presentan, pero no tiene nada que ver con los reinicios, o al menos creo que eso no se ve en los logs


  • Rebel Alliance

    La "Fuente de Alimentación" está OK ? Una "Fuente" con problemas/fallas puede causar comportamiento errático….

    La/s Memoria/s... puedes "testearla" con "memtest" (pero dejarás fuera de servicio el equipo mientras realices el test)

    quisiera saber si puedo tener alguna solución cuando se apague, por ejemplo, poner otro equipo haciendo una especie de ping watchdog que cuando detecte que se ha caído le mande un wake up

    Puedes utilizar una IP PDU que tenga Ping Watchdog… las que utilizamos nosotros son las Aviosys IP POWER 9255Pro

    No le va  enviar un Wake-Up pero, si configuras la BIOS (AC PWR Loss) para que esté "Allways ON" y la IP PDU para que corte la energía unos segundos (OFF/ON), el equipo arrancará nuevamente…



  • Cierto @ptt, la fuente de poder no la he probado, pero si puede que esté dañada, lleva funcionando muchos años, adquirir una nueva y la cambiare, como ya he pedido las memorias, junto con las memorias, probare lo que usted dice, a ver si mi bios puede soportarlo, ahora mismo investigo sobre memtest para cuando estar seguro de que ha sido si problema de memoria o tal vez es la fuente, que tampoco cuento con un probador a la mano, y probablemente si lo puedo con un voltímetro a lo mejor si me da el voltaje correcto pero puede que no me esté dando el amperaje necesario o cuando se le exige cierta potencia ya no la puede brindar, así que esa la cambiare sin chistar gracias por el comentario sobre ese dato, me podría a investigar sobre el memtest en pfsense porque no encontré el paquete para instalar, imagino que tendré que hacerlo desde otro sistema, tal vez un linux en vivo o algo así.

    Muchas gracias por su apoyo.


  • Rebel Alliance

    No existe el paquete para pfSense….

    Debes "Bootear" con el memtest ;)

    http://www.memtest.org/

    Y, ya que estás "desarmando/revisando" realiza una inspección "visual" del Motherboard, a ver sin no tienes "dañados" alguno/s de los "Electrolíticos"(Capacitores).....  También la "Fuente" puede tener el mismo problema con los capacitores....




  • Si fue lo primero que hice revisar capacitores en la mother, pero no, todos se ven sanos, la fuente no la he desarmado, porque el pfsense esta en producción, y de por si ya hubo una caída de dos horas, lo que es frustrante para las personas, así que lo haré en la madrugada, veré si la fuente está con capacitores inflados, aún así no tendré la nueva hasta el día de mañana, mientras a descargar eso, a ver que tal, a ver si se puede llegar a la razón de los reinicios.