Netgate Discussion Forum
    • Categories
    • Recent
    • Tags
    • Popular
    • Users
    • Search
    • Register
    • Login

    Gateway Monitoring está travando

    Scheduled Pinned Locked Moved Portuguese
    26 Posts 6 Posters 4.3k Views
    Loading More Posts
    • Oldest to Newest
    • Newest to Oldest
    • Most Votes
    Reply
    • Reply as topic
    Log in to reply
    This topic has been deleted. Only users with topic management privileges can see it.
    • F Offline
      fabianoheringer
      last edited by

      Pessoal, estou tendo um problema ao monitorar meus gateways, em algum momento ele para de monitorar, e fica constando somente a ultima informação. Pode derrubar a interface, desligar cabo, e ele continua do mesmo jeito, conforme a imagem em anexo

      Note que a interface "OI" está down, mas o gateway GWOI (que está configurada na interface OI), continua Online, esses valores que estão travados.

      Tenho percebido isso, e tem atrapalhado meu balanceamento, pois quando um link cai, ele continua como Online, mas sendo que está parado

      To usando pFsense 2.1, em um Vmware Sphere 5.1 (com interface E1000, ja testei com o VMXNET3, troquei achando que fosse esse o problema)

      Verifiquei, e o apinger, está rodando.

      Alguma idéia?

      gw.jpg
      gw.jpg_thumb

      1 Reply Last reply Reply Quote 0
      • marcellocM Offline
        marcelloc
        last edited by

        A forma mais eficiente para monitorar é testar um ip depois do gateway.

        Se o ip lan do gateway estiver respondendo, para o pfsense o link está ok.

        Para ter certeza que o ip de testes saia pelo link x, crie uma rota estática em system-> routing.

        Treinamentos de Elite: http://sys-squad.com

        Help a community developer! ;D

        1 Reply Last reply Reply Quote 0
        • H Offline
          henriquejensen
          last edited by

          Ressucitando o tópico, estou com o mesmo problema em um dos servidores que uso FailOver. Meu link principal é adsl gvt de 35mb, o ip monitorado está o dns do google 8.8.8.8. De vez em quando o apinger pára, fazendo acionar o failover errado, mesmo eu estando com gvt à 100%. Meu link de reserva é uma Oi com pppoe direto no pfsense.
          Se reinicio o seriço do apinger em Status>Services>apinger "clico no restart service" tudo volta ao normal por um tempo.

          Alguém tem ideia do que possa ser isso?

          1 Reply Last reply Reply Quote 0
          • V Offline
            victorfmaraujo
            last edited by

            @henriquejensen:

            Ressucitando o tópico, estou com o mesmo problema em um dos servidores que uso FailOver. Meu link principal é adsl gvt de 35mb, o ip monitorado está o dns do google 8.8.8.8. De vez em quando o apinger pára, fazendo acionar o failover errado, mesmo eu estando com gvt à 100%. Meu link de reserva é uma Oi com pppoe direto no pfsense.
            Se reinicio o seriço do apinger em Status>Services>apinger "clico no restart service" tudo volta ao normal por um tempo.

            Alguém tem ideia do que possa ser isso?

            Eu ia abrir uma thread agora sobre isso.

            Estou com o mesmo problema.  Em algum momento um de meus links é marcado como offline (Quando na verdade não está)
            Estou utilizando a versão 2.1.5 amd64

            E os logs não informam muita coisa

            pinger: ALARM: GW_VIRTUA(208.67.222.222) *** down ***
            Sep 26 13:40:48 apinger: ALARM: GW_GVT(8.8.4.4) *** down ***
            Sep 26 14:00:27 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** down ***
            Sep 26 14:06:12 apinger: SIGHUP received, reloading configuration.
            Sep 26 14:06:12 apinger: alarm canceled (config reload): GW_GVT(8.8.4.4) *** down ***
            Sep 26 14:07:25 apinger: ALARM: GW_GVT(8.8.8.8) *** down ***
            Sep 26 14:08:37 apinger: alarm canceled: GW_GVT(8.8.8.8) *** down ***
            Sep 26 16:09:17 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:09:36 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:09:48 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:10:06 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:10:30 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:11:21 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:11:30 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:12:47 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:13:29 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:13:58 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:14:22 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:14:51 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:15:02 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:16:18 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:16:34 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:23:00 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:23:13 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:23:26 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:23:48 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 16:23:57 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 17:09:28 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 17:09:49 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 17:24:00 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 26 17:24:28 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 27 01:09:15 apinger: ALARM: GW_GVT(8.8.8.8) *** down ***
            Sep 27 01:09:17 apinger: alarm canceled: GW_GVT(8.8.8.8) *** down ***
            Sep 27 12:04:34 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 27 12:04:46 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 27 17:48:04 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 27 17:49:12 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 28 09:18:16 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 28 09:18:31 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 28 09:48:41 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 28 09:49:07 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 28 10:52:51 apinger: ALARM: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 28 10:53:53 apinger: alarm canceled: GW_VIRTUA(208.67.222.222) *** delay ***
            Sep 28 14:08:39 apinger: ALARM: GW_GVT(8.8.8.8) *** down ***
            Sep 29 11:26:47 apinger: Exiting on signal 15.
            Sep 29 11:26:48 apinger: Starting Alarm Pinger, apinger(54247)

            o Link simplesmente cai e não volta.

            1 Reply Last reply Reply Quote 0
            • H Offline
              henriquejensen
              last edited by

              Sim victorfmaraujo, problema sério pra quem usa FailOver né  :-[

              Mas ficamos no aguardo sobre uma solução.
              Será que se rodar um cron pra dar restart no seviço de 2 em dois minutos não contorna o problema por enquanto até sair uma solução definitiva?

              1 Reply Last reply Reply Quote 0
              • V Offline
                victorfmaraujo
                last edited by

                @henriquejensen:

                Sim victorfmaraujo, problema sério pra quem usa FailOver né  :-[

                Mas ficamos no aguardo sobre uma solução.
                Será que se rodar um cron pra dar restart no seviço de 2 em dois minutos não contorna o problema por enquanto até sair uma solução definitiva?
                [/quote]

                fiz isso e não resolveu :(

                1 Reply Last reply Reply Quote 0
                • H Offline
                  henriquejensen
                  last edited by

                  fiz isso e não resolveu :(

                  tamo na merda então…...ahurehuahuehuhaue

                  1 Reply Last reply Reply Quote 0
                  • S Offline
                    santello
                    last edited by

                    Tente utilizar ips da própria operadora, de um tracert e verifica um router no caminho de cada link. Ips google tem ICMP controlado.

                    1 Reply Last reply Reply Quote 0
                    • H Offline
                      henriquejensen
                      last edited by

                      @santello:

                      Tente utilizar ips da própria operadora, de um tracert e verifica um router no caminho de cada link. Ips google tem ICMP controlado.

                      caraca man….não sabia disso não.
                      Troquei agora o monitoring para o ip 177.97.164.1 , que acredito que seja o primeiro gateway que atende a minhão região da GVT segundo o tracert.

                      1 Reply Last reply Reply Quote 0
                      • H Offline
                        henriquejensen
                        last edited by

                        santello, mudei os ips ontem e até agora tá funfando certinho, vamos ver se não dá pau de novo, se resolver mesmo já fica aqui meu agradecimento pela dica  ;D :) ;D :)

                        1 Reply Last reply Reply Quote 0
                        • H Offline
                          henriquejensen
                          last edited by

                          @henriquejensen:

                          santello, mudei os ips ontem e até agora tá funfando certinho, vamos ver se não dá pau de novo, se resolver mesmo já fica aqui meu agradecimento pela dica  ;D :) ;D :)

                          Não deu, agora falha menos, mas quando o monitoring pára ele não volta mais à funcionar, só indo na mão mesmo e reiniciando o serviço do apinger  :-[

                          1 Reply Last reply Reply Quote 0
                          • H Offline
                            henriquejensen
                            last edited by

                            solução bem boqueta para o apinger ficar reinciando de 5 em 5 mim.

                            pkill -15 apinger | ping -c 5 localhost | /usr/local/sbin/apinger -c /var/etc/apinger.conf

                            configurar no cron.

                            1 Reply Last reply Reply Quote 0
                            • S Offline
                              santello
                              last edited by

                              Tenho dois links monitorados pelo apinger, pf versão 2.1.5-RELEASE (amd64).

                              Funcionamento normal no meu caso.

                              1 Reply Last reply Reply Quote 0
                              • V Offline
                                victorfmaraujo
                                last edited by

                                @henriquejensen:

                                solução bem boqueta para o apinger ficar reinciando de 5 em 5 mim.

                                pkill -15 apinger | ping -c 5 localhost | /usr/local/sbin/apinger -c /var/etc/apinger.conf

                                configurar no cron.

                                Henriquejensen, o comando é pkill ou kill ?

                                1 Reply Last reply Reply Quote 0
                                • H Offline
                                  henriquejensen
                                  last edited by

                                  pelo oque eu segui nesse tópico é pkill mesmo https://forum.pfsense.org/index.php?topic=69533.30

                                  No manual do linux pkill seria isso:

                                  pkill will send the specified signal (by default SIGTERM) to each process instead of listing them on stdout.

                                  1 Reply Last reply Reply Quote 0
                                  • V Offline
                                    victorfmaraujo
                                    last edited by

                                    Sabe o que é mais esquisito?

                                    Em meu cliente onde esse problema está ocorrendo possuo 2 Pfsenses configurados com CARP

                                    nos dois ocorre esse problema.  Não sei mais o que fazer.

                                    1 Reply Last reply Reply Quote 0
                                    • H Offline
                                      henriquejensen
                                      last edited by

                                      Chato isso né cara, um serviço tão básico essencial pra quem trabalha com multiplos links dando problema desse jeito  :-[

                                      1 Reply Last reply Reply Quote 0
                                      • V Offline
                                        victorfmaraujo
                                        last edited by

                                        @henriquejensen:

                                        Chato isso né cara, um serviço tão básico essencial pra quem trabalha com multiplos links dando problema desse jeito  :-[
                                        [/quote]

                                        Experimente instalar o pacote Service Watchdog.  Ele monitora os daemons e reinicia caso eles travem e envia uma notificação por email.

                                        Lembre-se de configurar o envio de emails em System > advanced > notifications.

                                        1 Reply Last reply Reply Quote 0
                                        • H Offline
                                          henriquejensen
                                          last edited by

                                          Experimente instalar o pacote Service Watchdog.  Ele monitora os daemons e reinicia caso eles travem e envia uma notificação por email.

                                          Lembre-se de configurar o envio de emails em System > advanced > notifications.

                                          Obrigado pela dica victorfmaraujo, mas o problema é que o serviço apinger continua funcionando mas detectando o gateway como offline, creio eu que o Watchdog nesse caso não vai surtir efeito, mas mesmo assim vou baixar e testar  ;)

                                          1 Reply Last reply Reply Quote 0
                                          • S Offline
                                            santello
                                            last edited by

                                            Fez o teste colocando o IP da sua interface no monitor?

                                            Lembrando que não é regra, mas pode acontecer do gateway default estar impossibilitando a rota para tal ip, tente colocar 4.2.2.2 em uma interface e 4.2.2.1 em outra, caso falhe, adicione rotas estáticas para garantir  que a saída vai ser pelo gw correto.

                                            1 Reply Last reply Reply Quote 0
                                            • First post
                                              Last post
                                            Copyright 2025 Rubicon Communications LLC (Netgate). All rights reserved.