Problema com Failover



  • Boa Tarde pessoal…Estou enfrentando um problema com o failover, tenho um link de 120MB e outro de 10MB, configurei o faiover para meu link de 120MB(NET) ser o principal(Tier 1) e meu link de 10mb(SIM TELECOM)  ser meu bkp(Tier 2), em Gateway Groups configurei o trigger Level  para member down pois minha intenção é que o link de 10mb entre em caso de queda do link principal, o problema é que o pfsense  esta jogando para meu link de bkp(10mb) todas as vezes que o link principal esta com sua carga acima dos 25mb de trafego pois é óbvio que quanto maior o trafego em cima do link maior a latência para o ip do monitor do gateway, em nenhum momento existe de fato perda de pacote para o pfsense jogar as conexoes para o link de bkp e sim somente aumento de latência.

    Esse comportamento eu esperaria caso meu trigger level fosse para qualquer outra opção que não a “member down”, pois eu só quero que o link de bkp assuma caso de fato haja queda no link principal.

    O problema que eu tenho com isso é que durante todo o dia o pfsense fica jogando minhas conexões para o link de bkp pois obviamente durante o dia minha latência acaba ficando maior no link principal devido a uso.

    Não estou conseguindo de forma alguma ver onde esta o problema, agradeço quem puder me ajudar.

    Anexo imagens das minhas configurações pra ilustrar meu cenário.










  • Você percebe essa latência ou o motivo do chaveamento nos logs e/ou gráficos do fw?



  • @marcelloc:

    Você percebe essa latência ou o motivo do chaveamento nos logs e/ou gráficos do fw?

    Então Marcelo essa latência é percebida pela dashboard no monitor dos gateways, porem é como falei a latência sobe mais não a perda de pacotes, pq paralelo disparo um ping para o mesmo ip do monitor dos gateways e vejo que a latência esta de fato mais alta pelo trafego estar mais alto no link, porem não a queda de pacotes para justificar o chaveamento para o link de bkp.

    Olha o log que chega no meu email todas as vezes que acontece o chaveamento:

    _**E-mail as 12:42hs
    MONITOR: GW_WAN is down, omitting from routing group GW_FO
    201.49.148.135|192.168.0.2|GW_WAN|21.514ms|4.017ms|21%|down

    E-mail as 12:43hs
    MONITOR: GW_WAN is available now, adding to routing group GW_FO
    201.49.148.135|192.168.0.2|GW_WAN|21.849ms|13.72ms|17%|loss**_

    É sempre assim ele chaveia para o link de bkp, 1min depois já volta para o link principal, ai basta o trafego do link principal subir novamente ai sobre a latência e ele volta a chavear e sempre a mesmo ciclo, chaveia 1min depois volta para o principal. Isso acontece pelo menos umas 10 vezes durante o horário de expediente.

    Será que seria o caso de fazer alguma configuração se é que existe para o pfsense só chavear para o link de bkp após X perdas de pacotes?

    Agradeço a ajuda.



  • Está na 2.3.4? Se não estiver, já viu no chance log se tem alguma correção na rotina de monitoramento do link? A mensagem do log mostra member down.



  • @marcelloc:

    Está na 2.3.4? Se não estiver, já viu no chance log se tem alguma correção na rotina de monitoramento do link? A mensagem do log mostra member down.

    Sim esta na versão 2.3.4…Sigo aqui na busca do que pode estar acontecendo.



  • @rafaelvaranda:

    Sim esta na versão 2.3.4…Sigo aqui na busca do que pode estar acontecendo.

    teste outro ip de monitoria.



  • @marcelloc:

    @rafaelvaranda:

    Sim esta na versão 2.3.4…Sigo aqui na busca do que pode estar acontecendo.

    teste outro ip de monitoria.

    Então antes eu usava os de DNS da google 8.8.8.8 e 8.8.4.4. porem também dava esse mesmo problema, ai mudei para os da ntp.br, mais vou tentar colocar outros pra ver…



  • Coloque um próximo, de preferência logo após o roteador.