Alta disponibilidade com VMware



  • Pessoal, bom dia.

    Estou passando por alguns problemas em dois clientes distintos, estão com o mesmo sintoma.

    Tenho dois servidores físicos com VMware Esxi instalado, criei um PfSense em cada um porque estão em datacenters separados e a ideia é ter redundância.

    Para os PfSenses adicionei uma placa de rede que é a LAN e depois adicionei uma WAN e uma de sincronismo através de VLAN (1001 e 1002). Fiz toda a configuração dos switches, do CARP e sincronismo. Usei este link https://doc.pfsense.org/index.php/CARP_Configuration_Troubleshooting com as instruções de como configurar o VMware Esxi.

    A alta disponibilidade está funcionando perfeitamente, quando derrubo o PfSense primário o PfSense secundário assume e quando ligo o primário novamente os serviços e ips retornam para ele.

    O problema é que depois que ativei os IPs virtuais como CARP comecei a ter problemas na rede, as vezes perco pacotes de ping na rede local. Nesta rede temos um PABX IP com alguns telefones, também IP, os telefones chegam até a perder conexão com o PABX. Tenho certeza que é o CARP porque quando mudo os IPs virtuais para "Alias" o problema não acontece.

    Creio que seja o multicast.

    Alguém já enfrentou problemas parecidos? Podem que dar uma luz?

    Abraço.



  • Nesta rede temos um PABX IP com alguns telefones, também IP, os telefones chegam até a perder conexão com o PABX. Tenho certeza que é o CARP porque quando mudo os IPs virtuais para "Alias" o problema não acontece.

    O ideal é separar e colocar em outra vlan o PABX dando prioridade aos pacotes de dados e voz.

    Analise com o tcpdump.



  • Quando você tem essa perda de pacote, consegue identificar se o firewall secundário assumiu a conexão?
    Já vi switches que 'demoram' a atualizar suas tabelas de arp e nesse caso, o pfSense backup assume mas o switch continua mandando os pacotes para a porta do firewall principal.



  • @empbilly:

    Nesta rede temos um PABX IP com alguns telefones, também IP, os telefones chegam até a perder conexão com o PABX. Tenho certeza que é o CARP porque quando mudo os IPs virtuais para "Alias" o problema não acontece.

    O ideal é separar e colocar em outra vlan o PABX dando prioridade aos pacotes de dados e voz.

    Analise com o tcpdump.

    O problema não acontece somente com o PABX, toda a rede perde pacotes



  • @marcelloc:

    Quando você tem essa perda de pacote, consegue identificar se o firewall secundário assumiu a conexão?
    Já vi switches que 'demoram' a atualizar suas tabelas de arp e nesse caso, o pfSense backup assume mas o switch continua mandando os pacotes para a porta do firewall principal.

    Pelo que observei não, o firewall secundário não assume.



  • @matheus.oliveira:

    @empbilly:

    Nesta rede temos um PABX IP com alguns telefones, também IP, os telefones chegam até a perder conexão com o PABX. Tenho certeza que é o CARP porque quando mudo os IPs virtuais para "Alias" o problema não acontece.

    O ideal é separar e colocar em outra vlan o PABX dando prioridade aos pacotes de dados e voz.

    Analise com o tcpdump.

    O problema não acontece somente com o PABX, toda a rede perde pacotes

    Então tu precisa analisar melhor a infra da tua rede e verificar onde possa estar o problema, já que segundo você, não é somente o problema  com o PABX.



  • @empbilly:

    @matheus.oliveira:

    @empbilly:

    Nesta rede temos um PABX IP com alguns telefones, também IP, os telefones chegam até a perder conexão com o PABX. Tenho certeza que é o CARP porque quando mudo os IPs virtuais para "Alias" o problema não acontece.

    O ideal é separar e colocar em outra vlan o PABX dando prioridade aos pacotes de dados e voz.

    Analise com o tcpdump.

    O problema não acontece somente com o PABX, toda a rede perde pacotes

    Então tu precisa analisar melhor a infra da tua rede e verificar onde possa estar o problema, já que segundo você, não é somente o problema  com o PABX.

    Já analisei, o problema está no CARP, conforme o primeiro post.



  • @matheus.oliveira:

    Já analisei, o problema está no CARP, conforme o primeiro post.

    Em system  -> advanced -> system tunables, tem duas opções de ajuste de carp. Já pesquisou se em ambiente virtualizado é necessários ajustar esses valores?



  • @marcelloc:

    @matheus.oliveira:

    Já analisei, o problema está no CARP, conforme o primeiro post.

    Em system  -> advanced -> system tunables, tem duas opções de ajuste de carp. Já pesquisou se em ambiente virtualizado é necessários ajustar esses valores?

    Vou dar uma olhada, o único ajuste que eu fiz foi no próprio Vmware. No outro post você comentou que pode ser algum problema com o switch. Você acha que se eu mexer nos tempos do CARP pode resolver, se o problema for com os switches?

    Caso sim, você recomenda algum valor de "Advertising frequency"?

    Obrigado pela ajuda.