1.2.3 Release - Problemas com falha de energia



  • Olá pessoal.

    Tenho o pfSense versão 1.2.3-RELEASE instalado em vários servidores de clientes e estou passando pelo seguinte problema…

    Quando há falha de energia ou quando o usuário reinicia o servidor pelo bom e velho método "dedão no reset", ao religar o servidor o sistema não sobe. Ele executa as rotinas de fsck e logo após isto ele fica estacionado na seguinte linha:

    "init: can't exec getty '/usr/libexec/getty' for port /dev/ttyv0: no such file or directory"

    Note que isto ocorre apenas nas situação citadas acima, sendo que, se o servidor for reiniciado ou desligado corretamente o erro não ocorre. Quando ocorre este erro digito um "CTRL + ALT + DEL" forçando o servidor a reiniciar de maneira "correta" e o sistema volta normal.

    Vi em um tópico este erro mas referia-se à versão 2.0 BETA, onde inclusive disseram que era problema com a iso, mas não sei isso também se aplica à versão 1.2.3-RELEASE.

    Um outro fato interessante é o seguinte. Tenho servidores rodando pfSense 1.2.3-RELEASE em compact flash, com imagens geradas à partir de scripts e tenho servidores que rodam a mesma versão mas em HD. Nos servidores que usam compact flash este problema não acontece. Testei em máquina virtual também e não acontece o problema.

    Alguém já passou por este problema ou tem alguma idéia do que possa ser?  ???



  • Eu já tive esse mesmo problema, tanto na versão 1.2.3-RELEASE quanto na beta, porém nas versões mais recentes da beta (setembro em diante) o mesmo não tem ocorrido. Mas eu não recomendo usar beta para ambiente de produção.

    Há vários relatos no forum em Inglês sobre falhas de HDs quando há falta de energia. Tanto falha mecânica quanto no que diz respeito a perda do parâmetro que aponta qual é o disco físico a ser utilizado. A recomendação é utilizar no-break. Aliás, essa recomendação é mais do que básica para servidores e estações que rodam aplicativos de produção. Trata-se de um equipamento essencial para servidores, pelo menos!

    O difícil é convencer o cliente de que ele precisa ga$tar com no-break porque ele não pensa a médio/longo prazo: é imediati$ta.
    Mas quando o cliente começar a sentir no bolso as despesas com suporte técnico, troca de HDs por causa das quedas de energia, ou pior ainda, parada na produção, a primeira coisa que ele vai dizer é:

    • Por que você não me disse isso antes?


  • Sim johnnybe, é exatamente isso. Difícil achar um cliente que aceite nossas recomendações. Na maioria das vezes nem o hardware recomendavel o cliente traz. Por se tratar de um sistema leve, que não requer uma super máquina e que o cliente vai usar apenas como webserver, pegam qualquer k6 que está parado há anos no porão e quer que façamos milagres… imagina convencer a comprar um nobreak...

    Sem contar que não adianta. Por mais que a gente fale para não resetar o servidor no dedão, sempre tem um apressadinho que por uma falha de 5 minutos na conexão vai lá e mete o dedão no reset, sem nem saber ou perguntar o que está acontecendo.

    Mas, tirando a questão do nobreak e da maneira incorreta de resetar o servidor, você conseguiu encontrar alguma solução que não seja usar a versão beta?



  • Realmente isso é um problema
    Já tive esse tipo de problema tambem e ainda por cima o pessoal perde a confiança no software…coisa que é culpa de energia e não do Pf
    Concerteza um noobreak é a melhor opção...
    Agora levantando uma questão, se eu utilizar um noobreak inteligente, ele tem possibilidade de se desligar uma estação windows via software
    Isso no Pfsense será que é possivel??
    Acredito que não mas....quem sabe
    Abraço



  • @João:


    Agora levantando uma questão, se eu utilizar um noobreak inteligente, ele tem possibilidade de se desligar uma estação windows via software
    Isso no Pfsense será que é possivel??
    Acredito que não mas....quem sabe
    Abraço

    Se o No-Break for gerenciável via software e compatível com o SO, você programa ele para isso. Além dele desligar o sistema acoplado, antes disso o software salva todos trabalhos em execução antes de desligar.
    E isso serve também para o pfSense. Nesse caso, basta pesquisar compatibilidade do equipamento com o FreeBSD.



  • Ok entendi
    O dificil é achar um nobreak com um custo bom compativel para o freebsd
    tipo um sms ou um apc
    Abraço



  • Segundo sei, o APC gerenciavel é compatível.



  • Tenho aqui alguns nobreaks da Engetron que podem ser gerenciados por meio de uma placa de comunicação externa (WBRC). Sei que são compatíveis com Linux, mas ainda não tive a oportunidade e a curiosidade de testar em FreeBSD, mas agora que tocaram nesse assunto me bateu a curiosidade. Quando tiver um tempo aqui vou fazer alguns testes.



  • Caro johnnybe,

    Só a título de conhecimento. Estou configurando um servidor de balanceamento para um cliente e aroveitei para fazer o teste com o 2.0BETA para ver se resolveria o problema em questão. Eu já havia instalado o sistema 1.2.3 Release e estava começando a configurar o LoadBalancer quando resolvi fazer o teste. Fiz a atualização via pfSense mesmo lá em System -> Firmware. Ok, atualização perfeita, sistema funcionando perfeitamente e eis que fui fazer o teste do dedão. Cara, aí ferrou de vez… kkkkkk

    Enquanto estava com a versão 1.2.3 Release, cheguei a fazer o teste do dedão e aconteceu o mesmo erro que postei no início do tópico, bastando dar um CTRL + ALT + DEL e o sistema voltou justinho. Depois que atualizei para o 2.0BETA, ao resetar no dedão o sistema executa as rotinas de fsck e prossegue no carregamento do sistema mas para naquela etapa de definição de interfaces, mesmo que elas já tenham sido definidas. E tem outro detalhe fica em loop fazendo isso. Pede para definir as interfaces, faço a definição, confirmo aí volta a pedir para definir as interfaces... faço o mesmo processo novamente, acontece a mesma coisa e assim fica incessantemente.

    Alguma sugestão para este problema?

    Vou fazer mais alguns testes com uma máquina que tenho para testes aqui e quanto ao servidor vou usar o 1.2.3 mesmo... esse cliente pelo menos é mais consciente e inclusive já tem nobreaks em seu CPD, então acho que não vou ter muitas reclamações referentes a este problema.



  • Moises, a versão do pfSense que estou usando é 2.0-BETA4 (i386) built on Fri Nov 5 01:04:55 EDT 2010. Quero deixar claro que só não atualizei ainda essa versão do pfS porque há alguns problemas com o Snort na sua interface WEB. Mas desde que a instalei, já aconteceu falta de energia por duas vezes em minha casa, daquelas abruptas! Quando a energia voltou a máquina subiu sózinha (configuração do BIOS) e sem qualquer problema.
    A máquina onde meu pfSense roda é um Athlon XP 1700+@866mhz, mobo ASUS A7N8X-X (com ultima versão do BIOS), HD IDE Maxtor de 40Gb.

    Devo dizer ainda que eu vinha fazendo updates do pfS semanalmente desde agosto/2010. Não faz muito tempo, acho que no final de outubro, após um update seguido de desligar/religar o sistema, a falha ocorreu novamente. Porém, como eu disse antes, na versão que estou usando, mesmo se eu "meter o dedão" no reset, nada acontece de mal.

    Uma das coisas que o próprio livro do pfSense fala, sobre falha de hardware, é sobre atualização e seleção dos parâmetros no BIOS. Procure desabilitar tudo o que for possível nas opções do BIOS, principalmente a opção PNP OS. Outro ponto é que algumas mobos funcionam bem com o parâmetro de Power Management Interface setada em ON, outras não. E vai por aí… experimente, faça testes...
    O que eu quero dizer é que ninguém consegue resolver problemas relacionados a hardware se esse hardware não tem um mínimo de confiabilidade: pcchips, realtek, entre outros.



  • Entendi…

    Valeu pela dica. Logo farei alguns testes nesse sentido e posto o resultado.

    Abraço :-)


Log in to reply