Zufällige Reboots



  • Hallo zusammen

    Meine Beta pfSense 2.4 ist gerade spannend drauf. Seit ca. 3-4 Wochen bootet die Kiste in unregelmässigen Abständen neu. Teilweise nur 1x pro Tag, teilweise sind es aber 3-4 reboots täglich. Leider wird kein Crashreport generiert und ich sehe auch im Syslog nichts. Das einzige sind ein paar igmpproxy-warnings, welche aber schon lange immer wieder mal auftauchen. Dann plötzlich kein Eintrag mehr und dann der normale Bootupeintrag vom Kernel. Mein unten verlinktes Ticket wurde mit dem Verweis geschlossen, dass es fast immer hardware issues sind. Dem würde ich prinzipiell ja auch zustimmen. Dennoch kriege ich die kiste über cpuburn nicht runter und der memtest hat auch keine Fehler aufgezeigt. Auch ist es ECC-Memory und ECC ist auch aktiv, was Fehler somit aufzeigen würde. Die Stromversorgung ist stabil und die Temperatur im grünen Bereich.

    Ja, mir ist klar was eine Beta-Software ist. Dennoch möchte ich dem Issue auf den Grund gehen, auch wenn es in meiner privaten Infrastruktur noch kein kritisches Issue ist. Handelt es sich doch um einen Bug kann man ihn beheben und handelt es sich um einen PEBKAC (Problem Exists Between Keyboard And Chair), dann kann ich ja was daraus lernen :-)

    Hat jemand evtl. irgendwelche Ideen, ausser den Server zu ersetzen? Die Reaktivierung mit Swisscom ist immer so ein geknorze, wenn man den Router nicht verwendet.

    Aktuelle Massnahmen:

    • Nut deinstalliert

    • powerd deaktiviert

    durchgeführte Tests:

    • cpuburn

    • memtest

    Installierte Pakete:

    • AutoConfigBackup

    • Cron

    • nut (network client mode)

    • openvpn-client-export

    • Service_Watchdog

    • zabbix-agent

    Hardware:

    • Asus P9D-E/4L S1150 XEON E3 C224

    • Intel Xeon E3-1231 v3 3.4GHz/8MB

    • 2x Kingston ValueRAM 8GB (1x8) DDR3-1600 ECC CL11

    • Kingston SSDNow V300 60GB

    • Corsair CX Series CX430M - 430 Watt Netzteil

    • 6x Intel Pro IGB 1GBit Netzwerkkarten (4x onboard, 1x 2-Port)

    https://redmine.pfsense.org/issues/7641

    Ah ja, mein Setup:
    Es gibt sicherere Netzwerkarchitekturen, aber für mein Homesystem, dürfte das reichen ;-)

    
          WAN / Internet
                :
                : Glasfaser DHCP
                :
          .-----+------------.
          |  Mediaconverter  |
          '-----+------------'
                |
            WAN | IP or Protocol
                |
          .-----+-----.         .------------.
          |  pfSense  +------- -+ DMZ-Server |
          '-+-+-+-+---'         '------------'
            | | | |
            | | | |             .-----------------.
            | | | \-------------+ internal-Server |
            | | |               '-----------------'
            | | |
            | | |               .------------.
            | | \---------------+ Guest-WIFI |
            | |                 '------------'
            | |                 .-------------.
            | \-----------------+ LAB-Network |
            |                   '-------------'
            |
            |
      .-----+------.
      |    LAN     |
      '-----+------'
    
    

    Update 1, 2017-06-13:
    Nachdem der Server nun über 1.5 Tage ohne Reboot läuft, wird NUT wieder installiert. Sollte sich nichts an der Stabilität ändern, rückt powerd ganz stark in die Rolle des Verdächtigen.



  • Moin,

    AOL, hatte ich in meiner Testphase auch. Die Kinder kamen fluchend aus ihren Zimmern, keine verdächtigen Einträge, habe aber auch keine Zeit mit der Ursachenforschung verbracht.
    Zurück zu Stable und pfSense läuft  wieder stabil ;)

    -teddy



  • Servus

    Danke für die Rückmeldung. Zumindest bin ich nicht alleine damit.

    Jetzt auch mit Nut installiert, bootet der Server nicht mehr neu. Somit hat sich der verdacht auf Probleme mit powerd erhärtet. Das ist nun der einzige Unterschied zum Setup mit den reboots… Ich werde jetzt nochmals den Gegencheck durchführen und sollte bis morgen Abend kein reboot erfolgen, powerd nochmals aktivieren. Tritt das Problem wieder auf, dürfte es dort doch irgendwo ein Issue geben.

    powermanagement.... eine Odyssee mit allen Betriebssystemen, egal ob Windows, Linux oder BSD.... ich hatte noch immer Ärger damit  >:(

    Greets

    Philipp



  • Ok, so far so good….

    Auch heute keinen Neustart. Rocksolid und ohne issues. Jetzt habe ich powerd wieder aktiviert. Ich bin gespannt, wie lange es bis zum nächsten Restart geht.

    Greets

    Philipp



  • So that's it.

    powerd wieder aktiviert und schon kommen die reboots zurück. Da scheint es ein Problem zu geben. Mein letzter Bugreport wurde geschlossen, mit dem Verweis zuerst hier hin und dass es Hardware sei. Nun, bin ich ziemlich sicher, dass es powerd ist und ich glaube nicht daran, dass es die hardware ist. Soll ich das Ticket nochmals öffnen oder soll ich die Erkenntnis hier im Forum stehen lassen und das Issue ignorieren?

    Greets

    Philipp


  • Moderator

    Ich würde es neu öffnen und gezielt auf das Trial and Error hinweisen, dass es auf PowerD eingegrenzt werden kann.



  • Es gibt einen ähnlichen Report im Free-BSD bugtracker. Hier der Link: https://bugs.freebsd.org/bugzilla/show_bug.cgi?id=196468