Netgate Discussion Forum
    • Categories
    • Recent
    • Tags
    • Popular
    • Users
    • Search
    • Register
    • Login

    pfsense Crash NMI indicates hardware failure

    Scheduled Pinned Locked Moved Deutsch
    9 Posts 4 Posters 1.0k Views
    Loading More Posts
    • Oldest to Newest
    • Newest to Oldest
    • Most Votes
    Reply
    • Reply as topic
    Log in to reply
    This topic has been deleted. Only users with topic management privileges can see it.
    • B
      bosco
      last edited by

      Hallo Zusammen,

      meine pfsense hat seit einem Tag abstürze und macht einen automatischen reboot. Dann läuft pfsense wieder für ein paar Stunden und dann wiederholt sich der Crash. Ich habe jetzt erst mal den Supermicro Server stromlos gemach und dann wieder eingeschaltet. Ich warte ob der Crash wieder kommt.

      Wer kann helfen? Danke

      Hier der Crash Report:

      Crash report begins.  Anonymous machine information:
      
      amd64
      12.3-STABLE
      FreeBSD 12.3-STABLE RELENG_2_6_0-n226742-1285d6d205f pfSense
      
      Crash report details:
      
      No PHP errors found.
      
      Filename: /var/crash/info.0
      Dump header from device: /dev/ada0p2
        Architecture: amd64
        Architecture Version: 4
        Dump Length: 77824
        Blocksize: 512
        Compression: none
        Dumptime: Tue Sep 27 09:29:16 2022
        Hostname: pfSense.rbsnet
        Magic: FreeBSD Text Dump
        Version String: FreeBSD 12.3-STABLE RELENG_2_6_0-n226742-1285d6d205f pfSense
        Panic String: NMI indicates hardware failure
        Dump Parity: 1624451452
        Bounds: 0
        Dump Status: good
      
      Filename: /var/crash/textdump.tar.0
      
      usbus1 on ehci0
      usbus1: 480Mbps High Speed USB v2.0
      ahci0: <Intel Avoton AHCI SATA controller> port 0xe150-0xe157,0xe140-0xe143,0xe130-0xe137,0xe120-0xe123,0xe040-0xe05f mem 0xdf2f2000-0xdf2f27ff irq 19 at device 23.0 on pci0
      ahci0: AHCI v1.30 with 4 3Gbps ports, Port Multiplier not supported
      ahcich0: <AHCI channel> at channel 0 on ahci0
      ahcich1: <AHCI channel> at channel 1 on ahci0
      ahcich2: <AHCI channel> at channel 2 on ahci0
      ahcich3: <AHCI channel> at channel 3 on ahci0
      ahci1: <Intel Avoton AHCI SATA controller> port 0xe110-0xe117,0xe100-0xe103,0xe0f0-0xe0f7,0xe0e0-0xe0e3,0xe020-0xe03f mem 0xdf2f1000-0xdf2f17ff irq 19 at device 24.0 on pci0
      ahci1: AHCI v1.30 with 2 6Gbps ports, Port Multiplier not supported
      ahcich4: <AHCI channel> at channel 0 on ahci1
      ahcich5: <AHCI channel> at channel 1 on ahci1
      isab0: <PCI-ISA bridge> at device 31.0 on pci0
      isa0: <ISA bus> on isab0
      apei0: <ACPI Platform Error Interface> on acpi0
      uart0: <16550 or compatible> port 0x3f8-0x3ff irq 4 flags 0x10 on acpi0
      uart1: <16550 or compatible> port 0x2f8-0x2ff irq 3 on acpi0
      orm0: <ISA Option ROMs> at iomem 0xc0000-0xc7fff,0xc8000-0xc8fff pnpid ORM0000 on isa0
      atkbdc0: <Keyboard controller (i8042)> at port 0x60,0x64 on isa0
      atkbd0: <AT Keyboard> irq 1 on atkbdc0
      kbd0 at atkbd0
      atkbd0: [GIANT-LOCKED]
      est0: <Enhanced SpeedStep Frequency Control> on cpu0
      ZFS filesystem version: 5
      ZFS storage pool version: features support (5000)
      Timecounters tick every 1.000 msec
      Trying to mount root from zfs:pfSense/ROOT/default []...
      ugen1.1: <Intel EHCI root HUB> at usbus1
      Root mount waiting for: usbus0 usbus1 CAM
      ugen0.1: <0x1912 XHCI root HUB> at usbus0
      uhub1: <Intel EHCI root HUB, class 9/0, rev 2.00/1.00, addr 1> on usbus1
      uhub0: <0x1912 XHCI root HUB, class 9/0, rev 3.00/1.00, addr 1> on usbus0
      uhub0: 8 ports with 8 removable, self powered
      Root mount waiting for: usbus1 CAM
      Root mount waiting for: usbus1 CAM
      uhub1: 8 ports with 8 removable, self powered
      Root mount waiting for: usbus1 CAM
      ugen1.2: <vendor 0x8087 product 0x07db> at usbus1
      uhub2 on uhub1
      uhub2: <vendor 0x8087 product 0x07db, class 9/0, rev 2.00/0.02, addr 2> on usbus1
      Root mount waiting for: usbus1 CAM
      uhub2: 4 ports with 4 removable, self powered
      ugen1.3: <vendor 0x0557 product 0x7000> at usbus1
      uhub3 on uhub2
      uhub3: <vendor 0x0557 product 0x7000, class 9/0, rev 2.00/0.00, addr 3> on usbus1
      uhub3: 4 ports with 3 removable, self powered
      Root mount waiting for: usbus1 CAM
      ugen1.4: <vendor 0x0557 product 0x2419> at usbus1
      ukbd0 on uhub3
      ukbd0: <vendor 0x0557 product 0x2419, class 0/0, rev 1.10/1.00, addr 4> on usbus1
      kbd2 at ukbd0
      Root mount waiting for: CAM
      Root mount waiting for: CAM
      Root mount waiting for: CAM
      ada0 at ahcich4 bus 0 scbus4 target 0 lun 0
      ada0: <KINGSTON SA400S37120G 03070009> ACS-3 ATA SATA 3.x device
      ada0: Serial Number 50026B778318AC21
      ada0: 600.000MB/s transfers (SATA 3.x, UDMA6, PIO 512bytes)
      ada0: Command Queueing enabled
      ada0: 114473MB (234441648 512 byte sectors)
      <118>Configuring crash dumps...
      <118>Using /dev/ada0p2 for dump device.
      <118>Filesystems are clean, continuing...
      <118>Mounting filesystems...
      <118>
      <118>        __
      <118> _ __  / _|___  ___ _ __  ___  ___
      <118>| '_ \| |_/ __|/ _ \ '_ \/ __|/ _ \
      <118>| |_) |  _\__ \  __/ | | \__ \  __/
      <118>| .__/|_| |___/\___|_| |_|___/\___|
      <118>|_|
      <118>
      <118>
      <118>Welcome to pfSense 2.6.0-RELEASE...
      <118>
      <118>No core dumps found.
      <118>...ELF ldconfig path: /lib /usr/lib /usr/lib/compat /usr/local/lib /usr/local/lib/compat/pkg /usr/local/lib/compat/pkg /usr/local/lib/ipsec /usr/local/lib/perl5/5.32/mach/CORE
      <118>32-bit compatibility ldconfig path:
      <118>done.
      <118>>>> Removing vital flag from php74... done.
      <118>External config loader 1.0 is now starting... ada0p1 ada0p3
      <118>Launching the init system...Updating CPU Microcode...
      CPU: Intel(R) Atom(TM) CPU  C2750  @ 2.40GHz (2400.07-MHz K8-class CPU)
        Origin="GenuineIntel"  Id=0x406d8  Family=0x6  Model=0x4d  Stepping=8
        Features=0xbfebfbff<FPU,VME,DE,PSE,TSC,MSR,PAE,MCE,CX8,APIC,SEP,MTRR,PGE,MCA,CMOV,PAT,PSE36,CLFLUSH,DTS,ACPI,MMX,FXSR,SSE,SSE2,SS,HTT,TM,PBE>
        Features2=0x43d8e3bf<SSE3,PCLMULQDQ,DTES64,MON,DS_CPL,VMX,EST,TM2,SSSE3,CX16,xTPR,PDCM,SSE4.1,SSE4.2,MOVBE,POPCNT,TSCDLT,AESNI,RDRAND>
        AMD Features=0x28100800<SYSCALL,NX,RDTSCP,LM>
        AMD Features2=0x101<LAHF,Prefetch>
        Structured Extended Features=0x2282<TSCADJ,SMEP,ERMS,NFPUSG>
        Structured Extended Features3=0xc000400<MD_CLEAR,IBPB,STIBP>
        VT-x: PAT,HLT,MTF,PAUSE,EPT,UG,VPID
        TSC: P-state invariant, performance statistics
      <118>Done.
      <118>.... done.
      <118>Initializing.................. done.
      <118>Starting device manager (devd)...
      ums0 on uhub3
      ums0: <vendor 0x0557 product 0x2419, class 0/0, rev 1.10/1.00, addr 4> on usbus1
      ums0: 3 buttons and [XYZ] coordinates ID=0
      <118>done.
      <118>Loading configuration......done.
      <118>Updating configuration...done.
      <118>Checking config backups consistency.................................done.
      <118>Setting up extended sysctls...done.
      aesni0: <AES-CBC,AES-CCM,AES-GCM,AES-ICM,AES-XTS> on motherboard
      WARNING: Device "crypto" is Giant locked and may be deleted before FreeBSD 14.0.
      coretemp0: <CPU On-Die Thermal Sensors> on cpu0
      <118>Setting timezone...done.
      <118>Configuring loopback interface...
      <6>lo0: link state changed to UP
      <118>done.
      <118>Starting syslog...done.
      <118>Starting Secure Shell Services...done.
      <118>Setting up interfaces microcode...done.
      <118>Configuring loopback interface...done.
      <118>Configuring VLAN interfaces...
      <6>vlan0: changing name to 'igb0.7'
      <118>done.
      <118>Configuring MANAGEMENT interface...done.
      <118>Configuring WEBSERVER interface...done.
      <118>Configuring LAN interface...done.
      <118>Configuring WAN interface...
      <6>ng0: changing name to 'pppoe0'
      <6>igb0: link state changed to UP
      <6>igb0.7: link state changed to UP
      <6>igb3: link state changed to UP
      <6>igb2: link state changed to UP
      <118>done.
      <118>Configuring CARP settings...done.
      <118>Syncing OpenVPN settings...
      <6>tun3: changing name to 'ovpns3'
      <6>ovpns3: link state changed to UP
      <6>tun4: changing name to 'ovpns4'
      <6>igb1: link state changed to UP
      <6>ovpns4: link state changed to UP
      <6>tun1: changing name to 'ovpns1'
      <118>done.
      <6>ovpns1: link state changed to UP
      <6>pflog0: promiscuous mode enabled
      <118>Configuring firewall......done.
      <118>Starting PFLOG...done.
      <118>Setting up gateway monitors...done.
      <118>Setting up static routes...route: writing to routing socket: Network is unreachable
      <118>done.
      <118>Synchronizing user settings...done.
      <118>Configuring CRON...done.
      <118>Bootstrapping clock...done.
      <118>Starting NTP Server...done.
      <118>Starting webConfigurator...done.
      <118>Starting DHCP service...done.
      <118>Starting DHCPv6 service...done.
      <118>Configuring firewall......done.
      <6>ovpns3: link state changed to DOWN
      <6>ovpns3: link state changed to UP
      <118>Starting SNMP daemon... done.
      <118>Generating RRD graphs...done.
      <6>ovpns4: link state changed to DOWN
      <6>ovpns4: link state changed to UP
      <118>Starting syslog...done.
      <118>Starting CRON... done.
      <118> Starting package Cron...done.
      <118> Starting package acme...done.
      <118> Starting package Telegraf...done.
      <118> Starting package arpwatch...done.
      <118> Starting package nmap...done.
      <118> Starting package haproxy...done.
      <118> Starting package Service Watchdog...done.
      <118> Starting package OpenVPN Client Export Utility...done.
      <118>pfSense 2.6.0-RELEASE amd64 Mon Jan 31 19:57:53 UTC 2022
      <118>Bootup complete
      <6>ovpns1: link state changed to DOWN
      <6>ovpns1: link state changed to UP
      <6>igb1: promiscuous mode enabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <6>igb3: promiscuous mode disabled
      <6>igb1: promiscuous mode disabled
      <6>igb2: promiscuous mode disabled
      <6>igb1: promiscuous mode enabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <6>igb2: promiscuous mode disabled
      <6>igb3: promiscuous mode disabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <6>ovpns4: link state changed to DOWN
      <6>ovpns4: link state changed to UP
      <6>igb1: promiscuous mode disabled
      <6>igb2: promiscuous mode disabled
      <6>igb3: promiscuous mode disabled
      <6>igb1: promiscuous mode enabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <6>ovpns3: link state changed to DOWN
      <6>ovpns3: link state changed to UP
      <6>igb3: promiscuous mode disabled
      <6>igb2: promiscuous mode disabled
      <6>igb1: promiscuous mode disabled
      <6>igb1: promiscuous mode enabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <6>ovpns4: link state changed to DOWN
      <6>ovpns4: link state changed to UP
      <6>igb1: promiscuous mode disabled
      <6>igb2: promiscuous mode disabled
      <6>igb3: promiscuous mode disabled
      <6>igb1: promiscuous mode enabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <6>ovpns3: link state changed to DOWN
      <6>ovpns3: link state changed to UP
      <6>igb3: promiscuous mode disabled
      <6>igb2: promiscuous mode disabled
      <6>igb1: promiscuous mode disabled
      <6>ovpns4: link state changed to DOWN
      <6>ovpns4: link state changed to UP
      <6>ovpns1: link state changed to DOWN
      <6>igb1: promiscuous mode enabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <6>ovpns1: link state changed to UP
      <6>igb2: promiscuous mode disabled
      <6>igb3: promiscuous mode disabled
      <6>igb1: promiscuous mode disabled
      <6>igb1: promiscuous mode enabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <6>igb2: promiscuous mode disabled
      <6>igb1: promiscuous mode disabled
      <6>igb3: promiscuous mode disabled
      <6>igb1: promiscuous mode enabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <6>igb2: promiscuous mode disabled
      <6>igb1: promiscuous mode disabled
      <6>igb3: promiscuous mode disabled
      <6>igb1: promiscuous mode enabled
      <6>igb3: promiscuous mode enabled
      <6>igb2: promiscuous mode enabled
      <6>pppoe0: promiscuous mode enabled
      <6>pppoe0: promiscuous mode disabled
      <2>NMI ISA 70, EISA 0
      <2>I/O channel check, likely hardware failure.
      panic: NMI indicates hardware failure
      cpuid = 5
      time = 1664263756
      KDB: enter: panic
      �����������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������panic.txt�������������������������������������������������������������������������������������������0600����0�������0�������36����������14314523114�  7135� �����������������������������������������������������������������������������������������������������ustar���root����������������������������wheel������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������NMI indicates hardware failure��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������version.txt�����������������������������������������������������������������������������������������0600����0�������0�������75����������14314523114�  7533� �����������������������������������������������������������������������������������������������������ustar���root����������������������������wheeFreeBSD 12.3-STABLE RELENG_2_6_0-n226742-1285d6d205f pfSense
      
      
      1 Reply Last reply Reply Quote 0
      • micneuM
        micneu
        last edited by

        @bosco wie alt ist die hardware denn?

        Internet: Willy.tel Down: 1Gbit/s, UP: 250Mbit/s Glasfaser |
        Hardware: Netgate 6100
        ALT Intel NUC BNUC11TNHV50L00 (32GB Ram, 512GB M.2 NVME SSD)

        B 1 Reply Last reply Reply Quote 0
        • B
          bosco @micneu
          last edited by

          @micneu Alt ist sie nicht. Es ist ein Supermicro A1SAI-2750F.

          micneuM 1 Reply Last reply Reply Quote 0
          • N
            NOCling
            last edited by

            Ah die C2x Serie ist doch wie die Celerons dieser Generation von dem Intel Clock Bug betroffen.

            Da werden ja massenhaft NAS Systeme mit einem 100Ohm Widerstand geflickt, ob jedoch der passende Pfad bei der Platine rausgeführt wurde um das auch flicken zu können ist mir aber nicht bekannt.

            Und lässt sich alt ist sie nicht auch in Zahlen ausdrücken, sagen wir im Monaten?

            https://www.heise.de/newsticker/meldung/Cisco-Panne-Grund-moeglicherweise-Intel-Atom-Prozessor-3619283.html

            Netgate 6100 & Netgate 2100

            B 1 Reply Last reply Reply Quote 0
            • B
              bosco @NOCling
              last edited by

              @nocling Das habe ich auch schon vermutet. Ich hatte den Server gestern komplett aus und neu gestartet. Seitdem ist der Fehler nicht mehr aufgetreten. Ich beobachte weiter.

              Zum Alter kann ich sagen es er ca. 3-4 Jahre alt ist.

              JeGrJ 1 Reply Last reply Reply Quote 0
              • JeGrJ
                JeGr LAYER 8 Moderator @bosco
                last edited by

                @bosco said in pfsense Crash NMI indicates hardware failure:

                @nocling Das habe ich auch schon vermutet. Ich hatte den Server gestern komplett aus und neu gestartet. Seitdem ist der Fehler nicht mehr aufgetreten. Ich beobachte weiter.

                Zum Alter kann ich sagen es er ca. 3-4 Jahre alt ist.

                Also sofern das nicht nen sehr seltsamer Bug ist, sieht mir das doch nach HW aus:

                <2>I/O channel check, likely hardware failure.
                panic: NMI indicates hardware failure
                cpuid = 5
                time = 1664263756
                KDB: enter: panic
                

                Der Panic sagt das auch selbst mit "hardware failure" - da könnte @NOCling mit dem Clock HW Bug durchaus recht haben.

                Don't forget to upvote 👍 those who kindly offered their time and brainpower to help you!

                If you're interested, I'm available to discuss details of German-speaking paid support (for companies) if needed.

                1 Reply Last reply Reply Quote 0
                • N
                  NOCling
                  last edited by

                  Dann musst suchen ob der Kontakt hier raus geführt wurde, wenn ja kann man das Flicken.
                  Hält dann so lange wie ein Privisorium also ewig.

                  Ansonsten ruhe in kürze in frieden.

                  Da hat Intel halt mal wieder echt Mist produziert.

                  Netgate 6100 & Netgate 2100

                  1 Reply Last reply Reply Quote 0
                  • micneuM
                    micneu @bosco
                    last edited by

                    @bosco said in pfsense Crash NMI indicates hardware failure:

                    @micneu Alt ist sie nicht. Es ist ein Supermicro A1SAI-2750F.

                    ich finde eine hardware von 2013 sehr alt (sowas hätte ich vor 3-4 jahren nicht mehr gekauft)

                    Internet: Willy.tel Down: 1Gbit/s, UP: 250Mbit/s Glasfaser |
                    Hardware: Netgate 6100
                    ALT Intel NUC BNUC11TNHV50L00 (32GB Ram, 512GB M.2 NVME SSD)

                    JeGrJ 1 Reply Last reply Reply Quote 0
                    • JeGrJ
                      JeGr LAYER 8 Moderator @micneu
                      last edited by

                      @micneu Nur weil der SOC 2013 erschienen ist, heißt das nicht, dass das auch 2013 raus kam. In dem Fall wars AFAIR late 2013 als die Testmuster kamen. Das ist aber irrelevant. Es ist ein C2000 SOC und die C-Atome werden mit 8-10y++ von Anfang an konstruiert. Ich hätte jetzt auch wenig Bock nach 3 Jahren privat schon wieder was Neues suchen zu müssen vor allem weil die nicht billig sind/waren. Und wenn man sie später dann ggf. günstig bekommt weil der C3000 kommt und die Kiste reicht einem, warum nicht. Konnte ja bis zum Abrauchen und Skandälchen keiner ahnen, dass statt 8-10y plötzlich wesentlich weniger auf der Agenda stehen weil Intel bei Kleinteilen Probleme hat.

                      Hilft außerdem jetzt auch niemand rückblickend zu sagen "warum kauft man sowas". Hinterher ist man immer schlauer :)

                      Ich hätte allerhöchstens "gemeckert" weils ein 2750 ist und der nicht für Netzwerk, sondern für kleine Server gebaut war. Die Netzwerk Kisten haben alle Achten als letzte Ziffer -> C2758. Denn nur die 8er hatten QuickAssist (QAT) mit drauf.

                      Anyways, hoffe es ist fixbar und nicht doch ein Totalausfall!

                      Don't forget to upvote 👍 those who kindly offered their time and brainpower to help you!

                      If you're interested, I'm available to discuss details of German-speaking paid support (for companies) if needed.

                      1 Reply Last reply Reply Quote 0
                      • First post
                        Last post
                      Copyright 2025 Rubicon Communications LLC (Netgate). All rights reserved.