Netgate Discussion Forum
    • Categories
    • Recent
    • Tags
    • Popular
    • Users
    • Search
    • Register
    • Login

    Problème suite MAJ pfsense 2.0.x -> 2.1.5 (pfsense qui crash)

    Scheduled Pinned Locked Moved Français
    12 Posts 3 Posters 2.3k Views
    Loading More Posts
    • Oldest to Newest
    • Newest to Oldest
    • Most Votes
    Reply
    • Reply as topic
    Log in to reply
    This topic has been deleted. Only users with topic management privileges can see it.
    • J
      Juve
      last edited by

      Je pense que vous devez arriver à court de mbuf lors des montée en charge de début dûes à la sauvegarde.

      Regardez du côté du tunning des mbuf (nmbcluster), votre valeur maximale me parait faible pour un système à 2G de RAM.

      suivez les recommandations de cette section : https://doc.pfsense.org/index.php/Tuning_and_Troubleshooting_Network_Cards

      et dites nous si vous obtenez un résultat positif.

      1 Reply Last reply Reply Quote 0
      • W
        wazadex
        last edited by

        bonjour,

        j'ai doublé le mbuf via la commande  "sysctl kern.ipc.nmbclusters=51200", pour me permettre de  revenir en arrière via avec un reboot au cas ou ;)

        Sinon depuis que j'ai désinstallé squid3, il y a du mieux, le pfsense peine toujours lorsque les backups se lancent mais il plante moins…
        M'enfin ce weekend il a rebouté 3 fois tout seul... il y avait les backup hebdo + mensuel + journalière.

        Sinon j'ai graphé des stats pfsense via snmp (en pièces jointes), mon backups se lance a 13h pour finir à 3h du mat. on peut y voir
        -Le cpu pointe a 100%
        -La ram ne suffit plus et il commence a swapper
        -le nombre de processus augmente fortement

        Le pfsense est tellement débordé qu’il ne reponds plus au poller snmp, et une fois le backup achevé à 3H, tous les paramètres reviennent au vert et il répond à nouveau.

        Pour le moment j'ai installé un syslog et je vais récupérer les logs complètes afin de potentiellement  identifier un problème.
        Sinon je cherche un moyen d'identifier le process qui me fait monter en flèche mon cpu lors des backups.

        cpu.jpg
        cpu.jpg_thumb
        process.jpg
        process.jpg_thumb
        ram.jpg
        ram.jpg_thumb

        1 Reply Last reply Reply Quote 0
        • W
          wazadex
          last edited by

          @Juve:

          Je pense que vous devez arriver à court de mbuf lors des montée en charge de début dûes à la sauvegarde.

          Regardez du côté du tunning des mbuf (nmbcluster), votre valeur maximale me parait faible pour un système à 2G de RAM.

          suivez les recommandations de cette section : https://doc.pfsense.org/index.php/Tuning_and_Troubleshooting_Network_Cards

          et dites nous si vous obtenez un résultat positif.

          Hélas ce fut la même chose cette nuit malgré avoir doublé le mbuf => Ce matin reboot manuel du pfsense, il était figé.

          Concernant mon serveur syslog, j'ai récupéré les logs du pfsense de cette nuit, j'ai reçu plus de 30000 notifications de niveau Error et au dessus  de 20h (début backup) à 1h30, quand le pfsense a figé.

          Voici les erreurs que je retrouve :

          2014-11-04 01:30:23 Kernel Error 10.0.0.253 Nov 4 01:30:23 kernel: pid 26674 (php), uid 0, was killed: out of swap space
          2014-11-04 01:30:23 Kernel Critical 10.0.0.253 Nov 4 01:30:23 kernel: swap_pager_getswapspace(14): failed
          2014-11-04 01:11:31 Kernel Critical 10.0.0.253 Nov 4 01:11:31 kernel: swap_pager: out of swap space
          2014-11-04 01:13:48 Kernel Critical 10.0.0.253 Nov 4 01:13:48 kernel: Approaching the limit on PV entries, consider increasing either the vm.pmap.shpgperproc or the vm.pmap.pv_entry_max tunable.
          2014-11-03 20:19:59 Kernel Critical 10.0.0.253 Nov 3 20:20:00 kernel: swap_pager: indefinite wait buffer: bufobj: 0, blkno: 486813, size: 4096

          j'ai eu  aussi :

          2014-11-03 21:38:03 Kernel Critical 10.0.0.253 Nov 3 21:38:03 kernel: vm_fault: pager read error, pid 78192 (php)
          2014-11-03 21:38:03 Kernel Critical 10.0.0.253 Nov 3 21:38:03 kernel: swap_pager: I/O error - pagein failed; blkno 920124,size 4096, error 5
          2014-11-03 21:38:03 Kernel Critical 10.0.0.253 Nov 3 21:38:03 kernel: ata2: setting up DMA failed
          2014-11-03 21:38:03 Kernel Critical 10.0.0.253 Nov 3 21:38:03 kernel: ata2: FAILURE - already active DMA on this device

          Et bien sur la saturation du pfsense a causé un down des liens :

          2014-11-03 23:31:10 User Error 10.0.0.253 Nov 3 23:31:10 apinger: ALARM: FOGW5() *** down ***
          2014-11-03 23:31:10 User Error 10.0.0.253 Nov 3 23:31:10 apinger: ALARM: FOGW4(
          ) *** down ***
          2014-11-03 23:31:10 User Error 10.0.0.253 Nov 3 23:31:10 apinger: ALARM: FOGW3() *** down ***
          2014-11-03 23:31:10 User Error 10.0.0.253 Nov 3 23:31:10 apinger: ALARM: FOGW2(
          ) *** down ***
          2014-11-03 23:31:10 User Error 10.0.0.253 Nov 3 23:31:10 apinger: ALARM: GW_LAN2() *** down ***
          2014-11-03 23:31:10 User Error 10.0.0.253 Nov 3 23:31:10 apinger: alarm canceled: GW_LAN(
          ) *** delay ***

          Et après un certain temps, je n'ai plus que deux messages d'erreurs en boucle qui sont :

          2014-11-04 01:30:23 Kernel Error 10.0.0.253 Nov 4 01:30:23 kernel: pid 26674 (php), uid 0, was killed: out of swap space
          2014-11-04 01:30:23 Kernel Critical 10.0.0.253 Nov 4 01:30:23 kernel: swap_pager_getswapspace(14): failed

          Crash report details :

          Filename: /var/crash/info.0
          Dump header from device /dev/ad4s1b
            Architecture: i386
            Architecture Version: 2
            Dump Length: 264085504B (251 MB)
            Blocksize: 512
            Dumptime: Mon Nov  3 22:47:31 2014
            Hostname: pfsense.****
            Magic: FreeBSD Kernel Dump
            Version String: FreeBSD 8.3-RELEASE-p16 #0: Mon Aug 25 08:27:41 EDT 2014
              root@pf2_1_1_i386.pfsense.org:/usr/obj.i386/usr/pfSensesrc/src/sys/pfSense_wrap.8.i386
            Panic String: get_pv_entry: increase vm.pmap.shpgperproc
            Dump Parity: 2186076783
            Bounds: 0
            Dump Status: good

          need help :)
          Pour info, j'ai effectué un smart status du disque , résultat : PASSED
          Il faut que je trouve le process en cause pour m'assurer que c'est bien le hardware qui ne suit plus.

          [EDIT]
          je vais tester pour ce soir en augmentant la valeur vm.pmap.shpgperproc à 500 (200 par défaut)

          1 Reply Last reply Reply Quote 0
          • W
            wazadex
            last edited by

            hello,

            j'ai ajouté les valeurs suivantes hier dans /boot/loader.conf :
            vm.pmap.shpgperproc="500"
            vm.pmap.pg_ps_enabled="1"
            Puis un rebooter le pfsense et verifier la bonne prise en compte des paramètres (commande : sysctl vm.pmap.shpgperproc).

            Pendant la sauvegarde, le pfsense n'a pas planté, pour autant il était inaccessible pendant un bout de temps et ce matin pas accès GUI ni ssh donc reboot nécessaire. De plus il n'y a pas eu pas de crash report pour une fois ce matin.

            j'ai eu le temps avant de perdre la main d'y effectuer un top et un ps auxw lors du lancement des backups :

            ps auxw :

            USER     PID %CPU %MEM   VSZ   RSS  TT  STAT STARTED      TIME COMMAND
            root       0 85.9  0.0     0   168  ??  DLs   8:35PM 127:31.07 [kernel]
            root      10 43.9  0.0     0    16  ??  RL    8:35PM 191:20.72 [idle]
            root     256 40.0  0.0  9496   780  ??  RNs   8:35PM  16:13.04 /usr/local/sbin/check_reload_status
            root   64039 25.0  1.8 91568 36188  ??  SN   11:37PM   0:02.36 /usr/local/bin/php -f /etc/rc.filter_configure_sync
            root   63685 11.0  1.5 87472 30600  ??  SN   11:37PM   0:00.62 /usr/local/bin/php -f /etc/rc.newipsecdns
            root   63935 11.0  1.4 87472 28836  ??  SN   11:37PM   0:00.55 /usr/local/bin/php -f /etc/rc.openvpn NEUFBOXGW
            root   21760  3.0  0.9 96304 19480  ??  S     9:39PM   0:20.50 /usr/local/bin/php
            root       1  0.0  0.0  8032    88  ??  SLs   8:35PM   0:00.11 /sbin/init --
            root       2  0.0  0.0     0     8  ??  DL    8:35PM   0:00.21 [g_event]
            root       3  0.0  0.0     0     8  ??  DL    8:35PM   0:17.97 [g_up]
            root       4  0.0  0.0     0     8  ??  DL    8:35PM   0:07.47 [g_down]
            root       5  0.0  0.0     0     8  ??  DL    8:35PM   0:00.00 [crypto]
            root       6  0.0  0.0     0     8  ??  DL    8:35PM   0:00.00 [crypto returns]
            root       7  0.0  0.0     0     8  ??  DL    8:35PM   0:01.53 [pfpurge]
            root       8  0.0  0.0     0     8  ??  DL    8:35PM   0:00.00 [xpt_thrd]
            root       9  0.0  0.0     0     8  ??  DL    8:35PM   1:56.83 [pagedaemon]
            root      11  0.0  0.0     0   152  ??  WL    8:35PM   0:43.04 [intr]
            root      12  0.0  0.0     0    16  ??  DL    8:35PM   0:00.00 [ng_queue]
            root      13  0.0  0.0     0     8  ??  DL    8:35PM   1:09.28 [yarrow]
            root      14  0.0  0.0     0   128  ??  DL    8:35PM   0:00.20 [usb]
            root      15  0.0  0.0     0     8  ??  DL    8:35PM   0:16.96 [vmdaemon]
            root      16  0.0  0.0     0     8  ??  DL    8:35PM   0:00.00 [pagezero]
            root      17  0.0  0.0     0     8  ??  DL    8:35PM   0:00.02 [idlepoll]
            root      18  0.0  0.0     0     8  ??  DL    8:35PM   0:00.07 [bufdaemon]
            root      19  0.0  0.0     0     8  ??  DL    8:35PM   0:00.92 [syncer]
            root      20  0.0  0.0     0     8  ??  DL    8:35PM   0:00.07 [vnlru]
            root      21  0.0  0.0     0     8  ??  DL    8:35PM   0:00.09 [softdepflush]
            root      33  0.0  0.0     0    16  ??  DL    8:35PM   0:02.30 [zfskern]
            root      64  0.0  0.0     0     8  ??  DL    8:35PM   0:01.58 [md0]
            root     258  0.0  0.0  9496     0  ??  IWN  -         0:00.00 check_reload_status: Monitoring daemon of check_reload_status
            root     267  0.0  0.0  8032     8  ??  Is    8:35PM   0:00.04 /sbin/devd
            root    5447  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root    8753  0.0  0.1  9556  1216  ??  Ss    8:36PM   0:11.46 /usr/sbin/syslogd -s -c -c -l /var/dhcpd/var/run/log -f /var/etc/syslog.conf
            root    9380  0.0  0.0  9496   508  ??  Ss    8:36PM   0:00.03 /usr/sbin/cron -s
            root   16071  0.0  0.1 11420  1480  ??  Is    8:36PM   0:00.00 /usr/sbin/sshd
            root   16370  0.0  0.0 13720   956  ??  Is    8:36PM   0:00.02 /usr/local/sbin/sshlockout_pf 15
            root   22269  0.0  0.1  9528  1220  ??  Ss    8:36PM   0:00.05 /usr/sbin/inetd -wW -R 0 -a 127.0.0.1 /var/etc/inetd.conf
            root   27113  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   27961  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   28522  0.0  0.0  9408     0  ??  IWs  -         0:00.00 /usr/local/bin/minicron 240 /var/run/ping_hosts.pid /usr/local/bin/ping_hosts.sh
            root   28531  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   28621  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   28861  0.0  0.0  9408   236  ??  I     8:36PM   0:00.02 minicron: helper /usr/local/bin/ping_hosts.sh  (minicron)
            root   28918  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   29060  0.0  0.9 87472 19344  ??  IN    9:50PM   0:00.52 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   29519  0.0  0.0  9408     0  ??  IWs  -         0:00.00 /usr/local/bin/minicron 3600 /var/run/expire_accounts.pid /etc/rc.expireaccounts
            root   29585  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   29644  0.0  0.5 11296 11316  ??  SNs  10:04PM   0:00.68 /usr/local/sbin/ntpd -g -c /var/etc/ntpd.conf -p /var/run/ntpd.pid
            root   29849  0.0  0.0  9408   236  ??  S     8:36PM   0:00.00 minicron: helper /etc/rc.expireaccounts  (minicron)
            root   30144  0.0  0.0  9408     0  ??  IWs  -         0:00.00 /usr/local/bin/minicron 86400 /var/run/update_alias_url_data.pid /etc/rc.update_alias_url_data
            root   30357  0.0  1.4 87472 28200  ??  IN   10:04PM   0:00.53 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   30371  0.0  0.0  9408     0  ??  IW   -         0:00.00 minicron: helper /etc/rc.update_alias_url_data  (minicron)
            root   30669  0.0  0.0  9408   668  ??  Rs    8:36PM   0:09.82 /usr/local/sbin/apinger -c /var/etc/apinger.conf
            root   30816  0.0  1.4 87472 28200  ??  IN   10:04PM   0:00.55 /usr/local/bin/php -f /etc/rc.openvpn NEUFBOXGW
            root   30835  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   30988  0.0  0.1 10704  1400  ??  S     8:36PM   0:00.49 /usr/local/bin/rrdtool -
            root   31335  0.0  1.4 87472 28200  ??  IN   10:04PM   0:00.56 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   31411  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   32162  0.0  0.0  9624   960  ??  Is    8:36PM   0:00.02 /usr/local/sbin/sshlockout_pf 15
            root   33867  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   34666  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   35624  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   36210  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   39114  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            nagios 39663  0.0  0.1 11132  2724  ??  SNs  10:04PM   0:00.40 /usr/pbi/nrpe-i386/sbin/nrpe2 -d -c /usr/pbi/nrpe-i386/etc/nrpe.cfg
            root   39804  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   39912  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN
            root   40198  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   40449  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   40542  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   40791  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   40880  0.0  1.4 87472 28236  ??  IN   10:04PM   0:00.50 /usr/local/bin/php -f /etc/rc.openvpn NEUFBOXGW
            root   41733  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   42147  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_OPT2
            root   42217  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   43338  0.0  0.9 87472 19248  ??  IN    9:56PM   0:00.54 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   44648  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   47615  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   48056  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   48201  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn BouyguesGW
            root   48531  0.0  0.0  1512   772  ??  IN   11:36PM   0:00.00 sleep 60
            root   48566  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_OPT2
            root   48693  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN
            root   49292  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   49446  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   49808  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   50124  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   50143  0.0  1.3 87472 26256  ??  IN    9:56PM   0:00.57 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   50295  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   50468  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN
            root   50857  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   51109  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   51860  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   52213  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   53032  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   53933  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   54086  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   54239  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   54498  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   54743  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN
            root   55111  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN
            root   55302  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   55503  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   55821  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN
            root   55864  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   58986  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   59378  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   59577  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   60265  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   60457  0.0  0.2 12112  4696  ??  S     8:36PM   0:02.38 /usr/local/sbin/lighttpd -f /var/etc/lighty-webConfigurator.conf
            root   60541  0.0  0.0 79280     0  ??  IWs  -         0:00.00 /usr/local/bin/php
            root   60602  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   61630  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   62634  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   63273  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   63451  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   63659  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   63850  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   63981  0.0  0.0 79280     0  ??  IWs  -         0:00.00 /usr/local/bin/php
            root   64092  0.0  0.2 11576  3556  ??  SNs   9:57PM   0:04.46 /usr/local/sbin/openvpn --config /var/etc/openvpn/server1.conf
            root   64676  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   65139  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   65536  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   65704  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN
            root   66244  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   66283  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   66466  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   67338  0.0  0.1  9608  1752  ??  RN   11:37PM   0:00.05 /sbin/pfctl -o basic -f /tmp/rules.debug
            root   67537  0.0  0.1  9548  1340  ??  R    11:37PM   0:00.01 ps auxwww
            root   67663  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   67985  0.0  1.2 87600 25244  ??  I     8:36PM   0:00.73 /usr/local/bin/php
            nobody 68029  0.0  0.1 11396  1852  ??  S     8:36PM   0:00.23 /usr/local/sbin/dnsmasq --all-servers --rebind-localhost-ok --stop-dns-rebind --dns-forward-max=5000 --cache-size=10000 --local-ttl=1
            root   68421  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   68718  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   69115  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   69506  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   70300  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   70996  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            dhcpd  71138  0.0  0.1 13504  1900  ??  Ss    8:36PM   0:04.23 /usr/local/sbin/dhcpd -user dhcpd -group _dhcp -chroot /var/dhcpd -cf /etc/dhcpd.conf -pf /var/run/dhcpd.pid em3
            root   71794  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   72088  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn NEUFBOXGW
            root   72833  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOcompletel
            root   75788  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn NEUFBOXGW
            root   77687  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   82935  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   83400  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   83721  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn NEUFBOXGW
            root   83818  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW4
            root   84250  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   85379  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN
            root   86019  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW2
            root   86086  0.0  0.1 14172  2168  ??  Ss    8:43PM   0:02.93 sshd: admin@pts/0 (sshd)
            root   86132  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn GW_LAN2
            root   86436  0.0  0.1 14172  1896  ??  Is    8:43PM   0:00.16 sshd: admin@notty (sshd)
            root   86637  0.0  0.2 11764  3636  ??  Ss    8:36PM   0:12.10 /usr/local/sbin/racoon -f /var/etc/ipsec/racoon.conf
            root   87174  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   87343  0.0  0.4 14448  7716  ??  Ss    8:36PM   0:30.67 /usr/sbin/bsnmpd -c /var/etc/snmpd.conf -p /var/run/snmpd.pid
            root   93167  0.0  1.4 87472 28836  ??  IN   11:35PM   0:00.55 /usr/local/bin/php -f /etc/rc.openvpn NEUFBOXGW
            root   95854  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   96284  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW3
            root   97509  0.0  0.0 87472     0  ??  IWN  -         0:00.00 /usr/local/bin/php -f /etc/rc.openvpn FOGW5
            root   98027  0.0  1.4 87472 28836  ??  IN   11:36PM   0:00.54 /usr/local/bin/php -f /etc/rc.openvpn NEUFBOXGW
            root   17300  0.0  0.1 10984  2020  u0- S     8:36PM   0:01.39 /usr/sbin/tcpdump -s 256 -v -S -l -n -e -ttt -i pflog0
            root   17436  0.0  0.0  9408   800  u0- S     8:36PM   0:02.16 logger -t pf -p local0.info
            root   31866  0.0  0.0  9860     0  u0  IWs  -         0:00.00 login [pam] (login)
            root   32458  0.0  0.0  9788     0  u0  IW   -         0:00.00 -sh (sh)
            root   33933  0.0  0.1  9788  1084  u0  I+    8:36PM   0:00.01 /bin/sh /etc/rc.initial
            root   91939  0.0  0.0  9788   636  u0- IN    8:36PM   0:02.74 /bin/sh /var/db/rrd/updaterrd.sh
            root   87043  0.0  0.0  9788     0   0  IWs  -         0:00.00 /bin/sh /etc/rc.initial
            root   92611  0.0  0.1  9816  1672   0  I+    8:43PM   0:00.03 /bin/tcsh
            

            top :

            PID USERNAME    THR PRI NICE   SIZE    RES STATE   C   TIME   WCPU COMMAND
            21760 root          1  54    0 91696K 18820K piperd  1   0:04  4.98% php
              256 root          1  76   20  9496K   780K kqread  0  15:52  0.00% check_reload_status
            17021 root          1  44    0  9804K  2224K select  1   0:32  0.00% top
            87343 root          1  44    0 14448K  7704K select  1   0:28  0.00% bsnmpd
            86637 root          1  44    0 11764K  3636K select  1   0:12  0.00% racoon
             8753 root          1  44    0  9556K  1204K select  0   0:11  0.00% syslogd
            30669 root          1  44    0  9408K   668K select  1   0:09  0.00% apinger
            71138 dhcpd         1  44    0 13504K  1900K select  1   0:04  0.00% dhcpd
            86086 root          1  44    0 14172K  2152K select  1   0:03  0.00% sshd
            91939 root          1  76   20  9788K   636K wait    0   0:02  0.00% sh
            17436 root          1  44    0  9408K   800K piperd  1   0:02  0.00% logger
            60457 root          1  44    0 12112K  4660K kqread  1   0:02  0.00% lighttpd
            17300 root          1  44    0 10984K  1876K bpf     1   0:01  0.00% tcpdump
            63273 root          1  64   20 87472K     0K lockf   1   0:01  0.00% <php>49446 root          1  64   20 87472K     0K lockf   1   0:01  0.00% <php>55111 root          1  65   20 87472K     0K lockf   1   0:01  0.00%</php></php> 
            

            System Activity :

            
            PID USERNAME   PRI NICE   SIZE    RES STATE   C   TIME   WCPU COMMAND
               10 root       171 ki31     0K    16K RUN     1 133:58 86.96% [idle{idle: cpu1}]
                0 root       -68    0     0K   168K CPU0    0 120:00 78.96% [kernel{em1 que}]
               10 root       171 ki31     0K    16K RUN     0  50:19 21.97% [idle{idle: cpu0}]
            21760 root        51    0 91824K 18996K piperd  1   0:12  2.98% /usr/local/bin/php{php}
              256 root        76   20  9496K   780K kqread  0  15:52  0.00% /usr/local/sbin/check_reload_status
                9 root       -16    -     0K     8K RUN     0   1:57  0.00% [pagedaemon]
                0 root       -68    0     0K   168K RUN     1   1:53  0.00% [kernel{em2 que}]
               13 root       -16    -     0K     8K RUN     1   1:06  0.00% [yarrow]
                0 root       -16    0     0K   168K sched   0   0:39  0.00% [kernel{swapper}]
            87343 root        44    0 14448K  7712K select  0   0:26  0.00% /usr/sbin/bsnmpd -c /var/etc/snmpd.conf -
                3 root        -8    -     0K     8K -       1   0:18  0.00% [g_up]
               15 root       -16    -     0K     8K psleep  0   0:17  0.00% [vmdaemon]
               11 root       -32    -     0K   152K WAIT    1   0:16  0.00% [intr{swi4: clock}]
            86637 root        44    0 11764K  3636K select  1   0:12  0.00% /usr/local/sbin/racoon -f /var/etc/ipsec/
               11 root       -44    -     0K   152K WAIT    1   0:12  0.00% [intr{swi1: netisr 1}]
             8753 root        44    0  9556K  1216K select  0   0:11  0.00% /usr/sbin/syslogd -s -c -c -l /var/dhcpd/
            30669 root        44    0  9408K   668K select  0   0:09  0.00% /usr/local/sbin/apinger -c /var/etc/aping
               11 root       -64    -     0K   152K WAIT    0   0:09  0.00% [intr{irq18: uhci2+}]
            

            A priori c'est le process "php" en cause…

            Quelqu'un a des idées ou une solution  à mon problème ?

            est il possible de downgrade en 1.2.x ?

            1 Reply Last reply Reply Quote 0
            • J
              Juve
              last edited by

              A priori, durant le backup les gateway deviennent injoignable, le script de reload openVPN (qui a pour but de réinitialiser le tunnel via une interface de secours) est lancé de multiples fois. hors ce script lock un fichier (semaphore) durant son exécution et là j'ai l'impression qu'on part en dead lock.

              Je ne sais pas pourquoi pour le moment.

              Ensuite je vois une forte activité CPU par le kernel sur un driver EM (Intel)

              78.96% [kernel{em1 que}]

              Essayez de limiter les queue du driver en ajoutant ceci au loader.conf:
              kern.ipc.nmbclusters="131072"
              hw.em.num_queues=1

              Et de forcer la désactivation du TSO :
              net.inet.tcp.tso=0

              et vérifiez de nouveau lors d'un pic de charge.

              1 Reply Last reply Reply Quote 0
              • W
                wazadex
                last edited by

                Merci, je vais tester.

                je viens de voir que ma bande passante utilisait lors des backups monte à plus de 200mbps alors qu'auparavant je dépassais rarement les 170 et en fouillant le prés-requis d'un pfsense je lis :

                201-500 Mbps - configuration type appliance ou serveur avec une architecture type PCI-X ou PCI-e pour les cartes réseau. Processeur de 2.0 GHz.

                Sachant que mon appliance à comme proc : Intel(R) Atom(TM) CPU D410 @ 1.66GHz 2 CPUs et 2go de ram ; est-ce suffisant ?
                Surtout qu'a cela, se rajoute toute ma config pfsense (tunnel vpn / multiple liens / … )

                Sinon toujours ma question, comment downgrade une appliance car je possède la précédente conf, mais comment effectuer une réinstalle propre du pfsense, il n'y a pas de lecteur cd, de port usb... ??
                Car je vais devoir tester, et faut que je trouve une solution un jour :(

                1 Reply Last reply Reply Quote 0
                • W
                  wazadex
                  last edited by

                  autre possibilité aussi :

                  https://forum.pfsense.org/index.php/topic,38660.0.html

                  possible ?

                  1 Reply Last reply Reply Quote 0
                  • TataveT
                    Tatave
                    last edited by

                    perso je dirais a tester au cas ou.
                    mais avant une sauvegarde total pour revenir en arrière on ne sait jamais.

                    aider, bien sûre que oui
                    assister, évidement non !!!

                    donner à manger à un homme, ne lui permettra que de survivre qu'un temps.
                    apprendre à un homme comment cuisiner, il sera vivre.

                    1 Reply Last reply Reply Quote 0
                    • W
                      wazadex
                      last edited by

                      @Juve:

                      A priori, durant le backup les gateway deviennent injoignable, le script de reload openVPN (qui a pour but de réinitialiser le tunnel via une interface de secours) est lancé de multiples fois. hors ce script lock un fichier (semaphore) durant son exécution et là j'ai l'impression qu'on part en dead lock.

                      Je ne sais pas pourquoi pour le moment.

                      Ensuite je vois une forte activité CPU par le kernel sur un driver EM (Intel)

                      78.96% [kernel{em1 que}]

                      Essayez de limiter les queue du driver en ajoutant ceci au loader.conf:
                      kern.ipc.nmbclusters="131072"
                      hw.em.num_queues=1

                      Et de forcer la désactivation du TSO :
                      net.inet.tcp.tso=0

                      et vérifiez de nouveau lors d'un pic de charge.

                      j'ai donc testé hier soir et pas de crash constaté ni de reboot a effectuer ce matin.
                      Par contre pendant le backup l'appliance ne répond plus, impossible de s'y connecter via openvpn ou d’accéder à l'interface, j'ai timeout systématiquement. Pour autant elle fait son job donc l'appliance sature toujours.

                      Concernant le system activity, j'ai pu avoir un aperçu avant de perdre l'accès,  et j'ai toujours la même ligne qui me bouffe mon cpu a fond.

                        0 root       -68    0     0K   168K CPU0    0 120:00 78.96% [kernel{em1 que}]
                      

                      et ca peut monter a plus de 85%.

                      Sinon j'ai changé l'ip de mon serveur de backup, car il ne se trouvait pas dans le même réseau que mes serveurs a backuper, donc le pfsense devait router les paquets. A voir si ca va mieux maintenant, mais je pense que ca ne résout pas mon problème mais le contourne…
                      De plus si je n'ai plus de problème après cet modif, alors c'est que mon appliance est sous dimensionné car la version 2.1.5 serait plus gourmande en ressource.

                      1 Reply Last reply Reply Quote 0
                      • W
                        wazadex
                        last edited by

                        hello,

                        voila des news, depuis le changement de l'ip de mon serveur de backup pour être dans le même réseau que mes serveurs à backuper et ainsi éviter le routage par le pfsense, je n'ai plus aucune saturation de celui-ci, que cela soit cpu, ram ou kernel… et en cadeau bonus, mes debits réseaux pour les backups on plus que doublé.  Que du bon donc !!!

                        j'en conclue que la faute est bien la MAJ 2.1.5 sur mon appliance qui est beaucoup plus gourmande en ressource (ou à un pb de compatibilité matériel de celle-ci avec cette version) et le fait saturer lors de forte BP demandée.

                        1 Reply Last reply Reply Quote 0
                        • J
                          Juve
                          last edited by

                          C'est sans doute cela.
                          Au moins, ce problème vous aura permit de corriger une erreur de design :-)

                          1 Reply Last reply Reply Quote 0
                          • First post
                            Last post
                          Copyright 2025 Rubicon Communications LLC (Netgate). All rights reserved.