Pf2.0.3 Большая загрузка процессора (до 100%)



  • Еще торомоза веб-интерфейса.
    Как посмотреть что грузит? И как устранить?



    1. PFTOP
    2. риторический вопрос


  • @dvserg:

    1. PFTOP

    И как может помочь мне эта информация?



  • @garald50:

    @dvserg:

    1. PFTOP

    И как может помочь мне эта информация?

    Как посмотреть что грузит

    Извините - утилита ТОР



  • Включил в биосе мультипроцессорность (отключал при установке pf). Загрузка проца в дашборде уменьшилась, но все равно стабильно 38-43 процента.
    В версии 1,2,3 с более слабым процессором больше 10 процентов не поднималась.

    Вот результат утилиты top

    
    last pid: 63956;  load averages:  0.00,  0.02,  0.00    up 0+01:22:19  09:33:25
    55 processes:  1 running, 54 sleeping
    CPU:  0.0% user,  0.0% nice,  0.4% system, 38.1% interrupt, 61.5% idle
    Mem: 66M Active, 17M Inact, 80M Wired, 120K Cache, 85M Buf, 1716M Free
    Swap: 4096M Total, 4096M Free
    
      PID USERNAME  THR PRI NICE   SIZE    RES STATE   C   TIME   WCPU COMMAND
      245 root        1  76   20  3348K  1192K kqread  0   2:27  0.00% check_reload
    10780 proxy       1  44    0 37996K 30260K kqread  1   0:14  0.00% squid
    31989 root        1  64   20  3256K  1280K select  1   0:02  0.00% apinger
    62620 root        1  50    0 62108K 20012K accept  0   0:01  0.00% php
    46494 proxy       1  44    0  7188K  3236K sbwait  1   0:01  0.00% squidGuard
    20934 root        1  44    0 61084K 18080K accept  0   0:01  0.00% php
    38829 nobody      1  44    0  5504K  2548K select  1   0:00  0.00% dnsmasq
    20299 root        1  44    0  6780K  3600K kqread  0   0:00  0.00% lighttpd
    49928 root        1  76   20  3596K  1472K wait    1   0:00  0.00% sh
    43322 root        1  64   20  5324K  3584K select  1   0:00  0.00% racoon
     5697 root        1  44    0  8808K  3896K select  1   0:00  0.00% mpd5
    10430 root        1  44    0  4908K  2476K select  1   0:00  0.00% syslogd
    43420 root        1  44    0  9616K  4036K select  1   0:00  0.00% mpd4
    36380 root        1  44    0  6020K  6044K select  1   0:00  0.00% ntpd
    21018 root        1  55    0 60060K 12932K wait    1   0:00  0.00% php
    46591 proxy       1  44    0  7188K  3216K sbwait  1   0:00  0.00% squidGuard
    10361 root        1  44    0  3256K   900K piperd  1   0:00  0.00% logger
    

    Что тут можно сказать? Прерывания выеживаются? От чего это зависит?



  • Ну те-же 38% что и на 1.2.3, как вы говорите.
    Прерывания могут от разных причин генерироваться, в том числе и от сетевых карт.
    В Адванс настройках почитайте - галки оптимизации были типа скраба/пересборки пакетов и пр..
    Так-же при работе веб интерфейса может подниматься загрузка процессора.



  • В 1,2,3 40% было в момент пиковой загрузки, прерывания 0%. А здесь на 2,0,3 прерывания стабильно около 40%. Что-т нездорОво, но я не пойму что.
    Pfsense устанавливался в режиме IDE в биос, если выбрать AHCI, то установка была невозможной.
    Сейчас выставляю AHCI, система не грузится.



  • Причем здесь режимы харда. Речь о настройках pfSense.



  • @dvserg:

    В Адванс настройках почитайте - галки оптимизации были типа скраба/пересборки пакетов и пр..

    Это где-то здесь смотреть

    System: Advanced

    ?



  • @dvserg:

    Причем здесь режимы харда.

    Проблема с нагрузкой на проц прерываниями ненова на фряхах. Я загуглил и нашел, что некоторые устраняли отключением двд-привода, включением ahci и прочим шаманством.
    http://forum.lissyara.su/viewtopic.php?f=8&t=16150#p147168
    http://forum.lissyara.su/viewtopic.php?f=8&t=16150#p148623



  • @garald50:

    @dvserg:

    В Адванс настройках почитайте - галки оптимизации были типа скраба/пересборки пакетов и пр..

    Это где-то здесь смотреть

    System: Advanced

    ?

    Да. 
    У меня сейчас нет под рукой работающего pfSense, поэтому точнее сказать не могу.
    Почитайте аннотации и подергайте настройки ( пересборка пакетов, поллинг и др. )



  • [2.0.3-RELEASE][root@pfsense.local]/root(13): vmstat -i                         
    interrupt                          total       rate
    irq16: em1 ehci0                16260359        184
    irq19: em0 atapci0+           1764803224      20068
    irq23: ehci1                      176014          2
    cpu0: timer                    175881261       2000
    cpu1: timer                    175881054       2000
    Total                         2133001912      24255
    

    Похоже сетевушные заморочки.
    Вообще странно, что показывает разные интерфейсы (ehci0 и atapci0+). Сетевушки то одинаковые совершенно, воткнуты в pci-слоты.



  • Похоже на Interrupt Storm на старших прерываниях.
    Была здесь тема, вроде подключали монитор по HDMI и из-за этого было.
    Так-же рекомендуют обновить BIOS; переставить сетевые карты на другие места, поиграть настройками IRQ в BIOS чтобы назначить на PCI слоты другие прерывания.
    Однозначного решения не видел пока.



  • БИОС обновлял.
    А что значит переставить сет.карты? Сейчас вставлено три одинаковых карты (с расчетом на резервный инет-канал), в сист.плате только три разъема PCI. Имеет ли смысл попереставлять сетевые карты?



  • Тогда не стоит. Иногда бывает от 5-ти.



  • С прерываниями поиграюсь. Может еще какие мысли будут, напишите



  • Все железо новое. Может имеет смысл написать в поддержку Интел (производителя сист.платы)?
    Затрудняюсь, как объяснить проблему.



  • В интернете погуглите Interrupt storm



  • 1. Отключите в БИОСе всё ненужное - СОМ, LPT, Audio etc.
    2. Попробуйте отключить в БИОСе это - http://www.probios.ru/options/usb/configure/bios-ehci-hand-off.html.

    И последнее :
    У вас контроллер жестких дисков работает в АТА режиме ? Возможно , что это он "штормит". Попробуйте следующее - выгрузите конфиг пфсенсе, зайдите в БИОС и переведите контроллер в AHCI, затем установите пфсенсе "на чистую" , подгрузите конфиг и проверяйте работу.



  • Сейчас вставлено три одинаковых карты
    Может еще какие мысли будут, напишите
    Может имеет смысл написать в поддержку Интел

    Из опыта могу сказать, что bsd очень плохо переносит наличие нескольких одинаковых сетевых карт. И это редко когда лечиться. Проблема в самой оси. Переходите на линукс, вот и все мысли.
    2 werter

    переведите контроллер в AHCI, затем установите пфсенсе "на чистую"

    Pfsense устанавливался в режиме IDE в биос, если выбрать AHCI, то установка была невозможной.



  • Кто о чем ,а aleksvolgin за свое.
    Нет , я бы понял, если б M$ "продвигал" за деньги. А тут Линух. Не могу понять такое неприятие *BSD . Чем это мотивировано ? Бывают проблемы, само собой, как и у любого продукта. Но такая навязчивость для многих тут неприемлема. Как что , так сразу "переходите на Linux".

    У меня пф работает (sic!) на 4-ых разных платформах - начиная от старых Селеронов\Пней и заканчивая виртуальными средами (ESXi, Proxmox, Xen).

    http://frena.ru/news/646-freebsd-90-universalna-i-nadezhna

    Самый лучший показатель надежности в этом отношении у систем, основанных на BSD (около двух лет), у систем, поддерживаемых Linux это 85 дней, и Windows-сервера могут непрерывно работать без сбоев около 20 дней. В соответствии с исследованиями институтов, изучающих проблемы безопасности, в процентном соотношении количество дыр распределяется следующим образом: 44% в системе Windows, 22%, – в системе Linux, ну и в FreeBSD – всего 9%.



  • @werter:

    У вас контроллер жестких дисков работает в АТА режиме ? Возможно , что это он "штормит".

    Да, устройства HDD и DVD - SATA, но сейчас включен режим IDE в BIOS.
    @werter:

    Попробуйте следующее - выгрузите конфиг пфсенсе, зайдите в БИОС и переведите контроллер в AHCI, затем установите пфсенсе "на чистую" , подгрузите конфиг и проверяйте работу.

    Я пробовал с самого начала ставить систему в AHCI, но quick\easy install говорил: у вас нет жестких дисков. Пришлось включать IDE. В чем там хитрость?

    Проблему локализовал - обесточил DVD, загрузился: нагрузка проца по прерываниям ушла в 0. Но хочется DVD оставить.



  • @werter:

    Самый лучший показатель надежности в этом отношении у систем, основанных на BSD (около двух лет), у систем, поддерживаемых Linux это 85 дней, и Windows-сервера могут непрерывно работать без сбоев около 20 дней. В соответствии с исследованиями институтов, изучающих проблемы безопасности, в процентном соотношении количество дыр распределяется следующим образом: 44% в системе Windows, 22%, – в системе Linux, ну и в FreeBSD – всего 9%.

    Windows-сервера могут непрерывно работать без сбоев около 20 дней

    Статья не сильно объективна.

    Мог бы показать автору аптайм 4-6 месяцев для довольно сильно нагруженных серверов. Большего не позволяет электропитание - раз в месяц-полгода пропадает обязательно и надолго.

    Согласен с тем что каждой задаче - свои железо\ОС.



  • @pigbrother:

    Мог бы показать автору аптайм 4-6 месяцев для довольно сильно нагруженных серверов.

    Имелась в виду "средняя температура по больнице"



  • @garald50:

    Проблему локализовал - обесточил DVD, загрузился: нагрузка проца по прерываниям ушла в 0. Но хочется DVD оставить.

    В биосе вашей МП меняйте прерывания для портов, куда вставлены ваши сетевые.

    P.s. У вас машина только под пф используется ? Если - да, то на кой там ДВД после установки пф нужен?



  • МП Intel DH77KC. Изменение прерываний непредусмотрено в BIOS Setup.

    на кой там ДВД после установки пф нужен?

    если вытаскивать DVD, нет планки, закрыть отверстие



  • @garald50:

    МП Intel DH77KC. Изменение прерываний непредусмотрено в BIOS Setup.

    на кой там ДВД после установки пф нужен?

    если вытаскивать DVD, нет планки, закрыть отверстие

    Тогда просто отключите DVD или воткните как заглушку старый CD-ROM, его еще можно найти.



  • @garald50:

    если вытаскивать DVD, нет планки, закрыть отверстие

    Всё.Приехали."Звэзда в шоке (С)". Вы сисадмин там или хто? Это что проблема?!

    P.s. Пардон за эмоции. Нет слов.



  • А это по-вашему профессиональный подход - выкинуть деталь, не разобравшись в причинах, почему эта деталь флудит.



  • @garald50:

    А это по-вашему профессиональный подход - выкинуть деталь, не разобравшись в причинах, почему эта деталь флудит.

    По-моему - отключить молекс\сата-разъем питания от привода, оставив сам привод на месте, точно сможет и мой двухлетний ребенок.



  • ;D тут весело последнее время.



  • Подскакивает процессорное время какого-то юзера. Как узнать подробности?

    CPU: 49.9% user,  0.0% nice,  0.9% system,  0.0% interrupt, 49.2% idle
    Mem: 174M Active, 459M Inact, 107M Wired, 492K Cache, 112M Buf, 1139M Free
    Swap: 4096M Total, 4096M Free



  • Походу вот виновник торжества

    9156 root        1 118    0 62108K 20564K CPU1    1 917:01 97.75% php

    Как можно исправить?



  • @garald50:

    Походу вот виновник торжества

    9156 root        1 118    0 62108K 20564K CPU1    1 917:01 97.75% php

    Как можно исправить?

    А никаких сторонних скриптов не используется при загрузке pfsense или в планировщике не висят ?



  • @werter:

    А никаких сторонних скриптов не используется при загрузке pfsense или в планировщике не висят ?

    В каком планировщике?



  • @garald50:

    @werter:

    А никаких сторонних скриптов не используется при загрузке pfsense или в планировщике не висят ?

    В каком планировщике?

    Cron/Crontab
    Есть такой пакет, позволяющий управлять заданиями в pfSense.



  • а что показывает
    ps afx



  • столкнулся с следующей картиной
    last pid:  6988;  load averages:  1.02,  1.04,  1.06                                                up 4+08:22:20  22:46:47
    50 processes:  1 running, 49 sleeping
    CPU:  0.2% user,  0.0% nice, 50.3% system,  2.1% interrupt, 47.4% idle
    Mem: 73M Active, 17M Inact, 99M Wired, 5044K Cache, 46M Buf, 1794M Free
    Swap: 8192M Total, 8192M Free

    PID USERNAME  THR PRI NICE  SIZE    RES STATE  C  TIME  WCPU COMMAND
      244 root        1  76  20  3348K  1200K kqread  0  73:47  0.00% check_reload_status
    12571 root        1  44    0 19172K 16256K bpf    0  2:03  0.00% tcpdump
    12643 root        1  44    0  3256K  900K piperd  1  1:22  0.00% logger
    12506 root        1  44    0  4908K  2544K select  0  0:25  0.00% syslogd
    39795 zabbix      1  44    0  4572K  1848K nanslp  1  0:18  0.00% zabbix_agentd
    27861 root        1  76    0 62084K 24288K accept  0  0:18  0.00% php
    39791 root        1  44    0  6020K  6044K select  1  0:13  0.00% ntpd
    40319 zabbix      1  44    0  4572K  1724K nanslp  1  0:09  0.00% zabbix_agentd
    57710 root        1  44    0 62084K 20896K accept  1  0:06  0.00% php
    6745 root        1  44    0  8808K  3872K select  0  0:03  0.00% mpd5
    6626 root        1  64  20  8808K  4244K select  1  0:03  0.00% mpd5
    20050 root        1  64  20  7804K  6248K kqread  0  0:03  0.00% lighttpd
    4021 root        1  44    0 13072K  6448K select  0  0:02  0.00% mpd4
    57787 root        1  52    0  3348K  1320K nanslp  0  0:01  0.00% cron
    47730 root        1  44    0  3256K  1316K select  0  0:01  0.00% apinger
    20764 root        1  76  20  3596K  1560K wait    0  0:01  0.00% sh
    36815 root        1  44    0 61060K 18608K accept  1  0:01  0.00% php
    5439 dhcpd      1  44    0  8376K  6372K select  1  0:01  0.00% dhcpd
    31745 root        1  44    0  7944K  3528K select  1  0:00  0.00% sshd
    43683 root        1  67    0  3256K  1032K nanslp  0  0:00  0.00% minicron
    22026 root        1  44    0  3376K  1340K select  1  0:00  0.00% inetd
      256 root        1  44    0  1888K  540K select  0  0:00  0.00% devd
    38928 root        1  76    0 60036K 12984K wait    0  0:00  0.00% php
    34157 root        1  76    0 60036K 12984K wait    0  0:00  0.00% php
    38558 root        1  44    0 60036K 12984K wait    0  0:00  0.00% php
    33468 root        1  44    0  3652K  2080K CPU0    0  0:00  0.00% top

    –---------------------------------------------------------------------------------------------

    загрузка одного ядра приближается к 50%
    вопрос чем она занята?
    ТОР не отображает процесса который бы жрал эти ресурсы.
    при этом работает РРРтР тоннель на 65 мегабит с 128битным шифрованием, но его выключением загрузка снимается на очень малое значение. 3-5%.
    заметил иногда процесс check_reload_status занимает 100% одного ядра процессора иногда показатель скачет.
    при том что сетевуха intel стоит на PCI-Ex с активными offload и segmentation, не должна так грузить проц. вот две другие pci сетевухи дают загрузки irq по 3% и это видно.
    ничего не понимаю. потому как когда загрузка процессом check_reload_status подходит к отметке 40% на ядро скорость ВПН канала начинает падать.

    vmstat -i

    interrupt                          total      rate
    irq1: atkbd0                          2          0
    irq14: ata0                      1283818          3
    irq19: re0 uhci1              180337997        479
    irq20: skc0                    203194823        540
    cpu0: timer                    751235302      1997
    irq258: em0:link                      1          0
    cpu1: timer                    751235282      1997
    Total                        1887287225      5019

    irq19: re0 uhci1 и irq20: skc0  сетевухи для WANов и они дешовые и PCI.
    нормальные сетевухи сейчас допинываю на другой машине.

    вот так он грузит систему =
    last pid: 20364;  load averages:  1.92,  1.69,  1.35    up 4+09:28:49  23:53:16
    48 processes:  1 running, 47 sleeping
    CPU:  0.3% user,  0.0% nice, 63.0% system,  2.3% interrupt, 34.3% idle
    Mem: 73M Active, 17M Inact, 99M Wired, 5044K Cache, 46M Buf, 1795M Free
    Swap: 8192M Total, 8192M Free

    PID USERNAME  THR PRI NICE  SIZE    RES STATE  C  TIME  WCPU COMMAND
      244 root        1  76  20  3348K  1200K kqread  1  78:53 45.56% check_reload
    12571 root        1  44    0 19172K 16340K bpf    1  2:08  0.00% tcpdump
    12643 root        1  44    0  3256K  900K piperd  1  1:25  0.00% logger



  • VPN под за 30 Мбит лучше делать на проце с Hyper-threading.
    Здесь явно проц его не поддерживает.



  • проц Intel(R) Core(TM)2 CPU 6320 @ 1.86GHz

    это тестовая машина, работает сейчас под реальной нагрузкой. вычисляются параметры необходимые для будующего шлюза


Log in to reply