Netgate Discussion Forum
    • Categories
    • Recent
    • Tags
    • Popular
    • Users
    • Search
    • Register
    • Login

    Interrupts проблема

    Scheduled Pinned Locked Moved Russian
    31 Posts 9 Posters 13.3k Views
    Loading More Posts
    • Oldest to Newest
    • Newest to Oldest
    • Most Votes
    Reply
    • Reply as topic
    Log in to reply
    This topic has been deleted. Only users with topic management privileges can see it.
    • S
      Shraik
      last edited by

      "кэп"  подсказывает, что на железо :)
      Я-бы начал с сетевух, память можно и с диска проверить.
      Ну а там останется то винт БП. да материнка, заменил и всё  ;D

      1 Reply Last reply Reply Quote 0
      • K
        killeo
        last edited by

        ожидаю подъема прцента по прерываниям, посмотрю на вывод

        vmstat -w 5

        всё-таки хочется узнать настоящую причину (т.к. уж очень дорогие intel server nic)

        DuckDuckGo is a search engine does not collect or share personal information.

        1 Reply Last reply Reply Quote 0
        • K
          killeo
          last edited by

          ну в общем ничем  vmstat не помог.  :'(
          может кто сталкивался с диагностикой?

          DuckDuckGo is a search engine does not collect or share personal information.

          1 Reply Last reply Reply Quote 0
          • G
            gr0mW
            last edited by

            Была похожая ситуация с Realtek RTL8169 (а чип DGE-528T –- это аналог). Поиск в интернете показал  что в зависаниях виноват перегрев чипа. Поставил радиаторы и на Realtek RTL8169 и на  DGE-528T. Сейчас тестирую --- пока все нормально.

            1 Reply Last reply Reply Quote 0
            • K
              killeo
              last edited by

              ок, пробуем

              DuckDuckGo is a search engine does not collect or share personal information.

              1 Reply Last reply Reply Quote 0
              • S
                Shraik
                last edited by

                @killeo:

                всё-таки хочется узнать настоящую причину (т.к. уж очень дорогие intel server nic)

                да никто и не говорит о серверных сетевухах. Вопрос был поставлен "начал виснуть" т.е. до этого не вис.
                Я так понимаю что рабочее железо не должно зависать или
                вы думаете, что только серверное железо не должно зависать ? ;D

                1 Reply Last reply Reply Quote 0
                • K
                  killeo
                  last edited by

                  да, проблема именно появилась, хочу разобраться, а про intel - думаю, что для запаса прочности.

                  DuckDuckGo is a search engine does not collect or share personal information.

                  1 Reply Last reply Reply Quote 0
                  • K
                    killeo
                    last edited by

                    Итак. Когда система работает
                    systat -vmstat:

                    2 users    Load  0.00  0.03  0.05                  Jan 14 14:50

                    Mem:KB    REAL            VIRTUAL                       VN PAGER   SWAP PAGER
                           Tot   Share      Tot    Share    Free           in   out     in   out
                    Act   44420   18652   233348    54068  922700  count            
                    All   67672   22396  2393296    71420          pages            
                    Proc:                                                            Interrupts
                     r   p   d   s   w   Csw  Trp  Sys  Int  Sof  Flt     20 cow    5957 total
                                37       10k  243  643 4384 5370  155     92 zfod        atkbd0 1
                                                                           3 ozfod       ata0 irq14
                    0.2%Sys   6.3%Intr  0.9%User  0.0%Nice 92.6%Idle       3%ozfod      1621 re1 irq16
                    |    |    |    |    |    |    |    |    |    |    |       daefr                                                 4 rl0 irq17
                    +++>                                                  111 prcfr                                  2333  re0 irq18
                                                           42 dtbuf      120 totfr                                    1999  cpu0: time
                    Namei     Name-cache   Dir-cache     69211 desvn          react
                      Calls    hits   %    hits   %       787 numvn          pdwak
                       1910    1816  95                    52 frevn          pdpgs
                                                                             intrn
                    Disks   ad0   md0                                   42372 wire
                    KB/t  16.00 16.00                                   30996 act
                    tps       0     0                                   12224 inact
                    MB/s   0.00  0.00                                     956 cache
                    %busy     0     0                                  921744 free
                                                                       26480 buf

                    vmstat -i

                    vmstat -i

                    interrupt                          total       rate
                    irq1: atkbd0                           6          0
                    irq14: ata0                         8521          2
                    irq16: re1                      6643803       1864
                    irq17: rl0                         45275         12
                    irq18: re0                       9069207       2544
                    cpu0: timer                      7127137       1999

                    Подвисшая система
                    systat -vmstat

                    Mem:KB    REAL            VIRTUAL                       VN PAGER   SWAP PAGER
                           Tot   Share      Tot    Share    Free           in   out     in   out
                    Act   67556   31796   220952    75592  375536  count            
                    All   93628   35436  2361336    92808          pages            
                    Proc:                                                            Interrupts
                     r   p   d   s   w   Csw  Trp  Sys  Int  Sof  Flt     20 cow                                                   134k total
                                38      273k 5440  606 132k 164k  154     92 zfod        atkbd0 1
                                                                           2 ozfod            ata0 irq14
                    1.1%Sys  58.9%Intr  0.8%User  0.0%Nice 39.3%Idle       2%ozfod                               4 vr0 irq17
                    |    |    |    |    |    |    |    |    |    |    |       daefr                                                                     9 re0 irq18
                    =+++++++++++++++++++++++++++++                        112 prcfr         132k re1 irq19
                                                           17 dtbuf      120 totfr                                                        2002 cpu0: time
                    Namei     Name-cache   Dir-cache     34796 desvn          react
                      Calls    hits   %    hits   %      1521 numvn          pdwak
                       1894    1894 100                   549 frevn          pdpgs
                                                                             intrn
                    Disks   ad0   md0                                   50380 wire
                    KB/t  16.00 16.00                                   50776 act
                    tps       0     0                                   16524 inact
                    MB/s   0.00  0.00                                     596 cache
                    %busy     0     0                                  374940 free
                                                                       33408 buf

                    vmstat -i

                    interrupt                          total       rate
                    irq1: atkbd0                           6          0
                    irq14: ata0                      1399199          3
                    irq17: vr0                      58168351        135
                    irq18: re0                     493576117       1147
                    irq19: re1                    4291436460       9978
                    cpu0: timer                    859965484       1999
                    Total                         5704545617      13263

                    ну и  {swi5+},  забиравший у cpu 60% нагрузки на софтовые прерывания, на что именно так и оставалось загадкой (для меня)

                    Итого:
                    после проверок железа оказалось, что винт умирал
                    Remap,  в моём случае,  помог на все 100.

                    remap.jpg
                    remap.jpg_thumb

                    DuckDuckGo is a search engine does not collect or share personal information.

                    1 Reply Last reply Reply Quote 0
                    • S
                      Sonya
                      last edited by

                      @killeo:

                      после проверок железа оказалось, что винт умирал
                      Remap,  в моём случае,  помог на все 100.

                      С таким графиком винту давно пора в морг! 2000 битых секторов!
                      Если seagate, то ещё можно запустить заводской тест и подлечить винт, в других случаях - только замена.
                      Кстати, при замене харда не обязательно всё ставить с нуля, можно и клонировать диски.

                      1 Reply Last reply Reply Quote 0
                      • D
                        dvserg
                        last edited by

                        @Sonya:

                        Кстати, при замене харда не обязательно всё ставить с нуля, можно и клонировать диски.

                        Или поставить с нуля и сохранить/восстановить конфиг pfSense, если конечно статистики в пакетах никакой нет на харде.

                        SquidGuardDoc EN  RU Tutorial
                        Localization ru_PFSense

                        1 Reply Last reply Reply Quote 0
                        • A
                          aleksvolgin
                          last edited by

                          2 Sonya

                          Если seagate, то ещё можно запустить заводской тест и подлечить винт

                          какой-такой "заводской тест"?

                          1 Reply Last reply Reply Quote 0
                          • D
                            dvserg
                            last edited by

                            @aleksvolgin:

                            2 Sonya

                            Если seagate, то ещё можно запустить заводской тест и подлечить винт

                            какой-такой "заводской тест"?

                            Наверное утилиту от производителя.

                            SquidGuardDoc EN  RU Tutorial
                            Localization ru_PFSense

                            1 Reply Last reply Reply Quote 0
                            • K
                              killeo
                              last edited by

                              на картинке выше  MAXTOR 40G, к стати восстановил.
                              не надо никаких заводских утилит, Victoria 3.5 поддерживает практически любой винт, за что спасибо автору. Она к тому-же бесплатная.

                              DuckDuckGo is a search engine does not collect or share personal information.

                              1 Reply Last reply Reply Quote 0
                              • S
                                Sonya
                                last edited by

                                @aleksvolgin:

                                какой-такой "заводской тест"?

                                У сигейта есть возможность давать команды через шнурок, запустив selfscan.

                                1 Reply Last reply Reply Quote 0
                                • S
                                  Sonya
                                  last edited by

                                  @killeo:

                                  на картинке выше  MAXTOR 40G, к стати восстановил.
                                  не надо никаких заводских утилит, Victoria 3.5

                                  Victoria - это вещь. Один-два дефекта можно подменить из резервной зоны подобным образом и пользоваться дальше. Но 2300 дефектов - это жуть, дефект-лист не резиновый, а такое обилие дефектов говорит о скорой кончине винта. Не говорите, что я пессимист, но хард надо менять, пока система ещё дышит, иначе в скором времени придётся её переустанавливать.

                                  1 Reply Last reply Reply Quote 0
                                  • A
                                    aleksvolgin
                                    last edited by

                                    2 Sonya

                                    есть возможность давать команды через шнурок

                                    так я и думал.

                                    1 Reply Last reply Reply Quote 0
                                    • K
                                      killeo
                                      last edited by

                                      Таки поставил новый винт, 5-й день - полёт нормальный.

                                      DuckDuckGo is a search engine does not collect or share personal information.

                                      1 Reply Last reply Reply Quote 0
                                      • V
                                        vlad-i-mir
                                        last edited by

                                        Добрый день!
                                        Собрал роутер для дома на базе ZOTAC®LGA 1155 Z68-ITX, Intel Celeron G530, 2 GB DDR3, HDD WD2500AAKX, 2 x onboard Realtek RTL8111E, WiFi - AzureWave AR5B95. Основное назначение - переваривание гигабита от провайдера и обеспечение работы сервера с торрентом, нескольких медиа-танков, телефизора и 3-5 беспроводных устройств. Всё бы ничего, но через время заметил постоянную загрузку CPU в пределах 30-40%, стал разбираться, оказалось это interrupts от irq16: ath0 ehci0. С одной стороны ресурсов хватает с головой и при 70-80% загрузке канала утилизация CPU не превышает 60-65%, но очень хочется, чтобы все было так сказать по фэн-шую и если ничего не происходит, процессор простаивал и небыл занят непонятно чем.

                                        После прочтения данного форума, в том числе и англоязычной ветки с аналогичной проблемой (я отписался и там тоже), начал разбираться. Сначала отключил все "ненужное" в биосе, начиная от звуковой карты и заканчивая Legacy USB и USB 3. Понаблюдал - результат тот же, работает 2-3 часа нормально (CPU load 1-2%), затем все возвращается и снова CPU load 36%. Затем я открутил и удалил физически WiFi карту AzureWave AR5B95, увидел irq16: ehci0, стал наблюдать. Снова через 3 часа появились эти прерывания, но уже 25-26%, то есть меньше, затем я прописал в /boot/loader.conf:

                                        hw.usb.ehci.lostintrbug="1"
                                        hw.usb.ehci.iaadbug="1"
                                        hw.usb.ehci.no_hs="1"
                                        

                                        Уже на протяжении 5-6 часов все было в порядке, но затем снова irq16: ehci0 появился и показывал CPU load 20-23%. Вот, что показывают $ vmstat -i и $ devinfo -v:

                                        interrupt total rate
                                        irq16: ehci0 6679556627 168445    –----> + примерно 450 000 каждую секунду
                                        irq19: atapci0+ 57770 1
                                        irq23: ehci1 79325 2
                                        cpu0: timer 79305108 1999
                                        irq256: re0 98275744 2478
                                        irq257: re1 96862546 2442
                                        cpu1: timer 79304926 1999
                                        Total 7033442046 177370

                                        $ devinfo -v
                                        nexus0
                                        …....
                                        acpi0
                                        .......
                                        pcib0 pnpinfo HID=PNP0A08 UID=0 at handle=_SB.PCI0
                                        pci0
                                        .......
                                        ehci0 pnpinfo vendor=0x8086 device=0x1c2d subvendor=0x19da subdevice=0xa198 class=0x0c0320 at slot=26 function=0 handle=_SB
                                        .PCI0.USBE
                                        usbus0
                                        uhub0
                                        uhub2 pnpinfo vendor=0x8087 product=0x0024 devclass=0x09 devsubclass=0x00 sernum="" release=0x0000 intclass=0x09 intsubclass=0x00 at bus=1 hubaddr=1 port=0 devaddr=2 interface=0
                                        .......
                                        ehci1 pnpinfo vendor=0x8086 device=0x1c26 subvendor=0x19da subdevice=0xa198 class=0x0c0320 at slot=29 function=0 handle=_SB_.PCI0.EUSB
                                        usbus1
                                        uhub1
                                        uhub3 pnpinfo vendor=0x8087 product=0x0024 devclass=0x09 devsubclass=0x00 sernum="" release=0x0000 intclass=0x09 intsubclass=0x00 at bus=1 hubaddr=1 port=1 devaddr=2 interface=0
                                        .......

                                        Прошу подсказать, в какую сторону теперь копать? К сожалению я плохо знаком с FreeBSD и прочими механизмами работы данной системы, но уж очень не хотелось бы переходить на какой-нибудь IPcop или ещё чего-нибудь там. Уж очень нравится pfsense с его плюшками и вэбкой.

                                        ps: ставил m0n0wall, бетку, результат зеркальный.

                                        1 Reply Last reply Reply Quote 0
                                        • K
                                          killeo
                                          last edited by

                                          Замена сетевуки на 3COM или INTEL решило аналогичную проблему для меня

                                          DuckDuckGo is a search engine does not collect or share personal information.

                                          1 Reply Last reply Reply Quote 0
                                          • V
                                            vlad-i-mir
                                            last edited by

                                            К сожалению, для меня это не выход, т. к. остался только один свободный PCI Express x16, который в планах будет занят WiFi модулем (на замену действующему слабенькому Atheros 9285 mini-PCI Express). Да и потом, если присмотреть "активную" сетевуху и все таки воткнуть её в свободный PCI-E, то стоимость моего роутера с легкостью перевалит за 4 сотни долларов. А это уже, практически, цена производительного и многопортового Микротика (например - RB1100AHx2), с готовой Level6 на борту и возможностью переваривать 500k пакетов. То есть экономия получается неэкономной и смысл сборки/шаманства над действующей коробочкой теряется.

                                            1 Reply Last reply Reply Quote 0
                                            • First post
                                              Last post
                                            Copyright 2025 Rubicon Communications LLC (Netgate). All rights reserved.