Netgate Discussion Forum
    • Categories
    • Recent
    • Tags
    • Popular
    • Users
    • Search
    • Register
    • Login

    Падает интерфейс у двухпортовой сетевой Intel

    Scheduled Pinned Locked Moved Russian
    3 Posts 2 Posters 1.0k Views
    Loading More Posts
    • Oldest to Newest
    • Newest to Oldest
    • Most Votes
    Reply
    • Reply as topic
    Log in to reply
    This topic has been deleted. Only users with topic management privileges can see it.
    • D
      dimic
      last edited by

      Всем привет.
      Начал наглухо ложиться (до ребута) один из интерфейсов igb на PFSense 2.1 у двухпортовой сетевой Intel. В этот порт вставлен двухволоконный SFP модуль, который смотрит внутрь сети и подключен к Cisco SCE одномодовыми патчкордами (хотя поидее циска предусматривает подключение по многомоду, но раньше проблем не было никаких абсолютно).
      Вот бектрейс, который отдает PFSens после ребута:
      https://gist.github.com/anonymous/b5704d3bf120a82da767

      MBUF увеличен до максимального значения, переполнение буферов мало вероятно

      Еще некоторая информация:
      Сервер служит пограничным маршрутизатором между собственной сетью и апстримом. На нем дополнительно крутится всего ничего: OpenBGP да Zabbix Agent. Так же NATится "серая" сеть.
      Есть некоторое подозрение, что глюки с сетевой начались после обновления в сентябре с предыдущей версии, но это мое личное субъективное мнение.

      netstat -w 1 -I igb1 -h
                  input         (igb1)           output
         packets  errs idrops      bytes    packets  errs      bytes colls
             24k     0     0       7.0M        35k     0        41M     0
             25k     0     0       7.6M        35k     0        39M     0
             23k     0     0       7.6M        33k     0        37M     0
             25k     0     0       7.4M        35k     0        40M     0
             25k     0     0       7.1M        35k     0        41M     0
      
      vmstat -z | grep -v 0$
      ITEM                     SIZE     LIMIT      USED      FREE  REQUESTS  FAILURES
      
      64 Bucket:                268,        0,      150,        4,      197,       92
      128 Bucket:               524,        0,      635,        2,     1892,      119
      
       netstat -m
      8825/2830/11655 mbufs in use (current/cache/total)
      8821/2417/11238/131072 mbuf clusters in use (current/cache/total/max)
      8820/1548 mbuf+clusters out of packet secondary zone in use (current/cache)
      0/104/104/65536 4k (page size) jumbo clusters in use (current/cache/total/max)
      0/0/0/32768 9k jumbo clusters in use (current/cache/total/max)
      0/0/0/16384 16k jumbo clusters in use (current/cache/total/max)
      19872K/5957K/25829K bytes allocated to network (current/cache/total)
      0/0/0 requests for mbufs denied (mbufs/clusters/mbuf+clusters)
      0/0/0 requests for jumbo clusters denied (4k/9k/16k)
      0/6/6656 sfbufs in use (current/peak/max)
      0 requests for sfbufs denied
      0 requests for sfbufs delayed
      0 requests for I/O initiated by sendfile
      0 calls to protocol drain routines
      
      last pid: 22983;  load averages:  0.62,  0.79,  0.87                                                                                                                   up 0+01:02:06  14:36:16
      168 processes: 5 running, 128 sleeping, 35 waiting
      CPU 0:  0.0% user,  0.0% nice,  0.0% system, 23.3% interrupt, 76.7% idle
      CPU 1:  0.0% user,  0.0% nice,  0.0% system, 25.2% interrupt, 74.8% idle
      CPU 2:  0.0% user,  0.0% nice,  0.4% system, 32.6% interrupt, 67.0% idle
      CPU 3:  0.0% user,  0.0% nice,  0.4% system, 20.6% interrupt, 79.0% idle
      Mem: 56M Active, 17M Inact, 138M Wired, 320K Cache, 19M Buf, 3538M Free
      Swap: 8192M Total, 8192M Free
      
        PID USERNAME PRI NICE   SIZE    RES STATE   C   TIME    CPU COMMAND
         11 root     171 ki31     0K    32K RUN     3  47:43 78.17% [idle{idle: cpu3}]
         11 root     171 ki31     0K    32K RUN     2  48:00 77.29% [idle{idle: cpu2}]
         11 root     171 ki31     0K    32K RUN     0  47:31 76.95% [idle{idle: cpu0}]
         11 root     171 ki31     0K    32K CPU1    1  47:58 72.56% [idle{idle: cpu1}]
         12 root     -68    -     0K   280K WAIT    2   7:05 15.28% [intr{irq258: igb0:que}]
         12 root     -68    -     0K   280K WAIT    3   7:11 14.16% [intr{irq259: igb0:que}]
         12 root     -68    -     0K   280K WAIT    0   7:43 14.06% [intr{irq256: igb0:que}]
         12 root     -68    -     0K   280K WAIT    1   7:12 12.79% [intr{irq257: igb0:que}]
         12 root     -68    -     0K   280K WAIT    3   6:40 12.60% [intr{irq264: igb1:que}]
         12 root     -68    -     0K   280K WAIT    0   6:04 12.50% [intr{irq261: igb1:que}]
         12 root     -68    -     0K   280K WAIT    1   6:12 12.35% [intr{irq262: igb1:que}]
         12 root     -68    -     0K   280K WAIT    2   6:23 11.38% [intr{irq263: igb1:que}]
      

      Что можете посоветовать для вылавливания бага? Или может сами сталкивались с подобным?

      1 Reply Last reply Reply Quote 0
      • werterW
        werter
        last edited by

        глюки с сетевой начались после обновления в сентябре с предыдущей версии

        Вполне очень-и-очень возможно. Пакеты - все последней версии? Железо - не совсем старое ?

        Как вариант, сделать бэкап конфига и , подняв с нуля 2.1, подгрузить конфиг.

        P.s. http://www.bsdportal.ru/viewtopic.php?t=24959

        я бы память проверил и HDD.

        попробуй в single user mode загрузиться и сделать fsck -fy

        И не используется ли одинаковые прерывания для обоих интерфейсов этой карты ?

        1 Reply Last reply Reply Quote 0
        • D
          dimic
          last edited by

          По прерываниям все нормально, проверял:

          vmstat -i
          interrupt                          total       rate
          irq1: atkbd0                         189          0
          irq19: uhci4+                      96965          0
          cpu0: timer                    678170290       1996
          irq256: igb0:que 0            2257082844       6645
          irq257: igb0:que 1            2273901619       6695
          irq258: igb0:que 2            2252781543       6632
          irq259: igb0:que 3            2239417498       6593
          irq260: igb0:link                      3          0
          irq261: igb1:que 0            2247433132       6617
          irq262: igb1:que 1            2256606046       6644
          irq263: igb1:que 2            2234475077       6579
          irq264: igb1:que 3            2228791382       6562
          irq265: igb1:link                      2          0
          irq266: re0                         9877          0
          cpu3: timer                    678214676       1996
          cpu1: timer                    678170203       1996
          cpu2: timer                    678214675       1996
          Total                        20703366021      60958
          
          

          Уже идея поставить систему с нуля крутилась в голове, просто мало желания в ночь на работу переться.
          Железо не очень древнее: Intel Quad Core, 8Gb оперы - для бордера более чем, считаю, с моим pps.
          Спасибо за советы.

          1 Reply Last reply Reply Quote 0
          • First post
            Last post
          Copyright 2025 Rubicon Communications LLC (Netgate). All rights reserved.