Падает интерфейс у двухпортовой сетевой Intel
-
Всем привет.
Начал наглухо ложиться (до ребута) один из интерфейсов igb на PFSense 2.1 у двухпортовой сетевой Intel. В этот порт вставлен двухволоконный SFP модуль, который смотрит внутрь сети и подключен к Cisco SCE одномодовыми патчкордами (хотя поидее циска предусматривает подключение по многомоду, но раньше проблем не было никаких абсолютно).
Вот бектрейс, который отдает PFSens после ребута:
https://gist.github.com/anonymous/b5704d3bf120a82da767MBUF увеличен до максимального значения, переполнение буферов мало вероятно
Еще некоторая информация:
Сервер служит пограничным маршрутизатором между собственной сетью и апстримом. На нем дополнительно крутится всего ничего: OpenBGP да Zabbix Agent. Так же NATится "серая" сеть.
Есть некоторое подозрение, что глюки с сетевой начались после обновления в сентябре с предыдущей версии, но это мое личное субъективное мнение.netstat -w 1 -I igb1 -h input (igb1) output packets errs idrops bytes packets errs bytes colls 24k 0 0 7.0M 35k 0 41M 0 25k 0 0 7.6M 35k 0 39M 0 23k 0 0 7.6M 33k 0 37M 0 25k 0 0 7.4M 35k 0 40M 0 25k 0 0 7.1M 35k 0 41M 0
vmstat -z | grep -v 0$ ITEM SIZE LIMIT USED FREE REQUESTS FAILURES 64 Bucket: 268, 0, 150, 4, 197, 92 128 Bucket: 524, 0, 635, 2, 1892, 119
netstat -m 8825/2830/11655 mbufs in use (current/cache/total) 8821/2417/11238/131072 mbuf clusters in use (current/cache/total/max) 8820/1548 mbuf+clusters out of packet secondary zone in use (current/cache) 0/104/104/65536 4k (page size) jumbo clusters in use (current/cache/total/max) 0/0/0/32768 9k jumbo clusters in use (current/cache/total/max) 0/0/0/16384 16k jumbo clusters in use (current/cache/total/max) 19872K/5957K/25829K bytes allocated to network (current/cache/total) 0/0/0 requests for mbufs denied (mbufs/clusters/mbuf+clusters) 0/0/0 requests for jumbo clusters denied (4k/9k/16k) 0/6/6656 sfbufs in use (current/peak/max) 0 requests for sfbufs denied 0 requests for sfbufs delayed 0 requests for I/O initiated by sendfile 0 calls to protocol drain routines
last pid: 22983; load averages: 0.62, 0.79, 0.87 up 0+01:02:06 14:36:16 168 processes: 5 running, 128 sleeping, 35 waiting CPU 0: 0.0% user, 0.0% nice, 0.0% system, 23.3% interrupt, 76.7% idle CPU 1: 0.0% user, 0.0% nice, 0.0% system, 25.2% interrupt, 74.8% idle CPU 2: 0.0% user, 0.0% nice, 0.4% system, 32.6% interrupt, 67.0% idle CPU 3: 0.0% user, 0.0% nice, 0.4% system, 20.6% interrupt, 79.0% idle Mem: 56M Active, 17M Inact, 138M Wired, 320K Cache, 19M Buf, 3538M Free Swap: 8192M Total, 8192M Free PID USERNAME PRI NICE SIZE RES STATE C TIME CPU COMMAND 11 root 171 ki31 0K 32K RUN 3 47:43 78.17% [idle{idle: cpu3}] 11 root 171 ki31 0K 32K RUN 2 48:00 77.29% [idle{idle: cpu2}] 11 root 171 ki31 0K 32K RUN 0 47:31 76.95% [idle{idle: cpu0}] 11 root 171 ki31 0K 32K CPU1 1 47:58 72.56% [idle{idle: cpu1}] 12 root -68 - 0K 280K WAIT 2 7:05 15.28% [intr{irq258: igb0:que}] 12 root -68 - 0K 280K WAIT 3 7:11 14.16% [intr{irq259: igb0:que}] 12 root -68 - 0K 280K WAIT 0 7:43 14.06% [intr{irq256: igb0:que}] 12 root -68 - 0K 280K WAIT 1 7:12 12.79% [intr{irq257: igb0:que}] 12 root -68 - 0K 280K WAIT 3 6:40 12.60% [intr{irq264: igb1:que}] 12 root -68 - 0K 280K WAIT 0 6:04 12.50% [intr{irq261: igb1:que}] 12 root -68 - 0K 280K WAIT 1 6:12 12.35% [intr{irq262: igb1:que}] 12 root -68 - 0K 280K WAIT 2 6:23 11.38% [intr{irq263: igb1:que}]
Что можете посоветовать для вылавливания бага? Или может сами сталкивались с подобным?
-
глюки с сетевой начались после обновления в сентябре с предыдущей версии
Вполне очень-и-очень возможно. Пакеты - все последней версии? Железо - не совсем старое ?
Как вариант, сделать бэкап конфига и , подняв с нуля 2.1, подгрузить конфиг.
P.s. http://www.bsdportal.ru/viewtopic.php?t=24959
я бы память проверил и HDD.
попробуй в single user mode загрузиться и сделать fsck -fy
И не используется ли одинаковые прерывания для обоих интерфейсов этой карты ?
-
По прерываниям все нормально, проверял:
vmstat -i interrupt total rate irq1: atkbd0 189 0 irq19: uhci4+ 96965 0 cpu0: timer 678170290 1996 irq256: igb0:que 0 2257082844 6645 irq257: igb0:que 1 2273901619 6695 irq258: igb0:que 2 2252781543 6632 irq259: igb0:que 3 2239417498 6593 irq260: igb0:link 3 0 irq261: igb1:que 0 2247433132 6617 irq262: igb1:que 1 2256606046 6644 irq263: igb1:que 2 2234475077 6579 irq264: igb1:que 3 2228791382 6562 irq265: igb1:link 2 0 irq266: re0 9877 0 cpu3: timer 678214676 1996 cpu1: timer 678170203 1996 cpu2: timer 678214675 1996 Total 20703366021 60958
Уже идея поставить систему с нуля крутилась в голове, просто мало желания в ночь на работу переться.
Железо не очень древнее: Intel Quad Core, 8Gb оперы - для бордера более чем, считаю, с моим pps.
Спасибо за советы.