Как провести диагностику (ЛВС) локальной вычислительной сети?

Используем Cisco Catalyst 6513 уже более 5 лет, с ним проблем таких не возникало, ниже листинг show version и далее описание ситуации.

Catalyst-6513#sh ver
Cisco Internetwork Operating System Software
IOS (tm) c6sup2_rp Software (c6sup2_rp-PSV-M), Version 12.1(26)E6, RELEASE SOFTW
ARE (fc1)
Technical Support: http://www.cisco.com/techsupport
Copyright (c) 1986-2006 by cisco Systems, Inc.
Compiled Mon 23-Jan-06 10:13 by hqluong
Image text-base: 0x40008F90, data-base: 0x41854000

ROM: System Bootstrap, Version 12.1(11r)E1, RELEASE SOFTWARE (fc1)
BOOTLDR: c6sup2_rp Software (c6sup2_rp-PSV-M), Version 12.1(26)E6, RELEASE SOFTW
ARE (fc1)

Catalyst-6513 uptime is 5 days, 22 hours, 23 minutes
Time since Catalyst-6513 switched to active is 5 days, 22 hours, 22 minutes
System returned to ROM by power-on (SP by power-on)
System image file is "sup-bootflash:c6sup22-psv-mz.121-26.E6.bin"

cisco WS-C6513 (R7000) processor (revision 1.0) with 112640K/18432K bytes of mem
ory.
Processor board ID SAL0802SHTV
R7000 CPU at 300Mhz, Implementation 39, Rev 3.3, 256KB L2, 1024KB L3 Cache
Last reset from power-on
X.25 software, Version 3.0.0.
Bridging software.
9 Virtual Ethernet/IEEE 802.3  interface(s)
338 Gigabit Ethernet/IEEE 802.3 interface(s)
381K bytes of non-volatile configuration memory.

32768K bytes of Flash internal SIMM (Sector size 512K).
Configuration register is 0x2102


Уже как вторую неделю наблюдаем следующую картину:
Увеличивается нагрузка на CPU вплоть до 80%, сеть начинает жутко лагать, пинг до принтеров увеличивается до 300 мс., недоступны сетевые сервисы компании (принт сервер, 1С, падает IP-телефония (Cisco UCM), сеть на компах). В нормальном же режиме нагрузка на CPU не достигает и 5%, температура компонентов коммутатора не подымается выше 28 градусов цельсия.
Самое странное во всём этом что началось это после того как компания закупила моноблоки HP ProOne 600. Первая возникшая проблема: не запускались приложения через сеть, включения-отключения UAC ни к чему не привели. Помогало только копирование дистрибутивов на ПК и последующая установка (причину так и не выявили).
Когда нагрузка выросла мы выявили что был виноват один из этих моноблоков, перезагрузили ПК, сменили патч-корд и порт на cisco (чтобы уж наверняка).
Через сутки ситуация повторилась, но уже с другим пользователем - однако имеющим в распоряжении такой же моноблок. С одной стороны - они работают у нас уже 3 месяца, с другой стороны - источником проблемы в обоих случаях были они, и их последующая перезагрузка и смена порта на коммутаторе сбросила нагрузку с 80% до 2% в течении 10 мин после проделанных манипуляций.
Проблема в том, что я не могу выявить виноватого в этой ситуации, не знаю куда еще копать.
Гугление про диагностику сетей дало ссылки на скопипащенные статьи, где в качестве исследования использовали Win 95.
  • Вопрос задан
  • 4478 просмотров
Решения вопроса 1
@throughtheether
human after all
Увеличивается нагрузка на CPU вплоть до 80%
Какой процесс потребляет больше всего ресурсов? Поможет команда:
show process cpu sorted

Самое странное во всём этом что началось это после того как компания закупила моноблоки HP ProOne 600.
Проблема в том, что я не могу выявить виноватого в этой ситуации, не знаю куда еще копать.
Вот такой интересный тред на реддит (извините). Чтобы убедиться, что это ваш случай, подсоединитесь ноутбуком в порт в том же L2-домене (влане), что и моноблок и запустите на нем wireshark. Искать следует многоадресную рассылку IPv6 пакетов от моноблока (см. MAC-адрес источника). В качестве решение попробуйте обновить сетевой драйвер моноблока. Если не получится, задумайтесь о фильтрации IPv6-трафика, если этот протокол не используется. Или можете ограничить уровень многоадресного трафика:
storm-control multicast level 0.5
на интерфейсах, подключенных к конечным хостам. Значение порога может нуждаться в подборе.

Пара замечаний не по теме вопроса:
Version 12.1(26)E6
Я конечно понимаю, работает - не трогай, но можно подумать и об обновлении ПО.
Кроме того, трудно говорить о внятной диагностике без снятия соответствующих показаний - утилизации памяти, ресурсов CPU, интерфейсов (в т.ч. уровень широковещательного и многоадресного трафика), наличие ошибок/отброшенных пакетов, трафик на процессор (зеркалированный при помощи SPAN). Также задумайтесь о настройке control plane protection policy (ссылка).
Ответ написан
Пригласить эксперта
Ответы на вопрос 3
gbg
@gbg Куратор тега Компьютерные сети
Любые ответы на любые вопросы
Включить на коммутаторе зеркалирование трафика на другой порт и посмотреть при помощи wireshark, что же такое особенное присылает этот моноблок.

Еще вариант - снимать дамп прямо коммутатором и сохранять на флеш, но это при наличии возможности.
Ответ написан
Комментировать
Jump
@Jump
Системный администратор со стажем.
Ну если проблема в моноблоках - смотрите чьи у них сетевые карты, какие драйвера на них стоят, нет ли разного рода утилит для "улучшения" работы сети.

Хотя - у вас случайно петли в сети нет? А то мало ли, меняли оборудование, втыкали провода....
Ответ написан
RicoX
@RicoX
Ушел на http://ru.stackoverflow.com/
По симптомам похоже на кольцо, снимите брудкаст каунтеры на входе с портов и посмотрите насколько быстро растут, вообще это системой мониторинга обычно делают, но можно и ручками. Если найдете 2 порта на которых каунтеры растут на входе сильнее остальных - у вас кольцо, если на одном порту сильно растут, то либо кольцо дальше либо железка какая флудит. Гадать можно долго, без системы мониторинга по всему управляемому железу это вам опытных экстрасенсов в штат нужно.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы