Возможно как-то переделать ее в домашних условиях? Если да, то как?
Можно просто меньше директоров поставить.
Вообще главная задача у меня это такой мониторинг загрузки канала на web-сервере с разделением по доменам. Может будут советы по алгоритмам измерения?Я правильно понимаю, ваш веб-сервер обслуживает несколько доменных имен и вы хотите узнать статистику запросов по доменным именам? В таком случае, полагаю, как SNMP, так и netflow вам помогут вряд ли. Дело в том, что в общем случае, эти запросы отличаются заголовком "Host:" HTTP-сообщений. Я сомневаюсь, что SNMP-агент вашего маршрутизатора предоставит подобную информацию. В netflow эти параметры тоже не учитываются. Если я правильно понял вашу задачу, логичнее парсить access-логи. Полученные данные можно отправлять на collectd/graphite, например.
на точках интернет работает, sip через спутник работает, никаких проблем, я могу подключиться к серверам через ammyy admin, но! Не работает RDP, я не могу подключиться к админке роутера, то есть не работают ни пробросы, ни роутер не отвечает. Пинг в это время идет. Еще получалось подключиться телнетом, в самом начале, потом я не проверял. ССШ висит, висит, отваливается по таймауту. Winbox - mikrotik утилита для конфигурирования - может висеть очень-очень долго. RDP аналогично висит, устанавливает соединение. Проброс в админки ip-камер аналогично не отрабатывает, браузер очень быстро выдает что не удается отобразить страницу.Я предполагаю, проблема наблюдается в случае использования по крайней мере некоторых протоколов, работающих поверх TCP. Есть предположение, что провайдер, вероятно, каким-то образом дифференцирует TCP-трафик от UDP. Это может быть связано с использованием "ускорителей интернета" а-ля Transport Flow Optimization в Cisco WAAS.
в какую сторону копать?Убедиться в различном поведении TCP и UDP (я не уверен, какой именно протокол использует ammyy admin). Если возможно, завернуть часть "проблемного" трафика в VPN-over-UDP. Пронаблюдать ситуацию. Изучить поведение TCP между интересующими вас точками. Вы говорите, есть доступ через ammyy admin до серверов. На вашем месте я бы поднял на одном из серверов tcp-сервис (настроив соответствующим образом NAT ("проброс портов")), периодически обращался к нему с клиента, сохраняя дампы трафика на обоих концах. В моем представлении, это можно автоматизировать. Если гипотеза подтвердится, и обнаружится разница в дампах, с этими данными можно задать представителям провайдера предметный вопрос.
есть идеи?Основная идея - узнать, чем отличаются эти три проблемных компьютера от остальных. Практические приложения этой идеи таковы:
External Data Representation
Representation
presentation
все-таки часто спрашивают:Мне, например, трудно воспринимать как инженера с практическим опытом человека, который слишком серьезно относится к семиуровневой модели.
Это вообще можно определить по каким-то критериямЗачем? Что это даст? XDR - протокол шестого уровня, и что из этого следует? Если цель - пройти собеседование, то проще выучить популярные варианты. Я думаю, что если очень долго всматриваться в это наследие 70х (семиуровневую модель), то, вероятно, некую логику можно узреть. Какое это имеет применение на практике, я не знаю. Я считаю, что современные стеки протоколов (HTTP over TCP over IPv4 over Ethernet) яснее описываются 4-уровневой моделью TCP/IP. Я, конечно, могу предположить, что в редких случаях (X-стек) модель OSI внятно отображает стек протоколов и дает какие-то важные следствия, применимые на практике. Жаль, я с такими случаями не встречался.
Интересно узнать, сохраняется ли история моих посещений\скачиваний у провайдера?Я полагаю, любой вменяемый провайдер собирает т.н. flow-данные с целью учета трафика (netflow, s-flow и т.д.). В этих данных содержится информация о времени начала/окончания "flow" (грубо говоря, "flow", "поток", "сессия" задается IP-адресами источника/адресата, номером протокола (TCP, UDP, ICMP, etc), номерами портов источника и адресата), об объеме переданной информации (в байтах, в пакетах) и т.д. Понятно, что с точки зрения полезного (с точки зрения пользователя) трафика это метаданные. Соответственно исходя из этих данных, нельзя сказать, что и где вы писали на форуме, к примеру, можно лишь сказать, обращались ли вы тогда-то и тогда-то по такому-то порту такого-то сервера и если да, то какой(количественно) трафик потребляли/генерировали.
Сколько времени история может храниться на сереверах провайдера и как часто они удаляют информацию?Подобная информация собирается исключительно для внутренних нужд провайдера, поэтому удаляется по мере заполнения диска.
Как можно избежать потери пакетов на 188.254.44.34, Сибирьтелеком?Зачем? По факту, хост 188.254.44.34 отбрасывает 90% пакетов, направленных ему. Если этот адрес завешан на интерфейсе устройства (маршрутизатора), то скорее всего, это результат действия Control plane policing - трафик, адресованный устройству, может попасть на обработку центральным процессором (а не оптимизированными микросхемами), поэтому при большом объеме трафика возможен DoS (denial of service) в том или ином проявлении, поэтому такой трафик ограничивается. Если бы проблемы наблюдались на линке между 188.254.44.34 и mail.ru, то хосту mail.ru соответствовал такой же или больший процент отброшенных пакетов. Этого не наблюдается.
Погуглил - люди по всей России жалуются на этот ip еще с мая месяцаИ что? В общем случае наблюдаемые вами "потери" не имеют отношения к низкой производительности доступа в интернет. Информации, позволяющей указать на устройство с адресом 188.254.44.34 как на источник ваших проблем, я не наблюдаю.
Подскажите, что можно предпринять?Я бы порекомендовал разобраться, что означает (в реальности, данной нам в ощущениях, сегментах, пакетах и фреймах) "начал тормозить интернет". Страница медленно загружается? Что это значит (тут поможет водопадная диаграмма загрузки, waterfall diagram, во многих современных браузерах присутствует, насколько я знаю)? Доменное имя медленно разрешается? Неоптимальная работа TCP (здесь поможет wireshark и представления о работе TCP)? Или проблема в компьютере (трояны и прочая)?
Наши в узле связи отмахнулись, не желая разбиратьсяЯ не знаю, кто такие "ваши", но я чаще получаю нужный мне ответ (или действия), предоставив в техподдержку всю имеющуюся у меня информацию, с описанием, как она подтверждает мою гипотезу , и что нужно поменять, чтобы стало хорошо. Хотя и в этом случае приходится проявлять настойчивость.
bond0 Link encap:Ethernet HWaddr 00:15:17:D6:B0:14
UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1
RX packets:9381 errors:0 dropped:6123 overruns:0 frame:0
bond0.3 Link encap:Ethernet HWaddr 00:15:17:D6:B0:14
inet addr:192.168.32.7 Bcast:192.168.32.127 Mask:255.255.255.128
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:1561 errors:0 dropped:146 overruns:0 frame:0
ethtool eth0
ethtool eth1
Native VLAN не используется, отдаю в PortChanell только 2 вышеупомянутых VLAN'а.Предоставьте, пожалуйста, вывод с коммутатора
show interface Port-channel6 switchport
Если все-таки выяснится, что на интерфейсе Po6 native vlan установлен в 1, по посмотрите на коммутатореshow cdp
show cdp interface GigabitEthernet1/3
show cdp interface GigabitEthernet1/39
Как думаете, может это как-то связано с ядром?К сожалению, я недостаточно владею особенностями работы ядра Linux, чтобы ответить на этот вопрос. Могу лишь предложить использовать tcpdump на интерфейсе bond0.3. Необходимо иметь в виду, что пакет, "дропнутый" ядром, может появиться, а может и не появиться в дампе трафика, в зависимости от причины "дропа". Но вполне может быть, чтоб вы увидите чужой мультикаст, например (OSPF Hello с другого конца L2-домена как вариант). Я хочу сказать, что это может быть связано с ядром, а может - и с обстановкой в сети.
Здесь видно, что все-таки native vlan 1 присутствует, упорно гуглил, но так и не понял как убрать эти параметры из конфигурации..Создайте новый (ранее неиспользуемый) влан на коммутаторе и назначьте его в качестве native, но только на этот интерфейс. Пример:
configure terminal
interface Port-channel6
switchport trunk native vlan XXXX
, XXXX-номер влана.eth0 Link encap:Ethernet HWaddr 00:15:17:D6:B0:14
TX packets:104 errors:0 dropped:0 overruns:0 carrier:0
eth1 Link encap:Ethernet HWaddr 00:15:17:D6:B0:14
TX packets:1141 errors:0 dropped:0 overruns:0 carrier:0
# cat ./ifcfg-bond0
BONDING_OPTS="debug=1 mode=802.3ad miimon=100 xmit_hash_policy=layer2 lacp_rate=1"
2 сервера на freebsd, находятся в одной подсети с маршрутизаторами.То есть оба адреса 10.141.1.1 и 10.141.100.9 (я ведь правильно понял, это адреса маршрутизаторов?) входят в один префикс (/17 или короче), используемый на L2-домене(линке)?
С одного все данные получаются, с другого - нет. Ограничение стоит на другие сети, в данной подсети ограничений нет, тем более, для одного конкретного хоста.Вообще-то, как правило, принято (этому способствует логика настройки) разрешать SNMP-доступ для каждого конкретного хоста, а не "ограничивать сети". Приведите конфигурацию каждого из маршрутизаторов в части SNMP.
Команда из одной консоли скопирована в другую, т.е. ошибок быть не может.
ошибок быть не может.Как много раз я это слышал.
Откуда взялась совершенно бредовая маска /17 я не совсем понял. Разве я такую маску упоминал?Вы писали:
2 сервера на freebsd, находятся в одной подсети с маршрутизаторами.
в одной подсети с маршрутизаторами
в одной подсети, при этом адреса маршрутизаторов указаны как 10.141.1.1 и 10.141.100.9. Я предположил, что "одна подсеть" включает в себя оба этих адреса. Оба этих адреса могут входить в один префикс, если его длина /17 (10.141.0.0/17) и короче. Вы могли сразу указать, что каждый сервер имеет по одному интерфейсу в одной подсети с каждым маршрутизатором, что избавило бы от двояких прочтений. Выражайтесь корректнее, пожалуйста.
С одного все данные получаются, с другого - нет.Вы не могли бы уточнить, вы, действуя с каждого из серверов, не можете получить данные с одного конкретного маршрутизатора (10.141.100.9), я правильно вас понял?
Не надо придумывать лишних сложностей.
Почему при балансировке нагрузки через один шлюз идет больше трафика, чем через другой?Вкратце, потому что балансировки трафика не наблюдается. В моем понимании балансировка - это когда мы отслеживаем один параметр ('нагрузку', будь то утилизация линка, количество соединений, что угодно) и соответственно изменяем другой параметр (исходящий маршрут, интерфейс, и т.д.), чтобы выровнять (привести в баланс) изменения, реализуя обратную связь. В этом смысле балансировка наблюдается в различных балансировщиках нагрузки (load balancers), типа F5, haproxy и прочая.
Куда копать?Чтобы удостовериться правильности гипотезы, вы можете снять дамп трафика (в точке до разделения на линки) и изучить его при помощи wireshark (Statitics -> Conversations -> вкладки TCP, UDP, две правые колонки в bps). Если гипотеза верна, вы обнаружите пару сокетов, утилизирующих значительную долю пропускной способности линка.
Сейчас машина стоит на тестовом стенде. Здесь нет вообще никакого трафика, кроме двух пингов, запускающихся для теста.Приведите, пожалуйтса, точные команды, которые вы запускаете. Уточните, запускаете ли вы их на самом сервере-маршрутизаторе с длвумя линками или на сторонней машине. Цели для пингов - отвечают ли они на пинги. Каковы точные количественные характеристики трафика на линках (интерфейс такой-то, столько-то входящего, столько-то исходящего), как вы его меряете (среднее значение за 1,5,10 минут)
Связь между отделами должна осуществляться или с помощью шлюза, или мостов.Это промышленная сеть или предмет курсовой работы? Меня использование термина "мост" немного удивило.
Составленная схема правильная?Если цель схемы - отобразить физическую топологию, то примерно да.
и какое оборудование использовать?С такими размытыми требованиями (и без указания бюджета) - практически любое. Коммутатор, поддерживающий 802.1q вланы, маршрутизатор, поддерживающий 802.1q, NAT и способный подключиться к вашему провайдеру.
И посоветуйте, пожалуйста, гайды по проектированию таких сетей.В данном случае "проектирование" - слишком громкое слово. Если это курсовая, то должен быть и учебник. Если промышленная сеть - то тут реально два активных сетевых устройства; к тому же я считаю, что без опыта эксплуатации глубоко лезть в "дизайн" непродуктивно. Если все-таки неймется, то в книгах курса CCDA, насколько мне известно, среди маркетинговой хохломы есть и полезные сведения.
Возможна ли DoS/DDoS атака на устойство слушающее SPAN-порт?Атака возможна на что угодно. Другой вопрос, насколько эффективна она будет.
Возможно ли вообще в принципе завалить SPAN порт трафиком так чтобы устройство перестало с ним справляться?Без уточнения, о каком устройстве идет речь, ответ дать трудно. В общем, если вы подключились в гигабитный порт, и устройство обработает 1.5 миллиона фреймов в секунду, то есть надежда на устойчивую его работу.
На сколько я понимаю технологию зеркалирования вопрос перегрузки SPAN-порта трафиком (и как следствие любого устройства подключенного к нему) вообще не имеет смыслаSPAN-порт (в роли destination) не сможет пропустить трафика больше, чем физически возможно (этот предел задан скоростью среды и размерами буферов). Пример - вы копируете трафик с 3 портов (каждый загружен на 400 Мбит/с в среднем) в один гигабитный (1000 Мбит/с) порт. Примерно одну шестую трафика (3*400 Мбит/с - 1000 Мбит/с =200 Мбит/с) вы будете терять.
т.к. зеркалить можно только заранее аппаратно-определенный поток или вообще только один какой-то порт.Как правило, копировать трафик можно с порта (иногда с фильтрацией по вланам), группы портов, из влана - в другой порт.
Тогда в чем смысл вообще, если мы что-то важное можем пропустить?Часто, например, через SPAN мониторят трафик, приходящий на процессор. Увеличение объема такого трафика, как правило, ничего радостного не сулит.
Как мы тогда можем весь трафик видеть который идет через свич?Если бы я сейчас реализовывал подобный проект (т.е. необходимо видеть "весь" трафик), я бы обратил внимание на продукцию Gigamon (если много денег) или бы поэкспериментировал с пассивными оптическими разветвителями (логично их устанавливать на линки с интересующим нас трафиком).
у меня есть сеть и я ставлю чтоб трафик считал только с 111.0.0.0/255.0.0.0Я немного не понял используемую вами нотацию. Обычно используют или A.B.C.D/n, где n - длина префикса (число от 0 до 32), либо A.B.C.D M.M.M.M, где M.M.M.M - битовая маска (32 бита, 4 десятичных числа через точку, пример 255.255.255.0). Проясните этот момент, пожалуйста.
но хосты не пингуют друг друга.А должны? Может, на хостах фаерволлы настроены (windows 7 как пример)? Записи в arp-таблицах хостов создаются корректно?
может я что-то забыл?Применить настройки (commit) не забыли? Что показывают команды:
show vlans extensive
show interface ge-0/1/0
show interface ge-0/0/3
show interface ge-0/0/4
show interface ge-0/0/5