Помогите составить график регламентных работ на коммутационном оборудовании (коммутаторы, маршрутизаторы Cisco, оптические медиаконвертеры, DSLAM), сервера, кондиционеры. Из комплекта документов (инструкций) на оборудование не было ничего такого, где бы описывался порядок, периодичность проводимых (ежедневное, месячное, годовое обслуживание) работ.
Хотелось бы найти официальные документы (ГОСТЫ и подобные документы), на которые можно было бы ссылаться при составлении своего плана работ, проводимых на оборудовании.
p.s. На советские изделия (приборы, аппаратура связи и т.д.) в комплекте с оборудованием всегда шел паспорт на устройство, где указывались характеристики, допустимые значения при контрольных измерениях, периодичность и состав профилактических работ. Вот что-нибудь такое бы и для импортной техники хотел бы найти, но не получается.
Ну это как бы интеллектуальное оборудование высокой доступности, ему _обычно_ положено работать годами без профилактики.
На cisco.com есть datasheet'ы по их железу. Но там немного не то. В случае серверов — с точки зрения железа периодическая их остановка на профилактику тоже не предусмотрена.
Задача какая? Обычно работы планируют по мере необходимости (например, вылез критический баг). Иногда есть политики периодического обновления с целью устранения багов по части безопасности, но и это редкость в случае сетевого железа. Да и оборудование с резервированными супами обычно умеет обновляться без прерывания связи.
«на коммутационном оборудовании...» — обычно меняют по выходу из строя или при модернизации сети, что наступит раньше.
«сервера» — сами сообщают, но если умерло, то к сожалению без предупреждений. Модернизация, бекапы и резервирование…
«кондиционеры» — осмотр ежегодно минимум, а лучше два раза в год. Лучше проконсультироваться с представителем компании производителя, но как правило наружные блоки лучше чистить в начале лета, после «отцветания всего и вся»
Если производитель не предусмотрел порядок ТО в документации, никто не мешает админу составить его самостоятельно, ориентируясь на свои условия и оглядываясь на основной бизнес фирмы (чтобы регламентами никому не мешать). В общих чертах регламент — это внешний осмотр, проверка вращабельности всех вентиляторов, если таковые в конкретном оборудовании есть, а мониторинг этого не отслеживает, и наружная и внутренняя чистка от пыли там, куда она может попасть. Периодичность и способы проведения смотрите по месту; на чистку от пыли желательно всё же оборудование отключать (если это не просто протирка корпуса, на котором нет вентиляционных отверстий). Про кондеи уже написали; серверам можно, например, память периодически тестить с помощью memtest86 (правда, не факт, что нужно).
Самое важное, особенно на начальном этапе — тщательно документировать обнаруженное и сделанное по ходу регламента. Это позволит по итогам нескольких регламентов корректировать планы последующих работ (что-то где-то делать чаще, что-то где-то реже), точнее экипировать сотрудников, проводящих регламент, и планировать закупки запасных частей и расходников (некоторый запас тех же вентиляторов не мешает).
Коммутаторы и маршрутизаторы проще всего обновлять во время минимальной нагрузки, а еще лучше, обновить прошивку железки, скопировать конфигурацию с обновляемой железки, переключить линки, а текущую отправить в обновление прошивки и резерв, допустим, если не стековый коммутатор.
Сервера точно так же — бекап, обновление, перезапуск сервисов. если кластер — то пользователи вообще ничего не должны заметить т.к. обновляемый сервер выводится в maintenance режим и соединения не обслуживает.
если виртуалки еще проще.