infeneon
@infeneon
ИТ архитектор в энтерпрайз сегменте

Capacity planning — с чего начать? Чья это задача? Рабочие средства?

Добрый день Коллеги,


Есть задача разобраться с ИТ ресурсами и как следствие настроить процесс планирования мощностей. Я уже делал подобное, но было это в организации где я давно работал и многое знал, в итоге были назначены ответсвенные по основным сервисами, они написали типовые документы описывающие сервис, его основные характеристики а также ресурсы которые он потребляет + построили тренды роста. Далее, не реже раз в пол года данные обновлялись. Процесс работал т.к. во первых владельцы сервисов хорошо понимали что где лежит, ну и контролировали рост. Во вторых сервисы были построены достаточно прозрачно и понятно.


Сейчас же у меня более сложная задача. Новая организация и сильно запутанные сервисы, которые зачастую используют одни и те же ресурсы. К тому же нет людей которые бы знали все детали — с одной стороны есть разработчики, которые получают задачи от бизнеса, но они не всегда знают даже имена серверов которые обслуживают их приложение. С другой стороны есть администраторы, у них есть список серверов/баз данных/лунов, но нет привязки к приложениям или разработчикам. Отдельную проблему создают файловые ресурсы, есть несколько общих папок, где происходит обмен информации, кто в нем участвует не ясно, права доступа есть у всех разработчиков (в силу того что они перетекают между приложениями). Система виртуалиции также создает проблемы, ведь на одном луне лежит достаточно много виртуалок под разные задачи, кого считать владельцем не понятно.


Раньше проводили аудиты, кидали общий клич, все бросали работу и за неделю-две генерили несколько табличек в экселе с более менее актуальной информацией, которая быстро переставала быть актуальной. Я не хочу повторять эту ошибки.


Итого, вопросы:


1. Какой софт использоваться для планирования мощностей? CMDB все же достаточно статична для этого, Excel конечно универсален, но как то не энтерпрайз решение. Хочется что то с возможность интеграции в систему мониторинга (такая задача тоже есть).


2. Как разобрать общие ресурсы? Пока только одна идея — миграция в новое место, но это растянется на годы к сожалению.


3. Кто должен отвечать за общие ресурсы? Те кто их использует или предоставляет?


4. Если нет OLA/SLA между подразделениями, как обязать включать мозг при запросе и использование ресурсов? Сейчас никто не думает когда заливает в базу размером 100Гб еще столько же (хотя базу создавали год назад и просили лун размером 100Гб т.к. тогда она весила 10Гб).


Спасибо.


P.S. Если я не правильно выбрал хабы, прошу поправить, но вообще я долго перебирал их и вариант ITIL не нашел (зато увидел 999 хабов по отдельным языкам програмирования).
  • Вопрос задан
  • 7440 просмотров
Пригласить эксперта
Ответы на вопрос 4
Задача решаема и при наличии ОТ даже почти бесплатно.
Первое, что надо сделать — выписать все замеченные сервисы, и для бизнеса (SLA) и междусобойные (OLA). Так удастся в дальнейшем выявить и обработать потребителей.

Затем напротив каждого пункта (сервиса) перечислить известные ресурсы, его обеспечивающие. Тоже всё просто, идти от железа вверх до ОСи и конечной прикладухи. Сеть или жизнеобеспечение тут учитывать рано, т.к. они в итоге всё равно делятся на всех и чтобы поделить правильно, надо отдельно мерить нагрузки, контуры вращения информации, её классифицировать, в общем, возиться…

Кстати, эти два шага в любой майндмеп проге удобно сделать.

На выходе получаем прообраз Р-С модели, но он пока неуправляем. Тут методов фактически нет: все ресурсы, создающие сервис суть активы, по ним придётся создать и вести учёт. Что может дискавериться — выбрать софт, которым — и регулярно дискаверить (аналог бухгалтерской инвентаризации), что не ловится автоматическим образом, но важно видеть — снимать слепки руками.

Даже автоматически собираемая конфигурация — уверен — большей части ресурсов для большей же части сервисов из каталога существенно разгрузит и даст время на разбор труднодоступных ресурсов.

Проводите первичное наполнение CMDB, увязываете найденное с каталогом в ОТ и вуаля: осталось привязать потребителей и картина становится почти готовой.

Capacity не ведут без учета конфигураций, это еще со второго ITIL'а было очевидно.

По вопросам о ресурсах непонятно, о каких речь. Файловых? Тут если есть деньги можно хороших тулзов купить, ключевое словосочетание data governance, а вообще методически вы сейчас видите т.н. unstructured data, а цель — сделать из них structured. Это большой проект, не меньше capacity, а по подходу почти идентичный: посчитать, классифицировать, выявить потребителей, пожурналировать пользование и затем, набрав фактических данных, пересобрать структуру папок/ACL и правил работы с ними.

По последнему вопросу: лезть в тему внутренних SLA/OLA (есть еще и underpinning contracts, UC) сразу в ваш нынешний момент времени не советую. К учету должны привыкнуть, вы должны понять, что любые неавторизованные изменения конфигураций или использования ресурсов умеете ловить и насколько прозрачно и быстро.

Как только изменения получится отслеживать хотя бы в течение ближайших суток — можно начинать подстрекательство: сообщать потребителю сервиса и виновнику о том, что в сервис пришла нагрузка и его допустимая емкость почти исчерпаны. Они сами разберутся несколько раз, а потом устанут и попросят единый порядок. Вот тогда уже и можно будет расписывать все эти агрименты.

Как-то так…
Ответ написан
Комментировать
strib
@strib
1-2)Существует набор приложений Service Catalogue Management. Рекламировать не буду, но они отлично ищутся.
Этот процесс описывает иерархическую структуру услуг, начиная с продукта готового и до аппаратного уровня, и позволяет отслеживать все зависимости и ресурсы.

3) Что значит отвечает? Есть владелец ресурса, есть пользователи, у каждого свои права и обязанности которые регламентируются бизнес-процессом.

4) Улучшать коммуникацию между отделами.
Ответ написан
strib
@strib
1-2) Сложно объяснить в рамках комментария.
Отдел А оказывает внутри компании услуги. Допустим организует хранилище блочное. Эту услугу в свою очередь обеспечивают какие-то материальные ресурсы (серверы, хранилища, печеньки и прочее) и другие услуги (электричество, вентиляция в каком то объеме, поддержка от вендора, персонал, охрана)
Так вот этот процесс описывает все ресурсы, необходимые для окозания услуги
Что это дает:
1) Стоимость услуги. Всегда понятно, сколько стоит та или иная услуга в сторону потребителя.
2) Учет ресурсов. Видно сколько услуг оказывается, и сколько ресурсов при этом используется.

Об организации какого размера идет речь? Сколько оборудования?
Ответ написан
foxmuldercp
@foxmuldercp
Системный администратор, программист, фотограф
1. Провести тотальный аудит системы. Долго, дорого, муторно, но зато будет известен каждый компонент на каждом уровне.
Начать документировать — да хотя бы в за 5 минут развернутой mediawiki.

2. когда будут нарисованы зависимости в том же Visio, уже можно будет понимать
3. что, как и в какой последовательности мониторить, отслеживать и кого пинать если что.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы