Управление проблемами – еще проактивнее

В публикациях ITEMS уже освещалось возможное деление задач и акцентов управления проблемами на реактивные и проактивные (выпуск от 6 октября 2008 года). Описанное там разделение предполагает, что «разница между реактивным и проактивным управлением проблемами видна из названия. Цель первого – реагировать на инциденты и не допускать их повторения. Цель второго – предотвращать их возникновение». Это соответствует тексту ITIL® и практике большинства компаний, сознательно практикующих оба направления деятельности. Однако внимательный читатель не раз и не два встречал в тексте ITIL® упоминания о «предотвращении проблем» в проактивной ветви процесса. Но даже этот внимательный читатель, скорее всего, не нашел объяснения тому, как problem management обеспечивает предотвращение проблем – ведь процесс имеет дело с уже существующими в инфраструктуре ошибками, и в самом проактивном из своих проактивных действий лишь предотвращает инциденты, инициируя устранение ошибок или снижение их влияния.

Итак, возможно ли в рамках управления проблемами обеспечить их предотвращение?

Суть процесса и его роль в управлении качеством ИТ сервисов

Процесс, известный как «управление проблемами», занимается поиском, анализом, и контролем ошибок в среде эксплуатации. Результатом контроля может явиться исправление этих ошибок путем проведения изменений.

Роль процесса в жизненном цикле ИТ сервисов может быть проиллюстрирована следующим образом:

К сожалению, в жизни всякого ИТ сервиса на этапе эксплуатации можно выделить два состояния – нормальная работа и отклонение от нормы. Можно обозначит эти периоды как uptime и downtime соответственно – если мы договоримся понимать эти обозначения в контексте не только управления доступностью (доступен – недоступен), но максимально широко (соответствует норме – не соответствует).

Очевидно, что поставщик сервиса прилагает усилия к тому, чтобы сократить продолжительность периодов downtime и обеспечить максимальную длительность периодов uptime. Первое делается в рамках процесса управления инцидентами, а второе традиционно приписывается управлению проблемами. Однако если посмотреть на задачу обеспечения надежности чуть шире, мы увидим, что для того, чтобы сервисное решение дольше работало «правильно», необходимо, чтобы это решение было соответствующим образом спланировано и спроектировано, построено на основе надежных компонентов, корректно протестировано, описано и передано в эксплуатацию, - а там корректно сопровождалось, поддерживалось и потреблялось.

Если все перечисленные задачи выполнены хорошо и согласовано – вероятность наличия в инфраструктуре ошибок и, следовательно, возникновения инцидентов, будет относительно низкой. Однако, поскольку на практике все это, скорее всего, было сделано не лучшим образом, а исполнители друг с другом не встречались, в среде эксплуатации, вероятно, появились ошибки, сформированные на каждом из перечисленных этапов и – в особенности – на стыках этапов.

Те из ошибок service design, которые проходят фильтр управления релизами, попадают в среду эксплуатации – и в поле внимания управления проблемами. Там к ним добавляются ошибки, возникающие вследствие некорректных сопровождения, поддержки и потребления.

Управление ошибками как рисками

Вне зависимости от способа обнаружения ошибок в среде эксплуатации и связанного с этим деления на реактивную и проактивную деятельность, в процессе управления проблемами делается примерно следующее:

Идентифицированная (или вероятная) ошибка классифицируется с учетом вероятности проявления и возможного ущерба. Дальнейшая работа выполняется в отношении ошибок, преодолевших установленный барьер важности (приоритета).
Проводится анализ ошибки и выработка планов восстановления (обходных решений для инцидентов) и предотвращения (изменений для устранения ошибки).
С учетом результатов анализа ошибки и предложенных решений принимается решение о выборе модели дальнейшей работы с ней (подавать ли RFC, насколько срочно, с какими ресурсами… - или продолжать жить с ошибкой, устраняя инциденты по мере их возникновения). Данные об ошибке публикуются в KEDB.
Реализуется выбранная модель, контролируется ее эффективность.
Если уязвимость устранена или угроза утратила актуальность – вследствие наших усилий или внешних факторов – ошибка закрывается.
Если ошибка существует и актуальна, осуществляется периодический контроль эффективности выбранной модели деятельности.

Очевидно, что работа по управлению проблемами удобно укладывается в любую формальную модель управления рисками. Единственная особенность – процесс работает со специфическими уязвимостями, то есть ошибками в инфраструктуре ИТ.

Про проактивность

Часто оказывается, что расследуя причины инцидентов, аналитик может не только определить ошибку в инфраструктуре и оценить ее распространенность и влияние, но и высказать предположение о ее вероятном происхождении. Это может быть ошибка разработчиков, или ошибка планирования, или ошибка в документации по эксплуатации, или некорректная инсталляция – возможные источники были описаны выше. Однако управление проблемами обычно не имеет полномочий для внесения корректировок в перечисленные сферы деятельности. Используя терминологию ITIL® v3, можно сказать, что процессы Service Operations не уполномочены напрямую инициировать коррективы в областях Service Design и Service Transition. Можно добавить: равно как и в деятельности разработчиков. Поэтому в жизни нередко бывает так, что устраненные ошибки впоследствии «возвращаются» - или возникают вновь, например, на других площадках.

Вероятно, авторы ITIL® v3 тоже это заметили. В этой версии библиотеки есть и такая полезная часть, как Continual Service Improvement. Было бы логично предусмотреть в работе CSI такие процедуры:

анализ ошибок, выявленных в процессе управления проблемами
оценку предположений аналитиков о природе появления этих ошибок (и/или проведение собственного анализа)
инициацию корректирующих мер в отношении соответствующих процессов и функций для предотвращения повторного появления ошибок в среде эксплуатации.

У CSI есть для этого и полномочия, и инструментарий. Можно предположить, что нечто подобное имели в виду авторы книги Service Operations:

«Управление проблемами состоит из двух основных процессов:

Реактивного управления проблемами, которое обычно выполняется как часть Service Operations, и потому описано в данной книге
Проактивного управления проблемами, которое инициируется в Service Operations, но управляется как часть Continual Service Improvement.»

К сожалению, эта идея никак не отражена в книге Continual Service Improvement.

В реальной жизни, тем не менее, можно предусмотреть следующие механизмы для предотвращения повторного возникновения ошибок в среде эксплуатации:

Предотвращение «своих» ошибок

Если вероятный источник ошибок – в области, за которую отвечают «свои» специалисты (разработчики, проектировщики, бизнес аналитики…), следует предусмотреть в процессе управления проблемами интерфейсы к этим областям. Механизм действия этих интерфейсов может быть аналогичен механизму обработки жалоб: ясная точка контакта, четкие требования к создаваемой записи, гарантированные сроки рассмотрения и форма ответа, наличие процедур эскалации. При этом никаких гарантий внесения изменений – только возможность их предложить и получить обратную связь.

Предотвращение «чужих» ошибок

Если вероятный источник ошибок – вне сферы нашего контроля (сторонние поставщики и разработчики), можно предотвратить повторное «заражение» среды эксплуатации с помощью дополнительных фильтров в процессе управления релизами. Этот метод работает и в случаях, когда переданные «своим» данные об ошибках не привели к позитивным изменениям в передаваемых в эксплуатацию решениях. Опубликованные в KEDB данные о выявленных ошибках и способах их исправления должны использоваться не только процессами управления проблемами и инцидентами, но и процессом управления релизами.

Рассмотрим пример. Силами процесса управления проблемами была выявлена ошибка в ПО стороннего разработчика, и был найден патч, исправляющий ее или снижающий ее негативное влияние. Управление изменениями обеспечило эффективное применение патча для всех инсталляций этого ПО. Контрольный период показал, что инциденты, связанные с данной ошибкой, не повторяются. Ошибка признана устраненной и закрыта.

К сожалению, далее обычный сценарий выглядит так: при инсталляции очередного экземпляра ПО мы используем дистрибутив, предоставленный поставщиком. Поскольку он содержит ошибку, вновь возникают инциденты. Управление инцидентами устраняет их с помощью обходных решений из KEDB. Когда влияние инцидентов достигает предусмотренного порога, регистрируется проблема, из той же KEDB извлекается опробованный ранее способ устранения ошибки, устанавливается патч, инциденты прекращаются.

А вот другой возможный сценарий: при инсталляции очередного экземпляра ПО управление релизами обращается к KEDB и анализирует информацию о ранее обнаруженных в этом ПО ошибках. Включает в план построения и тестирования установку патча и проверку (не)проявления соответствующих инцидентов. Как следствие, в среде эксплуатации ни такая ошибка, ни такие инциденты повторно не возникают.

Таким образом, в процессе управления проблемами можно предусмотреть механизмы, позволяющие предотвращать не только повторное и первичное проявление инцидентов, но и повторное возникновение ошибок в среде эксплуатации.

28 марта 2025 года в рамках XV Ежегодной конференции itSMF России, ключевого события в сфере управления ИТ-сервисами, ГК IT Expert в статусе “Золотого партнера” представила свою инновационную разработку – продукт AI box. Масштабное мероприятие собрало более 600 представителей профессионального сообщества для обсуждения актуальных трендов в автоматизации ИТ-процессов и управлении цифровыми сервисами.

19.03.2025

ГК «ИТ Эксперт» и «Гуд программ» планируют сотрудничество в рамках проектов по цифровой трансформации и повышению зрелости процессов управления ИТ-услугами. В 2025 году компании планируют реализовывать совместные инициативы с использованием ITSM box (Реестровая запись №24457 от 18.10.2024) на базе платформы BPMSoft (Реестровая запись №17372 от 17.04.2023).

03.03.2025

В конце февраля 2025 года компания «БПМСофт», ведущий вендор платформы BPMSoft, провела ежегодную партнёрскую конференцию, на которой были подведены итоги прошедшего года. По результатам оценки деятельности ГК «IT Expert» успешно подтвердила статус партнёра пятого уровня — наивысшую категорию партнёрства, которая отражает исключительный уровень компетенций и достижений в работе с платформой BPMSoft.

27.02.2025

ГК «ИТ Эксперт» и «60 имён» продолжают сотрудничество в рамках проектов по цифровой трансформации и повышению зрелости процессов управления ИТ-услугами. В 2025 году компании планируют реализовывать совместные инициативы с использованием ITSM box (Реестровая запись №24457 от 18.10.2024) на базе платформы BPMSoft (Реестровая запись №17372 от 17.04.2023).

курс

25 ак. часов с тренером + 7 ак. часов на самостоятельное выполне...

курс

Курс «Основы сервис-менеджмента: передовые мировые практики» – это базовый трен...

курс

Микросервисная архитектура – это подход к созданию, развитию и эксплуатации распределенных ин...

курс

Курс проводится в вечернее время с 18:45 до 22:00 мск ...

#Стандарты и своды знаний #Порядок проведения онлайн экзамена по ваучеру PEOPLECERT # Сертификация «Цифровой путь» #Обучение и сертификация #Библиотека ITSM

Приведенная на данной странице информация носит справочный характер, не является публичной офертой и не создает для АНО УЦ ДПО "ИТ Эксперт" каких-либо обязательств. Вы можете ознакомиться с публичной офертой АНО УЦ ДПО "ИТ Эксперт"

Курсы ITIL Новости О компании Библиотека Проекты Статьи Отзывы Экзамены Акции Контакты

+7 (495) 981-57-10 E-mail:info@itexpert.ru

Адрес: г. Москва, Каланчевская ул., д. 15, офис 402

vk.com/itexpertvk/

ITIL® and PRINCE2® are registered trade marks of AXELOS Limited, used under permission of AXELOS Limited. The Swirl logo™ is a trade mark of AXELOS Limited, used under permission of AXELOS Limited.
All rights reserved.

Наш сайт использует файлы cookie

Наша задача – сделать Ваше обучение успешным. IT Expert использует файлы cookie, чтобы гарантировать максимальное удобство пользователям, предоставляя им персонализированную информацию и запоминая их предпочтения. Продолжая пользоваться сайтом, Вы подтверждаете своё согласие на использование файлов cookie. Подробнее...

Согласен(-на)