Группа НЛМК, одна из крупнейших сталелитейных компаний мира, подвела итоги масштабного проекта по автоматизации ИТ-мониторинга. В интервью руководитель направления операционного управления НЛМК-ИТ Михаил Полютин рассказал, как компания смогла автоматизировать рутинные операции, улучшить обработку инцидентов и обеспечить полное представление о состоянии ИТ-систем в режиме реального времени.
Зачем компании автоматизация ИТ- мониторинга?
Для Группы НЛМК, как одного из мировых лидеров в производстве стальной продукции, стабильная работа ИТ-инфраструктуры является основой непрерывности бизнес-процессов. Любой сбой может привести к простою производства и финансовым потерям. Именно поэтому качественный ИТ-мониторинг — это не просто наблюдение за системами, но и инструмент прогнозирования и предотвращения инцидентов.
Основной целью проекта стало создание системы, которая бы позволила оперативно выявлять и устранять проблемы в ИТ-инфраструктуре, а также автоматизировать множество рутинных операций. Это стало возможным благодаря внедрению российской платформы Monq, которая сочетает в себе инструменты искусственного интеллекта и машинного обучения для прогнозирования сбоев и автоматизации процессов.
Как выбиралось решение?
Команда НЛМК-ИТ ставила перед собой задачу найти платформу, которая бы не только собирала данные из различных систем мониторинга, но и предлагала структурированное отображение всех взаимосвязей. Ключевыми требованиями были:
- Прогнозирование сбоев с помощью ИИ и выявление аномалий;
- Автоматизация рутинных задач, таких как создание групп по инцидентам и оповещение ответственных лиц;
- Интеграция с уже существующими системами мониторинга;
- Регистрация решения в Реестре Минцифры.
Выбор пал на платформу Monq, которая полностью соответствовала ожиданиям компании. В ближайших версиях платформы запланированы улучшения, такие как детектор аномалий и прогнозирование метрик, что делает инвестиции в эту платформу перспективными на будущее.
Как изменилась работа ИТ-службы после внедрения Monq?
На текущий момент к системе Monq подключены уже девять информационных систем НЛМК, а ситуационный центр компании активно использует её для автоматизации инцидент-менеджмента. В режиме реального времени на экране центра отображаются данные о «цифровом здоровье» всех подключенных систем, что позволяет ИТ-команде оперативно реагировать на возникающие инциденты.
Monq предлагает два типа автоматизации: low-code для сбора и обработки данных и no-code для настройки бизнес-процессов. Это позволило автоматизировать такие задачи, как создание групп по инцидентам, отправка оповещений и эскалация. В результате рутинные операции, ранее выполнявшиеся вручную, теперь полностью автоматизированы.
Система Monq интегрировала данные под единый «зонтик», автоматически обрабатывает их и выводит результаты на единый экран дежурной смены. При возникновении инцидентов, система автоматически регистрирует их, уведомляет ответственных и помогает оперативно устранить проблемы.
Проект автоматизации ИТ-мониторинга в НЛМК находится на стадии активного развития. В будущем компания планирует расширять функционал системы Monq и делиться новыми кейсами и результатами с рынком.