От AIOps к Event Intelligence Solutions: ребрендинг от Gartner 

    Введение

    За восемь лет после появления термина AIOps (Artificial Intelligence for IT Operations) рынок пережил классический «эффект перегрева». Любой инструмент мониторинга или лог-аналитики спешил добавить к описанию модное «AI», и границы между сбором метрик, анализом логов и по-настоящему интеллектуальной автоматизацией постепенно исчезли. В итоге руководителям ИТ-служб стало все труднее понимать, за что они платят: за очередной дашборд или за платформу, способную действительно снизить нагрузку на команду и ускорить устранение проблем.

    В 2025 году аналитики Gartner переименовали AIОps-сегмент в Event Intelligence Solutions (EIS), сместив фокус с хайпа на конкретную задачу с измеряемым результатом: управление потоками событий и ускорение реакции на инциденты. 

    В этой статье мы рассмотрим, почему старое название перестало работать, что именно Gartner вкладывает в понятие EIS, какие задачи решает EIS, и есть ли на российском рынке подобный класс решений (спойлер: есть!).

    Кризис идентичности AIOps-платформ

    Когда компания Gartner в 2017 году придумала термин AIOps, задумка выглядела прорывной: объединить разрозненные метрики, логи и трассировки, а затем применить машинное обучение, чтобы  перевести ИТ-операции из режима «тушения пожаров» в проактивное управление. Интерес к концепции взлетел мгновенно: согласно Google Trends, в 2019–2020 годах популярность запроса «AIOps» подскочила с нуля до 78 из 100.

    Стоило появиться моде на «AI», как практически каждый вендор примерил на себя аббревиатуру AIOps. Провайдеры классического мониторинга просто дописывали «AI» в описание продукта. Разработчики лог-аналитики объявили «революцию», хотя внутри работали все те же регулярные выражения, статические правила, триггеры и корреляция по тэгам. В итоге одна лишь приставка «AI» перестала быть надежным ориентиром: вместо того чтобы прояснять позицию решения на рынке, она стала мешать разбираться, что именно способен делать конкретный продукт.

    Что такое Event Intelligence Solutions (решения для интеллектуального анализа событий)?

    В марте 2025 года Gartner опубликовала Market Guide for Event Intelligence Solutions и официально переименовала сегмент AIOps-платформ в Event Intelligence Solutions решения для интеллектуального анализа событий.

    По определению аналитиков, EIS — это инструменты, которые применяют технологии искусственного интеллекта и продвинутой аналитики данных, чтобы дополнять, ускорять и автоматизировать реакцию на сигналы и события, возникающие в цифровой инфраструктуре. Система разбирает непрерывный поток оповещений, извлекает из него полезную информацию и запускает проактивные действия, тем самым сокращая трудозатраты и повышая доступность сервисов.

    Получая от систем ИТ-мониторинга поток из оповещений, EIS выполняет дедупликацию и корреляцию, собирая оповещения в инциденты, тем самым снижая уровень информационного шума и упрощая фильтрацию ложных срабатываний. Кросс-доменные данные обогащаются дополнительным контекстом, например, информацией о взаимозависимостях между устройствами и сервисами. Также строятся связи с прошлыми и текущими инцидентами, изменениями, а также с неструктурированными данными, такими как статьи из базы знаний.

    В новой терминологии Gartner аббревиатура AIOps остается, но служит зонтичным обозначением всего класса AI-приложений в ИТ-операциях. Конкретные решения, работающие с событиями, теперь относятся к более узкой категории EIS.

    Ключевые функции решений для интеллектуального анализа событий

    Кросс-доменный сбор событий (Cross-Domain Event Ingestion)

    Системы решений интеллектуального анализа событий устроены иначе, чем традиционные средства ИТ-мониторинга и observability платформы. Пока последние фокусируются на сборе и первичном анализе машинной телеметрии (метрики, логи, трассировки), EIS подключаются уже на выходе этих систем, разбирая огромные потоки сигналов и событий, определяя, где требуется вмешательство.

    Платформа EIS агрегирует и интерпретирует оповещения из всего набора инструментов: мониторинга инфраструктуры, сетевых средств, observability-решений, систем лог-аналитики и мониторинга цифрового опыта, охватывая как локальные, так и облачные рабочие нагрузки. У крупной организации таких средств может быть от пяти до пятидесяти, и каждый генерирует собственный поток уведомлений, который необходимо связать, приоритизировать и передать командам ИТ-операций для своевременного реагирования.

    Прием и/или сборка топологии (Topology Ingestion and/or Assembly)

    Карту зависимостей чаще всего создают системы мониторинга и observability-платформы: они сканируют инфраструктуру и выявляют, как компоненты связаны друг с другом. EIS обычно не дублируют эту работу, а забирают готовые данные из «источников истины»: CMDB, APM-систем, облачных инвентарей, и объединяют их.

    На основе этих потоков платформа строит единую топологическую модель, отражающую как логические, так и физические связи между сервисами, приложениями и оборудованием. Это критически важно для понимания последствий событий в разных доменах и ускорения их первичной обработки.

    Корреляция и обогащение событий (Event Correlation and Enrichment)

    Главная функция EIS —  корреляция событий из разных доменов, поступающих от одного или нескольких инструментов мониторинга, и снижение ручных трудозатрат, связанных с информационным шумом. 

    По оценкам ИТ-руководителей, именно эта возможность чаще всего становится решающим аргументом в пользу внедрения: поток событий, требующих участия человека, может сократиться более чем на 95 %.

    После группировки каждое событие дополняется контекстом: какими бизнес-сервисами оно затронуто, были ли похожие инциденты раньше, какие изменения происходили в это время, кто владелец компонента, какой команде следует назначить задачу и какое действие система рекомендует. Такое обогащение заметно ускоряет все стадии обработки: от триажа и приоритизации до окончательного устранения проблемы.

    Выявление закономерностей и кластеризация (Pattern Recognition and Clustering)

    Помимо корреляции по заранее заданным правилам, EIS анализирует накопленные события с помощью машинного обучения. Алгоритмы ищут аномальные паттерны поведения и формируют кластеры оповещений, которые могут предвещать деградацию сервисов. Опираясь на исторические данные и результат прошлых инцидентов, система заблаговременно сигнализирует о потенциально критических сбоях, которые классический «устройственный» мониторинг часто упускает.

    Модели постоянно совершенствуются: по мере того как операторы подтверждают вердикты системы или вносят корректировки, EIS до-обучается и постепенно повышает точность прогнозов.

    Устранение и автоматизация (Remediation and Automation)

    EIS сокращают время восстановления, подсказывая операторам конкретные действия: определяют, какую команду подключить, кратко описывают бизнес-влияние, указывают вероятную первопричину и нередко предлагают готовое корректирующее решение. По мере того как продукт учится на обратной связи, и растет доверие к его рекомендациям, доля действий, выполняемых без участия человека, постепенно увеличивается.

    На зрелой стадии платформа связывается с системами оркестрации или автоматизации и сама запускает remedial-скрипты: по подтверждению инженера либо полностью в автоматическом режиме. Конечная цель — полностью автоматизировать путь от события до его устранения (см. рисунок 1).

    Именно замыкание цепочки «сигнал — реакция» делает EIS принципиально отличными от классических AIOps-платформ, которые часто ограничивались лишь эффектной визуализацией на дашбордах.

    Рисунок 1: Event Intelligence Solutions

    Качество данных — фундамент эффективности EIS

    Эффективность EIS напрямую зависит от источников и качества поступающих данных. Даже наиболее совершенные алгоритмы машинного обучения способны лишь частично компенсировать дефекты входного потока; при отсутствии полноты и корректности данных  невозможно сделать достоверные выводы.

    Прежде всего,  EIS-система опирается на качественные источники междоменных событий, формируемый на базе тщательно настроенного мониторинга. Какими бы совершенными ни были механизмы фильтрации, платформа не раскроет потенциал без всестороннего, непрерывного и нормализованного потока телеметрии.

    Для отдельных сценариев одного потока событий недостаточно: большинству ИСС требуется дополнительный контекст из зрелых внешних CMDB, которые играют роль источника данных о конфигурациях и зависимостях. Такая информация критична для точной корреляции оповещений и выявления первопричин; при её отсутствии эффект от системы заметно снижается.

    По мере роста сложности задач расширяется перечень необходимых данных: описания сервисов, схемы эскалации, группы разрешения инцидентов, история изменений, предыдущие инциденты, базы знаний и другие источники. Каждый из этих источников требует регулярной проверки актуальности и корректной интеграции в систему. Ряд вендоров уже внедрил встроенные инструменты аудита, которые позволяют оценить актуальность имеющихся данных и выявить пробелы, которые необходимо устранить до начала полномасштабного внедрения.

    Основные сценарии использования EIS-решений

    Уменьшение нагрузки на ИТ-персонал

    Уменьшение ручной работы при анализе объемов событий благодаря корреляции и обнаружению аномалий.

    Ускорение реагирования на инциденты

    Более быстрая триаж-оценка и, как следствие, более быстрая реакция — достигается благодаря прогнозированию и рекомендациям по устранению инцидентов. 

    Автоматизация 

    Цель — передать системе максимум шагов по реагированию и устранению инцидентов.

    Как Artimate соответствует требованиям Gartner к решениям в области интеллектуального анализа событий

    Рисунок 2. Как работает российская EIS-платформа Artimate

    Интеграция данных, поступающих из систем ИТ-мониторинга

    Artimate собирает события, метрики и логи из систем ИТ-мониторинга через единый Центр интеграции данных. Источники подключаются либо универсальным REST-коннектором Open Integration Manager (он принимает вебхуки практически всех систем мониторинга), либо готовыми адаптерами. Для логов используется LOG-FILE agent. Новую систему можно «подружить» с платформой за считаные минуты без кода.

    Попав в Центр, поток проходит встроенный ETL: нормализацию формата, выделение тегов, дедупликацию, фильтрацию и агрегацию. На этом этапе шум «сырого» мониторинга сокращается на порядок, а данные обогащаются контекстом для последующей ML-аналитики и корреляции инцидентов.

    Прием и/или сборка топологии 

    Платформа Artimate автоматически строит карту зависимостей IT-инфраструктуры, используя несколько источников данных:

    • Discovery-агенты сканируют сетевую инфраструктуру и автоматически обнаруживают связи между компонентами;
    • Импорт из CMDB позволяет загрузить готовые данные о конфигурации и зависимостях из внешних систем управления конфигурациями;
    • Интеграции с облачными платформами для получения актуальной информации о топологии облачных ресурсов;
    • Анализ трафика для автоматического выявления фактических связей между сервисами

    Результативная топологическая модель представляет собой живую карту IT-ландшафта, которая обновляется в реальном времени и служит основой для точной корреляции событий и оценки бизнес-влияния инцидентов.

    Корреляция событий и обогащение контекста на основе ML

    Artimate использует многоуровневый подход к корреляции событий:

    Статическая корреляция по правилам группирует события на основе заранее заданных критериев: временных окон, источников, типов оборудования и сервисов.

    ML-корреляция применяет алгоритмы машинного обучения для выявления неочевидных связей между событиями:

    • Анализ временных паттернов для обнаружения каскадных сбоев;
    • Кластеризация событий по семантическому сходству описаний;
    • Выявление аномальных последовательностей событий.

    Контекстное обогащение дополняет каждое событие релевантной информацией:

    • Привязка к бизнес-сервисам;
    • История аналогичных инцидентов и примененных решений;
    • Автоматическое назначение ответственных команд на основе матрицы ответственности;
    • Рекомендации по устранению на основе базы знаний и успешного опыта.

    Результат: вместо сотен разрозненных событий операторы получают десятки содержательных инцидентов с полным контекстом для быстрого реагирования.

    Предиктивная аналитика и обнаружение аномалий

    AIOps-платформа Artimate предлагает готовые инструменты для прогнозирования: корреляционные графы, отражающие полные карты причинно-следственных связей по заданным параметрам, и карту ресурсов, отражающую текущую картину по инцидентам: всем, открытым или конкретным.

    Интеллектуальный поиск аномалий с использованием технологий AI и ML меняет подход к управлению инфраструктурой. AIOps-платформа Artimate включает в себя детекторы, помогающие обнаруживать отклонения от нормального поведения последовательности, плотности событий и временных рядов.

    Автоматизация 

    Используя встроенные ML-модели и сценарии эскалации, Artimate автоматически реагирует на критические события, инициирует корректирующие действия или отправляет уведомления в ITSM-системы.

    Рисунок 3. Снижение информационного шума на 95% с Artimate

    Убедитесь в возможностях Artimate на практике! Запишитесь на демо, чтобы увидеть, как платформа поможет вашему бизнесу улучшить стабильность IT-систем и сократить время решения инцидентов.

    Будьте в курсе

    Компания “Пруфтек ИТ”, разработчик аналитической AIOps-платформы Artimate, и ITSDelta (ООО “Корпорация «Дельта-Групп”) заключили партнерское соглашение, направленное на продвижение интеллектуальных решений в области управления ИТ-инфраструктурой
    Подробнее
    IT-мониторинг —  это комплексный процесс, включающий сбор и обработку миллионов метрик, их корреляцию с бизнес‑показателями и автоматическое реагирование еще до того, как инцидент скажется на клиентах
    Подробнее