22.07.202523.07.2025 • Статьи

От AIOps к Event Intelligence Solutions: ребрендинг от Gartner

Введение

За восемь лет после появления термина AIOps (Artificial Intelligence for IT Operations) рынок пережил классический «эффект перегрева». Любой инструмент мониторинга или лог-аналитики спешил добавить к описанию модное «AI», и границы между сбором метрик, анализом логов и по-настоящему интеллектуальной автоматизацией постепенно исчезли. В итоге руководителям ИТ-служб стало все труднее понимать, за что они платят: за очередной дашборд или за платформу, способную действительно снизить нагрузку на команду и ускорить устранение проблем.

В 2025 году аналитики Gartner переименовали AIОps-сегмент в Event Intelligence Solutions (EIS), сместив фокус с хайпа на конкретную задачу с измеряемым результатом: управление потоками событий и ускорение реакции на инциденты.

В этой статье мы рассмотрим, почему старое название перестало работать, что именно Gartner вкладывает в понятие EIS, какие задачи решает EIS, и есть ли на российском рынке подобный класс решений (спойлер: есть!).

Кризис идентичности AIOps-платформ

Когда компания Gartner в 2017 году придумала термин AIOps, задумка выглядела прорывной: объединить разрозненные метрики, логи и трассировки, а затем применить машинное обучение, чтобы перевести ИТ-операции из режима «тушения пожаров» в проактивное управление. Интерес к концепции взлетел мгновенно: согласно Google Trends, в 2019–2020 годах популярность запроса «AIOps» подскочила с нуля до 78 из 100.

Стоило появиться моде на «AI», как практически каждый вендор примерил на себя аббревиатуру AIOps. Провайдеры классического мониторинга просто дописывали «AI» в описание продукта. Разработчики лог-аналитики объявили «революцию», хотя внутри работали все те же регулярные выражения, статические правила, триггеры и корреляция по тэгам. В итоге одна лишь приставка «AI» перестала быть надежным ориентиром: вместо того чтобы прояснять позицию решения на рынке, она стала мешать разбираться, что именно способен делать конкретный продукт.

Что такое Event Intelligence Solutions (решения для интеллектуального анализа событий)?

В марте 2025 года Gartner опубликовала Market Guide for Event Intelligence Solutions и официально переименовала сегмент AIOps-платформ в Event Intelligence Solutions — решения для интеллектуального анализа событий.

По определению аналитиков, EIS — это инструменты, которые применяют технологии искусственного интеллекта и продвинутой аналитики данных, чтобы дополнять, ускорять и автоматизировать реакцию на сигналы и события, возникающие в цифровой инфраструктуре. Система разбирает непрерывный поток оповещений, извлекает из него полезную информацию и запускает проактивные действия, тем самым сокращая трудозатраты и повышая доступность сервисов.

Получая от систем ИТ-мониторинга поток из оповещений, EIS выполняет дедупликацию и корреляцию, собирая оповещения в инциденты, тем самым снижая уровень информационного шума и упрощая фильтрацию ложных срабатываний. Кросс-доменные данные обогащаются дополнительным контекстом, например, информацией о взаимозависимостях между устройствами и сервисами. Также строятся связи с прошлыми и текущими инцидентами, изменениями, а также с неструктурированными данными, такими как статьи из базы знаний.

В новой терминологии Gartner аббревиатура AIOps остается, но служит зонтичным обозначением всего класса AI-приложений в ИТ-операциях. Конкретные решения, работающие с событиями, теперь относятся к более узкой категории EIS.

Ключевые функции решений для интеллектуального анализа событий

Кросс-доменный сбор событий (Cross-Domain Event Ingestion)

Системы решений интеллектуального анализа событий устроены иначе, чем традиционные средства ИТ-мониторинга и observability платформы. Пока последние фокусируются на сборе и первичном анализе машинной телеметрии (метрики, логи, трассировки), EIS подключаются уже на выходе этих систем, разбирая огромные потоки сигналов и событий, определяя, где требуется вмешательство.

Платформа EIS агрегирует и интерпретирует оповещения из всего набора инструментов: мониторинга инфраструктуры, сетевых средств, observability-решений, систем лог-аналитики и мониторинга цифрового опыта, охватывая как локальные, так и облачные рабочие нагрузки. У крупной организации таких средств может быть от пяти до пятидесяти, и каждый генерирует собственный поток уведомлений, который необходимо связать, приоритизировать и передать командам ИТ-операций для своевременного реагирования.

Прием и/или сборка топологии (Topology Ingestion and/or Assembly)

Карту зависимостей чаще всего создают системы мониторинга и observability-платформы: они сканируют инфраструктуру и выявляют, как компоненты связаны друг с другом. EIS обычно не дублируют эту работу, а забирают готовые данные из «источников истины»: CMDB, APM-систем, облачных инвентарей, и объединяют их.

На основе этих потоков платформа строит единую топологическую модель, отражающую как логические, так и физические связи между сервисами, приложениями и оборудованием. Это критически важно для понимания последствий событий в разных доменах и ускорения их первичной обработки.

Корреляция и обогащение событий (Event Correlation and Enrichment)

Главная функция EIS — корреляция событий из разных доменов, поступающих от одного или нескольких инструментов мониторинга, и снижение ручных трудозатрат, связанных с информационным шумом.

По оценкам ИТ-руководителей, именно эта возможность чаще всего становится решающим аргументом в пользу внедрения: поток событий, требующих участия человека, может сократиться более чем на 95 %.

После группировки каждое событие дополняется контекстом: какими бизнес-сервисами оно затронуто, были ли похожие инциденты раньше, какие изменения происходили в это время, кто владелец компонента, какой команде следует назначить задачу и какое действие система рекомендует. Такое обогащение заметно ускоряет все стадии обработки: от триажа и приоритизации до окончательного устранения проблемы.

Выявление закономерностей и кластеризация (Pattern Recognition and Clustering)

Помимо корреляции по заранее заданным правилам, EIS анализирует накопленные события с помощью машинного обучения. Алгоритмы ищут аномальные паттерны поведения и формируют кластеры оповещений, которые могут предвещать деградацию сервисов. Опираясь на исторические данные и результат прошлых инцидентов, система заблаговременно сигнализирует о потенциально критических сбоях, которые классический «устройственный» мониторинг часто упускает.

Модели постоянно совершенствуются: по мере того как операторы подтверждают вердикты системы или вносят корректировки, EIS до-обучается и постепенно повышает точность прогнозов.

Устранение и автоматизация (Remediation and Automation)

EIS сокращают время восстановления, подсказывая операторам конкретные действия: определяют, какую команду подключить, кратко описывают бизнес-влияние, указывают вероятную первопричину и нередко предлагают готовое корректирующее решение. По мере того как продукт учится на обратной связи, и растет доверие к его рекомендациям, доля действий, выполняемых без участия человека, постепенно увеличивается.

На зрелой стадии платформа связывается с системами оркестрации или автоматизации и сама запускает remedial-скрипты: по подтверждению инженера либо полностью в автоматическом режиме. Конечная цель — полностью автоматизировать путь от события до его устранения (см. рисунок 1).

Именно замыкание цепочки «сигнал — реакция» делает EIS принципиально отличными от классических AIOps-платформ, которые часто ограничивались лишь эффектной визуализацией на дашбордах.

Рисунок 1: Event Intelligence Solutions

Качество данных — фундамент эффективности EIS

Эффективность EIS напрямую зависит от источников и качества поступающих данных. Даже наиболее совершенные алгоритмы машинного обучения способны лишь частично компенсировать дефекты входного потока; при отсутствии полноты и корректности данных невозможно сделать достоверные выводы.

Прежде всего, EIS-система опирается на качественные источники междоменных событий, формируемый на базе тщательно настроенного мониторинга. Какими бы совершенными ни были механизмы фильтрации, платформа не раскроет потенциал без всестороннего, непрерывного и нормализованного потока телеметрии.

Для отдельных сценариев одного потока событий недостаточно: большинству ИСС требуется дополнительный контекст из зрелых внешних CMDB, которые играют роль источника данных о конфигурациях и зависимостях. Такая информация критична для точной корреляции оповещений и выявления первопричин; при её отсутствии эффект от системы заметно снижается.

По мере роста сложности задач расширяется перечень необходимых данных: описания сервисов, схемы эскалации, группы разрешения инцидентов, история изменений, предыдущие инциденты, базы знаний и другие источники. Каждый из этих источников требует регулярной проверки актуальности и корректной интеграции в систему. Ряд вендоров уже внедрил встроенные инструменты аудита, которые позволяют оценить актуальность имеющихся данных и выявить пробелы, которые необходимо устранить до начала полномасштабного внедрения.

Основные сценарии использования EIS-решений

Уменьшение нагрузки на ИТ-персонал

Уменьшение ручной работы при анализе объемов событий благодаря корреляции и обнаружению аномалий.

Ускорение реагирования на инциденты

Более быстрая триаж-оценка и, как следствие, более быстрая реакция — достигается благодаря прогнозированию и рекомендациям по устранению инцидентов.

Автоматизация

Цель — передать системе максимум шагов по реагированию и устранению инцидентов.

Как Artimate соответствует требованиям Gartner к решениям в области интеллектуального анализа событий

Рисунок 2. Как работает российская EIS-платформа Artimate

Интеграция данных, поступающих из систем ИТ-мониторинга

Artimate собирает события, метрики и логи из систем ИТ-мониторинга через единый Центр интеграции данных. Источники подключаются либо универсальным REST-коннектором Open Integration Manager (он принимает вебхуки практически всех систем мониторинга), либо готовыми адаптерами. Для логов используется LOG-FILE agent. Новую систему можно «подружить» с платформой за считаные минуты без кода.

Попав в Центр, поток проходит встроенный ETL: нормализацию формата, выделение тегов, дедупликацию, фильтрацию и агрегацию. На этом этапе шум «сырого» мониторинга сокращается на порядок, а данные обогащаются контекстом для последующей ML-аналитики и корреляции инцидентов.

Прием и/или сборка топологии

Платформа Artimate автоматически строит карту зависимостей IT-инфраструктуры, используя несколько источников данных:

Discovery-агенты сканируют сетевую инфраструктуру и автоматически обнаруживают связи между компонентами;
Импорт из CMDB позволяет загрузить готовые данные о конфигурации и зависимостях из внешних систем управления конфигурациями;
Интеграции с облачными платформами для получения актуальной информации о топологии облачных ресурсов;
Анализ трафика для автоматического выявления фактических связей между сервисами

Результативная топологическая модель представляет собой живую карту IT-ландшафта, которая обновляется в реальном времени и служит основой для точной корреляции событий и оценки бизнес-влияния инцидентов.

Корреляция событий и обогащение контекста на основе ML

Artimate использует многоуровневый подход к корреляции событий:

Статическая корреляция по правилам группирует события на основе заранее заданных критериев: временных окон, источников, типов оборудования и сервисов.

ML-корреляция применяет алгоритмы машинного обучения для выявления неочевидных связей между событиями:

Анализ временных паттернов для обнаружения каскадных сбоев;
Кластеризация событий по семантическому сходству описаний;
Выявление аномальных последовательностей событий.

Контекстное обогащение дополняет каждое событие релевантной информацией:

Привязка к бизнес-сервисам;
История аналогичных инцидентов и примененных решений;
Автоматическое назначение ответственных команд на основе матрицы ответственности;
Рекомендации по устранению на основе базы знаний и успешного опыта.

Результат: вместо сотен разрозненных событий операторы получают десятки содержательных инцидентов с полным контекстом для быстрого реагирования.

Предиктивная аналитика и обнаружение аномалий

AIOps-платформа Artimate предлагает готовые инструменты для прогнозирования: корреляционные графы, отражающие полные карты причинно-следственных связей по заданным параметрам, и карту ресурсов, отражающую текущую картину по инцидентам: всем, открытым или конкретным.

Интеллектуальный поиск аномалий с использованием технологий AI и ML меняет подход к управлению инфраструктурой. AIOps-платформа Artimate включает в себя детекторы, помогающие обнаруживать отклонения от нормального поведения последовательности, плотности событий и временных рядов.

Автоматизация

Используя встроенные ML-модели и сценарии эскалации, Artimate автоматически реагирует на критические события, инициирует корректирующие действия или отправляет уведомления в ITSM-системы.

Рисунок 3. Снижение информационного шума на 95% с Artimate

Убедитесь в возможностях Artimate на практике! Запишитесь на демо, чтобы увидеть, как платформа поможет вашему бизнесу улучшить стабильность IT-систем и сократить время решения инцидентов.

От AIOps к Event Intelligence Solutions: ребрендинг от Gartner

Введение

Кризис идентичности AIOps-платформ

Что такое Event Intelligence Solutions (решения для интеллектуального анализа событий)?

Ключевые функции решений для интеллектуального анализа событий

Кросс-доменный сбор событий (Cross-Domain Event Ingestion)

Прием и/или сборка топологии (Topology Ingestion and/or Assembly)

Корреляция и обогащение событий (Event Correlation and Enrichment)

Выявление закономерностей и кластеризация (Pattern Recognition and Clustering)

Устранение и автоматизация (Remediation and Automation)

Качество данных — фундамент эффективности EIS

Основные сценарии использования EIS-решений

Уменьшение нагрузки на ИТ-персонал

Ускорение реагирования на инциденты

Автоматизация

Как Artimate соответствует требованиям Gartner к решениям в области интеллектуального анализа событий

Интеграция данных, поступающих из систем ИТ-мониторинга

Прием и/или сборка топологии

Корреляция событий и обогащение контекста на основе ML

Предиктивная аналитика и обнаружение аномалий

Автоматизация

Будьте в курсе

Capacity Management: как предиктивное управление нагрузкой сокращает затраты на ИТ-инфраструктуру

Как ускорить анализ корневых причин с помощью AIOps

ИИ-модуль для снижения информационного шума в ИТ-мониторинге