25 февраля в 11.00 бесплатный вебинар «Как снизить информационный шум в мониторинге: от алертов к инцидентам с помощью ИИ»

От AIOps к Event Intelligence Solutions: ребрендинг от Gartner 

    Введение

    За восемь лет после появления термина AIOps (Artificial Intelligence for IT Operations) рынок пережил классический «эффект перегрева». Любой инструмент мониторинга или лог-аналитики спешил добавить к описанию модное «AI», и границы между сбором метрик, анализом логов и по-настоящему интеллектуальной автоматизацией постепенно исчезли. В итоге руководителям ИТ-служб стало все труднее понимать, за что они платят: за очередной дашборд или за платформу, способную действительно снизить нагрузку на команду и ускорить устранение проблем.

    В 2025 году аналитики Gartner переименовали AIОps-сегмент в Event Intelligence Solutions (EIS), сместив фокус с хайпа на конкретную задачу с измеряемым результатом: управление потоками событий и ускорение реакции на инциденты. 

    В этой статье мы рассмотрим, почему старое название перестало работать, что именно Gartner вкладывает в понятие EIS, какие задачи решает EIS, и есть ли на российском рынке подобный класс решений (спойлер: есть!).

    Кризис идентичности AIOps-платформ

    Когда компания Gartner в 2017 году придумала термин AIOps, задумка выглядела прорывной: объединить разрозненные метрики, логи и трассировки, а затем применить машинное обучение, чтобы  перевести ИТ-операции из режима «тушения пожаров» в проактивное управление. Интерес к концепции взлетел мгновенно: согласно Google Trends, в 2019–2020 годах популярность запроса «AIOps» подскочила с нуля до 78 из 100.

    Стоило появиться моде на «AI», как практически каждый вендор примерил на себя аббревиатуру AIOps. Провайдеры классического мониторинга просто дописывали «AI» в описание продукта. Разработчики лог-аналитики объявили «революцию», хотя внутри работали все те же регулярные выражения, статические правила, триггеры и корреляция по тэгам. В итоге одна лишь приставка «AI» перестала быть надежным ориентиром: вместо того чтобы прояснять позицию решения на рынке, она стала мешать разбираться, что именно способен делать конкретный продукт.

    Что такое Event Intelligence Solutions (решения для интеллектуального анализа событий)?

    В марте 2025 года Gartner опубликовала Market Guide for Event Intelligence Solutions и официально переименовала сегмент AIOps-платформ в Event Intelligence Solutions решения для интеллектуального анализа событий.

    По определению аналитиков, EIS — это инструменты, которые применяют технологии искусственного интеллекта и продвинутой аналитики данных, чтобы дополнять, ускорять и автоматизировать реакцию на сигналы и события, возникающие в цифровой инфраструктуре. Система разбирает непрерывный поток оповещений, извлекает из него полезную информацию и запускает проактивные действия, тем самым сокращая трудозатраты и повышая доступность сервисов.

    Получая от систем ИТ-мониторинга поток из оповещений, EIS выполняет дедупликацию и корреляцию, собирая оповещения в инциденты, тем самым снижая уровень информационного шума и упрощая фильтрацию ложных срабатываний. Кросс-доменные данные обогащаются дополнительным контекстом, например, информацией о взаимозависимостях между устройствами и сервисами. Также строятся связи с прошлыми и текущими инцидентами, изменениями, а также с неструктурированными данными, такими как статьи из базы знаний.

    В новой терминологии Gartner аббревиатура AIOps остается, но служит зонтичным обозначением всего класса AI-приложений в ИТ-операциях. Конкретные решения, работающие с событиями, теперь относятся к более узкой категории EIS.

    Ключевые функции решений для интеллектуального анализа событий

    Кросс-доменный сбор событий (Cross-Domain Event Ingestion)

    Системы решений интеллектуального анализа событий устроены иначе, чем традиционные средства ИТ-мониторинга и observability платформы. Пока последние фокусируются на сборе и первичном анализе машинной телеметрии (метрики, логи, трассировки), EIS подключаются уже на выходе этих систем, разбирая огромные потоки сигналов и событий, определяя, где требуется вмешательство.

    Платформа EIS агрегирует и интерпретирует оповещения из всего набора инструментов: мониторинга инфраструктуры, сетевых средств, observability-решений, систем лог-аналитики и мониторинга цифрового опыта, охватывая как локальные, так и облачные рабочие нагрузки. У крупной организации таких средств может быть от пяти до пятидесяти, и каждый генерирует собственный поток уведомлений, который необходимо связать, приоритизировать и передать командам ИТ-операций для своевременного реагирования.

    Прием и/или сборка топологии (Topology Ingestion and/or Assembly)

    Карту зависимостей чаще всего создают системы мониторинга и observability-платформы: они сканируют инфраструктуру и выявляют, как компоненты связаны друг с другом. EIS обычно не дублируют эту работу, а забирают готовые данные из «источников истины»: CMDB, APM-систем, облачных инвентарей, и объединяют их.

    На основе этих потоков платформа строит единую топологическую модель, отражающую как логические, так и физические связи между сервисами, приложениями и оборудованием. Это критически важно для понимания последствий событий в разных доменах и ускорения их первичной обработки.

    Корреляция и обогащение событий (Event Correlation and Enrichment)

    Главная функция EIS —  корреляция событий из разных доменов, поступающих от одного или нескольких инструментов мониторинга, и снижение ручных трудозатрат, связанных с информационным шумом. 

    По оценкам ИТ-руководителей, именно эта возможность чаще всего становится решающим аргументом в пользу внедрения: поток событий, требующих участия человека, может сократиться более чем на 95 %.

    После группировки каждое событие дополняется контекстом: какими бизнес-сервисами оно затронуто, были ли похожие инциденты раньше, какие изменения происходили в это время, кто владелец компонента, какой команде следует назначить задачу и какое действие система рекомендует. Такое обогащение заметно ускоряет все стадии обработки: от триажа и приоритизации до окончательного устранения проблемы.

    Выявление закономерностей и кластеризация (Pattern Recognition and Clustering)

    Помимо корреляции по заранее заданным правилам, EIS анализирует накопленные события с помощью машинного обучения. Алгоритмы ищут аномальные паттерны поведения и формируют кластеры оповещений, которые могут предвещать деградацию сервисов. Опираясь на исторические данные и результат прошлых инцидентов, система заблаговременно сигнализирует о потенциально критических сбоях, которые классический «устройственный» мониторинг часто упускает.

    Модели постоянно совершенствуются: по мере того как операторы подтверждают вердикты системы или вносят корректировки, EIS до-обучается и постепенно повышает точность прогнозов.

    Устранение и автоматизация (Remediation and Automation)

    EIS сокращают время восстановления, подсказывая операторам конкретные действия: определяют, какую команду подключить, кратко описывают бизнес-влияние, указывают вероятную первопричину и нередко предлагают готовое корректирующее решение. По мере того как продукт учится на обратной связи, и растет доверие к его рекомендациям, доля действий, выполняемых без участия человека, постепенно увеличивается.

    На зрелой стадии платформа связывается с системами оркестрации или автоматизации и сама запускает remedial-скрипты: по подтверждению инженера либо полностью в автоматическом режиме. Конечная цель — полностью автоматизировать путь от события до его устранения (см. рисунок 1).

    Именно замыкание цепочки «сигнал — реакция» делает EIS принципиально отличными от классических AIOps-платформ, которые часто ограничивались лишь эффектной визуализацией на дашбордах.

    Рисунок 1: Event Intelligence Solutions

    Качество данных — фундамент эффективности EIS

    Эффективность EIS напрямую зависит от источников и качества поступающих данных. Даже наиболее совершенные алгоритмы машинного обучения способны лишь частично компенсировать дефекты входного потока; при отсутствии полноты и корректности данных  невозможно сделать достоверные выводы.

    Прежде всего,  EIS-система опирается на качественные источники междоменных событий, формируемый на базе тщательно настроенного мониторинга. Какими бы совершенными ни были механизмы фильтрации, платформа не раскроет потенциал без всестороннего, непрерывного и нормализованного потока телеметрии.

    Для отдельных сценариев одного потока событий недостаточно: большинству ИСС требуется дополнительный контекст из зрелых внешних CMDB, которые играют роль источника данных о конфигурациях и зависимостях. Такая информация критична для точной корреляции оповещений и выявления первопричин; при её отсутствии эффект от системы заметно снижается.

    По мере роста сложности задач расширяется перечень необходимых данных: описания сервисов, схемы эскалации, группы разрешения инцидентов, история изменений, предыдущие инциденты, базы знаний и другие источники. Каждый из этих источников требует регулярной проверки актуальности и корректной интеграции в систему. Ряд вендоров уже внедрил встроенные инструменты аудита, которые позволяют оценить актуальность имеющихся данных и выявить пробелы, которые необходимо устранить до начала полномасштабного внедрения.

    Основные сценарии использования EIS-решений

    Уменьшение нагрузки на ИТ-персонал

    Уменьшение ручной работы при анализе объемов событий благодаря корреляции и обнаружению аномалий.

    Ускорение реагирования на инциденты

    Более быстрая триаж-оценка и, как следствие, более быстрая реакция — достигается благодаря прогнозированию и рекомендациям по устранению инцидентов. 

    Автоматизация 

    Цель — передать системе максимум шагов по реагированию и устранению инцидентов.

    Как Artimate соответствует требованиям Gartner к решениям в области интеллектуального анализа событий

    Рисунок 2. Как работает российская EIS-платформа Artimate

    Интеграция данных, поступающих из систем ИТ-мониторинга

    Artimate собирает события, метрики и логи из систем ИТ-мониторинга через единый Центр интеграции данных. Источники подключаются либо универсальным REST-коннектором Open Integration Manager (он принимает вебхуки практически всех систем мониторинга), либо готовыми адаптерами. Для логов используется LOG-FILE agent. Новую систему можно «подружить» с платформой за считаные минуты без кода.

    Попав в Центр, поток проходит встроенный ETL: нормализацию формата, выделение тегов, дедупликацию, фильтрацию и агрегацию. На этом этапе шум «сырого» мониторинга сокращается на порядок, а данные обогащаются контекстом для последующей ML-аналитики и корреляции инцидентов.

    Прием и/или сборка топологии 

    Платформа Artimate автоматически строит карту зависимостей IT-инфраструктуры, используя несколько источников данных:

    • Discovery-агенты сканируют сетевую инфраструктуру и автоматически обнаруживают связи между компонентами;
    • Импорт из CMDB позволяет загрузить готовые данные о конфигурации и зависимостях из внешних систем управления конфигурациями;
    • Интеграции с облачными платформами для получения актуальной информации о топологии облачных ресурсов;
    • Анализ трафика для автоматического выявления фактических связей между сервисами

    Результативная топологическая модель представляет собой живую карту IT-ландшафта, которая обновляется в реальном времени и служит основой для точной корреляции событий и оценки бизнес-влияния инцидентов.

    Корреляция событий и обогащение контекста на основе ML

    Artimate использует многоуровневый подход к корреляции событий:

    Статическая корреляция по правилам группирует события на основе заранее заданных критериев: временных окон, источников, типов оборудования и сервисов.

    ML-корреляция применяет алгоритмы машинного обучения для выявления неочевидных связей между событиями:

    • Анализ временных паттернов для обнаружения каскадных сбоев;
    • Кластеризация событий по семантическому сходству описаний;
    • Выявление аномальных последовательностей событий.

    Контекстное обогащение дополняет каждое событие релевантной информацией:

    • Привязка к бизнес-сервисам;
    • История аналогичных инцидентов и примененных решений;
    • Автоматическое назначение ответственных команд на основе матрицы ответственности;
    • Рекомендации по устранению на основе базы знаний и успешного опыта.

    Результат: вместо сотен разрозненных событий операторы получают десятки содержательных инцидентов с полным контекстом для быстрого реагирования.

    Предиктивная аналитика и обнаружение аномалий

    AIOps-платформа Artimate предлагает готовые инструменты для прогнозирования: корреляционные графы, отражающие полные карты причинно-следственных связей по заданным параметрам, и карту ресурсов, отражающую текущую картину по инцидентам: всем, открытым или конкретным.

    Интеллектуальный поиск аномалий с использованием технологий AI и ML меняет подход к управлению инфраструктурой. AIOps-платформа Artimate включает в себя детекторы, помогающие обнаруживать отклонения от нормального поведения последовательности, плотности событий и временных рядов.

    Автоматизация 

    Используя встроенные ML-модели и сценарии эскалации, Artimate автоматически реагирует на критические события, инициирует корректирующие действия или отправляет уведомления в ITSM-системы.

    Рисунок 3. Снижение информационного шума на 95% с Artimate

    Убедитесь в возможностях Artimate на практике! Запишитесь на демо, чтобы увидеть, как платформа поможет вашему бизнесу улучшить стабильность IT-систем и сократить время решения инцидентов.

    Будьте в курсе

    Управление ИТ-мощностями сегодня — это не просто контроль за серверами и дисками. Современная инфраструктура представляет собой сложную экосистему с динамически меняющейся нагрузкой, где одновременно работают десятки приложений, обрабатываются терабайты данных, а пиковые значения могут превышать базовую нагрузку в десятки раз. В таких условиях традиционные подходы к планированию мощностей (избыточное резервирование или ручная калибровка ресурсов) оказываются […]
    Подробнее
    По данным исследований, традиционный анализ корневых причин (Root Cause Analysis, RCA) может занимать от нескольких часов до нескольких дней, что критично для бизнеса, где каждая минута простоя оборачивается финансовыми потерями. AIOps-платформы меняют эту ситуацию, автоматизируя процесс RCA и сокращая время решения инцидентов в десятки раз.
    Подробнее
    ИИ-модуль для снижения информационного шума в ИТ-мониторинге решает эти проблемы за счет перехода от разрозненного, узкофункционального мониторинга к централизованному интеллектуальному анализу событий
    Подробнее