Обновление Monq 8.3. Новый ML-сервис для прогнозирования аварий и расширенные возможности инфраструктурного мониторинга
2024-09-24 17:31
Прогнозирование временных рядов и новые правила порогов
в правилах порогов появился инструмент анализа трендов и сезонности. Теперь инженер сможет видеть полноценную картину движения временного ряда и понимать, что это не просто кратковременная деградация, а явный тренд с серьезными последствиями в будущем;
пользователь сможет гибко настроить исторический период, за который необходимо взять данные для обучения и на какой период построить прогноз;
уведомление с прогнозом доступно как для визуального контроля, так и для средств автоматизации (сигналы и No-code бизнес-процессы);
Кейсы применения
Необходимо вовремя обнаружить и среагировать на лавинообразный рост метрики заполняемости диска за последние 6 часов. Прогноз позволит заранее определить, что такое поведение ряда в течение нескольких часов приведет к наивысшему уровню угрозы и необходимо принять срочные меры.
Функциональные улучшения правил порогов
Изменения коснулись удобства работы с правилами порогов и сырыми метриками:
вместо таблицы добавлен график временных рядов с отображением настроенных пороговых значений и легендой графика, с выводом меток;
упрощенное формирование запроса метрик. Появилась возможность посмотреть все доступные названия метрик и оперативно использовать их в запросе, в том числе инструментами автокомплита;
добавлена фильтрация правил порогов и расширена область поиска, которая теперь включает тело запроса, шаблон названия порогов и аннотации;
Отдельно стоит отметить функционал быстрого создания уровней порогов. Благодаря встроенным алгоритмам анализа временных рядов есть возможность задать уровни по одному клику.
Расширенные возможности агента
одним из ключевых изменений является поддержка протоколов TCP и UDP для внешних агентов. Теперь агенты могут прослушивать порты, что значительно расширяет возможности по мониторингу сетевых устройств. Это значительный шаг в развитии модуля инфраструктурного мониторинга в Monq. Обновление включает следующие функциональные возможности:
сбор системных сообщений с использованием плагина Syslog;
получение уведомлений о сетевых событиях с помощью плагина SNMP-trap.
в агентах теперь доступна буферизация данных, и в случае, если произойдет разрыв соединения между агентом и Monq, агент сможет записывать данные на диск или во внутреннюю память (управляется в конфиге агента) и при восстановлении соединения доставит данные в систему;
автопоставка плагинов агентам.Теперь не нужно идти на хост и локально подкладывать новый плагин в локальное хранилище агента. В момент получения задания агент самостоятельно скачает необходимый плагин из хранилища и приступит к выполнению.
Плагин Syslog
monq-агент теперь может быть задействован для сбора системных сообщений с портов, используя плагин Syslog, который преобразует полученные данные и передает их в формате JSON;
предположим, необходимо мониторить хосты, которые расположены в изолированных сетях и не могут напрямую записывать логи в централизованную систему мониторинга. Для них может быть настроена отправка своих логов через Syslog на определенный порт, и Monq-агент сможет получать данные и отправлять их в систему для дальнейшей обработки;
плагин поддерживает работу как по TCP, так и по UDP. Для разбора сообщений доступны несколько вариантов парсеров, включая стандарты syslog-rfc5424 и syslog-rfc3164.
Плагин SNMP-trap
плагин SNMP-trap позволит получать уведомления о важных событиях и изменениях состояния сетевых устройств, таких как маршрутизаторы, коммутаторы, видеокамеры и прочие элементы инфраструктуры;
плагин отвечает за сбор и декодирование SNMP трапов, поддерживая версии SNMPv1 и SNMPv2. С помощью MIB файлов плагин расшифровывает полученные данные и передает их в формате JSON для дальнейшей обработки в Monq.
Важно отметить, что данные изменения доступны только в новой версии агента (актуальная версия здесь). Однако благодаря обратной совместимости, агенты прошлых версий смогут подключаться к Monq 8.3, а новый агент будет работать с более старыми версиями системы. Это обеспечивает гибкость внедрения обновлений без необходимости моментального апгрейда всех существующих агентов.
Кластеризация графа РСМ
Кластеры объектов РСМ
конфигурационные единицы (КЕ) теперь могут быть автоматически сгруппированы в кластеры на основе их связей влияния. Это решение значительно упрощает работу с большими картами для тысяч конфигурационных единиц, позволяя пользователям оперативного центра быстрее анализировать состояние сервисов;
если КЕ из списка влияет на несколько кластеров, между ними появятся ненаправленные связи, которые визуально показывают пересечение влияний. Выбрав такую связь, можно увидеть все общие КЕ, находящиеся в связанных кластерах;
при обнаружении проблемного кластера по двойному клику можно перейти к его детальному изучению и анализу корневых причин.