Для всех наших клиентов мы организовываем круглосуточный мониторинг работоспособности инфрастуктуры. Доступность серверов и их helthcheck (диски, cpu, memory), доступность сервисов и их правильные ответы. Проверяется загрузка каналов и количество пакетов. Резкие перепады могут сигнализировать о ддосе или падение сервиса.
Частота проверок отличается от многвенных реакции при настройке snmp-trap, проверок каждые 15 секунд до стандартных снятия показтелей раз в 5 минут. Все варианты обсуждаемы и настраиваются под каждого пользователя индивидуально.
Сообщения об изменениях мы отправляем по разным каналам - почта, телеграм, slack, sms. Возможен вариант автоматического звонка. Уведомления также приходят нашим админам и решаются по мере критичности ситуации и выбраного тарифного пакета.
Для тестирования мы предлагаем лишь самый простой вариант проверок, который не требует никаких разрешений и настроек с вашей стороны - это icmp доступность ресурса и http доступность. Проверка будет происходить каждые 3 минуты. Сообщения об изменени ситации вы сможете получать на почту и в телеграмм.