Все мы с этим сталкивались: вроде бы сервис работает, графики зелёные, ресурсы свободны — а пользователи всё равно жалуются. Открываешь мониторинг — CPU в порядке, память не забита, места на диске полно. А люди продолжают писать: «У вас тормозит». Знакомо? Давайте разберёмся, как настроить мониторинг так, чтобы проблемы ловились сразу — ещё до того, как начнут ломиться сообщения в поддержку. Читать далее
Ранее я поднял проблему возрастающей сложности и обозначил порождаемую ей другую проблему. Проблему управления сложностью (разнообразием) организации. Поднял проблему возрастающей сложности и обозначил порождаемую ей другую проблему. Проблему управления сложностью…
«Никогда такого не было и тут опять...» Привет, Хабр! 27 ноября пройдёт семинар «Тестирование и мониторинг» нашего эксперта по управлению ЦОД Кирилла Шадского. Он расскажет, что можно и нужно тестировать в дата-центре. А также покажет, как настроить мониторинг, чтобы не перегружать системы. После основной части мероприятия Кирилл проведёт экскурсию по дата-центру NORD-4. Читать дальше →
Всем привет. В мае OTUS запускает практикум по мониторингу и логированию, как инфраструктуры так и приложений с помощью Zabbix, Prometheus, Grafana и ELK. В связи с этим традиционно делимся полезным материалом по теме. Blackbox экспортер для Prometheus позволяет реализовать мониторинг внешних сервисов через HTTP, HTTPS, DNS, TCP, ICMP. В этой статье я покажу вам, как настроить мониторинг HTTP/HTTPS с помощью Blackbox экспортера. Запускать Blackbox экспортер будем в Kubernetes. Читать дальше →