Представьте: у вас десятки микросервисов, миллионы логов и трассировок, а ваша задача — поддерживать SLA и не дать системе сломаться. Ручная настройка SLO (Service Level Objectives) и мониторинг SLI (Service Level Indicators) превращается в кошмар.SLO-Scout решает эту проблему с помощью AI, анализа телеметрии и автоматизации, позволяя SRE сосредоточиться на надежности, а не на ручной рутине. Читать далее
Большинство инженеров начинают путь с простой задачи - сделать так, чтобы ничего не падало. И в этом нет ничего плохого. Мы ставим мониторинг, настраиваем алерты и радуемся когда всё “зеленое”Но что делать когда этого не достаточно и пользователи все равно жалуются? Читать далее
Привет, меня зовут Дмитрий Синявский. Я инженер по надёжности сервиса в Ви.Tech и одна из моих любимых тем SLI/SLO. Сегодня разберемся с "скоростью расхода бюджета ошибок".Недавно я провел опрос в канале сообщества ALLSLO, в котором спрашивал вызывает ли понимание термина Error budget burn rate сложности. В опросе верный ответ отсутствовал и был вариант "нет верного ответа", однако более 40% выбрало неверный ответ. Потому давайте разберемся, что же это такое Error budget burn rate. Читать далее
Привет, Хабр! Вещает Иван Щукин, системный администратор с 1999 года. Последние 2,5 года я работаю в Купере. Сейчас моя роль — тимлид SRE фронтенда.Эта статья написана по мотивам моего выступления на DevOpsConf 2025. О чем поговорим?- Как мы мониторим фронтенд в Купере- Что выбираем в качестве SLI- Какие клиентские метрики используем в качестве SLI Читать далее