Представим себе идеальный центр управления: метрики в норме, зеленые графики, контроль на всех уровнях. Но когда система начинает сбоить, кто берет управление на себя? Кто видит всплеск latency и не ждет, а действует?Этот комикс — об инженерной миссии без паники, но с вызовом. Про то,…
Слёрм приглашает на митап «Профессия SRE: практика и мифы». Поговорим про SRE с экспертами, обсудим вопросы участников. Повестка дня: Что такое SRE и зачем все это нужно IT и бизнесу? SRE – хайп или проверенный подход? Как с этим работать? Практики SRE. Как внедрить у себя? Что нужно, чтобы стать SRE-инженером? Начало митапа: 3 ноября, вторник, 19.00 МСК. Читать дальше →
SRE — хайповая тема. Появились вакансии SRE-инженера, об SRE заговорили на конференциях и в интервью. Вчера я увидел слово SRE в рассылке. Скоро оно зазвучит из каждого утюга. Такой хайп у одних формирует лишние ожидания, а у других — ненужные опасения. SRE — это реализация идей DevOps,…
Site Reliability Engineering (SRE) — это одна из форм реализации DevOps. SRE-подход возник в Google и стал популярен в среде продуктовых IT-компаний после выхода одноимённой книги в 2016 году. В статье опишем, как SRE-подход соотносится с DevOps, какие задачи решает инженер по SRE и о каких показателях заботится. Читать дальше →