SRE: data-driven подход к управлению надёжностью систем — курс от Слёрм
Курс от Слёрм, обучающий инженеров и менеджеров data-driven подходу к управлению надёжностью IT-систем. Программа охватывает формулировку SLO и SLI для сервисов, настройку мониторинга и алертинга, работу с error budget и проведение постмортемов. Практическая часть включает работу с Kubernetes, внедрение fail-fast паттернов для раннего обнаружения проблем и настройку канареечных деплоев через Argo Rollouts. Обучение проходит в командах с распределением ролей, что имитирует реальную работу SRE-команды. Спикеры — практикующие SRE-инженеры из крупных российских IT-компаний.
Как мы оцениваем курсы
Рейтинг ToolFox формируется по 5 критериям, каждый оценивается от 1 до 10:
- Качество программы — полнота материала, актуальность технологий
- Практика — реальные проекты, код-ревью, тренажёры
- Поддержка — наставники, обратная связь, сообщество
- Трудоустройство — карьерный центр, помощь с резюме
- Цена/качество — соотношение стоимости и получаемых навыков
Итоговый балл — среднее арифметическое 5 критериев. Обновляется при каждом пересмотре курса.
- Платформа
- Слёрм
- Длительность
- 2 мес, 10 ч/нед
- Формат
- Онлайн
- Уровень
- Продвинутый
- Язык
- Русский
- Сертификат
- Сертификат о прохождении курса
- Обновлено
- март 2026 г.
Полная стоимость: 50 000 ₽
Программа и содержание
Модули и темы
Модуль формирует понимание data-driven подхода к надёжности и учит формулировать измеримые цели обслуживания для своих систем.
- Что такое SRE и чем отличается от DevOps
- SLA, SLO, SLI: определение и взаимосвязь
- Формулировка SLO для разных типов сервисов
- Выбор правильных SLI-метрик
- Error budget и его роль в принятии решений
Основы SRE и формулировка SLO/SLI
Принципы SRE, определение индикаторов надёжности, целевые уровни обслуживания
Модуль формирует понимание data-driven подхода к надёжности и учит формулировать измеримые цели обслуживания для своих систем.
- Что такое SRE и чем отличается от DevOps
- SLA, SLO, SLI: определение и взаимосвязь
- Формулировка SLO для разных типов сервисов
- Выбор правильных SLI-метрик
- Error budget и его роль в принятии решений
Мониторинг, алертинг и работа с инцидентами
Настройка мониторинга на основе SLI, алертинг по error budget, управление инцидентами
Слушатели учатся выстраивать систему алертов, которая сигнализирует об угрозе нарушения SLO, а не о каждом отклонении метрики.
- Архитектура системы мониторинга
- Алертинг на основе burn rate и error budget
- Процесс реагирования на инциденты
- Проведение постмортемов без поиска виноватых
- Дашборды SLO и error budget для команды и бизнеса
Надёжность на уровне архитектуры и деплоя
Fail-fast паттерны, канареечные деплои, chaos engineering
Модуль показывает, как архитектурные решения и стратегии развёртывания влияют на надёжность и как использовать данные для их оптимизации.
- Fail-fast подход в проектировании систем
- Канареечные деплои с Argo Rollouts
- Graceful degradation и circuit breaker
- Основы chaos engineering
- Capacity planning на основе данных
SRE-культура и работа в команде
Внедрение SRE-практик в организации, командные роли, коммуникация с бизнесом
Модуль помогает выстроить SRE-культуру в организации и научиться доносить ценность надёжности до бизнеса через понятные метрики.
- Роли в SRE-команде и распределение ответственности
- Коммуникация SLO и error budget бизнес-стейкхолдерам
- Адаптация SRE-практик к российским реалиям
- Инструменты для совместной работы SRE-команды
Чему научитесь
Для кого подходит
- →SRE-инженеры и DevOps-специалисты
- →Разработчики, ответственные за надёжность продакшн-систем
- →Тимлиды и технические менеджеры
- →Инженеры, внедряющие SRE-практики в своей компании
Требования
- →Опыт работы с Linux и командной строкой
- →Базовые знания Kubernetes
- →Понимание принципов мониторинга
Плюсы и минусы курса SRE: data-driven подход к управлению надёжностью систем
Обзор подготовлен редакцией ToolFox · Обновлено: март 2026 г.
Плюсы
- Data-driven подход с фокусом на SLO, SLI и error budget
- Командная работа с распределением ролей
- Практика с Argo Rollouts и Kubernetes
- Спикеры из крупных российских IT-компаний
- Адаптация международных SRE-практик к российскому рынку
Минусы
- Требуются предварительные знания Kubernetes и Linux
- Нет диплома о профпереподготовке
- Ограниченная информация о цене на сайте
Отзывы (1)
Загрузка комментариев...
Часто задаваемые вопросы
Чем SRE отличается от DevOps?
Нужен ли опыт работы с Kubernetes?
Как организована командная работа?
Выдаётся ли сертификат?
Можно ли оформить налоговый вычет?
Чем SRE отличается от DevOps?
SRE фокусируется на надёжности систем через измеримые метрики (SLO, SLI, error budget), тогда как DevOps — более широкая методология автоматизации и культуры.
Нужен ли опыт работы с Kubernetes?
Да, практическая часть курса включает работу с Kubernetes-кластерами. Базовые навыки необходимы.
Как организована командная работа?
Участники объединяются в команды с распределением ролей, что имитирует работу реальной SRE-команды в компании.
Выдаётся ли сертификат?
Да, по окончании курса выдаётся сертификат от Слёрм.
Можно ли оформить налоговый вычет?
Да, Слёрм имеет лицензию на образовательную деятельность, что даёт право на налоговый вычет 13%.