Data Engineer — курс от OTUS
«Data Engineer» от OTUS — пятимесячный курс для Junior+ разработчиков, знающих Python и SQL. Живые вебинары дважды в неделю (вторник и пятница в 20:00 МСК), код-ревью от экспертов и бесплатный доступ к Yandex Cloud для практических заданий. Программа охватывает полный стек дата-инженерии: DWH (ClickHouse, Greenplum, Data Vault), Data Lake (HDFS/S3, Hive), NoSQL (ELK, key-value), Streaming (Kafka), оркестрацию через Apache Airflow и обработку через Apache Spark. Обязательный вступительный тест по Python и SQL. Выпускной проект на реальных данных с защитой перед экспертами. Доступ к записям и материалам остаётся навсегда.
Как мы оцениваем курсы
Рейтинг ToolFox формируется по 5 критериям, каждый оценивается от 1 до 10:
- Качество программы — полнота материала, актуальность технологий
- Практика — реальные проекты, код-ревью, тренажёры
- Поддержка — наставники, обратная связь, сообщество
- Трудоустройство — карьерный центр, помощь с резюме
- Цена/качество — соотношение стоимости и получаемых навыков
Итоговый балл — среднее арифметическое 5 критериев. Обновляется при каждом пересмотре курса.
- Платформа
- OTUS
- Автор
- Длительность
- 5 мес, 10 ч/нед
- Формат
- Онлайн, живые вебинары 2 раза в неделю + код-ревью
- Уровень
- Средний
- Язык
- Русский
- Сертификат
- Сертификат OTUS
- Обновлено
- март 2026 г.
Полная стоимость: 107 000 ₽
Программа и содержание
Модули и темы
Изучите роль инженера данных и архитектуру аналитических систем. Освоите Docker, проектирование хранилищ данных (DWH), работу с Greenplum и ClickHouse.
- Инженер данных: задачи и навыки
- Архитектура систем обработки данных
- Docker
- Модели данных в DWH
- Проектирование DWH
- Greenplum
- ClickHouse
Введение и DWH
Архитектура систем, Docker, модели данных DWH, ClickHouse, Greenplum
Изучите роль инженера данных и архитектуру аналитических систем. Освоите Docker, проектирование хранилищ данных (DWH), работу с Greenplum и ClickHouse.
- Инженер данных: задачи и навыки
- Архитектура систем обработки данных
- Docker
- Модели данных в DWH
- Проектирование DWH
- Greenplum
- ClickHouse
Хранение данных: Data Lake и NoSQL
Hadoop, HDFS, распределённые системы, NoSQL, ELK
Освоите экосистему Hadoop и распределённые файловые системы (HDFS, S3). Изучите NoSQL-решения: key-value хранилища, wide-column БД и ELK Stack для работы с логами.
- Основы Hadoop
- Data Lake
- Распределённые файловые системы
- NoSQL: Key-Value
- NoSQL: Wide-column
- ELK Stack
Загрузка данных и оркестрация
ETL-процессы, Apache Kafka, NiFi, Apache Airflow
Научитесь строить ETL/ELT-процессы, работать с Apache Kafka для потоковой передачи данных, NiFi для выгрузки из внешних систем и Airflow для оркестрации пайплайнов.
- Загрузка данных (ETL/ELT)
- Apache Kafka
- Apache NiFi
- Apache Airflow: введение
- Airflow: сложные пайплайны
Запросы к данным и трансформация
Аналитические запросы, Apache Hive, Apache Spark, потоковая обработка
Изучите аналитические запросы, SQL-доступ к Hadoop через Hive, архитектуру и API Apache Spark и обработку потоковых данных в реальном времени.
- Аналитические запросы
- Apache Hive
- Apache Spark: архитектура
- Spark API
- Обработка потоковых данных
Предоставление данных и DataOps
Data Quality, метаданные, BI, CI/CD, мониторинг
Научитесь обеспечивать качество данных (Data Quality), управлять метаданными, развёртывать BI-решения и применять DevOps-практики (CI/CD, мониторинг) к data-пайплайнам.
- Предоставление данных для аналитики
- Data Quality
- Управление метаданными
- Business Intelligence
- CI/CD для данных
- Мониторинг
Выпускной проект
Комплексный проект по data engineering с защитой перед экспертами
Выполните выпускной проект с применением всех изученных технологий: от проектирования архитектуры до развёртывания пайплайна. Защита перед экспертами OTUS.
- Выбор темы проекта
- Реализация data pipeline
- Консультации с преподавателями
- Защита проекта
Чему научитесь
Для кого подходит
- →Junior Data-инженеры со знанием Python и SQL
- →Backend-разработчики, переходящие в Data Engineering
- →DevOps и сисадмины, осваивающие big data инструменты
Требования
- →Опыт разработки на Python или Java
- →Базовые знания SQL и работы с БД
- →Обязательный вступительный тест (30 минут)
Плюсы и минусы курса Data Engineer
Обзор подготовлен редакцией ToolFox · Обновлено: март 2026 г.
Плюсы
- Живые вебинары — не только записи
- Бесплатный доступ к Yandex Cloud для практики
- Код-ревью от экспертов-практиков
- Полный стек: DWH + Kafka + Spark + Airflow + ClickHouse
Минусы
- Не для новичков — нужен Python, SQL и тест
- Высокая цена — 107 000 руб. за 5 месяцев
- Привязка к расписанию вебинаров (Вт/Пт 20:00)
- Только сертификат OTUS, без диплома
Отзывы (1)
Загрузка комментариев...
Похожие курсы
Инженер данных с нуля
Яндекс Практикум
«Инженер данных с нуля» от Яндекс Практикума — программа обучения за 6.5 месяцев для тех, кто хочет строить пайплайны данных и хранилища. Курс из 12 м...
Data Engineering
Skillfactory
«Data Engineering» от Skillfactory — интенсивный десятинедельный курс для специалистов со знанием Python, которые хотят освоить инструменты дата-инжен...
Часто задаваемые вопросы
Есть ли вступительный тест?
Формат занятий?
Нужен ли опыт в big data?
Что за выпускной проект?
Может ли работодатель оплатить обучение?
Есть ли вступительный тест?
Да, обязательный 30-минутный тест по Python и SQL. При неудаче — повтор через 3 дня. Подготовительный курс Python в подарок.
Формат занятий?
Живые вебинары 2 раза в неделю (Вт и Пт в 20:00 МСК) по 2 академических часа. Доступ к записям навсегда.
Нужен ли опыт в big data?
Нет, достаточно знаний Python и SQL. Hadoop, Spark и Kafka изучаются на курсе с нуля.
Что за выпускной проект?
Реализация data pipeline на выбранную тему с применением всех изученных технологий. Защита перед экспертами OTUS.
Может ли работодатель оплатить обучение?
Да, OTUS поддерживает оплату от работодателя. Можно разделить оплату 50/50 между вами и компанией.