Логотип Apache Kafka

Apache Kafka

Бесплатный тариф

Распределённая платформа потоковой обработки данных для построения высоконагруженных систем обмена сообщениями в реальном времени

Основная информация

Основан
2011 г.
Страна
Apache Foundation (США)
Развёртывание
On-premises / Облако / Docker
Интеграции
200+
Языки
Английский
Поддержка
Сообщество (Mailing Lists), JIRA +3
Стоимость
Бесплатно
Пробный период
Бесплатный тариф

Тарифы Apache Kafka

Open Source

Бесплатно
  • Полный исходный код Apache Kafka
  • Kafka Streams и Kafka Connect
  • KRaft (без ZooKeeper)
  • Поддержка сообщества
  • Неограниченный кластер

Confluent Cloud Basic

Популярный

до 1 пользователей

Бесплатно
  • Управляемый Kafka в облаке
  • $400 бесплатных кредитов
  • Автоматическое масштабирование
  • Schema Registry
  • Базовые коннекторы
  • Оплата по использованию

Confluent Cloud Dedicated

до 1 пользователей

По запросу
  • Все функции Basic
  • Выделенный кластер
  • Расширенная безопасность (SSO, RBAC)
  • ksqlDB для потоковых SQL-запросов
  • Техническая поддержка 24/7
  • SLA 99.99%

Обзор Apache Kafka

Что такое Apache Kafka?

Apache Kafka — это распределённая платформа потоковой обработки данных с открытым исходным кодом, изначально разработанная в LinkedIn в 2011 году и переданная Apache Software Foundation. Kafka обеспечивает высокопроизводительную передачу и обработку потоков данных в реальном времени, обрабатывая миллионы сообщений в секунду с минимальной задержкой.

Сегодня Kafka используется более чем 80% компаний из списка Fortune 100. Платформа стала стандартом де-факто для построения событийно-ориентированных архитектур, потоковой аналитики и интеграции микросервисов.

Ключевые возможности Kafka

1. Потоковая передача сообщений

  • Публикация и подписка на потоки записей
  • Гарантированная доставка сообщений
  • Хранение потоков данных с настраиваемым retention
  • Обработка миллионов сообщений в секунду
  • Задержка менее 10 мс на уровне 99-го перцентиля

2. Kafka Streams

  • Библиотека для потоковой обработки данных
  • Stateful и stateless трансформации
  • Оконные агрегации и join-операции
  • Exactly-once семантика обработки
  • Развёртывание без дополнительного кластера

3. Kafka Connect

  • Фреймворк для интеграции с внешними системами
  • 200+ готовых коннекторов (базы данных, облака, файлы)
  • Source и Sink коннекторы
  • Масштабируемый распределённый режим
  • Мониторинг и управление через REST API

4. Архитектура и надёжность

  • Распределённый лог с партиционированием
  • Репликация данных между брокерами
  • Автоматическое восстановление при сбоях
  • Горизонтальное масштабирование кластера
  • KRaft — встроенный консенсус без ZooKeeper

Применение Apache Kafka

Kafka применяется для сбора и агрегации логов, потоковой аналитики в реальном времени, событийно-ориентированных микросервисных архитектур, CDC (Change Data Capture) из баз данных, обработки данных IoT-устройств и построения конвейеров данных между разнородными системами.

Экосистема Kafka

Вокруг Kafka сформировалась богатая экосистема: Confluent Platform (коммерческий дистрибутив), Schema Registry для управления схемами данных, ksqlDB для SQL-запросов к потокам, Kafka Connect для интеграций и множество клиентских библиотек для всех популярных языков программирования.

Видеообзор Apache Kafka

Плюсы и минусы Apache Kafka

+Преимущества

  • Сверхвысокая производительность (миллионы сообщений/сек)
  • Полностью бесплатный и открытый исходный код
  • Стандарт де-факто для event streaming
  • Надёжная гарантия доставки сообщений
  • Линейное масштабирование кластера
  • Огромная экосистема и сообщество

Недостатки

  • Сложная настройка и администрирование кластера
  • Высокие требования к квалификации команды
  • Потребляет значительные ресурсы (RAM, диск, сеть)
  • Избыточен для простых сценариев обмена сообщениями
  • Мониторинг требует дополнительных инструментов

Комментарии (1)

Был ли полезен этот инструмент?
💬

Загрузка комментариев...

Часто задаваемые вопросы о Apache Kafka

?Бесплатен ли Apache Kafka?

Да, Apache Kafka — полностью бесплатный open source проект под лицензией Apache 2.0. Confluent Platform предлагает коммерческие дополнения. Confluent Cloud — управляемый Kafka в облаке с оплатой по использованию (от $0 с бесплатными кредитами $400).

?Чем Kafka отличается от RabbitMQ?

Kafka оптимизирован для высокопроизводительных потоков данных с хранением и replay сообщений. RabbitMQ — классический брокер сообщений с гибкой маршрутизацией. Kafka лучше для big data и event streaming, RabbitMQ — для задач, очередей и сложной маршрутизации сообщений.

?Зачем нужен ZooKeeper для Kafka?

Исторически ZooKeeper управлял метаданными кластера Kafka. С версии 3.3+ Kafka поддерживает KRaft — встроенный протокол консенсуса, заменяющий ZooKeeper. Новые установки рекомендуется разворачивать с KRaft, что упрощает архитектуру и повышает производительность.

?Сколько сообщений в секунду обрабатывает Kafka?

Один кластер Kafka способен обрабатывать миллионы сообщений в секунду. LinkedIn обрабатывает более 7 триллионов сообщений в день через Kafka. Производительность зависит от размера сообщений, конфигурации кластера и требований к надёжности.

?Подходит ли Kafka для малого проекта?

Для малых проектов Kafka может быть избыточным из-за сложности администрирования. Рассмотрите Redis Streams, RabbitMQ или Amazon SQS для простых сценариев. Если нужен именно Kafka — используйте Confluent Cloud, который избавляет от администрирования.

?Какие языки программирования поддерживает Kafka?

Kafka имеет официальные клиенты для Java и Scala. Сообщество поддерживает клиенты для Python (confluent-kafka-python), Go (sarama, confluent-kafka-go), Node.js (KafkaJS), C/C++ (librdkafka), .NET и других языков. REST Proxy позволяет работать с Kafka через HTTP.

Обзор обновлён: 15 января 2026 г.