
API для распознавания и синтеза речи в реальном времени с потоковым режимом через gRPC и REST. Часть T-API от Т-Банка (бывший Tinkoff VoiceKit). Сервис ООО «ТЦР»: распознавание доступно для ЮЛ и физлиц, синтез — только для ЮЛ.
В каталоге 1 сервис по направлению «Tinkoff VoiceKit».

API для распознавания и синтеза речи в реальном времени с потоковым режимом через gRPC и REST. Часть T-API от Т-Банка (бывший Tinkoff VoiceKit). Сервис ООО «ТЦР»: распознавание доступно для ЮЛ и физлиц, синтез — только для ЮЛ.
| Название | Мин. цена | Пробный период | Развёртывание | Интеграции | Рейтинг |
|---|---|---|---|---|---|
| T-Bank VoiceKit | По запросу | — | Облачный API (developer.tbank.ru) | — | Нет оценок |
Tinkoff VoiceKit — облачный API распознавания и синтеза речи от Тинькофф (платформа voicekit.tinkoff.ru). Конкурент Yandex SpeechKit с похожим качеством и слегка более низкой ценой (8 ₽/мин против 10 ₽/мин). Точность 95% на чистой русской речи. Фокус на финансовый сектор и колл-центры — модели обучены на банковских и финансовых разговорах, отличное качество распознавания финансовой терминологии (название продуктов, банковских операций, юридических терминов). Используется в собственных продуктах Тинькофф (Олег, голосовые боты).
Цена — VoiceKit на 20-30% дешевле для базовых тарифов (8 ₽/мин против 10 ₽/мин Yandex). Специализация — VoiceKit лучше распознаёт финансовую терминологию (банковские продукты, юридические термины, бухгалтерию). Yandex — более универсальный для всех отраслей, больше голосов синтеза (30+ против 20+ у Tinkoff). По качеству на чистой русской речи — паритет. Для финансового сектора и колл-центров банков — VoiceKit. Для остального — Yandex SpeechKit. Многие компании используют оба — балансировка нагрузки и резервирование.
Распознавание речи: базовая модель 8 ₽/минута, премиум с пользовательскими словарями 15 ₽/минута. Синтез речи (TTS): 350 ₽ за 1 млн символов (≈дешевле Yandex на 12%). Бесплатный тариф: первые 1500 минут в месяц бесплатно — щедрее Yandex (1000 запросов). Корпоративный: индивидуальные условия для крупных клиентов с скидками 30-50% на объёмы от 100 000 минут/мес. Оплата через личный кабинет на voicekit.tinkoff.ru, биллинг помесячный с детализацией.
SDK для Python, Java, JavaScript/TypeScript, Go. REST API и gRPC для real-time streaming. Готовые примеры в документации voicekit.tinkoff.ru. Поддержка стандартных аудиоформатов (PCM, WAV, MP3, FLAC, OPUS). Работает с любой инфраструктурой — Yandex Cloud, AWS, GCP, on-premise серверы. Интеграция с Tinkoff Connect API для банковских сценариев. От регистрации до первого распознавания — около часа (нужно проверить документы для активации платного тарифа).
Да, отлично подходит. gRPC streaming API даёт задержку 150-300 мс — приемлемо для real-time диалогов в голосовых ботах. Используется в собственных продуктах Тинькофф (Олег, голосовые ассистенты в мобильном приложении). Финансовая специализация — преимущество для банковских ботов: распознаёт «оформить кредитную карту», «узнать баланс», «подключить услугу» точнее, чем универсальные API. Также интегрируется с большинством платформ голосовых ботов: AimyLogic, CraftTalk, Naumen — все поддерживают Tinkoff VoiceKit как опцию.
Колл-центры банков и финансовых компаний: распознавание разговоров операторов, контроль скриптов, анализ возражений. Голосовые боты для банков: автоматизация типовых запросов клиентов (баланс, история операций, оформление продуктов). Транскрибация юридических записей и договоров: точность распознавания юридической терминологии важнее средней. Бухгалтерские сервисы: голосовой ввод платежей, голосовые отчёты для сотрудников. Сервисы голосовой биометрии: VoiceKit имеет дополнительные функции верификации голоса для безопасной аутентификации.
20+ голосов в нескольких категориях. Мужские: Pavel (нейтральный диктор), Ermil (озвучка обучающих видео), Maxim (премиум). Женские: Anna (нейтральная), Olga (премиум для контента), Marina (молодая). Детские: Vitya, Lera. Эмоциональные стили: neutral, good, friendly, evil — для каждого голоса. Скорость от 0,5x до 2x. Поддержка SSML. Меньше голосов чем у Yandex (30+), но качественные и оптимизированы для финансового и юридического контента. Для большего разнообразия в проектах используют Yandex SpeechKit, для специализированного финансового — Tinkoff.
Tinkoff VoiceKit (voicekit.tinkoff.ru) — облачный API распознавания и синтеза речи от Тинькофф, работает с 2019 года. Конкурент Yandex SpeechKit с похожим качеством на чистой русской речи (95%+) и более низкой ценой (8 ₽/мин против 10 ₽/мин у Yandex). Главное отличие — специализация на финансовом секторе и колл-центрах. Модели обучены на банковских и юридических разговорах, отлично распознают финансовую терминологию: банковские продукты, юридические термины, бухгалтерские операции, страховые продукты. Используется в собственных продуктах Тинькофф (Олег, голосовые боты, мобильное приложение).
Финансовый сектор: банки, страховые компании, инвестиционные сервисы — VoiceKit лучше распознаёт финансовую терминологию на 5-10% точнее Yandex. Колл-центры с фокусом на финансы и юриспруденцию: качество распознавания специальной лексики важнее средней. Бюджет: цена на 20-30% ниже Yandex для тех же объёмов. Дополнительные функции голосовой биометрии: верификация голоса для безопасной аутентификации в финансовых приложениях. Если используете финтех-стек Тинькофф (Tinkoff Connect API, OpenAPI Banking) — нативная интеграция упрощает разработку. Многие крупные компании используют оба провайдера для резервирования и балансировки нагрузки.
Базовое распознавание речи: 8 ₽/минута, для большинства задач достаточно. Премиум с пользовательскими словарями: 15 ₽/минута, для специальной терминологии. Синтез речи (TTS): 350 ₽ за 1 млн символов (≈12% дешевле Yandex). Бесплатный тариф: 1500 минут в месяц бесплатно для тестов и прототипов. Корпоративный тариф: индивидуальные условия от 100 000 ₽/мес с скидками 30-50% на объёмы. Расчёт для среднего проекта (10 000 минут в месяц): 80 000 ₽/мес базового тарифа. Для крупного проекта (100 000 минут): со скидками 30-40% — 480 000-560 000 ₽/мес против 600 000-700 000 ₽ у Yandex.
SDK для Python, Java, JavaScript/TypeScript, Go. REST API и gRPC для real-time streaming с задержкой 150-300 мс — подходит для голосовых ботов и live-диалогов. Поддержка форматов: PCM, WAV, MP3, FLAC, OPUS. Работает с любой инфраструктурой: Yandex Cloud, AWS, Google Cloud, on-premise серверы. 20+ голосов синтеза с эмоциональными стилями (neutral, good, friendly, evil), скоростью 0,5x-2x, поддержкой SSML. Дополнительные функции: голосовая биометрия (верификация по голосу), определение языка, поиск ключевых слов в потоке.
Колл-центры банков (Тинькофф, Сбербанк, Альфа-Банк, ВТБ) для автоматического анализа разговоров операторов. Голосовые боты для банков и страховых: автоматизация типовых запросов клиентов через AimyLogic или CraftTalk с движком VoiceKit. Транскрибация юридических записей и договоров: точность распознавания юридической терминологии. Бухгалтерские сервисы: голосовой ввод платежей. Голосовая верификация в мобильных приложениях для безопасной аутентификации без паролей. Real-time распознавание для синхронного перевода презентаций. Для российского финтеха VoiceKit — стандарт де-факто.
Каталог обновлён: март 2026