Перейти к содержимому
Логотип Resemble AI

Resemble AI

Бесплатный тариф

Enterprise-платформа для синтеза и клонирования голоса (Chatterbox + DramaBox), вотермаркинга (PerTh) и детекции дипфейков (DETECT-3B-Omni — 96,7% точности на 51+ языке, #1 на HuggingFace). Pay-as-you-go от $0,0005/сек или Enterprise с SOC 2 и on-premise.

resemble.ai

Основная информация

Основан
2019 г.
Страна
Канада / США
Развёртывание
Облако (Flex) + On-premise (Enterprise)
Языки
Английский
Поддержка
Email — support@resemble.ai, Discord-сообщество +3
Стоимость
Бесплатно
Пробный период
Бесплатный тариф

Технические характеристики

Платформы
Веб-платформа + REST API + SDKs + Chrome Extension
Линейка продуктов
Generate (TTS, Voice Creation, Audio, STS), Verify (Identity, Watermarker), Detect (Detect, Meetings, Chrome Extension)
AI-модели
Chatterbox, Chatterbox Turbo, Chatterbox Multilingual, DramaBox (TTS) | Resemblyzer (identity) | PerTh (watermarking) | DETECT-3B-Omni, Detect 2B (deepfake detection)
API
Full API во всех тарифах
Точность распознавания (WER)
DETECT-3B-Omni — 96,7% точности на аудио (по бенчмарку сайта)
Языки
51+ языков для деектирования (DETECT-3B-Omni); Chatterbox Multilingual для TTS
Поддерживаемые аудиоформаты
WAV, FLAC, MP3, WEBM, M4A, OGG (для деектирования)
Модель развёртывания
Облако (Flex) + On-premise (Enterprise)
Self-hosted
On-premise развёртывание в Enterprise-тарифе
Одновременные подключения
Стандартные лимиты в Flex / повышенные в Enterprise
Авторизация API
API ключи (через личный кабинет)
Поддержка 24/7
Нет
Watermarker
Невидимые вотермарки PerTh для аудио, изображений и видео — путешествуют с файлом
Detection Coverage
Audio + Video + Image deepfake detection, zero-day model coverage, battle-tested против 160+ генеративных моделей

Безопасность и compliance

Сертификации
SOC 2 (Enterprise tier)
Хранение данных
Хостинг в США (по Privacy Policy)
Шифрование
Стандарты TLS/HTTPS, security@resemble.ai для responsible disclosure

Поддержка и SLA

Время отклика
Helpdesk-тикеты: ответ в течение 1 рабочего дня (по Terms of Service, Support Hours: 9:00–17:00 Pacific Time, без федеральных праздников)
Приоритет
Доступен на платных тарифах
Каналы поддержки
Email — support@resemble.aiEmail security — security@resemble.aiEmail team — team@resemble.aiDiscord-сообществоResemble Status

Тарифы Resemble AI

Flex

Популярный

до 1 пользователей

Бесплатно
  • Pay-as-you-go: $0 для старта, оплата по фактическому использованию
  • Кредиты не сгорают (Credits never expire)
  • Доступ ко всем voice AI моделям: Chatterbox, Chatterbox Turbo, Chatterbox Multilingual, DramaBox (NOW AVAILABLE)
  • Voice cloning (Rapid Voice Clone $2/мес/голос, Pro Voice Clone $5/мес/голос — add-ons)
  • Deepfake detection access — audio/video/image + intelligence analysis
  • Full API access
  • Add-ons: Team Seats $20/мес/пользователь, Voice design $2/мес/голос
  • Voice generation: TTS $0,0005/сек · Voice agents $0,001/сек · AI voice changer $0,0005/сек
  • Audio processing: Speech-to-text $0,001/сек · Audio enhancement $0,002/сек · Audio editing $0,0005/сек
  • Deepfake detection: Audio $0,04/сек · Video $0,07/сек · Image $0,04/сек
  • Intelligence analysis: Audio $0,03/сек · Video $0,03/сек · Image $0,03/сек
  • Additional: Identity search $0,0005 за поиск · Watermark encode $0,0005/сек · Watermark decode $0,0002/сек

Enterprise

По запросу
  • Custom-цены под организацию
  • Volume-скидки до 80%
  • Выше concurrency-лимиты на API
  • Enterprise SLA и SOC 2
  • Custom model training (кастомное дообучение моделей)
  • SSO / SAML аутентификация
  • Dedicated support
  • On-premise развёртывание
Сравнение тарифов Resemble AI
ТарифЦена
FlexTOPБесплатно
EnterpriseПо запросу
🎁
DramaBox Text-to-Speech — NOW AVAILABLE
Новая модель DramaBox для длинной нарративной подачи в драм-формате. Заявлено как «NOW AVAILABLE: DRAMABOX TEXT-TO-SPEECH» в шапке сайта. Доступна на Flex Plan по стандартной TTS-ставке $0,0005/сек.
🎁
Deepfake Detection теперь в Flex Plan
Audio, video и image deepfake detection доступны в pay-as-you-go Flex Plan: $0,04/сек для аудио, $0,07/сек для видео, $0,04/сек для изображений. Plus Intelligence analysis (углублённый анализ результатов) — $0,03/сек для каждой модальности. Раньше — только Enterprise.
🎁
2025 Deepfake Threat Report — бесплатно
Годовой отчёт о масштабе и характере дипфейк-атак с прогнозами на 2026 год. 1 567 верифицированных инцидентов, $1,28 млрд документированного фрода, менее 20% инцидентов с подтверждённым ущербом. Бесплатно для скачивания на сайте.
🎁
Deepfake Detector для Google Chrome
Бесплатное расширение для Chrome — детектирование дипфейков прямо во время веб-сёрфинга. Заявлено как «NOW AVAILABLE» в шапке сайта.

Обзор Resemble AI

Что такое Resemble AI?

Resemble AI (resemble.ai) — единственная enterprise-платформа, которая по позиционированию сайта одновременно генерирует, верифицирует и детектирует сгенерированный AI-контент через все три модальности: аудио, изображение и видео. Доступна в облаке и on-premise. Основатели Zohaib Ahmed и Saqib Muhammad запустили компанию в 2019 году.

Три продуктовые линии

  • Generate — синтез и клонирование голоса. Продукты: Resemble TTS, Resemble Voice Creation, Resemble Audio, Resemble STS (speech-to-speech). Модели: Chatterbox, Chatterbox Turbo, Chatterbox Multilingual и DramaBox (NOW AVAILABLE — длинная нарративная подача для драм-формата).
  • Verify — невидимые вотермарки на аудио, изображения и видео, которые «путешествуют» вместе с файлом. Продукты: Resemble Identity, Resemble Watermarker. Модель PerTh. Доступны отдельные операции Watermark encode ($0,0005/сек) и Watermark decode ($0,0002/сек).
  • Detect — детекция дипфейков с покрытием zero-day моделей. Продукты: Resemble Detect, Resemble Meetings, Resemble Intelligence (углублённый анализ результатов детекции для audio/video/image), Deepfake Detection Chrome Extension. Модели: DETECT-3B-Omni, Detect 2B, Resemblyzer.

Бенчмарки моделей

DETECT-3B-Omni — по заявлению сайта, самый точный аудио-детектор дипфейков в мире по публичным бенчмаркам: 96,7% точности на 51+ языках, #1 на HuggingFace для речи и изображений. «Battle-tested» против 160+ генеративных AI-моделей. Поддерживает форматы WAV, FLAC, MP3, WEBM, M4A, OGG.

Chatterbox Turbo — на сайте указано, что в blind A/B-тестировании его TTS-выход предпочитают слушатели по сравнению с ElevenLabs (10,2% «без предпочтения»), VibeVoice 7B (9,3%), Cartesia Sonic 3 (10,4%) и Qwen 3 TTS (21,3%).

Тарификация

Два тарифа: Flex Plan (pay-as-you-go от $0 для старта, кредиты не сгорают, доступ ко всем моделям, voice cloning, deepfake detection и full API) и Enterprise (custom — volume-скидки до 80%, выше concurrency-лимиты, SLA + SOC 2, кастомное обучение моделей, SSO/SAML, выделенная поддержка, on-premise развёртывание). На Flex биллинг — посекундный или per-search. Add-on'ы Flex: Team Seats $20/мес/пользователь, Rapid voice clone $2/мес/голос, Pro voice clone $5/мес/голос, Voice design $2/мес/голос. По данным сайта, если ваш бюджет превышает $500/мес на Flex — выгоднее перейти на Enterprise с volume-скидками.

Полный прайс-лист Flex (per-second)

  • Voice generation: Text-to-speech $0,0005/сек · Voice agents $0,001/сек · AI voice changer $0,0005/сек
  • Audio processing: Speech-to-text $0,001/сек · Audio enhancement $0,002/сек · Audio editing $0,0005/сек
  • Deepfake detection: Audio detection $0,04/сек · Video detection $0,07/сек · Image detection $0,04/сек
  • Intelligence analysis: Audio intelligence $0,03/сек · Video intelligence $0,03/сек · Image intelligence $0,03/сек
  • Additional services: Identity search $0,0005 за поиск · Watermark encode $0,0005/сек · Watermark decode $0,0002/сек

2025 Deepfake Threat Report

Resemble AI публикует ежегодный отчёт о масштабе и характере дипфейк-атак. По данным отчёта 2025: 1 567 верифицированных инцидентов, $1,28 млрд документированного финансового ущерба; при этом менее 20% инцидентов содержат документированный фрод. Отчёт включает прогнозы на 2026 год и доступен бесплатно для скачивания на сайте — позиционируется как «must read для каждого security-лидера».

Использование

  • Voice agents — голосовые AI-агенты для входящих и исходящих коммуникаций.
  • Dispute & claim verification — проверка голосовых записей в спорах и страховых кейсах.
  • Executive impersonation defense — защита от подделки голоса руководителей (CFO scams и т.п.).
  • Media watermarking — невидимый вотермарк, который остаётся в файле после редактирования.
  • Live agent assist — голосовая помощь живым операторам в реальном времени.
  • Identity verification & KYC — голосовая идентификация, контроль личности.

Индустрии

По разделу Solutions сайт прямо называет шесть отраслей: телеком, маркетплейсы, финансы, медиа и развлечения, healthtech, государственный сектор.

Юридическое лицо и регуляторика

Контактный адрес — 812 W Dana St, Mountain View, CA 94041 (США). По Terms of Service применимое право — Province of Ontario, Канада, и федеральные законы Канады. Privacy Policy effective с 10 мая 2024 г., обработка платежей — Stripe, хостинг данных — США. Для Enterprise-клиентов заявлен SOC 2.

Видеообзор Resemble AI

Плюсы и минусы Resemble AI

+Преимущества

  • Единственная платформа, объединяющая Generate + Verify + Detect для AI-голоса (по позиционированию сайта)
  • DETECT-3B-Omni — 96,7% точности на 51+ языке, лидер HuggingFace по речи и изображениям
  • Chatterbox Turbo — выигрывает blind A/B vs ElevenLabs / VibeVoice / Cartesia / Qwen 3 (по данным сайта)
  • 6 продуктов в линейке (TTS, Voice Creation, Audio, STS, Identity, Watermarker, Detect, Meetings, Chrome Extension)
  • Pay-as-you-go Flex от $0 — без минимальных платежей, кредиты не сгорают
  • Прозрачные per-second тарифы (TTS $0,0005/сек, audio detection $0,001/сек)
  • Enterprise: SOC 2, SSO/SAML, on-premise развёртывание для корпоративной безопасности
  • Volume-скидки до 80% для крупных клиентов
  • Полный REST API и SDKs во всех тарифах
  • Resemble Detect доступен прямо в Chrome через расширение
  • Use cases ориентированы на финансы, телеком, healthtech, маркетплейсы, госсектор

Недостатки

  • Сайт и интерфейс только на английском
  • Юрлицо в Канаде (Ontario), хостинг в США — для российских компаний и юрлиц возможны сложности с международными платежами и compliance
  • Per-second pricing требует моделирования бюджета — для постоянных нагрузок выгоднее Enterprise volume-discount
  • SOC 2 и on-premise доступны только в Enterprise-тарифе
  • Voice cloning add-ons оплачиваются отдельно ($2–5/мес за голос)
  • Качество клонирования зависит от исходных аудиоданных и согласия владельца голоса (требуется явное согласие по Terms)

Сценарии использования Resemble AI

1

Голосовые AI-агенты (Voice agents)

Развёртывание AI-агентов для входящих и исходящих коммуникаций по цене $0,001/сек. Используются в колл-центрах, маркетплейсах, телеком-операторах.

2

Защита от подделки голоса руководителей (Executive impersonation)

CFO-scams и подделка голоса топ-менеджеров — заявлены сайтом как реальный сценарий ($25M wire fraud с клонированным голосом CFO упомянут в коллаже на главной). Решение — связка Verify (вотермарки) + Detect (DETECT-3B-Omni) + identity verification.

3

Верификация голосовых записей в спорах и страховых кейсах

Dispute & claim verification — анализ голосовых записей на признаки AI-генерации для финансовых, страховых и юридических компаний.

4

Невидимый медиа-вотермаркинг

Resemble Watermarker наносит невидимый, индестрактибельный вотермарк, который остаётся в файле после редактирования, перекодирования и распространения. Для медиа-компаний и контент-команд.

5

Identity verification и KYC

Голосовая идентификация и контроль личности через Resemble Identity и Resemblyzer. Применяется в банкинге, телекоме, маркетплейсах и госсекторе.

6

Live agent assist для контакт-центров

Голосовая помощь живым операторам в реальном времени, рекомендации, скрипты и анализ диалога во время разговора.

7

Защита от дипфейков прямо в браузере

Deepfake Detection Chrome Extension — детектирует AI-сгенерированный контент во время веб-сёрфинга. Подходит для журналистов, security-команд и обычных пользователей.

Доверие и масштаб

DETECT-3B-Omni — самый точный аудио-детектор дипфейков в мире по публичным бенчмаркам (заявление сайта): 96,7% точности на 51+ языке, #1 на HuggingFace для речи и изображений. Battle-tested против 160+ генеративных AI-моделей. Threat Report 2025: 1 567 верифицированных инцидентов, $1,28 млрд документированного фрода (менее 20% инцидентов содержат документированный фрод).
Аудитория
Заявлено: тысячи разработчиков и enterprise-клиентов
Масштаб провайдера
6 продуктов в линейке + Chrome Extension; 7 собственных моделей (Chatterbox / Chatterbox Turbo / Chatterbox Multilingual / Resemblyzer / PerTh / DETECT-3B-Omni / Detect 2B)
Кейсы
  • Public benchmarks DETECT-3B-Omni96,7% accuracy across 51+ languages, #1 on HuggingFace для speech и image
  • Chatterbox Turbo TTSВыигрывает blind A/B vs ElevenLabs / VibeVoice 7B / Cartesia Sonic 3 / Qwen 3 TTS

Отзывы о Resemble AI

Поделитесь опытом использования

Помогите другим сделать правильный выбор — ваш отзыв будет полезен

Часто задаваемые вопросы о Resemble AI

?Что такое Resemble AI и какие задачи решает?

Resemble AI (resemble.ai) — единственная платформа, которая по позиционированию сайта одновременно генерирует, верифицирует и детектирует AI-сгенерированный контент через все три модальности (аудио, изображение, видео). Три продуктовые линии: Generate (TTS, voice cloning, voice changer), Verify (вотермаркинг), Detect (детекция дипфейков). Доступно в облаке и on-premise. Основано в 2019 году Zohaib Ahmed и Saqib Muhammad.

?Какие модели стоят за Resemble AI?

Восемь собственных моделей: Chatterbox, Chatterbox Turbo, Chatterbox Multilingual и DramaBox (NOW AVAILABLE) — для генерации голоса (TTS); Resemblyzer — для голосовой идентификации; PerTh — для невидимого вотермаркинга; DETECT-3B-Omni и Detect 2B — для детекции дипфейков. Chatterbox Turbo по заявлению сайта выигрывает blind A/B-тестирование TTS-качества против ElevenLabs, VibeVoice 7B, Cartesia Sonic 3 и Qwen 3 TTS (~2 500 оценок для основных конкурентов; для Qwen 3 — ~150 оценок).

?Насколько точна детекция дипфейков (DETECT-3B-Omni)?

По публичным бенчмаркам, заявленным на сайте: DETECT-3B-Omni — самый точный аудио-детектор дипфейков в мире, с точностью 96,7% на 51+ языке. #1 на HuggingFace для речи и изображений. Battle-tested против 160+ генеративных AI-моделей. Поддерживает форматы WAV, FLAC, MP3, WEBM, M4A, OGG.

?Сколько стоит Resemble AI?

Два тарифа. Flex Plan — pay-as-you-go от $0 для старта, кредиты не сгорают. Voice generation: TTS $0,0005/сек, Voice agents $0,001/сек, AI voice changer $0,0005/сек. Audio processing: Speech-to-text $0,001/сек, Audio enhancement $0,002/сек, Audio editing $0,0005/сек. Deepfake detection: Audio $0,04/сек, Video $0,07/сек, Image $0,04/сек. Intelligence analysis (углублённый анализ): Audio/Video/Image — по $0,03/сек. Additional: Identity search $0,0005 за поиск, Watermark encode $0,0005/сек, Watermark decode $0,0002/сек. Add-ons: Team Seats $20/мес/пользователь, Rapid voice clone $2/мес/голос, Pro voice clone $5/мес/голос, Voice design $2/мес/голос. Enterprise — custom-цены, volume-скидки до 80%, SOC 2, SSO/SAML, on-premise развёртывание, custom model training, dedicated support. По данным FAQ сайта: если бюджет на Flex превышает $500/мес — выгоднее перейти на Enterprise.

?Что такое DramaBox TTS?

DramaBox — новая модель Resemble AI для генерации голоса, заявлена в шапке сайта как «NOW AVAILABLE: DRAMABOX TEXT-TO-SPEECH». По названию и позиционированию — модель для длинной нарративной подачи в драм-формате (длинные аудио-сценарии, эмоциональная подача, актёрское чтение). Доступна на Flex Plan по стандартной TTS-ставке $0,0005/сек. Дополняет линейку Chatterbox (general-purpose), Chatterbox Turbo (быстрая генерация) и Chatterbox Multilingual (мультиязык).

?Что в 2025 Deepfake Threat Report?

Resemble AI публикует ежегодный отчёт о масштабе и характере дипфейк-атак с прогнозами на 2026 год. По данным отчёта 2025: 1 567 верифицированных инцидентов, $1,28 млрд документированного финансового ущерба; при этом менее 20% инцидентов содержат документированный фрод (остальные — атаки на репутацию, дезинформация, не-финансовые). Отчёт бесплатно скачивается на сайте, позиционируется как «must read для каждого security-лидера».

?Какие use cases поддерживаются?

По разделу Solutions сайт прямо называет шесть use cases: voice agents (голосовые AI-агенты), dispute & claim verification (проверка голосовых записей), executive impersonation defense (защита от подделки голоса руководителей), media watermarking, live agent assist (помощь живым операторам), identity verification & KYC. Индустрии: телеком, маркетплейсы, финансы, медиа и развлечения, healthtech, госсектор.

?Что такое Verify и как работает вотермаркинг?

Resemble Watermarker наносит невидимый, индестрактибельный вотермарк на аудио-, видео- и image-файлы. Вотермарк остаётся в файле после редактирования, перекодирования и распространения — это позволяет позже доказать происхождение контента и детектировать модификации. Resemble Identity — отдельный продукт для голосовой идентификации, основанный на модели Resemblyzer.

?Есть ли Chrome-расширение?

Да, на сайте заявлено «Deepfake Detection Chrome Extension — NOW AVAILABLE». Это бесплатное расширение для Google Chrome, которое детектирует AI-сгенерированный контент прямо во время веб-сёрфинга — подходит для журналистов, security-команд и обычных пользователей.

?Можно ли клонировать чужой голос?

По Terms of Service Resemble AI: «We may require consent from the individual or third party whose voice is being cloned. Consent needs to be verbal, unless otherwise stated by Resemble.» То есть для клонирования чужого голоса требуется явное согласие владельца. Без согласия запрещено по разделу 8 (Acceptable Use). При клонировании собственного голоса — никаких ограничений сверх стандартного workflow.

?Где юрлицо и где хранятся данные?

Контактный адрес: 812 W Dana St, Mountain View, CA 94041 (США). По Terms of Service применимое право — Province of Ontario, Канада, и федеральные законы Канады. Хостинг и обработка данных — США. Privacy Policy effective с 10 мая 2024 г. Платежи — через Stripe. На сайте есть Data breach policy, Data processing agreement и Trust Center. Для Enterprise-клиентов — SOC 2 и enterprise SLA.

?Какие альтернативы стоит сравнить?

На самом сайте Resemble AI есть страницы прямого сравнения: для voice generation — vs ElevenLabs, vs Descript, vs WellSaid; для deepfake detection — vs Pindrop, vs Reality Defender, vs Sensity. В нашем каталоге доступны прямые конкуренты ElevenLabs (TTS-лидер), Descript (audio/video editor с AI-голосом), LALAL.AI (другая AI-стек для voice cleaning, splitting, cloning).

Обновлено: 23 мая 2026 г.