Логотип SpeechGen

SpeechGen

Бесплатный тариф

AI Text-to-Speech: 5 000+ нейросетевых голосов, 150+ языков, экспорт MP3/WAV/FLAC. Pay-as-you-go без подписки от $4.99, Smart Cache, многоголосый диалог, фоновая музыка, REST API.

speechgen.io

Основная информация

Страна
Гонконг
Развёртывание
Облако
Языки
Русский, Английский (US/UK) +17
Поддержка
Email, Telegram (поддержка и админ) +1
Стоимость
Бесплатно
Пробный период
Бесплатный тариф

Технические характеристики

Количество голосов
5 000+
Количество языков
150+ языков и региональных акцентов
Тарификация голосов
Standard (1 лимит = 2 символа) · Pro (1 = 1) · HD (1 = 0.5)
Лимит символов на генерацию
2 000 000 символов за одну генерацию
Поддерживаемые аудиоформаты
MP3, WAV, FLAC, OGG, OPUS
Диапазон скорости речи
от 0.1× до 2.2×
Диапазон высоты голоса
от −20 до +20 (шаг 2)
Многоголосый диалог
Да — Dialog mode, до неограниченного количества спикеров
Smart Cache (повторное использование)
7 дней — бесплатная регенерация неизменённых предложений
История проектов
30 дней (избранное — постоянно)
Фоновая музыка
Встроенная AI-библиотека + загрузка своих треков
Поддержка SSML
<break>, <emphasis>, <prosody>, <sound> (зависит от голоса)
API
REST API (n8n, Make, Zapier-совместим)
Форматы загрузки файлов
TXT, DOCX, PDF, SRT
Коммерческая лицензия
Включена во все тарифы (включая бесплатный)

Безопасность и compliance

Соответствие законам
Юрисдикция Гонконг (Bueno Ltd., рег. № 68920709)

Поддержка и SLA

Каналы поддержки
Email: speechgen.io@gmail.comEmail (юридический): admin@speechgen.ioTelegram support: @speechgenTelegram admin: @Speechgen_alexGitHub

Интеграции SpeechGen (REST API + готовые коннекторы + 3 SDK+)

Категории интеграций
AutomationCMSSDKPaymentVideo editors
Ключевые интеграции
  • n8nAutomation
  • Make (Integromat)Automation
  • ZapierAutomation
  • WordPressCMS
  • Python SDKSDK
  • PayPalPayment
  • StripePayment
  • Premiere Pro / DaVinci Resolve / CapCut / Final Cut Pro / iMovie / CamtasiaVideo editors (через экспорт MP3/WAV)

Тарифы SpeechGen

Free (без регистрации)

Бесплатно
  • 1 000 символов мгновенно без регистрации
  • Без водяных знаков
  • Коммерческая лицензия включена
  • Все форматы экспорта (MP3, WAV, FLAC, OGG)
  • Файлы доступны 24 часа

Free (после регистрации)

Бесплатно
  • +1 000 лимитов сразу после подтверждения email
  • +3 000 символов в день на 7 дней
  • Все 5 000+ голосов доступны для прослушивания
  • История проектов 30 дней
  • Коммерческая лицензия включена

25 000 лимитов

$4,99
  • 25 000 лимитов = 50 000 символов Standard / 25 000 Pro / 12 500 HD
  • или ~180 минут транскрипции
  • Срок действия лимитов — до 1 года
  • Smart Cache, многоголосый диалог, SSML, фоновая музыка
  • REST API + WordPress + Python
  • Stripe (карта) или PayPal

65 000 лимитов (Popular)

Популярный
$9,99
  • 65 000 лимитов = 130 000 символов Standard / 65 000 Pro / 32 500 HD
  • или ~467 минут транскрипции
  • Всё из тарифа 25K + повышенный лимит

200 000 лимитов (Cost-effective)

$24,99
  • 200 000 лимитов = 400 000 символов Standard / 200 000 Pro / 100 000 HD
  • или ~1 437 минут транскрипции
  • Всё из тарифа 65K + повышенный лимит

500 000 лимитов

$49,99
  • 500 000 лимитов = 1 000 000 символов Standard / 500 000 Pro / 250 000 HD
  • или ~3 592 минуты транскрипции
  • Всё из тарифа 200K + максимальная скидка
Сравнение тарифов SpeechGen
ТарифЦена
Free (без регистрации)Бесплатно
Free (после регистрации)Бесплатно
25 000 лимитов$4,99
65 000 лимитов (Popular)TOP$9,99
200 000 лимитов (Cost-effective)$24,99
500 000 лимитов$49,99

Обзор SpeechGen

Что такое SpeechGen

SpeechGen — AI-генератор голоса с 5 000+ реалистичными голосами на 150+ языках. По данным сайта, через сервис прошло 700+ млн сгенерированных файлов и 500 000+ пользователей, в том числе 70 000 бизнес-аккаунтов из 22 индустрий — от маркетинга и видеопродакшна до промышленной безопасности, аудиогидов и локализации. Операторская компания — Bueno Ltd. (Гонконг, регистрационный номер 68920709).

Модель оплаты — pay-as-you-go без подписки

В отличие от ежемесячных подписок ($22–$99/мес у конкурентов), SpeechGen работает по модели оплаты за пакет лимитов: 25 000 / 65 000 / 200 000 / 500 000 лимитов за $4.99 / $9.99 / $24.99 / $49.99 соответственно. Купленные лимиты живут до 1 года (365 дней), а при каждом пополнении срок сбрасывается. Доступны Stripe (карта) и PayPal, выписка доступна в личном кабинете.

Три уровня качества голосов

  • Standard — 1 лимит = 2 символа (самый экономный, для внутренних задач, черновиков, массового контента).
  • Pro — 1 лимит = 1 символ (для YouTube, e-learning, маркетинга).
  • HD — 1 лимит = 0.5 символа (студийное качество, нейросетевые голоса с эмоциями — для broadcast, премиум-видео).

Smart Cache — бесплатные регенерации

Каждое предложение сохраняется в кеш на 7 дней. Если перегенерируешь тот же текст или меняешь только одно предложение — неизменённые фрагменты не списываются с баланса. История проектов хранится 30 дней, избранные файлы — постоянно. Для незарегистрированных пользователей файлы доступны 24 часа.

Продакшн-редактор в одной вкладке

  • Многоголосый диалог — несколько спикеров в одном файле через теги <Name>: интервью, диалоги, аудиокниги с персонажами.
  • Фоновая музыка — встроенная AI-библиотека плюс загрузка собственных треков, микс на нужном уровне без выхода в DAW.
  • Audio Cut — тег <cut/> разбивает текст на отдельные аудиофайлы (до 1 000 сегментов на генерацию для коротких, до 500 для длинных). Загружаешь книгу → получаешь файл на каждую главу.
  • SSML — теги <break time="2s"/>, <emphasis level="strong">, <prosody rate="slow"> и <sound id="..."/> для точного контроля пауз, ударений и звуковых эффектов.
  • Графики интонации — на части голосов можно перетаскивать точки интонационного контура для тонкой настройки фразы.

Лимиты, форматы и параметры

  • До 2 000 000 символов за одну генерацию (≈ 285 000–330 000 слов).
  • Форматы экспорта: MP3, WAV, FLAC, OGG, OPUS.
  • Частота дискретизации: от 8 000 до 44 000 Гц.
  • Битрейт: 8–64 kbps (телефон/IVR), 64–128 kbps (YouTube/подкасты), 192–320 kbps (broadcast/DAW/архив).
  • Скорость: от 0.1× до 2.2×. Высота голоса: от −20 до +20 с шагом 2.
  • Паузы: от 150 мс до 30 с между предложениями и абзацами.
  • Загрузка файлов: TXT, DOCX, PDF, SRT.

Бесплатный тариф без водяных знаков

1 000 символов мгновенно без регистрации и без привязки карты. После бесплатной регистрации (через Gmail/Yahoo/Hotmail) сразу зачисляется 1 000 лимитов + ежедневно обновляющиеся 3 000 символов на 7 дней. Без водяных знаков даже на бесплатном тарифе и со встроенной коммерческой лицензией.

Коммерческая лицензия и ограничения контента

Коммерческая лицензия включена во все тарифы, включая бесплатный. Полученное аудио можно публиковать в YouTube, рекламе, приложениях, e-learning. По условиям использования запрещено: имитировать голос или образ политиков и госслужащих (даже с их согласия); скрывать синтетическую природу аудио; выдавать себя за реальное лицо/компанию без разрешения; использовать в финансовых, медицинских, юридических, политических или духовных материалах для повышения авторитета; разжигать ненависть/дискриминацию/насилие; создавать сексуально явный контент или эксплуатировать детей; делать массовые звонки/спам; маскировать политические позиции; распространять контент без указания источников.

API и интеграции

REST API — один HTTP-запрос возвращает URL готового аудио. Совместим с n8n, Make, Zapier и любым приложением, работающим с JSON. Отдельно есть WordPress TTS Plugin, Python TTS SDK и API for Subtitle для автоматизированной озвучки SRT/VTT с посекундным таймингом.

Возвраты и юридические нюансы

Возврат средств возможен только в течение 24 часов после покупки и при условии, что использовано не более 3 000 символов. Создание нескольких аккаунтов запрещено. Возврат за неиспользованные лимиты не производится — покупка любого пакета подтверждает намерение полностью использовать его на озвучку.

Плюсы и минусы SpeechGen

+Преимущества

  • Один из самых широких каталогов: 5 000+ голосов на 150+ языках
  • Pay-as-you-go без подписки — платишь только за то, что нужно
  • Купленные лимиты живут до 1 года (vs ежемесячное «сгорание» у конкурентов)
  • Smart Cache: повторная генерация того же текста бесплатна
  • Коммерческая лицензия и отсутствие водяных знаков во ВСЕХ тарифах
  • 1 000 символов бесплатно без регистрации и без карты
  • 3 тира качества (Standard/Pro/HD) — гибкий баланс цена/качество
  • Многоголосый диалог в одном файле без склейки в DAW
  • Audio Cut: один скрипт → до 1 000 отдельных файлов автоматически
  • Встроенная фоновая музыка и SSML — полный продакшн в одной вкладке
  • 2 000 000 символов на одну генерацию — целые книги без разбивки
  • REST API + готовые интеграции с n8n, Make, Zapier, WordPress

Недостатки

  • Юрисдикция — Гонконг (Bueno Ltd.), оплата только в USD через Stripe и PayPal
  • Российские карты могут не приниматься напрямую — нужно уточнять у поддержки
  • Возврат средств только в течение 24 часов и при использовании ≤ 3 000 символов
  • Файлы незарегистрированных пользователей хранятся всего 24 часа
  • История зарегистрированных проектов — 30 дней (избранное — постоянно)
  • Создание нескольких аккаунтов запрещено
  • HD-голоса расходуют в 4 раза больше лимитов, чем Standard
  • Не все голоса поддерживают полный набор SSML-тегов
  • Интерфейс на английском (русские голоса есть, но UI без локализации в полном объёме)

Сценарии использования SpeechGen

1

Маркетинг и видеопродакшн (727 компаний)

Озвучка для запуска SaaS-видео с 48-часовым дедлайном без кастинга диктора: один голос, MP3, скорость 1.1× — готово в один клик. Локализация роликов на 12 рынков из одного SRT за один день.

2

E-Learning и онлайн-обучение (381 компания)

Двуязычные упражнения EN + ES в одном аудио, разбивка по урокам через <cut/> — 50 MP3 из одного скрипта. 90 cognitive exercises на 2 языках за 3 месяца ежедневного контента.

3

Бизнес-телефония и IVR (233 компании)

Двуязычный IVR для сети из 5 ветклиник в Атланте (EN + ES) с обновлением за 30 секунд. MP3 64 kbps, профессиональный тон, апдейт прямо в админке без подрядчика.

4

Аудиогиды и музейные туры (127 компаний)

18-минутный аудиогид по историческому зданию с двумя дикторами и фоновой музыкой в одном файле. Винодельня в Тоскане — 45 минут на 3 языках за один день.

5

Промышленная безопасность (473 компании)

PA-оповещения для склада 15 000 м² на 6 языках, auto-trigger через API по событию сенсоров. Решает языковой барьер для смешанных команд в полевых условиях.

6

Локализация и экспорт (408 компаний)

Аудиогид для выставки локализован на 5 языков из одного скрипта: SRT-загрузка → выбор голоса для каждого языка → один клик. Не нужно нанимать local-дикторов в каждой стране.

Доверие и масштаб

Аудитория
500 000+ пользователей (по странице Pricing FAQ заявлено также «1M+ users»)
Масштаб провайдера
700 000 000+ сгенерированных файлов

Отзывы о SpeechGen

Поделитесь опытом использования

Помогите другим сделать правильный выбор — ваш отзыв будет полезен

Часто задаваемые вопросы о SpeechGen

?Что такое SpeechGen?

SpeechGen — онлайн-сервис AI Text-to-Speech от Bueno Ltd. (Гонконг) с 5 000+ нейросетевыми голосами на 150+ языках. Превращает текст в реалистичную речь и отдаёт MP3/WAV/FLAC/OGG/OPUS. По данным сайта, через сервис прошло 700+ млн сгенерированных файлов и 500 000+ пользователей, в том числе 70 000 бизнес-аккаунтов из 22 индустрий.

?Как работает оплата — есть подписка?

Нет подписки. SpeechGen работает по модели pay-as-you-go: покупаешь пакет лимитов и тратишь когда нужно. Пакеты — 25 000 / 65 000 / 200 000 / 500 000 лимитов за $4.99 / $9.99 / $24.99 / $49.99. Один баланс тратится на TTS любого тира и на транскрипцию. Купленные лимиты живут до 1 года, при каждом пополнении срок сбрасывается. Оплата — Stripe (карта) или PayPal, выписка доступна в личном кабинете.

?Чем отличаются Standard, Pro и HD голоса?

Это три уровня качества с разной стоимостью в лимитах. Standard — 1 лимит = 2 символа, самый экономный (внутренние документы, черновики, массовый контент). Pro — 1 лимит = 1 символ, базовый профессиональный уровень (YouTube, e-learning, маркетинг). HD — 1 лимит = 0.5 символа, студийное качество с нейросетевыми голосами и реалистичной эмоциональностью (broadcast, премиум-видео). HD стоит в 4 раза дороже Standard за тот же объём текста.

?Можно ли использовать аудио в коммерции?

Да. Коммерческая лицензия включена во все тарифы, включая бесплатный. Готовое аудио можно публиковать в YouTube, рекламе, приложениях, e-learning курсах — без водяных знаков. Запрещено: имитировать голос политиков/госслужащих (даже с их согласия), скрывать синтетическую природу аудио, выдавать себя за реальное лицо, использовать в финансовых/медицинских/юридических/политических материалах для повышения авторитета, разжигать ненависть, эксплуатировать детей, делать массовые звонки/спам.

?Что такое Smart Cache?

Каждое предложение сохраняется в кеш на 7 дней. Если перегенерируешь тот же текст или меняешь только одно предложение — все неизменённые фрагменты не списываются с баланса. Это позволяет итеративно редактировать длинные тексты, не тратя лимиты на повторы. История проектов хранится 30 дней, избранные файлы — постоянно.

?Какой максимальный размер текста за одну генерацию?

До 2 000 000 символов (≈ 285 000–330 000 слов) — можно вставить целую книгу или большой объём документации. Очень длинные тексты автоматически разбиваются на сегменты. Через тег <cut/> можно разбить генерацию на отдельные файлы (до 1 000 сегментов для коротких, до 500 — для длинных).

?Есть ли API и интеграции?

Да. REST API — один HTTP-запрос возвращает URL готового аудио. Совместим с n8n, Make, Zapier и любым приложением, работающим с JSON. Дополнительно: WordPress TTS Plugin, Python TTS SDK, API for Subtitle для автоматизированной озвучки SRT/VTT с посекундным таймингом.

?Работает ли SpeechGen в России?

Сайт доступен, русский язык поддерживается среди 150+. Юр.лицо — Bueno Ltd. (Гонконг). Оплата идёт через Stripe (карта) и PayPal. Сайт явно не подтверждает приём российских банковских карт — лучше уточнить у поддержки speechgen.io@gmail.com или в Telegram @speechgen перед покупкой пакета.

?Как работает возврат средств?

Возврат возможен только в течение 24 часов после покупки и при условии, что использовано не более 3 000 символов. Если потратил больше 3 000 символов — возврат не оформляется. За неиспользованные лимиты после истечения 1 года возврата тоже нет.

?Какие форматы и битрейты доступны?

Форматы: MP3, WAV, FLAC, OGG, OPUS. Частота дискретизации: от 8 000 до 44 000 Гц. Битрейт: 8–64 kbps (телефон/IVR), 64–128 kbps (YouTube/подкасты), 192–320 kbps (broadcast/DAW/архив). Скорость регулируется от 0.1× до 2.2×, высота голоса от −20 до +20 с шагом 2, паузы между предложениями/абзацами — от 150 мс до 30 с.

Обновлено: 23 мая 2026 г.