
SpeechGen
Бесплатный тарифAI Text-to-Speech: 5 000+ нейросетевых голосов, 150+ языков, экспорт MP3/WAV/FLAC. Pay-as-you-go без подписки от $4.99, Smart Cache, многоголосый диалог, фоновая музыка, REST API.
Основная информация
Технические характеристики
- Количество голосов
- 5 000+
- Количество языков
- 150+ языков и региональных акцентов
- Тарификация голосов
- Standard (1 лимит = 2 символа) · Pro (1 = 1) · HD (1 = 0.5)
- Лимит символов на генерацию
- 2 000 000 символов за одну генерацию
- Поддерживаемые аудиоформаты
- MP3, WAV, FLAC, OGG, OPUS
- Диапазон скорости речи
- от 0.1× до 2.2×
- Диапазон высоты голоса
- от −20 до +20 (шаг 2)
- Многоголосый диалог
- Да — Dialog mode, до неограниченного количества спикеров
- Smart Cache (повторное использование)
- 7 дней — бесплатная регенерация неизменённых предложений
- История проектов
- 30 дней (избранное — постоянно)
- Фоновая музыка
- Встроенная AI-библиотека + загрузка своих треков
- Поддержка SSML
- <break>, <emphasis>, <prosody>, <sound> (зависит от голоса)
- API
- REST API (n8n, Make, Zapier-совместим)
- Форматы загрузки файлов
- TXT, DOCX, PDF, SRT
- Коммерческая лицензия
- Включена во все тарифы (включая бесплатный)
Безопасность и compliance
Поддержка и SLA
Интеграции SpeechGen (REST API + готовые коннекторы + 3 SDK+)
- n8n— Automation
- Make (Integromat)— Automation
- Zapier— Automation
- WordPress— CMS
- Python SDK— SDK
- PayPal— Payment
- Stripe— Payment
- Premiere Pro / DaVinci Resolve / CapCut / Final Cut Pro / iMovie / Camtasia— Video editors (через экспорт MP3/WAV)
Тарифы SpeechGen
Free (без регистрации)
- ✓1 000 символов мгновенно без регистрации
- ✓Без водяных знаков
- ✓Коммерческая лицензия включена
- ✓Все форматы экспорта (MP3, WAV, FLAC, OGG)
- ✓Файлы доступны 24 часа
Free (после регистрации)
- ✓+1 000 лимитов сразу после подтверждения email
- ✓+3 000 символов в день на 7 дней
- ✓Все 5 000+ голосов доступны для прослушивания
- ✓История проектов 30 дней
- ✓Коммерческая лицензия включена
25 000 лимитов
- ✓25 000 лимитов = 50 000 символов Standard / 25 000 Pro / 12 500 HD
- ✓или ~180 минут транскрипции
- ✓Срок действия лимитов — до 1 года
- ✓Smart Cache, многоголосый диалог, SSML, фоновая музыка
- ✓REST API + WordPress + Python
- ✓Stripe (карта) или PayPal
65 000 лимитов (Popular)
Популярный- ✓65 000 лимитов = 130 000 символов Standard / 65 000 Pro / 32 500 HD
- ✓или ~467 минут транскрипции
- ✓Всё из тарифа 25K + повышенный лимит
200 000 лимитов (Cost-effective)
- ✓200 000 лимитов = 400 000 символов Standard / 200 000 Pro / 100 000 HD
- ✓или ~1 437 минут транскрипции
- ✓Всё из тарифа 65K + повышенный лимит
500 000 лимитов
- ✓500 000 лимитов = 1 000 000 символов Standard / 500 000 Pro / 250 000 HD
- ✓или ~3 592 минуты транскрипции
- ✓Всё из тарифа 200K + максимальная скидка
| Тариф | Цена |
|---|---|
| Free (без регистрации) | Бесплатно |
| Free (после регистрации) | Бесплатно |
| 25 000 лимитов | $4,99 |
| 65 000 лимитов (Popular)TOP | $9,99 |
| 200 000 лимитов (Cost-effective) | $24,99 |
| 500 000 лимитов | $49,99 |
Обзор SpeechGen
Что такое SpeechGen
SpeechGen — AI-генератор голоса с 5 000+ реалистичными голосами на 150+ языках. По данным сайта, через сервис прошло 700+ млн сгенерированных файлов и 500 000+ пользователей, в том числе 70 000 бизнес-аккаунтов из 22 индустрий — от маркетинга и видеопродакшна до промышленной безопасности, аудиогидов и локализации. Операторская компания — Bueno Ltd. (Гонконг, регистрационный номер 68920709).
Модель оплаты — pay-as-you-go без подписки
В отличие от ежемесячных подписок ($22–$99/мес у конкурентов), SpeechGen работает по модели оплаты за пакет лимитов: 25 000 / 65 000 / 200 000 / 500 000 лимитов за $4.99 / $9.99 / $24.99 / $49.99 соответственно. Купленные лимиты живут до 1 года (365 дней), а при каждом пополнении срок сбрасывается. Доступны Stripe (карта) и PayPal, выписка доступна в личном кабинете.
Три уровня качества голосов
- Standard — 1 лимит = 2 символа (самый экономный, для внутренних задач, черновиков, массового контента).
- Pro — 1 лимит = 1 символ (для YouTube, e-learning, маркетинга).
- HD — 1 лимит = 0.5 символа (студийное качество, нейросетевые голоса с эмоциями — для broadcast, премиум-видео).
Smart Cache — бесплатные регенерации
Каждое предложение сохраняется в кеш на 7 дней. Если перегенерируешь тот же текст или меняешь только одно предложение — неизменённые фрагменты не списываются с баланса. История проектов хранится 30 дней, избранные файлы — постоянно. Для незарегистрированных пользователей файлы доступны 24 часа.
Продакшн-редактор в одной вкладке
- Многоголосый диалог — несколько спикеров в одном файле через теги
<Name>: интервью, диалоги, аудиокниги с персонажами. - Фоновая музыка — встроенная AI-библиотека плюс загрузка собственных треков, микс на нужном уровне без выхода в DAW.
- Audio Cut — тег
<cut/>разбивает текст на отдельные аудиофайлы (до 1 000 сегментов на генерацию для коротких, до 500 для длинных). Загружаешь книгу → получаешь файл на каждую главу. - SSML — теги
<break time="2s"/>,<emphasis level="strong">,<prosody rate="slow">и<sound id="..."/>для точного контроля пауз, ударений и звуковых эффектов. - Графики интонации — на части голосов можно перетаскивать точки интонационного контура для тонкой настройки фразы.
Лимиты, форматы и параметры
- До 2 000 000 символов за одну генерацию (≈ 285 000–330 000 слов).
- Форматы экспорта: MP3, WAV, FLAC, OGG, OPUS.
- Частота дискретизации: от 8 000 до 44 000 Гц.
- Битрейт: 8–64 kbps (телефон/IVR), 64–128 kbps (YouTube/подкасты), 192–320 kbps (broadcast/DAW/архив).
- Скорость: от 0.1× до 2.2×. Высота голоса: от −20 до +20 с шагом 2.
- Паузы: от 150 мс до 30 с между предложениями и абзацами.
- Загрузка файлов: TXT, DOCX, PDF, SRT.
Бесплатный тариф без водяных знаков
1 000 символов мгновенно без регистрации и без привязки карты. После бесплатной регистрации (через Gmail/Yahoo/Hotmail) сразу зачисляется 1 000 лимитов + ежедневно обновляющиеся 3 000 символов на 7 дней. Без водяных знаков даже на бесплатном тарифе и со встроенной коммерческой лицензией.
Коммерческая лицензия и ограничения контента
Коммерческая лицензия включена во все тарифы, включая бесплатный. Полученное аудио можно публиковать в YouTube, рекламе, приложениях, e-learning. По условиям использования запрещено: имитировать голос или образ политиков и госслужащих (даже с их согласия); скрывать синтетическую природу аудио; выдавать себя за реальное лицо/компанию без разрешения; использовать в финансовых, медицинских, юридических, политических или духовных материалах для повышения авторитета; разжигать ненависть/дискриминацию/насилие; создавать сексуально явный контент или эксплуатировать детей; делать массовые звонки/спам; маскировать политические позиции; распространять контент без указания источников.
API и интеграции
REST API — один HTTP-запрос возвращает URL готового аудио. Совместим с n8n, Make, Zapier и любым приложением, работающим с JSON. Отдельно есть WordPress TTS Plugin, Python TTS SDK и API for Subtitle для автоматизированной озвучки SRT/VTT с посекундным таймингом.
Возвраты и юридические нюансы
Возврат средств возможен только в течение 24 часов после покупки и при условии, что использовано не более 3 000 символов. Создание нескольких аккаунтов запрещено. Возврат за неиспользованные лимиты не производится — покупка любого пакета подтверждает намерение полностью использовать его на озвучку.
Плюсы и минусы SpeechGen
+Преимущества
- ✓Один из самых широких каталогов: 5 000+ голосов на 150+ языках
- ✓Pay-as-you-go без подписки — платишь только за то, что нужно
- ✓Купленные лимиты живут до 1 года (vs ежемесячное «сгорание» у конкурентов)
- ✓Smart Cache: повторная генерация того же текста бесплатна
- ✓Коммерческая лицензия и отсутствие водяных знаков во ВСЕХ тарифах
- ✓1 000 символов бесплатно без регистрации и без карты
- ✓3 тира качества (Standard/Pro/HD) — гибкий баланс цена/качество
- ✓Многоголосый диалог в одном файле без склейки в DAW
- ✓Audio Cut: один скрипт → до 1 000 отдельных файлов автоматически
- ✓Встроенная фоновая музыка и SSML — полный продакшн в одной вкладке
- ✓2 000 000 символов на одну генерацию — целые книги без разбивки
- ✓REST API + готовые интеграции с n8n, Make, Zapier, WordPress
−Недостатки
- ✗Юрисдикция — Гонконг (Bueno Ltd.), оплата только в USD через Stripe и PayPal
- ✗Российские карты могут не приниматься напрямую — нужно уточнять у поддержки
- ✗Возврат средств только в течение 24 часов и при использовании ≤ 3 000 символов
- ✗Файлы незарегистрированных пользователей хранятся всего 24 часа
- ✗История зарегистрированных проектов — 30 дней (избранное — постоянно)
- ✗Создание нескольких аккаунтов запрещено
- ✗HD-голоса расходуют в 4 раза больше лимитов, чем Standard
- ✗Не все голоса поддерживают полный набор SSML-тегов
- ✗Интерфейс на английском (русские голоса есть, но UI без локализации в полном объёме)
Сценарии использования SpeechGen
Маркетинг и видеопродакшн (727 компаний)
Озвучка для запуска SaaS-видео с 48-часовым дедлайном без кастинга диктора: один голос, MP3, скорость 1.1× — готово в один клик. Локализация роликов на 12 рынков из одного SRT за один день.
E-Learning и онлайн-обучение (381 компания)
Двуязычные упражнения EN + ES в одном аудио, разбивка по урокам через <cut/> — 50 MP3 из одного скрипта. 90 cognitive exercises на 2 языках за 3 месяца ежедневного контента.
Бизнес-телефония и IVR (233 компании)
Двуязычный IVR для сети из 5 ветклиник в Атланте (EN + ES) с обновлением за 30 секунд. MP3 64 kbps, профессиональный тон, апдейт прямо в админке без подрядчика.
Аудиогиды и музейные туры (127 компаний)
18-минутный аудиогид по историческому зданию с двумя дикторами и фоновой музыкой в одном файле. Винодельня в Тоскане — 45 минут на 3 языках за один день.
Промышленная безопасность (473 компании)
PA-оповещения для склада 15 000 м² на 6 языках, auto-trigger через API по событию сенсоров. Решает языковой барьер для смешанных команд в полевых условиях.
Локализация и экспорт (408 компаний)
Аудиогид для выставки локализован на 5 языков из одного скрипта: SRT-загрузка → выбор голоса для каждого языка → один клик. Не нужно нанимать local-дикторов в каждой стране.
Доверие и масштаб
Отзывы о SpeechGen
Поделитесь опытом использования
Помогите другим сделать правильный выбор — ваш отзыв будет полезен
Часто задаваемые вопросы о SpeechGen
?Что такое SpeechGen?
SpeechGen — онлайн-сервис AI Text-to-Speech от Bueno Ltd. (Гонконг) с 5 000+ нейросетевыми голосами на 150+ языках. Превращает текст в реалистичную речь и отдаёт MP3/WAV/FLAC/OGG/OPUS. По данным сайта, через сервис прошло 700+ млн сгенерированных файлов и 500 000+ пользователей, в том числе 70 000 бизнес-аккаунтов из 22 индустрий.
?Как работает оплата — есть подписка?
Нет подписки. SpeechGen работает по модели pay-as-you-go: покупаешь пакет лимитов и тратишь когда нужно. Пакеты — 25 000 / 65 000 / 200 000 / 500 000 лимитов за $4.99 / $9.99 / $24.99 / $49.99. Один баланс тратится на TTS любого тира и на транскрипцию. Купленные лимиты живут до 1 года, при каждом пополнении срок сбрасывается. Оплата — Stripe (карта) или PayPal, выписка доступна в личном кабинете.
?Чем отличаются Standard, Pro и HD голоса?
Это три уровня качества с разной стоимостью в лимитах. Standard — 1 лимит = 2 символа, самый экономный (внутренние документы, черновики, массовый контент). Pro — 1 лимит = 1 символ, базовый профессиональный уровень (YouTube, e-learning, маркетинг). HD — 1 лимит = 0.5 символа, студийное качество с нейросетевыми голосами и реалистичной эмоциональностью (broadcast, премиум-видео). HD стоит в 4 раза дороже Standard за тот же объём текста.
?Можно ли использовать аудио в коммерции?
Да. Коммерческая лицензия включена во все тарифы, включая бесплатный. Готовое аудио можно публиковать в YouTube, рекламе, приложениях, e-learning курсах — без водяных знаков. Запрещено: имитировать голос политиков/госслужащих (даже с их согласия), скрывать синтетическую природу аудио, выдавать себя за реальное лицо, использовать в финансовых/медицинских/юридических/политических материалах для повышения авторитета, разжигать ненависть, эксплуатировать детей, делать массовые звонки/спам.
?Что такое Smart Cache?
Каждое предложение сохраняется в кеш на 7 дней. Если перегенерируешь тот же текст или меняешь только одно предложение — все неизменённые фрагменты не списываются с баланса. Это позволяет итеративно редактировать длинные тексты, не тратя лимиты на повторы. История проектов хранится 30 дней, избранные файлы — постоянно.
?Какой максимальный размер текста за одну генерацию?
До 2 000 000 символов (≈ 285 000–330 000 слов) — можно вставить целую книгу или большой объём документации. Очень длинные тексты автоматически разбиваются на сегменты. Через тег <cut/> можно разбить генерацию на отдельные файлы (до 1 000 сегментов для коротких, до 500 — для длинных).
?Есть ли API и интеграции?
Да. REST API — один HTTP-запрос возвращает URL готового аудио. Совместим с n8n, Make, Zapier и любым приложением, работающим с JSON. Дополнительно: WordPress TTS Plugin, Python TTS SDK, API for Subtitle для автоматизированной озвучки SRT/VTT с посекундным таймингом.
?Работает ли SpeechGen в России?
Сайт доступен, русский язык поддерживается среди 150+. Юр.лицо — Bueno Ltd. (Гонконг). Оплата идёт через Stripe (карта) и PayPal. Сайт явно не подтверждает приём российских банковских карт — лучше уточнить у поддержки speechgen.io@gmail.com или в Telegram @speechgen перед покупкой пакета.
?Как работает возврат средств?
Возврат возможен только в течение 24 часов после покупки и при условии, что использовано не более 3 000 символов. Если потратил больше 3 000 символов — возврат не оформляется. За неиспользованные лимиты после истечения 1 года возврата тоже нет.
?Какие форматы и битрейты доступны?
Форматы: MP3, WAV, FLAC, OGG, OPUS. Частота дискретизации: от 8 000 до 44 000 Гц. Битрейт: 8–64 kbps (телефон/IVR), 64–128 kbps (YouTube/подкасты), 192–320 kbps (broadcast/DAW/архив). Скорость регулируется от 0.1× до 2.2×, высота голоса от −20 до +20 с шагом 2, паузы между предложениями/абзацами — от 150 мс до 30 с.
Обновлено: 23 мая 2026 г.