SpeechGen

Бесплатный тариф

AI Text-to-Speech: 5 000+ нейросетевых голосов, 150+ языков, экспорт MP3/WAV/FLAC. Pay-as-you-go без подписки от $4.99, Smart Cache, многоголосый диалог, фоновая музыка, REST API.

speechgen.io

Основная информация

Страна

Гонконг

Развёртывание

Облако

Языки

Русский, Английский (US/UK) +17

Поддержка

Email, Telegram (поддержка и админ) +1

Стоимость

Бесплатно

Пробный период

Бесплатный тариф

Технические характеристики

Количество голосов: 5 000+
Количество языков: 150+ языков и региональных акцентов
Тарификация голосов: Standard (1 лимит = 2 символа) · Pro (1 = 1) · HD (1 = 0.5)
Лимит символов на генерацию: 2 000 000 символов за одну генерацию
Поддерживаемые аудиоформаты: MP3, WAV, FLAC, OGG, OPUS
Диапазон скорости речи: от 0.1× до 2.2×
Диапазон высоты голоса: от −20 до +20 (шаг 2)
Многоголосый диалог: Да — Dialog mode, до неограниченного количества спикеров
Smart Cache (повторное использование): 7 дней — бесплатная регенерация неизменённых предложений
История проектов: 30 дней (избранное — постоянно)
Фоновая музыка: Встроенная AI-библиотека + загрузка своих треков
Поддержка SSML: <break>, <emphasis>, <prosody>, <sound> (зависит от голоса)
API: REST API (n8n, Make, Zapier-совместим)
Форматы загрузки файлов: TXT, DOCX, PDF, SRT
Коммерческая лицензия: Включена во все тарифы (включая бесплатный)

Безопасность и compliance

Соответствие законам

Юрисдикция Гонконг (Bueno Ltd., рег. № 68920709)

Поддержка и SLA

Каналы поддержки

Email: speechgen.io@gmail.comEmail (юридический): admin@speechgen.ioTelegram support: @speechgenTelegram admin: @Speechgen_alexGitHub

Интеграции SpeechGen (REST API + готовые коннекторы + 3 SDK+)

Категории интеграций

AutomationCMSSDKPaymentVideo editors

Ключевые интеграции

n8n— Automation
Make (Integromat)— Automation
Zapier— Automation
WordPress— CMS
Python SDK— SDK
PayPal— Payment
Stripe— Payment
Premiere Pro / DaVinci Resolve / CapCut / Final Cut Pro / iMovie / Camtasia— Video editors (через экспорт MP3/WAV)

Тарифы SpeechGen

Free (без регистрации)

Бесплатно

✓1 000 символов мгновенно без регистрации
✓Без водяных знаков
✓Коммерческая лицензия включена
✓Все форматы экспорта (MP3, WAV, FLAC, OGG)
✓Файлы доступны 24 часа

Free (после регистрации)

Бесплатно

✓+1 000 лимитов сразу после подтверждения email
✓+3 000 символов в день на 7 дней
✓Все 5 000+ голосов доступны для прослушивания
✓История проектов 30 дней
✓Коммерческая лицензия включена

25 000 лимитов

$4,99

✓25 000 лимитов = 50 000 символов Standard / 25 000 Pro / 12 500 HD
✓или ~180 минут транскрипции
✓Срок действия лимитов — до 1 года
✓Smart Cache, многоголосый диалог, SSML, фоновая музыка
✓REST API + WordPress + Python
✓Stripe (карта) или PayPal

65 000 лимитов (Popular)

Популярный

$9,99

✓65 000 лимитов = 130 000 символов Standard / 65 000 Pro / 32 500 HD
✓или ~467 минут транскрипции
✓Всё из тарифа 25K + повышенный лимит

200 000 лимитов (Cost-effective)

$24,99

✓200 000 лимитов = 400 000 символов Standard / 200 000 Pro / 100 000 HD
✓или ~1 437 минут транскрипции
✓Всё из тарифа 65K + повышенный лимит

500 000 лимитов

$49,99

✓500 000 лимитов = 1 000 000 символов Standard / 500 000 Pro / 250 000 HD
✓или ~3 592 минуты транскрипции
✓Всё из тарифа 200K + максимальная скидка

Сравнение тарифов SpeechGen
Тариф	Цена	Пользователи	Ключевые возможности
Free (без регистрации)	Бесплатно	—	1 000 символов мгновенно без регистрации, Без водяных знаков, Коммерческая лицензия включена
Free (после регистрации)	Бесплатно	—	+1 000 лимитов сразу после подтверждения email, +3 000 символов в день на 7 дней, Все 5 000+ голосов доступны для прослушивания
25 000 лимитов	$4,99	—	25 000 лимитов = 50 000 символов Standard / 25 000 Pro / 12 500 HD, или ~180 минут транскрипции, Срок действия лимитов — до 1 года
65 000 лимитов (Popular)TOP	$9,99	—	65 000 лимитов = 130 000 символов Standard / 65 000 Pro / 32 500 HD, или ~467 минут транскрипции, Всё из тарифа 25K + повышенный лимит
200 000 лимитов (Cost-effective)	$24,99	—	200 000 лимитов = 400 000 символов Standard / 200 000 Pro / 100 000 HD, или ~1 437 минут транскрипции, Всё из тарифа 65K + повышенный лимит
500 000 лимитов	$49,99	—	500 000 лимитов = 1 000 000 символов Standard / 500 000 Pro / 250 000 HD, или ~3 592 минуты транскрипции, Всё из тарифа 200K + максимальная скидка

Обзор SpeechGen

Что такое SpeechGen

SpeechGen — AI-генератор голоса с 5 000+ реалистичными голосами на 150+ языках. По данным сайта, через сервис прошло 700+ млн сгенерированных файлов и 500 000+ пользователей, в том числе 70 000 бизнес-аккаунтов из 22 индустрий — от маркетинга и видеопродакшна до промышленной безопасности, аудиогидов и локализации. Операторская компания — Bueno Ltd. (Гонконг, регистрационный номер 68920709).

Модель оплаты — pay-as-you-go без подписки

В отличие от ежемесячных подписок ($22–$99/мес у конкурентов), SpeechGen работает по модели оплаты за пакет лимитов: 25 000 / 65 000 / 200 000 / 500 000 лимитов за $4.99 / $9.99 / $24.99 / $49.99 соответственно. Купленные лимиты живут до 1 года (365 дней), а при каждом пополнении срок сбрасывается. Доступны Stripe (карта) и PayPal, выписка доступна в личном кабинете.

Три уровня качества голосов

Standard — 1 лимит = 2 символа (самый экономный, для внутренних задач, черновиков, массового контента).
Pro — 1 лимит = 1 символ (для YouTube, e-learning, маркетинга).
HD — 1 лимит = 0.5 символа (студийное качество, нейросетевые голоса с эмоциями — для broadcast, премиум-видео).

Smart Cache — бесплатные регенерации

Каждое предложение сохраняется в кеш на 7 дней. Если перегенерируешь тот же текст или меняешь только одно предложение — неизменённые фрагменты не списываются с баланса. История проектов хранится 30 дней, избранные файлы — постоянно. Для незарегистрированных пользователей файлы доступны 24 часа.

Продакшн-редактор в одной вкладке

Многоголосый диалог — несколько спикеров в одном файле через теги <Name>: интервью, диалоги, аудиокниги с персонажами.
Фоновая музыка — встроенная AI-библиотека плюс загрузка собственных треков, микс на нужном уровне без выхода в DAW.
Audio Cut — тег <cut/> разбивает текст на отдельные аудиофайлы (до 1 000 сегментов на генерацию для коротких, до 500 для длинных). Загружаешь книгу → получаешь файл на каждую главу.
SSML — теги <break time="2s"/>, <emphasis level="strong">, <prosody rate="slow"> и <sound id="..."/> для точного контроля пауз, ударений и звуковых эффектов.
Графики интонации — на части голосов можно перетаскивать точки интонационного контура для тонкой настройки фразы.

Лимиты, форматы и параметры

До 2 000 000 символов за одну генерацию (≈ 285 000–330 000 слов).
Форматы экспорта: MP3, WAV, FLAC, OGG, OPUS.
Частота дискретизации: от 8 000 до 44 000 Гц.
Битрейт: 8–64 kbps (телефон/IVR), 64–128 kbps (YouTube/подкасты), 192–320 kbps (broadcast/DAW/архив).
Скорость: от 0.1× до 2.2×. Высота голоса: от −20 до +20 с шагом 2.
Паузы: от 150 мс до 30 с между предложениями и абзацами.
Загрузка файлов: TXT, DOCX, PDF, SRT.

Бесплатный тариф без водяных знаков

1 000 символов мгновенно без регистрации и без привязки карты. После бесплатной регистрации (через Gmail/Yahoo/Hotmail) сразу зачисляется 1 000 лимитов + ежедневно обновляющиеся 3 000 символов на 7 дней. Без водяных знаков даже на бесплатном тарифе и со встроенной коммерческой лицензией.

Коммерческая лицензия и ограничения контента

Коммерческая лицензия включена во все тарифы, включая бесплатный. Полученное аудио можно публиковать в YouTube, рекламе, приложениях, e-learning. По условиям использования запрещено: имитировать голос или образ политиков и госслужащих (даже с их согласия); скрывать синтетическую природу аудио; выдавать себя за реальное лицо/компанию без разрешения; использовать в финансовых, медицинских, юридических, политических или духовных материалах для повышения авторитета; разжигать ненависть/дискриминацию/насилие; создавать сексуально явный контент или эксплуатировать детей; делать массовые звонки/спам; маскировать политические позиции; распространять контент без указания источников.

API и интеграции

REST API — один HTTP-запрос возвращает URL готового аудио. Совместим с n8n, Make, Zapier и любым приложением, работающим с JSON. Отдельно есть WordPress TTS Plugin, Python TTS SDK и API for Subtitle для автоматизированной озвучки SRT/VTT с посекундным таймингом.

Возвраты и юридические нюансы

Возврат средств возможен только в течение 24 часов после покупки и при условии, что использовано не более 3 000 символов. Создание нескольких аккаунтов запрещено. Возврат за неиспользованные лимиты не производится — покупка любого пакета подтверждает намерение полностью использовать его на озвучку.

Показать полное описаниеСкрыть описание

Плюсы и минусы SpeechGen

+Преимущества

✓Один из самых широких каталогов: 5 000+ голосов на 150+ языках
✓Pay-as-you-go без подписки — платишь только за то, что нужно
✓Купленные лимиты живут до 1 года (vs ежемесячное «сгорание» у конкурентов)
✓Smart Cache: повторная генерация того же текста бесплатна
✓Коммерческая лицензия и отсутствие водяных знаков во ВСЕХ тарифах
✓1 000 символов бесплатно без регистрации и без карты
✓3 тира качества (Standard/Pro/HD) — гибкий баланс цена/качество
✓Многоголосый диалог в одном файле без склейки в DAW
✓Audio Cut: один скрипт → до 1 000 отдельных файлов автоматически
✓Встроенная фоновая музыка и SSML — полный продакшн в одной вкладке
✓2 000 000 символов на одну генерацию — целые книги без разбивки
✓REST API + готовые интеграции с n8n, Make, Zapier, WordPress

−Недостатки

✗Юрисдикция — Гонконг (Bueno Ltd.), оплата только в USD через Stripe и PayPal
✗Российские карты могут не приниматься напрямую — нужно уточнять у поддержки
✗Возврат средств только в течение 24 часов и при использовании ≤ 3 000 символов
✗Файлы незарегистрированных пользователей хранятся всего 24 часа
✗История зарегистрированных проектов — 30 дней (избранное — постоянно)
✗Создание нескольких аккаунтов запрещено
✗HD-голоса расходуют в 4 раза больше лимитов, чем Standard
✗Не все голоса поддерживают полный набор SSML-тегов
✗Интерфейс на английском (русские голоса есть, но UI без локализации в полном объёме)

Сценарии использования SpeechGen

Маркетинг и видеопродакшн (727 компаний)

Озвучка для запуска SaaS-видео с 48-часовым дедлайном без кастинга диктора: один голос, MP3, скорость 1.1× — готово в один клик. Локализация роликов на 12 рынков из одного SRT за один день.

E-Learning и онлайн-обучение (381 компания)

Двуязычные упражнения EN + ES в одном аудио, разбивка по урокам через <cut/> — 50 MP3 из одного скрипта. 90 cognitive exercises на 2 языках за 3 месяца ежедневного контента.

Бизнес-телефония и IVR (233 компании)

Двуязычный IVR для сети из 5 ветклиник в Атланте (EN + ES) с обновлением за 30 секунд. MP3 64 kbps, профессиональный тон, апдейт прямо в админке без подрядчика.

Аудиогиды и музейные туры (127 компаний)

18-минутный аудиогид по историческому зданию с двумя дикторами и фоновой музыкой в одном файле. Винодельня в Тоскане — 45 минут на 3 языках за один день.

Промышленная безопасность (473 компании)

PA-оповещения для склада 15 000 м² на 6 языках, auto-trigger через API по событию сенсоров. Решает языковой барьер для смешанных команд в полевых условиях.

Локализация и экспорт (408 компаний)

Аудиогид для выставки локализован на 5 языков из одного скрипта: SRT-загрузка → выбор голоса для каждого языка → один клик. Не нужно нанимать local-дикторов в каждой стране.

Доверие и масштаб

Аудитория

500 000+ пользователей (по странице Pricing FAQ заявлено также «1M+ users»)

Масштаб провайдера

700 000 000+ сгенерированных файлов

Отзывы о SpeechGen

Поделитесь опытом использования

Помогите другим сделать правильный выбор — ваш отзыв будет полезен

Оставить отзыв

Часто задаваемые вопросы о SpeechGen

?Что такое SpeechGen?

SpeechGen — онлайн-сервис AI Text-to-Speech от Bueno Ltd. (Гонконг) с 5 000+ нейросетевыми голосами на 150+ языках. Превращает текст в реалистичную речь и отдаёт MP3/WAV/FLAC/OGG/OPUS. По данным сайта, через сервис прошло 700+ млн сгенерированных файлов и 500 000+ пользователей, в том числе 70 000 бизнес-аккаунтов из 22 индустрий.

?Как работает оплата — есть подписка?

Нет подписки. SpeechGen работает по модели pay-as-you-go: покупаешь пакет лимитов и тратишь когда нужно. Пакеты — 25 000 / 65 000 / 200 000 / 500 000 лимитов за $4.99 / $9.99 / $24.99 / $49.99. Один баланс тратится на TTS любого тира и на транскрипцию. Купленные лимиты живут до 1 года, при каждом пополнении срок сбрасывается. Оплата — Stripe (карта) или PayPal, выписка доступна в личном кабинете.

?Чем отличаются Standard, Pro и HD голоса?

Это три уровня качества с разной стоимостью в лимитах. Standard — 1 лимит = 2 символа, самый экономный (внутренние документы, черновики, массовый контент). Pro — 1 лимит = 1 символ, базовый профессиональный уровень (YouTube, e-learning, маркетинг). HD — 1 лимит = 0.5 символа, студийное качество с нейросетевыми голосами и реалистичной эмоциональностью (broadcast, премиум-видео). HD стоит в 4 раза дороже Standard за тот же объём текста.

?Можно ли использовать аудио в коммерции?

Да. Коммерческая лицензия включена во все тарифы, включая бесплатный. Готовое аудио можно публиковать в YouTube, рекламе, приложениях, e-learning курсах — без водяных знаков. Запрещено: имитировать голос политиков/госслужащих (даже с их согласия), скрывать синтетическую природу аудио, выдавать себя за реальное лицо, использовать в финансовых/медицинских/юридических/политических материалах для повышения авторитета, разжигать ненависть, эксплуатировать детей, делать массовые звонки/спам.

?Что такое Smart Cache?

Каждое предложение сохраняется в кеш на 7 дней. Если перегенерируешь тот же текст или меняешь только одно предложение — все неизменённые фрагменты не списываются с баланса. Это позволяет итеративно редактировать длинные тексты, не тратя лимиты на повторы. История проектов хранится 30 дней, избранные файлы — постоянно.

?Какой максимальный размер текста за одну генерацию?

До 2 000 000 символов (≈ 285 000–330 000 слов) — можно вставить целую книгу или большой объём документации. Очень длинные тексты автоматически разбиваются на сегменты. Через тег <cut/> можно разбить генерацию на отдельные файлы (до 1 000 сегментов для коротких, до 500 — для длинных).

?Есть ли API и интеграции?

Да. REST API — один HTTP-запрос возвращает URL готового аудио. Совместим с n8n, Make, Zapier и любым приложением, работающим с JSON. Дополнительно: WordPress TTS Plugin, Python TTS SDK, API for Subtitle для автоматизированной озвучки SRT/VTT с посекундным таймингом.

?Работает ли SpeechGen в России?

Сайт доступен, русский язык поддерживается среди 150+. Юр.лицо — Bueno Ltd. (Гонконг). Оплата идёт через Stripe (карта) и PayPal. Сайт явно не подтверждает приём российских банковских карт — лучше уточнить у поддержки speechgen.io@gmail.com или в Telegram @speechgen перед покупкой пакета.

?Как работает возврат средств?

Возврат возможен только в течение 24 часов после покупки и при условии, что использовано не более 3 000 символов. Если потратил больше 3 000 символов — возврат не оформляется. За неиспользованные лимиты после истечения 1 года возврата тоже нет.

?Какие форматы и битрейты доступны?

Форматы: MP3, WAV, FLAC, OGG, OPUS. Частота дискретизации: от 8 000 до 44 000 Гц. Битрейт: 8–64 kbps (телефон/IVR), 64–128 kbps (YouTube/подкасты), 192–320 kbps (broadcast/DAW/архив). Скорость регулируется от 0.1× до 2.2×, высота голоса от −20 до +20 с шагом 2, паузы между предложениями/абзацами — от 150 мс до 30 с.

Бесплатно

Ключевые функции

•5 000+ AI-голосов в 3 тирах (Standard / Pro / HD)
•150+ языков и региональных акцентов
•Multi-voice dialogue: несколько спикеров в одном файле через <Name>-теги
•Smart Cache: бесплатная регенерация неизменённых предложений (7 дней)
•Audio Cut <cut/>: до 1 000 сегментов на генерацию из одного скрипта
•Фоновая музыка: встроенная AI-библиотека + загрузка своих треков
•SSML: <break>, <emphasis>, <prosody>, <sound>
•Графики интонации на части голосов
•До 2 000 000 символов за одну генерацию
•Загрузка TXT, DOCX, PDF, SRT
•SRT/VTT to Synced Audio — каждая строка субтитра озвучивается по таймкоду
•Транскрипция аудио и видео в текст (140 языков, спикеры, таймкоды)
•YouTube-транскрибация (YT Transcribe)
•Экспорт: MP3, WAV, FLAC, OGG, OPUS; 8–44 кГц; 8–320 kbps
•REST API (совместим с n8n, Make, Zapier)
•WordPress TTS Plugin, Python TTS SDK
•Коммерческая лицензия во всех тарифах, включая бесплатный
•Без водяных знаков даже на бесплатном тарифе
•Скорость от 0.1× до 2.2×, высота от −20 до +20, паузы от 150 мс до 30 с

Для кого

Маркетинг и видеопродакшнEdTech и онлайн-обучениеБизнес-телефония и IVRАудиогиды и музеиПромышленная безопасностьЛокализация и экспортПодкастерыАвторы YouTube

🇷🇺Доступность в России

ДоступенДа
Карты РФНе принимаются
КриптовалютаНет
Оплата по счётуДа
Нужен VPNНет

Юрисдикция — Гонконг (Bueno Ltd.). Оплата картой через Stripe и PayPal. Русский язык поддерживается среди 150+, но способ оплаты с российских карт явно сайтом не подтверждается — нужно уточнять у поддержки speechgen.io@gmail.com или @speechgen в Telegram.

Ресурсы и сообщество

На странице

Обновлено: 23 мая 2026 г.