Fish Audio

Бесплатный тариф

Fish Audio — AI-платформа для синтеза речи, клонирования голоса (15 сек эталона) и распознавания речи на моделях S1/S2. Библиотека из 2 000 000+ голосов и 30+ языков.

fish.audio

Основная информация

Страна

США

Развёртывание

Облачный SaaS + iOS-приложение

Языки

English, Японский +7

Поддержка

Email (support@fish.audio)

Стоимость

Бесплатно

Пробный период

Бесплатный тариф

Технические характеристики

Платформы: Веб-сервис (fish.audio) + iOS-приложение в Apple App Store
Поколение модели: Fish Audio S1 и S2 (последнее поколение)
Голосов: 2 000 000+ голосов в публичной библиотеке
Поддерживаемых языков: 30+ языков синтез-речи
Эталон для клонирования: 15 секунд эталонного аудио
Символов за генерацию: 500 (Free) / 15 000 (Plus) / 30 000 (Pro и Max) символов
Кредитов в месяц: 8K (Free) / 250K (Plus) / 2M (Pro) / 25M (Max) кредитов в месяц
Голосовые слоты: 3 публичных (Free) / безлимит публичных + 10 приватных (Plus) / безлимит (Pro и Max)
Командные места: 0 (Free и Plus) / 3 (Pro) / 10 (Max) мест в команде
API: Да, на тарифах Plus и выше (pay-as-you-go)
Юридическое лицо: Hanabi AI Inc.
Страна регистрации: США (штат Делавэр)
Головной офис: 1111B S Governors Ave STE 48109, Dover, DE 19904, USA
Платёжный процессор: Stripe
Возрастной рейтинг: 13+ (для 13–17 лет требуется согласие родителей)

Безопасность и compliance

Соответствие законам

CPRA (California)VCDPA (Virginia)GDPR (EEA / UK / Switzerland)LGPD (Brazil)COPPADMCA

Поддержка и SLA

Каналы поддержки

Email: support@fish.audio

Интеграции Fish Audio

Ключевые интеграции

Stripe (платежи)— Платёжные системыофициальная
Apple App Store (iOS-приложение)— Мобильные сторыофициальная
Google Sign-In (Third Party Account)— Аутентификацияофициальная
API (pay-as-you-go)— API / разработчикамофициальная

Тарифы Fish Audio

Free

до 1 пользователей

Бесплатно

✓До 7 минут генерации S1 и S2 высокого качества
✓До 500 символов за одну генерацию
✓Стандартная скорость генерации
✓3 публичных голосовых слота
✓8 000 кредитов в месяц

Plus

Популярный

до 1 пользователей

$15

/мес

✓До 200 минут S1/S2-генерации в месяц
✓Приоритетная генерация на новейших моделях
✓До 15 000 символов за одну генерацию
✓Улучшенное клонирование голоса
✓Безлимит публичных + 10 приватных голосовых слотов
✓Коммерческое использование разрешено
✓Доступ к API (pay-as-you-go)
✓250 000 кредитов в месяц
✓Промо: 50% скидка при годовой оплате + 3 месяца бесплатно

Pro

до 3 пользователей

$100

/мес

✓До 1 620 минут S1/S2-генерации в месяц
✓Приоритетная генерация на новейших моделях
✓До 30 000 символов за одну генерацию
✓Улучшенное клонирование голоса
✓Неограниченные голосовые слоты
✓Коммерческое использование разрешено
✓3 командных места включены
✓Доступ к API (pay-as-you-go)
✓2 000 000 кредитов в месяц

Max

до 10 пользователей

$999

/мес

✓До 6 250 минут S1/S2-генерации в месяц
✓Приоритетная генерация на новейших моделях
✓До 30 000 символов за одну генерацию
✓Улучшенное клонирование голоса
✓Неограниченные голосовые слоты
✓Коммерческое использование разрешено
✓10 командных мест включены
✓Доступ к API (pay-as-you-go)
✓25 000 000 кредитов в месяц

Сравнение тарифов Fish Audio
Тариф	Цена	Пользователи	Ключевые возможности
Free	Бесплатно	до 1	До 7 минут генерации S1 и S2 высокого качества, До 500 символов за одну генерацию, Стандартная скорость генерации
PlusTOP	$15/мес	до 1	До 200 минут S1/S2-генерации в месяц, Приоритетная генерация на новейших моделях, До 15 000 символов за одну генерацию
Pro	$100/мес	до 3	До 1 620 минут S1/S2-генерации в месяц, Приоритетная генерация на новейших моделях, До 30 000 символов за одну генерацию
Max	$999/мес	до 10	До 6 250 минут S1/S2-генерации в месяц, Приоритетная генерация на новейших моделях, До 30 000 символов за одну генерацию

🎁

50% скидка на годовой план

Ограниченное предложение на странице тарифов: 50% скидка при оплате на год + 3 месяца бесплатно. Действует для тарифов Plus, Pro и Max.

Обзор Fish Audio

Что такое Fish Audio

Fish Audio (fish.audio) — это AI-платформа для синтеза и распознавания речи, работающая на собственных моделях Fish Audio S1 и S2. Сервис развивает компания Hanabi AI Inc. (зарегистрирована в штате Делавэр, США). На главной заявлены три основных продукта: текст в речь, клонирование голоса и распознавание речи (Speech-to-Text), а также комплексное решение «Голосовой агент».

Главные цифры платформы — более 2 000 000 голосов в публичной библиотеке (как от команды, так и от пользователей сообщества), поддержка 30+ языков и клонирование голоса по эталону длиной всего 15 секунд. Модель S2 поддерживает эмоциональные и звуковые теги ([angry], [sad], [whispering], [laughing], [chuckling], [sobbing], [pause], [long pause] и др.) — их можно расставлять прямо в тексте, чтобы озвучка получилась живой и контекстной.

Основные продукты Fish Audio

1. Text-to-Speech (S1 / S2)

Реалистичный синтез речи на моделях последнего поколения S1 и S2
До 30 000 символов за одну генерацию (на тарифах Pro и Max)
Эмоциональные теги: [angry], [sad], [embarrassed], [emphasis], [whispering], [soft], [breathy], [excited]
Звуковые теги: [laughing], [chuckling], [clear throat], [sobbing], [crying loudly], [sighing], [panting], [groaning], [pause], [long pause]

2. Клонирование голоса

Создание клона по 15-секундному эталонному аудио
Улучшенное клонирование на платных тарифах (Plus и выше)
Голосовые слоты: 3 публичных на Free, безлимит публичных + 10 приватных на Plus, безлимит на Pro/Max
Разрешённое коммерческое использование на всех платных тарифах

3. Распознавание речи (Speech-to-Text)

Транскрипция с поддержкой нескольких дикторов
Теги эмоций и описание на естественном языке внутри транскрипции

4. Голосовой агент и API

Комплексное решение «Голосовой агент» для разговорных сценариев
Сверхнизкая задержка для потокового вещания в реальном времени
API с оплатой по факту использования (доступен начиная с тарифа Plus)

Сценарии использования

Озвучивание видео — YouTube-ролики, реклама, объясняющие видео с эмоциональными метками и сменой тона
Озвучивание аудиокниг — готовое к публикации повествование «без студии», заявлено соответствие спецификациям ACX / Audible
Голоса персонажей — клонирование фирменных голосов и брендовых персонажей для игр, анимации и интерактивных историй
Разговорные чат-боты — голос для службы поддержки и виртуальных агентов с минимальной задержкой

Как начать пользоваться Fish Audio

Откройте сайт fish.audio и войдите в аккаунт (доступен вход через Google).
Для озвучки текста выберите голос из библиотеки, вставьте текст и при желании расставьте эмоциональные теги ([excited], [whispering] и др.), затем запустите генерацию.
Для клонирования голоса загрузите эталонную запись длиной около 15 секунд, платформа создаст цифровую копию голоса.
Скачайте готовый аудиофайл или подключите озвучку через API (доступен на тарифе Plus и выше).

Бесплатного режима без регистрации нет: аккаунт нужен, чтобы хранить голоса и вести учёт кредитов. На бесплатном тарифе доступно до 7 минут генерации, 8 000 кредитов в месяц и 500 символов за одну генерацию, чего хватает на тест возможностей. Русская локализация интерфейса есть, в библиотеке много русскоязычных голосов от сообщества.

Тарифы и доступ

Бесплатный тариф предоставляет до 7 минут S1/S2-генерации и 8 000 кредитов в месяц для тестирования. Платные планы: Plus $15/мес (200 минут, 250 000 кредитов, 10 приватных голосовых слотов, API, коммерческое использование), Pro $100/мес (1 620 минут, 2 млн кредитов, безлимит голосов, 3 командных места), Max $999/мес (6 250 минут, 25 млн кредитов, 10 командных мест, для крупного производства). На странице тарифов действует ограниченное по времени предложение «50% скидка на год» + 3 месяца бесплатно при годовой оплате. Платежи обрабатывает Stripe.

Юридическая информация

Оператор сервиса — Hanabi AI Inc., зарегистрирован в штате Делавэр, США. Юридический адрес и адрес DMCA-агента: 1111B S Governors Ave STE 48109, Dover, DE 19904, United States. Контакт по любым вопросам и реализации прав по CPRA (California), VCDPA (Virginia), GDPR (EEA / UK / Switzerland), LGPD (Brazil), а также по DMCA — support@fish.audio. Возрастное ограничение — от 13 лет (для пользователей 13–17 лет требуется разрешение родителей или законных представителей).

Показать полное описаниеСкрыть описание

Плюсы и минусы Fish Audio

+Преимущества

✓Один из лидеров по реалистичности AI-голосов (по отзывам KOL — превосходит ElevenLabs по эмоциональным нюансам)
✓2 000 000+ голосов в публичной библиотеке с фильтрами по полу, возрасту, стилю и языку
✓Клонирование голоса требует всего 15 секунд эталонного аудио
✓Эмоциональные и звуковые теги управляют интонацией прямо из текста
✓Большое количество русских голосов в библиотеке сообщества
✓Доступ к API уже на стартовом платном тарифе Plus ($15/мес)
✓Коммерческое использование разрешено на всех платных планах
✓Прозрачная юридическая структура (Hanabi AI Inc., США), DMCA и compliance с CPRA/VCDPA/GDPR/LGPD

−Недостатки

✗Нет русскоязычного юридического оператора и оплаты в рублях — расчёт через Stripe в USD
✗На бесплатном тарифе всего 7 минут генерации и 500 символов за раз
✗Стоимость старшего тарифа Max $999/мес рассчитана на крупное производство
✗Кредитная модель тарификации требует понимания того, как считаются кредиты на минуту/символ
✗UI и документация преимущественно на английском (русскоязычная локализация частична)
✗API-вызовы оплачиваются отдельно по pay-as-you-go поверх ежемесячного плана
✗Возрастное ограничение 13+ (доступ для 13–17 лет — только с разрешением родителей)

Сценарии использования Fish Audio

Озвучивание видео

Преобразование сценариев в богатое повествование под YouTube, рекламу и объясняющие видео. Смена тона, эмоциональные метки и удержание внимания зрителя.

Озвучивание аудиокниг

Готовое к публикации повествование с реалистичным темпом, эмоциями и управлением на уровне глав. Часы аудио, соответствующего спецификациям ACX/Audible — без звукозаписывающей студии.

Голоса персонажей

Клонирование фирменных голосов и брендовых персонажей для игр, анимации и интерактивных историй. Тонкая настройка эмоций онлайн или через простой API.

Разговорные чат-боты и голосовые агенты

Естественный голос для службы поддержки и виртуальных агентов с минимальной задержкой. Тоновые теги для полезных, сочувствующих или жизнерадостных ответов.

Доверие и масштаб

На главной Fish Audio собраны цитаты KOL: @heyDhavall (YouTube) — про многоязычные voice-overs на японском, французском и арабском; Ai Lockup (Twitter) — прямое сравнение с ElevenLabs в пользу Fish Audio по достоверности и эмоциональным нюансам; AI Webb TV (YouTube) — переход с традиционной озвучки; emdottech (TikTok) — клонирование за 15-секундный фрагмент; Kingy AI (YouTube) — апдейт Fish Speech 1.6; @techgaffer (Instagram) — open-source направление команды.

Аудитория

2 000 000+ голосов в публичной библиотеке (от команды и сообщества)

Отзывы о Fish Audio

Поделитесь опытом использования

Помогите другим сделать правильный выбор — ваш отзыв будет полезен

Оставить отзыв

Часто задаваемые вопросы о Fish Audio

?Что такое Fish Audio и какие у него основные продукты?

Fish Audio (fish.audio) — это AI-платформа компании Hanabi AI Inc. (США, Делавэр) для синтеза речи (TTS), клонирования голоса и распознавания речи. На главной заявлены три основных направления: Текст в речь на моделях S1/S2, Клонирование голоса по 15-секундному эталону и Распознавание речи с поддержкой нескольких дикторов. Также доступно комплексное решение «Голосовой агент».

?Сколько стоит Fish Audio?

Бесплатный тариф (7 минут генерации, 8 000 кредитов в месяц), Plus за $15/мес (200 минут, 250 000 кредитов, API, коммерческое использование), Pro за $100/мес (1 620 минут, 2 млн кредитов, 3 командных места) и Max за $999/мес (6 250 минут, 25 млн кредитов, 10 командных мест). На странице тарифов действует ограниченное предложение: 50% скидка при оплате на год + 3 месяца бесплатно.

?Сколько секунд аудио нужно для клонирования голоса?

По данным сайта и отзывам пользователей — около 15 секунд эталонной записи. На платных тарифах (Plus и выше) Fish Audio использует «улучшенное клонирование», которое работает точнее на тех же 15 секундах.

?Какие языки поддерживает Fish Audio?

В FAQ сайта явно перечислены: английский, японский, корейский, китайский, французский, немецкий, арабский и испанский. Команда заявляет о поддержке 30+ языков и постоянном расширении списка. В библиотеке голосов также есть большой раздел русскоязычных голосов от пользователей сообщества (Меллстрой, Жириновский, Сергей Бурунов и др.).

?Можно ли использовать сгенерированные голоса в коммерческих целях?

Да, на любом платном тарифе (Plus, Pro, Max) коммерческое использование разрешено. На бесплатном тарифе сгенерированный аудиоконтент предназначен для личного и тестового использования. Вопрос лицензии конкретного клонированного голоса остаётся на стороне правообладателя голоса.

?Есть ли у Fish Audio API?

Да, API доступен начиная с тарифа Plus ($15/мес) с моделью оплаты pay-as-you-go (поверх ежемесячных кредитов плана). API-функции включают синтез речи в реальном времени, клонирование голоса и распознавание речи. Для крупных команд (Pro, Max) добавляются командные места в дашборде.

?Какие эмоциональные и звуковые теги поддерживает Fish Audio S2?

Эмоциональные теги: [angry], [sad], [embarrassed], [emphasis], [whispering], [soft], [breathy], [excited]. Звуковые теги: [laughing], [chuckling], [moaning], [clear throat], [sobbing], [crying loudly], [sighing], [panting], [groaning], [crowd laughing], [background laughter], [audience laughing], [pause], [long pause]. Теги ставятся прямо в исходный текст, и модель учитывает их при генерации.

?Где зарегистрирована компания и как с ней связаться?

Сервис управляет Hanabi AI Inc., зарегистрированная в штате Делавэр, США. Юридический адрес и адрес DMCA-агента — 1111B S Governors Ave STE 48109, Dover, DE 19904. Контактный email для всех запросов — support@fish.audio. Privacy Policy и Terms of Use опубликованы на сайте; компания соблюдает CPRA, VCDPA, GDPR, LGPD, COPPA.

?Поддерживает ли Fish Audio русский язык?

Да. Интерфейс fish.audio имеет русскую локализацию, а в публичной библиотеке есть большой раздел русскоязычных голосов от сообщества. Русский входит в число 30+ поддерживаемых языков синтеза речи. При этом документация и часть интерфейса остаются преимущественно на английском, а оплата проходит в долларах через Stripe.

?Можно ли пользоваться Fish Audio бесплатно и нужна ли регистрация?

Бесплатный тариф есть: до 7 минут генерации на моделях S1/S2, 8 000 кредитов в месяц, до 500 символов за одну генерацию и 3 публичных голосовых слота. Регистрация нужна, доступен вход через Google-аккаунт. Режима совсем без регистрации нет: аккаунт требуется, чтобы хранить голоса и вести учёт кредитов.

?Чем заменить Fish Audio, какие есть аналоги?

Ближайший зарубежный аналог — ElevenLabs, с которым Fish Audio часто сравнивают (по отзывам пользователей Fish Audio выигрывает в эмоциональных нюансах). Из русскоязычных решений для озвучки можно рассмотреть Diktorov.Net, F1Golos и APIHost Voice. Сравнение по ценам и функциям собрано на вкладке «Альтернативы» этой карточки.

О сервисе писали в наших статьях

Гайд

Войс-чейнджер: как изменить голос для игр и стримов | ToolFox

Изменить голос на робота для стрима, превратить его в другой через нейросеть или спеть чужим голосом, всё это умеют войс-чейнджеры. Разбираем бесплатные программы для игр и Discord, AI-сервисы и что из этого работает из России и легально.

1 июня 2026 г.18 мин чтения

Подборка

Нейросети для озвучки текста: топ TTS на русском | ToolFox

Озвучить видео, подкаст или аудиокнигу живым голосом теперь можно за минуты, без диктора и студии. Разбираем, как нейросети синтезируют речь и клонируют голос, и какие сервисы реально подходят для русского текста.

31 мая 2026 г.15 мин чтения

Альтернативы Fish Audio

ElevenLabsFreeБесплатно

AI-платформа лидера индустрии аудио: TTS на 70+ языках с тысячами студийных голосов, клонирование голоса, AI-музыка, дубляж, генерация видео (Veo / Sora / Kling) и омниканальные голосовые агенты для бизнеса. Тарифы Free $0 → Business $990 + Enterprise по запросу.

F1Golosот 4,2 ₽

Сервис голосовых рассылок и автообзвона: робот зачитывает сообщение по базе, собирает ответы через IVR и распознавание речи, работает по API. Посекундная тарификация, до 4 000 звонков в час. Для маркетинга, уведомлений и опросов.

APIHost VoiceТриалот 500 ₽

Российский сервис синтеза речи через API для интеграции TTS в приложения и сайты с качественной поддержкой русского языка

Alto AIот 3 ₽

Голосовой AI-робот для обзвона клиентов под ключ: холодные звонки, приём входящих, подтверждение записи и опросы. До 500 одновременных линий и 100 000 звонков в день. Разработка командой Alto Calls.

Все аналоги Fish Audio

Бесплатно

Ключевые функции

•Реалистичный TTS на собственных моделях Fish Audio S1 и S2
•Клонирование голоса по 15-секундному эталонному аудио
•Библиотека из 2 000 000+ голосов от команды и сообщества
•Поддержка 30+ языков многоязычной синтез-речи
•Эмоциональные теги: [angry], [sad], [whispering], [excited], [emphasis] и др.
•Звуковые теги: [laughing], [chuckling], [sobbing], [pause], [long pause] и др.
•Распознавание речи с поддержкой нескольких дикторов и эмоциональных тегов
•Голосовой агент с минимальной задержкой для realtime-сценариев
•API с оплатой по факту использования (Plus и выше)
•До 30 000 символов на одну генерацию (Pro / Max)
•Поддержка ACX/Audible-форматов для аудиокниг
•Коллекции голосов: озвучка, документальные, кинематографические, аниме, игры, диалоги

Для кого

Создатели YouTube-роликов и ShortsАвторы аудиокниг (ACX/Audible)Геймдев и анимация (голоса персонажей)Разработчики чат-ботов и голосовых агентовРекламные и продакшн-студииAI-исследователи и разработчики

🇷🇺Доступность в России

ДоступенДа
Карты РФПринимаются
КриптовалютаДа
Оплата по счётуДа

UI имеет русскую локализацию. В библиотеке голосов есть большой раздел русскоязычных голосов от пользователей сообщества (русские категории: «Топ тренды», «Лучшее Рекомендуемое», «Образовательная», «Документальная», «Кинематографическая», «Игры» и др.).

На странице

Обновлено: 31 мая 2026 г.