Логотип Fish Audio

Fish Audio

Бесплатный тариф

Fish Audio — AI-платформа для синтеза речи, клонирования голоса (15 сек эталона) и распознавания речи на моделях S1/S2. Библиотека из 2 000 000+ голосов и 30+ языков.

fish.audio

Основная информация

Страна
США
Развёртывание
Облачный SaaS + iOS-приложение
Языки
English, Японский +7
Поддержка
Email (support@fish.audio)
Стоимость
Бесплатно
Пробный период
Бесплатный тариф

Технические характеристики

Платформы
Веб-сервис (fish.audio) + iOS-приложение в Apple App Store
Поколение модели
Fish Audio S1 и S2 (последнее поколение)
Голосов
2 000 000+ голосов в публичной библиотеке
Поддерживаемых языков
30+ языков синтез-речи
Эталон для клонирования
15 секунд эталонного аудио
Символов за генерацию
500 (Free) / 15 000 (Plus) / 30 000 (Pro и Max) символов
Кредитов в месяц
8K (Free) / 250K (Plus) / 2M (Pro) / 25M (Max) кредитов в месяц
Голосовые слоты
3 публичных (Free) / безлимит публичных + 10 приватных (Plus) / безлимит (Pro и Max)
Командные места
0 (Free и Plus) / 3 (Pro) / 10 (Max) мест в команде
API
Да, на тарифах Plus и выше (pay-as-you-go)
Юридическое лицо
Hanabi AI Inc.
Страна регистрации
США (штат Делавэр)
Головной офис
1111B S Governors Ave STE 48109, Dover, DE 19904, USA
Платёжный процессор
Stripe
Возрастной рейтинг
13+ (для 13–17 лет требуется согласие родителей)

Безопасность и compliance

Соответствие законам
CPRA (California)VCDPA (Virginia)GDPR (EEA / UK / Switzerland)LGPD (Brazil)COPPADMCA

Поддержка и SLA

Каналы поддержки
Email: support@fish.audio

Интеграции Fish Audio

Ключевые интеграции
  • Stripe (платежи)Платёжные системыофициальная
  • Apple App Store (iOS-приложение)Мобильные сторыофициальная
  • Google Sign-In (Third Party Account)Аутентификацияофициальная
  • API (pay-as-you-go)API / разработчикамофициальная

Тарифы Fish Audio

Free

до 1 пользователей

Бесплатно
  • До 7 минут генерации S1 и S2 высокого качества
  • До 500 символов за одну генерацию
  • Стандартная скорость генерации
  • 3 публичных голосовых слота
  • 8 000 кредитов в месяц

Plus

Популярный

до 1 пользователей

$15
/мес
  • До 200 минут S1/S2-генерации в месяц
  • Приоритетная генерация на новейших моделях
  • До 15 000 символов за одну генерацию
  • Улучшенное клонирование голоса
  • Безлимит публичных + 10 приватных голосовых слотов
  • Коммерческое использование разрешено
  • Доступ к API (pay-as-you-go)
  • 250 000 кредитов в месяц
  • Промо: 50% скидка при годовой оплате + 3 месяца бесплатно

Pro

до 3 пользователей

$100
/мес
  • До 1 620 минут S1/S2-генерации в месяц
  • Приоритетная генерация на новейших моделях
  • До 30 000 символов за одну генерацию
  • Улучшенное клонирование голоса
  • Неограниченные голосовые слоты
  • Коммерческое использование разрешено
  • 3 командных места включены
  • Доступ к API (pay-as-you-go)
  • 2 000 000 кредитов в месяц

Max

до 10 пользователей

$999
/мес
  • До 6 250 минут S1/S2-генерации в месяц
  • Приоритетная генерация на новейших моделях
  • До 30 000 символов за одну генерацию
  • Улучшенное клонирование голоса
  • Неограниченные голосовые слоты
  • Коммерческое использование разрешено
  • 10 командных мест включены
  • Доступ к API (pay-as-you-go)
  • 25 000 000 кредитов в месяц
Сравнение тарифов Fish Audio
ТарифЦена
FreeБесплатно
PlusTOP$15/мес
Pro$100/мес
Max$999/мес
🎁
50% скидка на годовой план
Ограниченное предложение на странице тарифов: 50% скидка при оплате на год + 3 месяца бесплатно. Действует для тарифов Plus, Pro и Max.

Обзор Fish Audio

Что такое Fish Audio

Fish Audio (fish.audio) — это AI-платформа для синтеза и распознавания речи, работающая на собственных моделях Fish Audio S1 и S2. Сервис развивает компания Hanabi AI Inc. (зарегистрирована в штате Делавэр, США). На главной заявлены три основных продукта: текст в речь, клонирование голоса и распознавание речи (Speech-to-Text), а также комплексное решение «Голосовой агент».

Главные цифры платформы — более 2 000 000 голосов в публичной библиотеке (как от команды, так и от пользователей сообщества), поддержка 30+ языков и клонирование голоса по эталону длиной всего 15 секунд. Модель S2 поддерживает эмоциональные и звуковые теги ([angry], [sad], [whispering], [laughing], [chuckling], [sobbing], [pause], [long pause] и др.) — их можно расставлять прямо в тексте, чтобы озвучка получилась живой и контекстной.

Основные продукты Fish Audio

1. Text-to-Speech (S1 / S2)

  • Реалистичный синтез речи на моделях последнего поколения S1 и S2
  • До 30 000 символов за одну генерацию (на тарифах Pro и Max)
  • Эмоциональные теги: [angry], [sad], [embarrassed], [emphasis], [whispering], [soft], [breathy], [excited]
  • Звуковые теги: [laughing], [chuckling], [clear throat], [sobbing], [crying loudly], [sighing], [panting], [groaning], [pause], [long pause]

2. Клонирование голоса

  • Создание клона по 15-секундному эталонному аудио
  • Улучшенное клонирование на платных тарифах (Plus и выше)
  • Голосовые слоты: 3 публичных на Free, безлимит публичных + 10 приватных на Plus, безлимит на Pro/Max
  • Разрешённое коммерческое использование на всех платных тарифах

3. Распознавание речи (Speech-to-Text)

  • Транскрипция с поддержкой нескольких дикторов
  • Теги эмоций и описание на естественном языке внутри транскрипции

4. Голосовой агент и API

  • Комплексное решение «Голосовой агент» для разговорных сценариев
  • Сверхнизкая задержка для потокового вещания в реальном времени
  • API с оплатой по факту использования (доступен начиная с тарифа Plus)

Сценарии использования

  • Озвучивание видео — YouTube-ролики, реклама, объясняющие видео с эмоциональными метками и сменой тона
  • Озвучивание аудиокниг — готовое к публикации повествование «без студии», заявлено соответствие спецификациям ACX / Audible
  • Голоса персонажей — клонирование фирменных голосов и брендовых персонажей для игр, анимации и интерактивных историй
  • Разговорные чат-боты — голос для службы поддержки и виртуальных агентов с минимальной задержкой

Тарифы и доступ

Бесплатный тариф предоставляет до 7 минут S1/S2-генерации и 8 000 кредитов в месяц для тестирования. Платные планы: Plus $15/мес (200 минут, 250 000 кредитов, 10 приватных голосовых слотов, API, коммерческое использование), Pro $100/мес (1 620 минут, 2 млн кредитов, безлимит голосов, 3 командных места), Max $999/мес (6 250 минут, 25 млн кредитов, 10 командных мест, для крупного производства). На странице тарифов действует ограниченное по времени предложение «50% скидка на год» + 3 месяца бесплатно при годовой оплате. Платежи обрабатывает Stripe.

Юридическая информация

Оператор сервиса — Hanabi AI Inc., зарегистрирован в штате Делавэр, США. Юридический адрес и адрес DMCA-агента: 1111B S Governors Ave STE 48109, Dover, DE 19904, United States. Контакт по любым вопросам и реализации прав по CPRA (California), VCDPA (Virginia), GDPR (EEA / UK / Switzerland), LGPD (Brazil), а также по DMCA — support@fish.audio. Возрастное ограничение — от 13 лет (для пользователей 13–17 лет требуется разрешение родителей или законных представителей).

Плюсы и минусы Fish Audio

+Преимущества

  • Один из лидеров по реалистичности AI-голосов (по отзывам KOL — превосходит ElevenLabs по эмоциональным нюансам)
  • 2 000 000+ голосов в публичной библиотеке с фильтрами по полу, возрасту, стилю и языку
  • Клонирование голоса требует всего 15 секунд эталонного аудио
  • Эмоциональные и звуковые теги управляют интонацией прямо из текста
  • Большое количество русских голосов в библиотеке сообщества
  • Доступ к API уже на стартовом платном тарифе Plus ($15/мес)
  • Коммерческое использование разрешено на всех платных планах
  • Прозрачная юридическая структура (Hanabi AI Inc., США), DMCA и compliance с CPRA/VCDPA/GDPR/LGPD

Недостатки

  • Нет русскоязычного юридического оператора и оплаты в рублях — расчёт через Stripe в USD
  • На бесплатном тарифе всего 7 минут генерации и 500 символов за раз
  • Стоимость старшего тарифа Max $999/мес рассчитана на крупное производство
  • Кредитная модель тарификации требует понимания того, как считаются кредиты на минуту/символ
  • UI и документация преимущественно на английском (русскоязычная локализация частична)
  • API-вызовы оплачиваются отдельно по pay-as-you-go поверх ежемесячного плана
  • Возрастное ограничение 13+ (доступ для 13–17 лет — только с разрешением родителей)

Сценарии использования Fish Audio

1

Озвучивание видео

Преобразование сценариев в богатое повествование под YouTube, рекламу и объясняющие видео. Смена тона, эмоциональные метки и удержание внимания зрителя.

2

Озвучивание аудиокниг

Готовое к публикации повествование с реалистичным темпом, эмоциями и управлением на уровне глав. Часы аудио, соответствующего спецификациям ACX/Audible — без звукозаписывающей студии.

3

Голоса персонажей

Клонирование фирменных голосов и брендовых персонажей для игр, анимации и интерактивных историй. Тонкая настройка эмоций онлайн или через простой API.

4

Разговорные чат-боты и голосовые агенты

Естественный голос для службы поддержки и виртуальных агентов с минимальной задержкой. Тоновые теги для полезных, сочувствующих или жизнерадостных ответов.

Доверие и масштаб

На главной Fish Audio собраны цитаты KOL: @heyDhavall (YouTube) — про многоязычные voice-overs на японском, французском и арабском; Ai Lockup (Twitter) — прямое сравнение с ElevenLabs в пользу Fish Audio по достоверности и эмоциональным нюансам; AI Webb TV (YouTube) — переход с традиционной озвучки; emdottech (TikTok) — клонирование за 15-секундный фрагмент; Kingy AI (YouTube) — апдейт Fish Speech 1.6; @techgaffer (Instagram) — open-source направление команды.
Аудитория
2 000 000+ голосов в публичной библиотеке (от команды и сообщества)

Отзывы о Fish Audio

Поделитесь опытом использования

Помогите другим сделать правильный выбор — ваш отзыв будет полезен

Часто задаваемые вопросы о Fish Audio

?Что такое Fish Audio и какие у него основные продукты?

Fish Audio (fish.audio) — это AI-платформа компании Hanabi AI Inc. (США, Делавэр) для синтеза речи (TTS), клонирования голоса и распознавания речи. На главной заявлены три основных направления: Текст в речь на моделях S1/S2, Клонирование голоса по 15-секундному эталону и Распознавание речи с поддержкой нескольких дикторов. Также доступно комплексное решение «Голосовой агент».

?Сколько стоит Fish Audio?

Бесплатный тариф (7 минут генерации, 8 000 кредитов в месяц), Plus за $15/мес (200 минут, 250 000 кредитов, API, коммерческое использование), Pro за $100/мес (1 620 минут, 2 млн кредитов, 3 командных места) и Max за $999/мес (6 250 минут, 25 млн кредитов, 10 командных мест). На странице тарифов действует ограниченное предложение: 50% скидка при оплате на год + 3 месяца бесплатно.

?Сколько секунд аудио нужно для клонирования голоса?

По данным сайта и отзывам пользователей — около 15 секунд эталонной записи. На платных тарифах (Plus и выше) Fish Audio использует «улучшенное клонирование», которое работает точнее на тех же 15 секундах.

?Какие языки поддерживает Fish Audio?

В FAQ сайта явно перечислены: английский, японский, корейский, китайский, французский, немецкий, арабский и испанский. Команда заявляет о поддержке 30+ языков и постоянном расширении списка. В библиотеке голосов также есть большой раздел русскоязычных голосов от пользователей сообщества (Меллстрой, Жириновский, Сергей Бурунов и др.).

?Можно ли использовать сгенерированные голоса в коммерческих целях?

Да, на любом платном тарифе (Plus, Pro, Max) коммерческое использование разрешено. На бесплатном тарифе сгенерированный аудиоконтент предназначен для личного и тестового использования. Вопрос лицензии конкретного клонированного голоса остаётся на стороне правообладателя голоса.

?Есть ли у Fish Audio API?

Да, API доступен начиная с тарифа Plus ($15/мес) с моделью оплаты pay-as-you-go (поверх ежемесячных кредитов плана). API-функции включают синтез речи в реальном времени, клонирование голоса и распознавание речи. Для крупных команд (Pro, Max) добавляются командные места в дашборде.

?Какие эмоциональные и звуковые теги поддерживает Fish Audio S2?

Эмоциональные теги: [angry], [sad], [embarrassed], [emphasis], [whispering], [soft], [breathy], [excited]. Звуковые теги: [laughing], [chuckling], [moaning], [clear throat], [sobbing], [crying loudly], [sighing], [panting], [groaning], [crowd laughing], [background laughter], [audience laughing], [pause], [long pause]. Теги ставятся прямо в исходный текст, и модель учитывает их при генерации.

?Где зарегистрирована компания и как с ней связаться?

Сервис управляет Hanabi AI Inc., зарегистрированная в штате Делавэр, США. Юридический адрес и адрес DMCA-агента — 1111B S Governors Ave STE 48109, Dover, DE 19904. Контактный email для всех запросов — support@fish.audio. Privacy Policy и Terms of Use опубликованы на сайте; компания соблюдает CPRA, VCDPA, GDPR, LGPD, COPPA.

Обновлено: 7 мая 2026 г.