
Fish Audio
Бесплатный тарифFish Audio — AI-платформа для синтеза речи, клонирования голоса (15 сек эталона) и распознавания речи на моделях S1/S2. Библиотека из 2 000 000+ голосов и 30+ языков.
Основная информация
Технические характеристики
- Платформы
- Веб-сервис (fish.audio) + iOS-приложение в Apple App Store
- Поколение модели
- Fish Audio S1 и S2 (последнее поколение)
- Голосов
- 2 000 000+ голосов в публичной библиотеке
- Поддерживаемых языков
- 30+ языков синтез-речи
- Эталон для клонирования
- 15 секунд эталонного аудио
- Символов за генерацию
- 500 (Free) / 15 000 (Plus) / 30 000 (Pro и Max) символов
- Кредитов в месяц
- 8K (Free) / 250K (Plus) / 2M (Pro) / 25M (Max) кредитов в месяц
- Голосовые слоты
- 3 публичных (Free) / безлимит публичных + 10 приватных (Plus) / безлимит (Pro и Max)
- Командные места
- 0 (Free и Plus) / 3 (Pro) / 10 (Max) мест в команде
- API
- Да, на тарифах Plus и выше (pay-as-you-go)
- Юридическое лицо
- Hanabi AI Inc.
- Страна регистрации
- США (штат Делавэр)
- Головной офис
- 1111B S Governors Ave STE 48109, Dover, DE 19904, USA
- Платёжный процессор
- Stripe
- Возрастной рейтинг
- 13+ (для 13–17 лет требуется согласие родителей)
Безопасность и compliance
Поддержка и SLA
Интеграции Fish Audio
- Stripe (платежи)— Платёжные системыофициальная
- Apple App Store (iOS-приложение)— Мобильные сторыофициальная
- Google Sign-In (Third Party Account)— Аутентификацияофициальная
- API (pay-as-you-go)— API / разработчикамофициальная
Тарифы Fish Audio
Free
до 1 пользователей
- ✓До 7 минут генерации S1 и S2 высокого качества
- ✓До 500 символов за одну генерацию
- ✓Стандартная скорость генерации
- ✓3 публичных голосовых слота
- ✓8 000 кредитов в месяц
Plus
Популярныйдо 1 пользователей
- ✓До 200 минут S1/S2-генерации в месяц
- ✓Приоритетная генерация на новейших моделях
- ✓До 15 000 символов за одну генерацию
- ✓Улучшенное клонирование голоса
- ✓Безлимит публичных + 10 приватных голосовых слотов
- ✓Коммерческое использование разрешено
- ✓Доступ к API (pay-as-you-go)
- ✓250 000 кредитов в месяц
- ✓Промо: 50% скидка при годовой оплате + 3 месяца бесплатно
Pro
до 3 пользователей
- ✓До 1 620 минут S1/S2-генерации в месяц
- ✓Приоритетная генерация на новейших моделях
- ✓До 30 000 символов за одну генерацию
- ✓Улучшенное клонирование голоса
- ✓Неограниченные голосовые слоты
- ✓Коммерческое использование разрешено
- ✓3 командных места включены
- ✓Доступ к API (pay-as-you-go)
- ✓2 000 000 кредитов в месяц
Max
до 10 пользователей
- ✓До 6 250 минут S1/S2-генерации в месяц
- ✓Приоритетная генерация на новейших моделях
- ✓До 30 000 символов за одну генерацию
- ✓Улучшенное клонирование голоса
- ✓Неограниченные голосовые слоты
- ✓Коммерческое использование разрешено
- ✓10 командных мест включены
- ✓Доступ к API (pay-as-you-go)
- ✓25 000 000 кредитов в месяц
| Тариф | Цена |
|---|---|
| Free | Бесплатно |
| PlusTOP | $15/мес |
| Pro | $100/мес |
| Max | $999/мес |
Обзор Fish Audio
Что такое Fish Audio
Fish Audio (fish.audio) — это AI-платформа для синтеза и распознавания речи, работающая на собственных моделях Fish Audio S1 и S2. Сервис развивает компания Hanabi AI Inc. (зарегистрирована в штате Делавэр, США). На главной заявлены три основных продукта: текст в речь, клонирование голоса и распознавание речи (Speech-to-Text), а также комплексное решение «Голосовой агент».
Главные цифры платформы — более 2 000 000 голосов в публичной
библиотеке (как от команды, так и от пользователей сообщества), поддержка
30+ языков и клонирование голоса по эталону длиной всего
15 секунд. Модель S2 поддерживает эмоциональные и звуковые
теги ([angry], [sad], [whispering],
[laughing], [chuckling], [sobbing],
[pause], [long pause] и др.) — их можно расставлять
прямо в тексте, чтобы озвучка получилась живой и контекстной.
Основные продукты Fish Audio
1. Text-to-Speech (S1 / S2)
- Реалистичный синтез речи на моделях последнего поколения S1 и S2
- До 30 000 символов за одну генерацию (на тарифах Pro и Max)
- Эмоциональные теги:
[angry],[sad],[embarrassed],[emphasis],[whispering],[soft],[breathy],[excited] - Звуковые теги:
[laughing],[chuckling],[clear throat],[sobbing],[crying loudly],[sighing],[panting],[groaning],[pause],[long pause]
2. Клонирование голоса
- Создание клона по 15-секундному эталонному аудио
- Улучшенное клонирование на платных тарифах (Plus и выше)
- Голосовые слоты: 3 публичных на Free, безлимит публичных + 10 приватных на Plus, безлимит на Pro/Max
- Разрешённое коммерческое использование на всех платных тарифах
3. Распознавание речи (Speech-to-Text)
- Транскрипция с поддержкой нескольких дикторов
- Теги эмоций и описание на естественном языке внутри транскрипции
4. Голосовой агент и API
- Комплексное решение «Голосовой агент» для разговорных сценариев
- Сверхнизкая задержка для потокового вещания в реальном времени
- API с оплатой по факту использования (доступен начиная с тарифа Plus)
Сценарии использования
- Озвучивание видео — YouTube-ролики, реклама, объясняющие видео с эмоциональными метками и сменой тона
- Озвучивание аудиокниг — готовое к публикации повествование «без студии», заявлено соответствие спецификациям ACX / Audible
- Голоса персонажей — клонирование фирменных голосов и брендовых персонажей для игр, анимации и интерактивных историй
- Разговорные чат-боты — голос для службы поддержки и виртуальных агентов с минимальной задержкой
Тарифы и доступ
Бесплатный тариф предоставляет до 7 минут S1/S2-генерации и 8 000 кредитов в месяц для тестирования. Платные планы: Plus $15/мес (200 минут, 250 000 кредитов, 10 приватных голосовых слотов, API, коммерческое использование), Pro $100/мес (1 620 минут, 2 млн кредитов, безлимит голосов, 3 командных места), Max $999/мес (6 250 минут, 25 млн кредитов, 10 командных мест, для крупного производства). На странице тарифов действует ограниченное по времени предложение «50% скидка на год» + 3 месяца бесплатно при годовой оплате. Платежи обрабатывает Stripe.
Юридическая информация
Оператор сервиса — Hanabi AI Inc., зарегистрирован в штате Делавэр, США. Юридический адрес и адрес DMCA-агента: 1111B S Governors Ave STE 48109, Dover, DE 19904, United States. Контакт по любым вопросам и реализации прав по CPRA (California), VCDPA (Virginia), GDPR (EEA / UK / Switzerland), LGPD (Brazil), а также по DMCA — support@fish.audio. Возрастное ограничение — от 13 лет (для пользователей 13–17 лет требуется разрешение родителей или законных представителей).
Плюсы и минусы Fish Audio
+Преимущества
- ✓Один из лидеров по реалистичности AI-голосов (по отзывам KOL — превосходит ElevenLabs по эмоциональным нюансам)
- ✓2 000 000+ голосов в публичной библиотеке с фильтрами по полу, возрасту, стилю и языку
- ✓Клонирование голоса требует всего 15 секунд эталонного аудио
- ✓Эмоциональные и звуковые теги управляют интонацией прямо из текста
- ✓Большое количество русских голосов в библиотеке сообщества
- ✓Доступ к API уже на стартовом платном тарифе Plus ($15/мес)
- ✓Коммерческое использование разрешено на всех платных планах
- ✓Прозрачная юридическая структура (Hanabi AI Inc., США), DMCA и compliance с CPRA/VCDPA/GDPR/LGPD
−Недостатки
- ✗Нет русскоязычного юридического оператора и оплаты в рублях — расчёт через Stripe в USD
- ✗На бесплатном тарифе всего 7 минут генерации и 500 символов за раз
- ✗Стоимость старшего тарифа Max $999/мес рассчитана на крупное производство
- ✗Кредитная модель тарификации требует понимания того, как считаются кредиты на минуту/символ
- ✗UI и документация преимущественно на английском (русскоязычная локализация частична)
- ✗API-вызовы оплачиваются отдельно по pay-as-you-go поверх ежемесячного плана
- ✗Возрастное ограничение 13+ (доступ для 13–17 лет — только с разрешением родителей)
Сценарии использования Fish Audio
Озвучивание видео
Преобразование сценариев в богатое повествование под YouTube, рекламу и объясняющие видео. Смена тона, эмоциональные метки и удержание внимания зрителя.
Озвучивание аудиокниг
Готовое к публикации повествование с реалистичным темпом, эмоциями и управлением на уровне глав. Часы аудио, соответствующего спецификациям ACX/Audible — без звукозаписывающей студии.
Голоса персонажей
Клонирование фирменных голосов и брендовых персонажей для игр, анимации и интерактивных историй. Тонкая настройка эмоций онлайн или через простой API.
Разговорные чат-боты и голосовые агенты
Естественный голос для службы поддержки и виртуальных агентов с минимальной задержкой. Тоновые теги для полезных, сочувствующих или жизнерадостных ответов.
Доверие и масштаб
Отзывы о Fish Audio
Поделитесь опытом использования
Помогите другим сделать правильный выбор — ваш отзыв будет полезен
Часто задаваемые вопросы о Fish Audio
?Что такое Fish Audio и какие у него основные продукты?
Fish Audio (fish.audio) — это AI-платформа компании Hanabi AI Inc. (США, Делавэр) для синтеза речи (TTS), клонирования голоса и распознавания речи. На главной заявлены три основных направления: Текст в речь на моделях S1/S2, Клонирование голоса по 15-секундному эталону и Распознавание речи с поддержкой нескольких дикторов. Также доступно комплексное решение «Голосовой агент».
?Сколько стоит Fish Audio?
Бесплатный тариф (7 минут генерации, 8 000 кредитов в месяц), Plus за $15/мес (200 минут, 250 000 кредитов, API, коммерческое использование), Pro за $100/мес (1 620 минут, 2 млн кредитов, 3 командных места) и Max за $999/мес (6 250 минут, 25 млн кредитов, 10 командных мест). На странице тарифов действует ограниченное предложение: 50% скидка при оплате на год + 3 месяца бесплатно.
?Сколько секунд аудио нужно для клонирования голоса?
По данным сайта и отзывам пользователей — около 15 секунд эталонной записи. На платных тарифах (Plus и выше) Fish Audio использует «улучшенное клонирование», которое работает точнее на тех же 15 секундах.
?Какие языки поддерживает Fish Audio?
В FAQ сайта явно перечислены: английский, японский, корейский, китайский, французский, немецкий, арабский и испанский. Команда заявляет о поддержке 30+ языков и постоянном расширении списка. В библиотеке голосов также есть большой раздел русскоязычных голосов от пользователей сообщества (Меллстрой, Жириновский, Сергей Бурунов и др.).
?Можно ли использовать сгенерированные голоса в коммерческих целях?
Да, на любом платном тарифе (Plus, Pro, Max) коммерческое использование разрешено. На бесплатном тарифе сгенерированный аудиоконтент предназначен для личного и тестового использования. Вопрос лицензии конкретного клонированного голоса остаётся на стороне правообладателя голоса.
?Есть ли у Fish Audio API?
Да, API доступен начиная с тарифа Plus ($15/мес) с моделью оплаты pay-as-you-go (поверх ежемесячных кредитов плана). API-функции включают синтез речи в реальном времени, клонирование голоса и распознавание речи. Для крупных команд (Pro, Max) добавляются командные места в дашборде.
?Какие эмоциональные и звуковые теги поддерживает Fish Audio S2?
Эмоциональные теги: [angry], [sad], [embarrassed], [emphasis], [whispering], [soft], [breathy], [excited]. Звуковые теги: [laughing], [chuckling], [moaning], [clear throat], [sobbing], [crying loudly], [sighing], [panting], [groaning], [crowd laughing], [background laughter], [audience laughing], [pause], [long pause]. Теги ставятся прямо в исходный текст, и модель учитывает их при генерации.
?Где зарегистрирована компания и как с ней связаться?
Сервис управляет Hanabi AI Inc., зарегистрированная в штате Делавэр, США. Юридический адрес и адрес DMCA-агента — 1111B S Governors Ave STE 48109, Dover, DE 19904. Контактный email для всех запросов — support@fish.audio. Privacy Policy и Terms of Use опубликованы на сайте; компания соблюдает CPRA, VCDPA, GDPR, LGPD, COPPA.
Обновлено: 7 мая 2026 г.