Расшифровать видео-лекцию в конспект, вытащить субтитры из чужого ролика или сделать подписи для Reels сегодня можно бесплатно и за минуты. У YouTube есть встроенная расшифровка, онлайн-сервисы принимают ссылку на видео, а видеоредакторы делают субтитры в один клик. Разберём все способы перевести видео в текст, чем отличаются форматы субтитров, насколько точны авто-субтитры на русском, и покажем результат собственного теста сервиса.
Видео в текст превращают по разным причинам: студенту нужен конспект лекции, маркетологу, субтитры для ролика, журналисту, цитаты из интервью. Эта статья продолжает наш гайд по транскрибации аудио и видео в текст, но фокусируется именно на видео и субтитрах.
Какими способами перевести видео в текст
Все методы сводятся к одному: из видео извлекается звук, а нейросеть распознаёт речь. Разница в удобстве, цене и приватности. Вот пять основных способов, от самого простого к самому гибкому.
| Способ | Цена | Когда подходит |
|---|---|---|
| Расшифровка YouTube | Бесплатно | Видео уже на YouTube и у него есть субтитры |
| Онлайн-сервис по ссылке | Free-лимит, далее платно | Нужна точность, разделение спикеров, субтитры файлом |
| Видеоредактор | Чаще бесплатно | Субтитры прямо в ролик (Reels, Shorts) |
| Whisper (своё видео) | Бесплатно локально | Приватное видео, большой объём, свой компьютер |
| Телефон | Бесплатно | Быстро, на ходу, для коротких роликов |
Дальше разберём каждый способ подробно, начиная с самого бесплатного.
Главное здесь: перевести видео в текст можно пятью способами, встроенная расшифровка YouTube (бесплатно), онлайн-сервисы по ссылке (точность и субтитры), видеоредакторы (субтитры в ролик), Whisper локально (приватно и бесплатно) и приложения на телефоне; выбор зависит от того, где видео и что нужно на выходе.
Как бесплатно получить расшифровку видео на YouTube
Если видео лежит на YouTube, самый быстрый способ получить его текст, встроенная расшифровка, и она бесплатна. На компьютере под плеером нажмите «...ещё», прокрутите вниз и нажмите «Показать текст видео», панель с расшифровкой появится справа. Текст прокручивается синхронно с видео, а клик по строке перематывает к нужному моменту.
Чтобы убрать тайм-коды, нажмите три точки в панели расшифровки и выберите «Показать или скрыть временные метки», затем выделите текст и скопируйте. Важное ограничение: расшифровка доступна только если у видео есть субтитры (загруженные автором или авто-сгенерированные), а они есть не у всех роликов. В мобильном приложении кнопка та же, но отключить тайм-коды там нельзя.
«Почти у всех видео на ютубе есть готовые субтитры. Чуть хуже, чем то, что делает Whisper, но для переваривания с помощью нейросети, без разницы вообще».
— pol_pot, комментарий на Habr, август 2025.
Это полезный лайфхак: если вам нужен не идеальный транскрипт, а конспект или саммари, расшифровки YouTube обычно хватает, чтобы скормить её нейросети и получить краткую выжимку. Если же субтитров у видео нет или нужен готовый файл SRT, переходите к сервисам.
Главное здесь: у видео на YouTube текст забирается бесплатно через «...ещё» → «Показать текст видео», тайм-коды убираются тремя точками в панели; работает, только если у ролика есть субтитры, а для конспекта через нейросеть этой расшифровки обычно достаточно.
Онлайн-сервисы: видео по ссылке или файлом
Когда нужно транскрибировать встречу, лекцию или другой контент с высокой точностью, разделением по спикерам или субтитрами готовым файлом, удобнее онлайн-сервисы. Вы либо вставляете ссылку на видео (YouTube, VK, RuTube), либо загружаете файл, а сервис возвращает текст и субтитры.

Удобный российский вариант, Speech2Text: он принимает и файл, и ссылку на YouTube/VK/Dzen, делит запись по спикерам, ставит пунктуацию и отдаёт субтитры, а данные обрабатываются в российском контуре:
Реклама обещает быструю расшифровку, но на анонимной пробе всё иначе.

Из других сервисов с поддержкой ссылок: российский Any2Text (принимает YouTube, RuTube, VK, рублёвые тарифы) и мультиязычный TurboScribe (работает на Whisper, до 98 языков, экспорт в SRT и VTT). Any2Text удобен, когда нужен русский интерфейс и оплата картой РФ:
TurboScribe берёт объёмом и форматами, на бесплатном тарифе доступно 3 файла в день до 30 минут каждый:
При выборе смотрите, что сервис отдаёт на выходе и какие у него лимиты. Хорошая расшифровка аудио и видео приходит со знаками препинания, абзацами и репликами по спикерам, а экспортировать её можно в популярные форматы: TXT, DOCX (Word), субтитры SRT, иногда таблицу XLSX. Проверьте лимиты по длительности ролика и размеру файла на бесплатном тарифе, поддержку нужных языков (русский, английский), запись с диктофона и поиск по ключевым словам в тексте. Из российских сервисов называют ещё Teamlogs, но, по отзывам, он плохо справляется с несколькими спикерами. Аудиодорожку сервисы принимают в любых форматах, включая MP3, WAV и OGG.
Главное здесь: онлайн-сервисы (Speech2Text, Any2Text, TurboScribe) расшифровывают видео по ссылке или файлом, делят по спикерам и отдают субтитры; на практике заявленную скорость дают зарегистрированные тарифы, а анонимная проба медленнее, российские сервисы удобны рублёвой оплатой и обработкой в РФ.
Субтитры: форматы SRT и VTT, вшитые и отдельные
Если результат нужен в виде субтитров, важно понимать два деления: по формату файла и по способу наложения на видео.
По формату чаще всего встречаются SRT и VTT. SRT (SubRip) — это самый простой и совместимый формат: его понимают почти все плееры и платформы (YouTube, VK, ВКонтакте, VLC), но он не поддерживает стили и позиционирование. VTT (WebVTT), более продвинутый: поддерживает жирный шрифт, курсив, цвет и положение на экране — это родной формат для веба и соцсетей. Форматы не взаимозаменяемы: если платформа ждёт SRT, файл VTT она может не подхватить.
| Признак | SRT | VTT |
|---|---|---|
| Стили (цвет, шрифт) | Нет | Да |
| Совместимость | Максимальная | Веб, соцсети |
| Когда брать | Обучающие и корпоративные видео | Сайт, стилизованные подписи |
По способу наложения субтитры бывают мягкие и вшитые. Мягкие (softsub) — это отдельный файл SRT или VTT: зритель может включить и выключить их, поменять язык, а вы легко правите текст без перерендера видео. Вшитые (hardsub) — это субтитры, впечатанные прямо в кадр: их нельзя отключить, зато они гарантированно видны везде, поэтому в Reels и TikTok, где подписи, часть картинки, используют именно их.
Главное здесь: по формату субтитры делятся на SRT (максимально совместимый, без стилей) и VTT (со стилями, для веба), они не взаимозаменяемы; по наложению, на мягкие (отдельный файл, отключаемые, легко править) и вшитые в кадр (нельзя отключить, нужны для Reels и TikTok).
Как сделать авто-субтитры для Reels, Shorts и YouTube
Если субтитры нужны прямо в ролике для соцсетей, проще всего сделать их в видеоредакторе с автоматическим распознаванием речи. Они сами расшифруют звук, разобьют на фразы и впишут подписи, останется поправить ошибки.
В CapCut это раздел «Текст» → «Автоматические субтитры» → выбор языка → «Создать», русский поддерживается, и для коротких роликов это бесплатно. В Reels есть встроенный стикер «Подписи», который генерирует субтитры автоматически (русский язык добавлен с сентября 2024 года). А Clipchamp от Microsoft делает авто-субтитры бесплатно для всех и умеет выгружать их отдельным файлом SRT:
Для горизонтальных видео и YouTube подойдут и веб-сервисы вроде VEED или Vizard, но у них на бесплатном тарифе обычно есть водяной знак и лимит по длине. Какой бы редактор вы ни выбрали, авто-субтитры всегда нужно вычитывать перед публикацией.
Главное здесь: авто-субтитры для Reels, Shorts и YouTube делают в видеоредакторах: CapCut («Текст» → «Автоматические субтитры»), встроенный стикер «Подписи» в Reels (русский с сентября 2024) или Clipchamp с экспортом в SRT; результат обязательно вычитывать.
Извлечь аудио и распознать через Whisper
Для своего видео, особенно приватного или большого, лучший вариант, распознать его локально через Whisper. Это бесплатно, и файл никуда не уходит. Извлекать звук вручную не обязательно: Whisper читает видеофайлы напрямую (MP4, MKV, MOV), потому что использует встроенный FFmpeg.
Если хочется вытащить именно аудиодорожку (например, чтобы загрузить её в сервис) — это делается одной командой FFmpeg вида ffmpeg -i video.mp4 -map a audio.mp3. Дальше аудио распознаётся как обычно. Через облачный Whisper API расшифровка часа видео стоит около 0,36 доллара, а локально, бесплатно, нужна только видеокарта для больших моделей. Подробно про установку, модели и точность, в нашем гайде по Whisper.
$0,36 за час
столько стоит расшифровать час видео через облачный Whisper API. А встроенная расшифровка YouTube и локальный Whisper, бесплатны вовсе. Платить есть смысл за удобство, скорость, работу по ссылке и разделение по спикерам, а не за саму расшифровку.
Главное здесь: своё видео удобно распознать через Whisper, он читает видеофайлы напрямую (MP4, MKV, MOV) без ручного извлечения звука; локально это бесплатно и приватно, через API, около 0,36 доллара за час, а извлечь дорожку при необходимости можно одной командой FFmpeg.
Точность авто-субтитров на русском и почему они врут
Авто-субтитры удобны, но не идеальны. По оценкам обзоров, точность авто-субтитров YouTube на русском держится в районе 80-85% (официальной цифры Google не публикует), то есть примерно каждое шестое-седьмое слово может быть с ошибкой. Whisper на чистом русском точнее, около 5% ошибок, но и он спотыкается на шуме и акцентах.
Чаще всего страдают имена собственные и топонимы, пунктуация расставляется хаотично, а похожие по звучанию слова заменяются. Отдельная беда видео, рассинхрон: субтитры начинают съезжать и появляться раньше или позже речи. Поэтому любые авто-субтитры перед публикацией нужно вычитывать.
«Может возникнуть проблема рассинхронизации текста с видео, то есть когда текст появляется сильно раньше или позже речи докладчика». А сам докладчик «может говорить невнятно, неразборчиво или со странным акцентом».
— Евгений Бартов, статья о подготовке субтитров на vc.ru, 18.03.2023.
Если субтитры съехали, время сдвигают в онлайн-инструментах или редакторах субтитров вроде Aegisub. Но если рассинхрон плавающий (нарастает по ходу видео), простой сдвиг не спасёт, придётся править по фрагментам.
Главное здесь: авто-субтитры YouTube на русском дают около 80-85% точности (оценка обзоров), коверкают имена, пунктуацию и похожие слова, а у видео добавляется рассинхрон; Whisper точнее (около 5% ошибок), но любые авто-субтитры нужно вычитывать перед публикацией.
Видео в текст на телефоне
На смартфоне видео тоже переводится в текст, и часто без сторонних приложений. В мобильном приложении YouTube расшифровка работает так же, как на компьютере: под видео есть кнопка «Показать текст видео», и русский поддерживается, только тайм-коды в мобильной версии отключить нельзя.
Для своих роликов удобны мобильные редакторы: CapCut делает авто-субтитры на русском бесплатно, а в Instagram Reels есть встроенный стикер «Подписи». Из отдельных приложений субтитры умеют MixCaptions и Kaptioned. Все они работают по одному принципу: распознают речь в ролике и накладывают подписи, которые потом можно поправить и стилизовать.
Главное здесь: на телефоне видео переводят в текст встроенными средствами (расшифровка в приложении YouTube, стикер «Подписи» в Reels) или мобильными редакторами (CapCut, MixCaptions, Kaptioned); тайм-коды в мобильном YouTube отключить нельзя.
RuTube и VK Видео: что с субтитрами
С российскими видеоплатформами ситуация разная. У VK Видео с февраля 2025 года работают «умные субтитры»: новая ИИ-модель распознаёт русскую речь с пунктуацией и учётом сленга, и по данным VK охват видео с субтитрами вырос в десять раз. Это бесплатно и нативно для России.
У RuTube собственной расшифровки или субтитров пока нет. Чтобы получить текст ролика с RuTube, его прогоняют через сторонний сервис (Speech2Text, Any2Text принимают ссылку) или скачивают видео и распознают через Whisper. Так что для RuTube подход тот же, что и для любого файла.
Главное здесь: у VK Видео есть бесплатные «умные субтитры» на русском (с февраля 2025), а у RuTube своей расшифровки нет, текст с него получают через сторонние сервисы (Speech2Text, Any2Text) или скачиванием видео и распознаванием через Whisper.
Безопасно ли загружать видео в облако? 152-ФЗ
Если видео содержит персональные данные (запись совещания, консультации, выступления с именами), стоит подумать, куда вы его загружаете. Большинство онлайн-сервисов отправляют ваш файл на свои серверы, а часть из них, зарубежные.
Для записей с персональными данными по 152-ФЗ безопаснее два пути. Первый, распознавать локально через Whisper: видео не покидает компьютер. Второй, использовать российский сервис с обработкой данных в РФ. Например, тот же Speech2Text заявляет, что не хранит файлы после удаления, и включён в реестр российского ПО, а значит, данные остаются в российском контуре. Для публичного ролика с YouTube это неважно, а для внутренней записи с данными сотрудников или клиентов, принципиально.
Главное здесь: видео с персональными данными нельзя бездумно грузить в облако; по 152-ФЗ безопаснее распознавать локально через Whisper (файл не уходит) или брать российский сервис с обработкой в РФ; для публичного видео это неважно, для записей с личными данными, обязательно.
Как выбрать способ перевода видео в текст
Способ проще выбирать от того, где лежит видео и что нужно на выходе.
Главное здесь: выбирайте от задачи, видео на YouTube, встроенная расшифровка; нужна точность и субтитры, сервис по ссылке; подписи в ролик, видеоредактор; приватное видео, Whisper локально; персональные данные, только локально или российский сервис.
5 ошибок при переводе видео в текст
Ошибка 1: «Опубликую авто-субтитры без вычитки»
Что не так: авто-субтитры на русском дают около 80-85% точности, коверкают имена, пунктуацию и похожие слова, а у видео ещё и съезжают тайм-коды.
Что делать: всегда вычитывать и поправлять авто-субтитры перед публикацией, особенно имена, термины и расстановку по времени.
Ошибка 2: «Залью запись совещания в первый попавшийся сервис»
Что не так: видео с персональными данными уходит на чужой, часто зарубежный сервер, а это риск по 152-ФЗ.
Что делать: приватные записи распознавать локально через Whisper или в российском сервисе с обработкой данных в РФ.
Ошибка 3: «Сделал субтитры в VTT, а платформа их не видит»
Что не так: SRT и VTT не взаимозаменяемы; если платформа ждёт SRT, файл VTT может не подхватиться.
Что делать: уточнять, какой формат принимает площадка; для максимальной совместимости брать SRT, для стилей и веба, VTT.
Ошибка 4: «Жду от бесплатной пробы скорости из рекламы»
Что не так: на анонимной пробе даже короткое видео обрабатывается медленно; заявленная скорость относится к платным и зарегистрированным тарифам.
Что делать: для реальной работы завести бесплатный аккаунт сервиса или взять тариф, а не рассчитывать на анонимный пробный режим.
Ошибка 5: «Скачаю всё видео ради пары цитат с YouTube»
Что не так: если ролик уже на YouTube и у него есть субтитры, скачивать видео и гонять через сервис незачем.
Что делать: взять текст через встроенную расшифровку YouTube («...ещё» → «Показать текст видео») — это бесплатно и мгновенно.
Вывод
Перевести видео в текст сегодня можно бесплатно и быстро, главное, выбрать способ под задачу. Если ролик на YouTube и у него есть субтитры, проще всего забрать текст встроенной расшифровкой через «...ещё» → «Показать текст видео». Когда нужна высокая точность, разделение по спикерам или готовый файл субтитров, подойдут онлайн-сервисы по ссылке: российские Speech2Text и Any2Text с рублёвой оплатой или мультиязычный TurboScribe. Проба напомнила важное: рекламную скорость дают зарегистрированные тарифы, а не анонимный доступ. Субтитры прямо в ролик для Reels и Shorts делают в CapCut, Clipchamp или встроенном стикере, а своё приватное видео лучше распознать локально через Whisper, который читает видеофайлы напрямую. Из форматов SRT даёт максимальную совместимость, VTT, стили для веба. И помните два правила: авто-субтитры на русском всегда нужно вычитывать, а видео с персональными данными по 152-ФЗ безопаснее обрабатывать локально или в российском сервисе.
Источники
📺 YouTube и платформы
- Справка YouTube, как посмотреть расшифровку видео
- Справка YouTube, об автоматических субтитрах
- iXBT, 24.02.2025, VK Видео запустил «умные субтитры»
🛠 Сервисы и практика
- speech2text.ru, расшифровка видео по ссылке и файлом
- Habr, 02.08.2025, видео в текст через Whisper, цена около 0,36 доллара за час
- vc.ru, 28.10.2024, транскрибация YouTube-видео: 5 способов
💬 Субтитры и отзывы
- vc.ru, 18.03.2023, Евгений Бартов о сложностях подготовки субтитров
- Postium, 11.09.2024, авто-субтитры для Reels (русский язык)



