Перейти к содержимому

Как убрать или вытащить вокал из песни: сервисы для минусовки и акапеллы

Как убрать или вытащить вокал из песни: бесплатные онлайн-сервисы и программы для минусовки, акапеллы и стемов, сравнение качества разных моделей и что работает из России.

14 мин чтения
Руслан Авдеев
разделение вокалаубрать вокал из песниминусовкаакапеллаvocal removerстемыкараокеразделение аудионейросетизвук
Как разделить вокал и инструментал: готовый микс песни проходит через нейросеть-сепаратор и распадается на отдельные дорожки, вокал (акапелла) и инструментал (минусовка). Сервисы vocalremover.org, LALAL.ai, MVSEP, Moises и программа UVR

Сделать минусовку для караоке, вытащить чистую акапеллу для кавера или разделить трек на отдельные дорожки (барабаны, бас, голос) сегодня можно онлайн за минуты, причём бесплатно. Нейросети-сепараторы научились разбирать готовый микс на части лучше старых способов «вырезания центра». Разберём, как убрать или вытащить вокал из песни, какие сервисы и программы для этого есть, чем они отличаются по качеству и что работает из России. С нашим тестом и реальными отзывами.

Разделение вокала нужно музыкантам, диджеям, авторам каверов и просто тем, кто хочет спеть под минус любимой песни. Эта статья из нашей серии про работу со звуком; общий разбор смотрите в гайде по транскрибации и работе с аудио.

Что такое разделение вокала и стемы

Разделение вокала — это выделение из готовой песни (где все дорожки уже сведены в один файл) отдельных составляющих. Технически это называется source separation, разделение источников. Несколько терминов, которые встретятся:

  • Стемы (stems), отдельные дорожки микса. Классический набор из четырёх: вокал, барабаны, бас и «прочее».
  • Акапелла, выделенная вокальная дорожка без музыки.
  • Минусовка (инструментал), наоборот, дорожка без вокала, основа для караоке.

Раньше вокал убирали грубо: инвертировали фазу стереоканалов, вычитая то, что записано «по центру». Это портило звук и не работало на сложных миксах. Современные сервисы используют нейросети, обученные на тысячах песен с известными отдельными дорожками: сеть «понимает», где голос, а где инструменты, и разбирает даже моно-запись. Поэтому качество выросло кратно, хотя и не стало идеальным.

Главное здесь: разделение вокала — это выделение из готового микса отдельных дорожек (стемов): акапеллы (голос) и инструментала (минусовки); современные нейросети-сепараторы делают это заметно лучше старого «вычитания центра» и работают даже на сложных и моно-записях.

Как бесплатно убрать вокал из песни онлайн

Для разовой задачи проще всего браузерный сервис: загрузил файл, через несколько секунд скачал инструментал и акапеллу, ничего не устанавливая. Самый известный бесплатный вариант, vocalremover.org: он работает прямо в браузере, на русском и без регистрации.

Интерфейс vocalremover.org на русском: сервис разделяет музыку на инструментальную и вокальную партии с помощью нейросети, показывает дорожки Музыка и Вокал и кнопку Выбрать файл, слева набор инструментов сплиттер, изменить тональность, BPM, обрезать

Браузерный сервис разделения вокала с набором смежных инструментов:

Кроме него без регистрации работают MVSEP (даёт лучшее качество, но без аккаунта стоит в очереди по часу и отдаёт только MP3) и российский X-Minus. Их разберём дальше.

«Загрузите аудио или видео, алгоритм за 10 секунд создаст инструментал и акапеллу».

Костя и AI, обзор сервисов удаления голоса на vc.ru, 27.04.2025.

Главное здесь: бесплатно и без регистрации убрать вокал онлайн можно в vocalremover.org (браузер, русский, только файл, лимит около 10 минут в день), а также в MVSEP и российском X-Minus; для разовой минусовки этого достаточно.

Лучшие сервисы и программы: сравнение

Сервисов и программ много, и они сильно отличаются по качеству, цене и удобству. Принцип у всех схожий: вы загружаете аудиофайл, нейросеть обрабатывает его для отделения вокала и за минуту отдаёт акапеллу и минусовку. Большинство сервисов поддерживают MP3 и WAV, а для извлечения вокала в высоком качестве и профессиональных задач берут модели посильнее, с их помощью можно создавать минусовки, каверы и ремиксы. Вот основные варианты.

Сервис Цена Чем хорош
vocalremover.org Бесплатно Браузер, русский, без регистрации, лимит 10 мин/день
MVSEP Бесплатно 30+ моделей, лучшее качество, но очередь без аккаунта
X-Minus Free + Premium (РФ) Российский, караоке-библиотека, оплата рублём
LALAL.ai Free 10 мин, от $7,5/мес Чистый результат, до 10 стемов, но карта РФ не проходит
Moises Free 5 в мес Приложение, стемы плюс смена темпа и тональности
UVR (программа) Бесплатно Мощно, модели Demucs и MDX, но нужна установка и GPU

Отдельно стоит упомянуть AI-сервисы, которые чистят звук и попутно делят на голос и музыку, например AudioCleaner, удобный, когда нужно убрать ещё и шум:

Логика выбора простая: для разового караоке хватит бесплатного vocalremover.org или X-Minus; за максимальным качеством идите в MVSEP или платный LALAL.ai; а если разделять нужно много и регулярно, ставьте бесплатную программу UVR на компьютер.

Главное здесь: для разовой задачи подойдут бесплатные vocalremover.org и российский X-Minus; за лучшим качеством, MVSEP или LALAL.ai; для регулярной работы без лимитов, бесплатная десктопная программа UVR с моделями Demucs и MDX.

Качество: какие модели лучше и почему остаются артефакты

Качество разделения зависит не столько от сервиса, сколько от модели нейросети под капотом. Их сравнивают по метрике SDR (чем выше, тем чище разделение), и разрыв между моделями заметный.

11,9 против 9

такова разница в чистоте разделения вокала (метрика SDR в децибелах) между лучшими современными моделями семейства RoFormer на сервисе MVSEP и популярной Demucs. Поэтому качество минусовки сильно зависит от того, какой сервис и какую модель вы выбрали, а не только от самой песни.

На сегодня самый чистый вокал дают модели RoFormer (их используют ансамбли MVSEP), за ними идёт Demucs четвёртой версии, на которой работают Audacity и многие сервисы. Старый Spleeter заметно слабее. Но даже лучшие модели не дают идеального результата: в минусовке часто остаются следы голоса, особенно бэк-вокал, хор и «хвосты» реверберации, которые физически смешаны с музыкой и плохо отделяются. На хип-хопе и электронике разделение обычно хуже, чем на поп- и рок-треках.

«Из бесплатных нормально работает разве что Moises, но качество заметно просело».

kredwi, пользователь, Ответы Mail.ru (формулировка сокращена).

Поэтому относитесь к результату трезво: для караоке и черновика хватит любого сервиса, а для чистой акапеллы под публикацию стоит сравнить несколько моделей или довести результат в спектральном редакторе.

Главное здесь: качество разделения определяет модель нейросети (лучшие, RoFormer на MVSEP, SDR около 11,9 против 9 у Demucs); идеального разделения не бывает, в минусовке остаются бэк-вокал, эхо и реверб, а хип-хоп и электроника делятся хуже поп-музыки.

Как сделать минусовку для караоке

Минусовка — это та же инструментальная дорожка, поэтому делается она в один шаг: загрузите песню в любой сепаратор, выберите разделение на вокал и инструментал и скачайте инструментал. Этого достаточно, чтобы петь под оригинальную аранжировку.

Часто под караоке нужно ещё и подстроить тональность под свой голос. Это умеют российский X-Minus (у него к тому же огромная готовая библиотека караоке-треков) и приложение Moises, где есть и смена тональности, и смена темпа. В vocalremover.org смена тональности тоже встроена отдельным инструментом, как мы видели в нашем тесте.

Главное здесь: минусовка — это инструментальная дорожка: разделите песню на вокал и инструментал и скачайте инструментал; чтобы петь под свой голос, поменяйте тональность (это умеют X-Minus с большой караоке-библиотекой, Moises и сам vocalremover.org).

Как вытащить акапеллу для AI-кавера

Отдельный популярный сценарий, выделить чистый вокал, чтобы потом перепеть песню другим голосом через нейросеть. Здесь к разделению добавляется пара шагов.

Сначала вытащите акапеллу качественной моделью: лучше всего подойдут MVSEP или бесплатная программа UVR с моделями Kim Vocal или MDX-Net. Затем, если в вокале остался реверб или эхо, прогоните его через модель де-реверберации (в UVR это Reverb HQ), иначе призвук помешает. Чистую акапеллу уже подают в RVC, технологию преобразования голоса. Подробно про неё, в нашем разборе войс-чейнджеров и AI-каверов.

Главное здесь: для AI-кавера вытащите чистую акапеллу хорошей моделью (MVSEP или UVR с Kim Vocal / MDX-Net), при необходимости уберите реверб (Reverb HQ в UVR), а затем подайте вокал в RVC для преобразования голоса.

Как убрать музыку из речи или подкаста

Бывает и обратная задача: оставить голос и убрать фоновую музыку, например из записи интервью, подкаста или лекции, где играла музыкальная подложка. Это решается тем же разделением: нейросеть отличает речь от музыки, вы берёте голосовой стем и отбрасываете инструментал.

Современные AI-сепараторы делают это с точностью выше 90%, тогда как старые методы (эквалайзер, вычитание фазы) на реальных записях дают плохой результат. Подойдут MVSEP, AudioCleaner или встроенные инструменты видеоредакторов. Если же из записи нужен текст, а не чистый звук — это уже задача транскрибации, о которой у нас есть отдельный подробный гайд.

Главное здесь: чтобы убрать музыку и оставить голос, используйте AI-сепаратор (MVSEP, AudioCleaner) и возьмите голосовой стем; нейросети делают это точнее старого эквалайзера, а если нужен текст из записи — это уже транскрибация.

Как разделить трек на стемы (барабаны, бас, инструменты)

Если нужно не просто убрать вокал, а разобрать трек на отдельные инструменты (барабаны, бас, прочее), нужен многостемный сепаратор. Это полезно для ремиксов, мэшапов, обучения игре и диджеинга.

Бесплатный и качественный вариант, модель Demucs четвёртой версии: она делит на четыре стема и доступна как через командную строку, так и через бесплатный плагин OpenVINO для редактора Audacity, который работает офлайн. В онлайн-сервисах (LALAL.ai, MVSEP, Moises) можно выбрать конкретный тип (барабаны или бас), но учтите, что в LALAL.ai каждый дополнительный тип расходует отдельные минуты. После разделения дорожки сводят и обрабатывают в обычном аудиоредакторе.

Главное здесь: чтобы разобрать трек на стемы (барабаны, бас, прочее), берут многостемную модель Demucs v4 (через Audacity с плагином OpenVINO бесплатно и офлайн) или онлайн-сервисы LALAL.ai, MVSEP, Moises; в LALAL каждый тип стема расходует отдельные минуты.

Бесплатные программы: UVR, Demucs и Audacity

Если разделять нужно регулярно и без лимитов, лучше поставить программу на компьютер, тем более что лучшие из них бесплатны и open-source.

Ultimate Vocal Remover (UVR) — это бесплатная десктопная программа с графическим интерфейсом, которая подключает топовые модели (Demucs, MDX-Net) и докачивает их из встроенного центра загрузки. Её считают самым универсальным бесплатным вариантом, по качеству она не уступает платным веб-сервисам. Минус, нужна установка и желательно видеокарта, а на настройку уйдёт время. Сами модели Demucs (от Meta) и Spleeter (от Deezer) можно запускать и напрямую через командную строку. А для тех, кто не хочет ставить отдельный софт, разделение на четыре стема встроено в бесплатный плагин OpenVINO для Audacity.

Главное здесь: для регулярной работы без лимитов берут бесплатные программы: UVR (графический интерфейс, модели Demucs и MDX, нужна установка и GPU), сами Demucs и Spleeter через командную строку или плагин OpenVINO в Audacity для разделения на стемы офлайн.

Что работает из России

Большинство сервисов разделения вокала открываются из России, и сама обработка трека VPN не требует. Сложности возникают только с оплатой платных тарифов западных сервисов.

Без проблем из России работают: российский X-Minus (родной русский интерфейс, оплата рублём, большая караоке-библиотека), vocalremover.org (есть русская версия, бесплатная функция доступна) и MVSEP (бесплатно, есть русский). Десктопные UVR, Demucs и Audacity вообще не зависят от страны. А вот у LALAL.ai прямая оплата картой РФ не проходит (биллинг через Stripe), для платной подписки нужны посредники или зарубежная карта. Moises частично работает, оплата зависит от региона аккаунта в сторе.

Главное здесь: из России обработка работает у большинства сервисов без VPN; удобнее всего российский X-Minus (рублём), а также vocalremover.org и MVSEP бесплатно; у LALAL.ai карта РФ не проходит, нужны посредники, десктопные UVR и Audacity от страны не зависят.

Как выбрать сервис разделения вокала

Выбор проще делать от задачи и от того, насколько важно качество.

Дерево выбора сервиса разделения вокала по задаче: для разовой минусовки подойдёт бесплатный vocalremover.org или X-Minus, для максимального качества MVSEP или LALAL.ai, для AI-кавера UVR с моделями, для регулярной работы программа UVR, для оплаты из России X-Minus

Главное здесь: от задачи: разовая минусовка, vocalremover.org или X-Minus; чистая акапелла, MVSEP или LALAL.ai; для кавера, UVR плюс RVC; регулярно, программа UVR; оплата из РФ, X-Minus; стемы, Demucs в Audacity.

5 ошибок при разделении вокала

Ошибка 1: «Жду идеально чистую минусовку с первого раза»

Что не так: даже лучшие модели оставляют следы голоса, особенно бэк-вокал, хор и реверб; идеального разделения не существует.

Что делать: сравнить несколько моделей (MVSEP, UVR), а для важной задачи довести результат в спектральном редакторе.

Ошибка 2: «Любой сервис разделит одинаково»

Что не так: качество зависит от модели нейросети, разрыв между RoFormer и старым Spleeter огромный.

Что делать: для качества выбирать сервисы с современными моделями (RoFormer на MVSEP, Demucs v4), а не первый попавшийся сайт.

Ошибка 3: «Подам в RVC акапеллу прямо с реверберацией»

Что не так: остатки эха и реверба в вокале портят AI-кавер, голос звучит грязно и с призвуком.

Что делать: перед RVC прогнать акапеллу через де-реверберацию (модель Reverb HQ в UVR), чтобы вокал был чистым.

Ошибка 4: «Оплачу LALAL.ai российской картой»

Что не так: LALAL.ai и большинство западных сервисов используют Stripe, карты РФ у них не проходят.

Что делать: для оплаты из России брать X-Minus (рублём) или бесплатные MVSEP и UVR; к LALAL.ai, посредники или зарубежная карта.

Ошибка 5: «Минуты в LALAL.ai не кончатся»

Что не так: минуты списываются как длина файла, умноженная на число типов разделения, и сгорают ежемесячно; разбор на стемы тратит их быстро.

Что делать: выбирать только нужные типы стемов, а для частой работы перейти на бесплатную программу UVR.

Вывод

Разделить вокал и инструментал сегодня просто и чаще всего бесплатно. Для разовой минусовки или караоке достаточно браузерного vocalremover.org (он работает без регистрации, на русском, с лимитом около 10 минут в день) или российского X-Minus с оплатой рублём. За максимально чистой акапеллой идите в MVSEP с моделями RoFormer или платный LALAL.ai, а для регулярной работы без лимитов поставьте бесплатную программу Ultimate Vocal Remover. Главное, помните два момента: идеального разделения не бывает, в минусовке почти всегда остаются следы бэк-вокала и реверба, а качество сильно зависит от модели нейросети, а не только от песни. Если вы готовите акапеллу для AI-кавера, не забудьте убрать реверб перед тем, как подавать вокал в RVC. А пользователям из России проще всего начинать с X-Minus и бесплатных MVSEP и UVR, потому что у западного LALAL.ai карты РФ не проходят.

Источники

🎛 Сервисы и модели

  • mvsep.com, веб-сепаратор с 30+ моделями и лидербордом качества (SDR)
  • lalal.ai, тарифы и стемы LALAL.ai
  • github.com, Ultimate Vocal Remover (UVR), бесплатная программа
  • github.com, Demucs от Meta (модель htdemucs v4)

📰 Качество, практика и отзывы

  • vc.ru, 27.04.2025, обзор нейросетей для удаления голоса
  • Ответы Mail.ru, обсуждение бесплатных сервисов удаления вокала
  • moises.ai, 21.08.2025, запуск Moises AI Studio
  • audacityteam.org, плагин OpenVINO для разделения на стемы

Часто задаваемые вопросы

Как убрать вокал из песни онлайн бесплатно?

Проще всего через браузерный сервис без установки: vocalremover.org (русский, без регистрации, лимит около 10 минут в день), MVSEP (бесплатно, лучшее качество, но без аккаунта очередь по часу) или российский X-Minus. Загрузите файл, выберите разделение на вокал и инструментал и скачайте инструментал — это и будет минусовка. Для самой чистой акапеллы лучше брать MVSEP с современными моделями RoFormer. Важно: идеального результата не бывает, в минусовке могут остаться следы бэк-вокала и реверба.

Как вытащить голос (акапеллу) из песни?

Выберите в сепараторе тип «вокал», и сервис отдаст вокальную дорожку без музыки. Для максимально чистой акапеллы используйте MVSEP с моделями RoFormer или бесплатную программу Ultimate Vocal Remover (UVR) с моделями Kim Vocal или MDX-Net, они дают более чистый вокал, чем старые модели. Если в акапелле остался реверб или эхо, прогоните её через модель де-реверберации (в UVR это Reverb HQ). Особенно это важно, если вы готовите вокал для AI-кавера через RVC.

Как сделать минусовку из любой песни?

Минусовка — это инструментальная дорожка без вокала. Загрузите песню в любой сепаратор (vocalremover.org, X-Minus, MVSEP), выберите разделение на вокал и инструментал и скачайте инструментал, под него уже можно петь. Чтобы подстроить тональность под свой голос, поменяйте её в X-Minus, Moises или самом vocalremover.org, где смена тональности встроена. Учтите, что в минусовке из сложного трека могут остаться следы бэк-вокала и эхо — это нормальное ограничение технологии.

Какой сервис для разделения вокала лучший?

По чистоте вокала лучшие, ансамбли MVSEP и модели семейства RoFormer (по метрике SDR они дают около 11,9 децибел против примерно 9 у популярной Demucs). Из сервисов «нажал и получил» хвалят платный LALAL.ai. Бесплатно и максимально мощно работает десктопная программа Ultimate Vocal Remover (UVR) с моделями Demucs и MDX. А для разовой задачи без установки достаточно бесплатного vocalremover.org или российского X-Minus. Качество сильно зависит от выбранной модели нейросети, а не только от сервиса.

Почему в минусовке слышны остатки вокала?

Это главное ограничение технологии. Бэк-вокал, хоровые партии, а также реверберация и эхо физически смешаны с музыкой в общем миксе, поэтому нейросеть не может отделить их идеально, их «хвосты» остаются в инструментале. Хуже всего разделяются хип-хоп и электронная музыка, лучше, чистые поп- и рок-треки. Уменьшить остатки можно, выбрав более современную модель (RoFormer на MVSEP) или прогнав трек через ансамбль моделей в UVR, а финальную доводку делают в спектральном редакторе вроде iZotope RX.

Как разделить трек на стемы (барабаны, бас)?

Нужен многостемный сепаратор. Бесплатный и качественный вариант, модель Demucs четвёртой версии: она делит трек на четыре стема (вокал, барабаны, бас, прочее) и доступна через бесплатный плагин OpenVINO для редактора Audacity, который работает офлайн на вашем компьютере. В онлайн-сервисах LALAL.ai, MVSEP и Moises можно выбрать нужный тип стема (например, только барабаны или бас). Учтите, что в LALAL.ai каждый дополнительный тип разделения расходует отдельные минуты подписки.

Как убрать музыку из записи, оставив голос?

Это та же задача разделения, только вам нужен голосовой стем, а не инструментал. Загрузите запись в AI-сепаратор (MVSEP, AudioCleaner или инструменты видеоредакторов), нейросеть отличит речь от музыки и выделит голос, а музыкальную подложку вы отбросите. Современные нейросети делают это с точностью выше 90%, тогда как старые методы (эквалайзер, вычитание фазы) на реальных записях дают плохой результат. Если же из записи нужен именно текст — это уже задача транскрибации.

Работает ли LALAL.ai из России и как оплатить?

Сам сервис LALAL.ai из России открывается, и обработка трека VPN не требует. Проблема в оплате: биллинг идёт через Stripe, и карты российских банков обычно не проходят. Чтобы оплатить подписку, используют сервисы-посредники (с комиссией порядка 20%) или зарубежную карту через VPN. Если не хотите этих сложностей, для России удобнее российский X-Minus с оплатой рублём или полностью бесплатные варианты, MVSEP в браузере и десктопная программа UVR.

Ultimate Vocal Remover (UVR) — это бесплатно?

Да, UVR полностью бесплатна и имеет открытый исходный код. Это десктопная программа с графическим интерфейсом для Windows, macOS и Linux, которая подключает топовые модели разделения (Demucs, MDX-Net) и докачивает их из встроенного центра загрузки. По качеству она не уступает платным веб-сервисам и считается самым универсальным бесплатным вариантом. Минусы: нужна установка, для быстрой работы желательна видеокарта, а на первичную настройку уйдёт некоторое время, поэтому для разовой задачи проще онлайн-сервис.

Можно ли сделать караоке из любой песни?

Да. Технически караоке — это минусовка (инструментал) плюс текст, а минусовку можно получить из почти любой песни, разделив её на вокал и инструментал в сепараторе. Чтобы петь комфортно, тональность подстраивают под свой голос (это умеют X-Minus, Moises и vocalremover.org). Если не хотите ничего разделять сами, у российского сервиса X-Minus есть готовая библиотека из сотен тысяч караоке-треков. Помните только, что в самодельной минусовке из сложного трека могут остаться еле слышные следы вокала.

Сервисы из этой статьи

Похожие статьи

Whisper для транскрибации: установка, точность и цены | ToolFox

Whisper от OpenAI распознаёт речь бесплатно и офлайн, но новичков пугают установка, выбор модели и галлюцинации на тишине. Разбираем по шагам: как запустить, какая модель нужна, насколько точно на русском и сколько стоит облачный API.

нейросети
1 июня 2026 г.21 мин

Видео в текст: как извлечь субтитры и расшифровку | ToolFox

Расшифровать видео-лекцию, вытащить субтитры из ролика или сделать подписи для Reels можно бесплатно и за минуты. Разбираем все способы: встроенную расшифровку YouTube, онлайн-сервисы по ссылке, видеоредакторы и Whisper, с нашим тестом и реальными отзывами.

нейросети
1 июня 2026 г.16 мин

Распознавание речи: SpeechKit, SaluteSpeech и Whisper | ToolFox

Yandex SpeechKit, SaluteSpeech от Сбера и Whisper от OpenAI распознают русскую речь по-разному, и одного победителя нет: всё решают чистота аудио, скорость, цена и требования к данным. Сравниваем три сервиса по реальным бенчмаркам, ценам за час и 152-ФЗ.

нейросети
1 июня 2026 г.14 мин

Все статьи блога

Всего 774 статей в блоге ToolFox