RVC¶
RVC представляет из себя программное обеспечения для преобразования одного голоса в другой. Вы можете обучать собственные модели, основываясь на нескольких минутах записи нужного вам голоса.
Так же в комплекте идут утилиты для изменения голоса в реальном времени.
Как установить?¶
У данной системы существует множество варинтов UI, здесь будет рассмотрена установка самого популярного варианта - Retrieval-based-Voice-Conversion-WebUI.
Скачайте последнюю версию RVC WebUI по данной ссылке.
- Выберите zip-архив рядом с надписью For Nvidia GPU users
если у вас NVidia
- В противном случае выберите For AMD/Intel GPU users
На этом всё - никаких дополнительных установок и манипуляций в консоли проводить не нужно. Все зависимости (включая нужную версию Python и библиотек) вшиты в архив.
Для открытия основного UI запустите файл go-web.bat
. Вы увидите консоль, в которой будет указан URL, через который вы будете открывать данный UI.
Так же в комплекте идут утилиты для изменения голоса в реальном времени. Для их запуска необходимо запустить файл go-realtime-gui.bat
.
Где взять и как установить готовые модели?¶
Онлайн-каталоги моделей:
https://discord.gg/aihub (канал voice-models)
https://www.weights.gg
https://voice-models.com
https://huggingface.co (ищите по имени спикера + rvc, например "letov rvc")
https://google.com (аналогично предыдущему пункту)
https://t.me/AINetSD_bot
Модели состоят либо из одного файла pth
, либо из двух файлов - pth
и index
.
Помещать модели необходимо сюда:
- файлы .pth
в директорию /weights
- файлы .index
в директорию /logs
Как использовать?¶
Рассмотрим основные элементы управления RVC WebUI. Всё, что необходимо для преобразования голоса, находится в верхней части первого таба.
1. Inferencing voice: выпадающий список со всеми моделями из каталога /weights
. Выбираем нужный вам файл с моделью
2. Index file: выпадающий список с index-файлами. Отображаются все файлы из каталога /logs
. Если для вашей модели идёт index-файл в комплекте, укажите его здесь. В противном случае, оставьте пустым
3. Transpose: Относительная высота голоса, указывается в полутонах (одна октава = 12 полутонов).
В общем случае рекомендуется использовать следующие значения для данного параметра:
Если меняете мужской голос на женский = 12
Если меняете женский голос на мужской = -12
В остальных случаях = 0
Вам ничего не мешает указывать и другие значения, если вы хотите задрать голос выше/ниже. Для преобразования голоса в песнях стоит указывать значения, кратные 12, в противном случае ваш спикер может фальшивить.
4. Audio file path: Путь до файла с аудиодорожкой, которую меняем. RVC, в отличии от SVC, всеядный и съест любые аудио и видеоформаты. Аудиофайл не должен содержать в тебе ничего, кроме вокала, иначе ваш спикер попытается озвучить все звуки.
5. Pitch extraction algorithm: Алгоритм преобразования. Опции pm и harvest считаются более быстрыми но менее качественными, в то время как преобразование через crepe и rmvpe занимает больше времени. На момент написания этой статьи default опцией считается rmvpe
- в большинстве случаев вам нужно использовать именно её.
6. Нажатие на кнопку "Convert" запускает преобразование трека.
7. Здесь вы увидите мини-плеер для запуска преобразованного трека. При нажатии на символ ⋮ откроется меню, в котором вы сможете сохранить преобразованный трек
Что ещё нужно знать?¶
Качество каверов определяется в первую очередь тем, насколько качественно вы сможете разделить дорожку на составляющие в виде вокальной части и инструменталки. Если у вас в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.
В комплекте с RVC идёт несколько UVR5-моделей, которые можно использовать для отделения вокальной части песен от инструментальной через вкладку Vocals/Accompaniment Separation & Reverberation Removal
в основном UI. Однако, выбор моделей там небольшой и наилучшие модели отсутствуют в комплекте. В связи с этим, я рекомендую вам поставить Ultimate Vocal Remover отдельно.
Прочие ссылки¶
TODO¶
- Альтернативные UI
- Как разделять дорожку?
- Как обучать свои модели?