Музыкальные дипфейки становятся все качественнее. Американская исследовательская компания OpenAI представила систему Jukebox, которая создает музыку с осмысленными текстами и вокалом в стиле известных музыкантов разных жанров. Все треки бесплатно доступны на Soundcloud, а код системы — на GitHub. Если вы хотите лучше разобраться в том, как все работает, то обратите внимание на подробное исследование компании.
Создание аудио-фейков интересует не только OpenAI. В конце апреля агентство американского рэпера Jay-Z потребовало удалить с ютьюб-канала Vocal Synthesis несколько треков, сгенерированных искусственным интеллектом, за нарушения авторских прав. Авторы канала обучают нейронную сеть на большом объеме аудиоданных, теперь она умеет воспроизводить текст голосами разных людей. Так появились ролики, где Боб Дилан поет песню Бритни Спирс, а Джордж Буш исполняет кавер на 'In Da Club' рэпера 50 Cent.
Послушайте, как звучит рождественская песня о горячей ванне в исполнении Фрэнка Синатры (на самом деле — нейросети Jukebox):
А как — хип-хоп в стиле Канье Уэста: