Женщина с красными волосами смотрит через металлическую сферу на фоне кирпичной стены.

Эта музыкантша создала искусственный интеллект-клон своего голоса, чтобы любой мог петь как она

Композитор-экспериментатор Холли Херндон (Holly Herndon) говорит, что эта технология создана не для того, чтобы заменять художников, и что будущее творчества принадлежит коллективному разуму.

Холли Херндон стоит в помещении галереи Serpentine North в Лондоне, обрамленная подвесной круглой скульптурной конструкцией, на фоне кирпичных стен.

Холли Херндон слышит будущее музыки в данных. Херндон пришла к электронной музыке после того, как пела в церкви и хорах в Восточном Теннесси. Она получила степень магистра в Миллс-колледже и докторскую степень в Центре компьютерных исследований в музыке и акустике Стэнфордского университета.

Когда она начала экспериментировать с машинным обучением в 2015 году, результаты казались «неубедительными», но она вспоминает, что видела «алмаз в чистом виде». Сегодня эти эксперименты они превратились в пользовательские модели, которые позволяют любому выступать в их роли.

Scientific American поговорила с Херндон о тренировке ее моделей искусственного интеллекта и ее вере в то, что творчество всегда было коллективным&Искусственный интеллект просто делает это видимым.

О поддержке научной журналистики

Если вам понравилась эта статья, подумайте о том, чтобы поддержать нашу журналистику, отмеченную наградами, подписавшись на нее. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.

[Ниже приводится отредактированная стенограмма интервью.]

Вы описываете свою работу как «протокольное искусство». Что это значит?

В 20 веке местом зарождения медиа были бумага и ручка, на которых писалась музыка, и это был художественный акт. В случае с протокольным искусством творческий акт происходит перед созданием медиа. Это создает набор правил и условий, в которых создается искусство.

Мы действительно заинтересованы в обучении наших собственных моделей. Я всегда говорю «мы», потому что я работаю со своим партнером Мэтом Драйхерстом. Мы относимся к каждому этапу процесса создания модели как к творческому вмешательству. Создание набора данных — это часть художественного оформления. Я часто пишу музыку для тренировок — музыку не обязательно для человеческого слуха, но для того, чтобы компьютер мог чему-то научиться.

Можете ли вы привести мне пример того, как это выглядит на практике?

Прямо сейчас у нас в Берлине проходит выставка. Нас вдохновила Хильдегарда фон Бинген, средневековый композитор. Мы хотели представить, что полифония существовала при ее жизни. Мы начали с модели ее композиций и добавили набор правил, чтобы создать полифонию в ее стиле. Мы взяли эти записи, переделали их и отдали певцам-людям для интерпретации. Затем мы создали огромную инсталляцию, где исполнители поют и приглашают публику потренироваться вместе с нами.

Дело не в том, чтобы «написать мне поп-песню под гитару».&Речь идет об использовании этой технологии для объединения людей для создания произведений искусства в реальном пространстве.

Большинство коммерческих моделей ИИ обучаются на основе данных, собранных из Интернета. Почему вы настаиваете на создании собственных моделей?

Как электронный музыкант, я никогда не занимался сэмплированием — я всегда создавал свои собственные звуковые палитры. Когда мы начинали, еще до появления Suno и всего остального, нам нужно было создать свой собственный набор данных. Это казалось естественным, как создание собственных сэмплов или цифровых инструментов.

Одна из критических замечаний в адрес продуктов [таких, как Suno] заключается в том, что они звучат очень «средне», т.е. обучены всему или являются самыми средними. Мои модели звучат уникально, потому что я сам создаю обучающие данные. Я также думаю, что в Suno есть система подсказок, которая ограничивает их трехминутными песнями со структурой куплет-припев. Из-за ограничителей это становится скучным. Я бы хотел, чтобы они сняли некоторые ограничения.

Удивляла ли вас когда-нибудь модель?

Примерно в 2021 году мы запустили проект под названием Holly+ — голосовой клон моего конкретного голоса. Мы работали с Voctro Labs над созданием голосовой модели, которая работала бы в режиме реального времени, чтобы люди могли петь моим голосом. Это изменило правила игры.

Если это работает в режиме реального времени, другие люди могут идентифицировать друг друга в режиме реального времени. Когда мы ее тестировали, мой партнер, британец, пел в нее. Я услышал свой голос с британским акцентом. Это было так странно, что мне пришлось выйти из комнаты — он пел вместо меня. Это было одним из самых больших открытий для понимания того, насколько странным и крутым может быть этот материал.

Я думаю, что потребуется от пяти до десяти лет, чтобы все прошло гладко. Но как только мы начнем трансформировать тело в реальном времени — представьте, что вы могли бы создать модель голоса кита, а затем создать гибридное сопрано кита. Когда ты поешь высоко, это звучит как опера; когда ты поешь низко, ты больше похож на Уэйла или Барри Уайта. Мы больше не привязаны к моей гортани.

Как вы думаете, где мы будем через 10 лет?

Многие опасения, связанные с этой технологией, на самом деле связаны с тем, как работает современный Интернет — с экономией внимания, с тем, насколько это сложно для создателя. Мой партнер всегда говорит: «Прокрутка — это для ботов, а прогулка — для людей».

Наше более оптимистичное видение заключается в использовании агентов для работы со всем этим дерьмом и фильтрации информации, на самом деле это сводит нас вместе в реальном мире. Вот почему наши проекты предполагают, что люди встречаются в реальной жизни и делают что-то вместе. Некоторые из моих самых умных друзей-разработчиков работают над программированием vibe с несколькими агентами, готовя еду или отправляясь в поход со своим малышом. Все могло бы быть по-настоящему красиво, если бы мы представили и построили это таким образом.

Меняет ли эта технология ваше определение креативности?

Вся эта история с искусственным интеллектом может заставить нас увидеть себя, возможно, не единственными творческими субъектами во Вселенной. Это не обязательно должно пугать — это может быть красиво и освобождать.

Творчество происходит в рое, в сообществе. Искусственный интеллект — это просто коллективный разум, объединенный человеческий разум. Художественная модель 20-го века основана на индивидуальном гении, который прикасается к объекту и придает ему ценность. Все это переворачивается с ног на голову. Я — коллективный разум всей команды.

✅ Найденные теги: Голос, искусственный интеллект, Клон, Музыкантша, новости, Пение, Эта

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

dummy-img
Силуэт лица с диаграммой связи на голове, символизирующий думы и идеи.
ideipro logotyp
Руки режут свежий хлеб на деревянной доске.
Мужчина заряжает электромобиль на зимней стоянке, снег, дальний план - деревья и горы.
Человек спит в кровати под красным пледом, солнечный свет падает на подушку.
Человек в смокинге держит планеты Земля и Марс, символизируя космические достижения.
Твердотельный аккумулятор Donut на выставке, показывает замещающий литий-ион стоимость.
Человек рядом с изображением двойной спирали ДНК на фоне природы.
Image Not Found
Руки режут свежий хлеб на деревянной доске.

Ученые РУДН рассказали о подводных камнях нового ГОСТа на белый хлеб

Новым российским ГОСТом на белый хлеб будут пользоваться еще шесть стран 1 апреля в России вступает в силу новый ГОСТ на белый хлеб из пшеничной муки. Документ, разработанный НИИ хлебопекарной промышленности, в мае 2025 года утвердило Федеральное агентство…

Мар 5, 2026
Мужчина заряжает электромобиль на зимней стоянке, снег, дальний план - деревья и горы.

Солевая батарея может сделать электромобили более зимостойкими — если они выдержат дорогу

Компания CATL утверждает, что ее натриево-ионный аккумулятор может продолжать заряжать и обеспечивать мощность при температуре значительно ниже нуля. Настоящий тест заключается в том, выдержат ли эти лабораторные показатели реальную зимнюю езду Ю Сяоин под редакцией Эрика Салливана…

Мар 5, 2026
Человек спит в кровати под красным пледом, солнечный свет падает на подушку.

Люди, употребляющие много клетчатки, проводят больше времени в фазе глубокого сна.

Самое масштабное на сегодняшний день исследование показало, что нам нужно есть в течение дня, чтобы хорошо выспаться ночью. Хотите хорошо выспаться сегодня ночью? Наполните свою тарелку большим количеством клетчатки и растительной пищи. Ольга Панкова/Getty Images Употребление большего…

Мар 5, 2026
Человек рядом с изображением двойной спирали ДНК на фоне природы.

Откуда у нас следы ДНК неандертальцев: новые открытия учёных

Новое исследование, опубликованное в журнале Science, позволило ученым лучше понять отношения между древними людьми и неандертальцами, жившими бок о бок десятки тысяч лет назад. До настоящего момента оставалось неясным, как именно происходил обмен генами между двумя видами,…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых