Композитор-экспериментатор Холли Херндон (Holly Herndon) говорит, что эта технология создана не для того, чтобы заменять художников, и что будущее творчества принадлежит коллективному разуму.

Холли Херндон слышит будущее музыки в данных. Херндон пришла к электронной музыке после того, как пела в церкви и хорах в Восточном Теннесси. Она получила степень магистра в Миллс-колледже и докторскую степень в Центре компьютерных исследований в музыке и акустике Стэнфордского университета.
Когда она начала экспериментировать с машинным обучением в 2015 году, результаты казались «неубедительными», но она вспоминает, что видела «алмаз в чистом виде». Сегодня эти эксперименты они превратились в пользовательские модели, которые позволяют любому выступать в их роли.
Scientific American поговорила с Херндон о тренировке ее моделей искусственного интеллекта и ее вере в то, что творчество всегда было коллективным&Искусственный интеллект просто делает это видимым.
О поддержке научной журналистики
Если вам понравилась эта статья, подумайте о том, чтобы поддержать нашу журналистику, отмеченную наградами, подписавшись на нее. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.
[Ниже приводится отредактированная стенограмма интервью.]
Вы описываете свою работу как «протокольное искусство». Что это значит?
В 20 веке местом зарождения медиа были бумага и ручка, на которых писалась музыка, и это был художественный акт. В случае с протокольным искусством творческий акт происходит перед созданием медиа. Это создает набор правил и условий, в которых создается искусство.
Мы действительно заинтересованы в обучении наших собственных моделей. Я всегда говорю «мы», потому что я работаю со своим партнером Мэтом Драйхерстом. Мы относимся к каждому этапу процесса создания модели как к творческому вмешательству. Создание набора данных — это часть художественного оформления. Я часто пишу музыку для тренировок — музыку не обязательно для человеческого слуха, но для того, чтобы компьютер мог чему-то научиться.
Можете ли вы привести мне пример того, как это выглядит на практике?
Прямо сейчас у нас в Берлине проходит выставка. Нас вдохновила Хильдегарда фон Бинген, средневековый композитор. Мы хотели представить, что полифония существовала при ее жизни. Мы начали с модели ее композиций и добавили набор правил, чтобы создать полифонию в ее стиле. Мы взяли эти записи, переделали их и отдали певцам-людям для интерпретации. Затем мы создали огромную инсталляцию, где исполнители поют и приглашают публику потренироваться вместе с нами.
Дело не в том, чтобы «написать мне поп-песню под гитару».&Речь идет об использовании этой технологии для объединения людей для создания произведений искусства в реальном пространстве.
Большинство коммерческих моделей ИИ обучаются на основе данных, собранных из Интернета. Почему вы настаиваете на создании собственных моделей?
Как электронный музыкант, я никогда не занимался сэмплированием — я всегда создавал свои собственные звуковые палитры. Когда мы начинали, еще до появления Suno и всего остального, нам нужно было создать свой собственный набор данных. Это казалось естественным, как создание собственных сэмплов или цифровых инструментов.
Одна из критических замечаний в адрес продуктов [таких, как Suno] заключается в том, что они звучат очень «средне», т.е. обучены всему или являются самыми средними. Мои модели звучат уникально, потому что я сам создаю обучающие данные. Я также думаю, что в Suno есть система подсказок, которая ограничивает их трехминутными песнями со структурой куплет-припев. Из-за ограничителей это становится скучным. Я бы хотел, чтобы они сняли некоторые ограничения.
Удивляла ли вас когда-нибудь модель?
Примерно в 2021 году мы запустили проект под названием Holly+ — голосовой клон моего конкретного голоса. Мы работали с Voctro Labs над созданием голосовой модели, которая работала бы в режиме реального времени, чтобы люди могли петь моим голосом. Это изменило правила игры.
Если это работает в режиме реального времени, другие люди могут идентифицировать друг друга в режиме реального времени. Когда мы ее тестировали, мой партнер, британец, пел в нее. Я услышал свой голос с британским акцентом. Это было так странно, что мне пришлось выйти из комнаты — он пел вместо меня. Это было одним из самых больших открытий для понимания того, насколько странным и крутым может быть этот материал.
Я думаю, что потребуется от пяти до десяти лет, чтобы все прошло гладко. Но как только мы начнем трансформировать тело в реальном времени — представьте, что вы могли бы создать модель голоса кита, а затем создать гибридное сопрано кита. Когда ты поешь высоко, это звучит как опера; когда ты поешь низко, ты больше похож на Уэйла или Барри Уайта. Мы больше не привязаны к моей гортани.
Как вы думаете, где мы будем через 10 лет?
Многие опасения, связанные с этой технологией, на самом деле связаны с тем, как работает современный Интернет — с экономией внимания, с тем, насколько это сложно для создателя. Мой партнер всегда говорит: «Прокрутка — это для ботов, а прогулка — для людей».
Наше более оптимистичное видение заключается в использовании агентов для работы со всем этим дерьмом и фильтрации информации, на самом деле это сводит нас вместе в реальном мире. Вот почему наши проекты предполагают, что люди встречаются в реальной жизни и делают что-то вместе. Некоторые из моих самых умных друзей-разработчиков работают над программированием vibe с несколькими агентами, готовя еду или отправляясь в поход со своим малышом. Все могло бы быть по-настоящему красиво, если бы мы представили и построили это таким образом.
Меняет ли эта технология ваше определение креативности?
Вся эта история с искусственным интеллектом может заставить нас увидеть себя, возможно, не единственными творческими субъектами во Вселенной. Это не обязательно должно пугать — это может быть красиво и освобождать.
Творчество происходит в рое, в сообществе. Искусственный интеллект — это просто коллективный разум, объединенный человеческий разум. Художественная модель 20-го века основана на индивидуальном гении, который прикасается к объекту и придает ему ценность. Все это переворачивается с ног на голову. Я — коллективный разум всей команды.





















