Image

Алгоритм творчества как возможная основа для сильного искусственного интеллекта

ИИ и творчество. Сильный и слабый ИИ

Сильный ИИ решает задачи творчески. Что значит – творчески? Почему сейчас не творчески?

Вывод: научить ИИ творчеству – сделать шаг к сильному ИИ.

Культура работы в среде с возрастающей ценой ошибки

Agile

Как сейчас развивается ИИ? Глубокое обучение, GAN, все дела. По сути ватерфолл: [A → B], но много-много раз, чтобы ИИ научился делать [A → B] хорошо. 

Как работает настоящее творчество? Рассмотрим на примере пространственных видов искусств.

f4af88bb79fe9a3c8e4bf79886d665c4

Профессиональные художники, проектировщики работают в культуре с возрастающей ценой ошибки. То есть, подвинуть на портрете глаз правее гораздо проще, когда у тебя обрубовочными линиями накиданы пропорции, чем когда почти готовый портрет написан акварелью. Цена ошибки на начальном этапе (внесение изменений займет 20 секунд) несопоставима с ценой ошибки на финальном этапе (внесение изменений займет часы-дни-месяцы-годы-миллиарды денег, смотря что за проект – подвинь-ка туалетную комнату в небоскребе).

e7aa569772a25c199b724765ab7a96f8
8cffdb8c133d15b93870c3cddad3da4d

Художники начали применять в работе гибкие методологии (agile) еще тогда, когда такого термина не существовало.

a4829d8e94d30b5479f7d73fa3d745e8

Плюс цифровой среды: меньше затраты на проработку нескольких вариантов решения задачи даже на финальных этапах.

Диджитал как инструмент в руках человека всё ещё позволяет условно «подвинуть глаз» достаточно безболезненно, но при этом нарушает логику возрастающей цены ошибки. «Удобство диджитал среды» — это следующий шаг для ИИ, а не начальный.

Brain Storm

Для решения творческих задач часто применяется техника мозгового штурма, она показывает себя достаточно эффективно.

Мозговой штурм: сначала ставится задача, затем генерируются варианты ее решения, в конце отсекаются лишние варианты.

Изменение культуры работы в среде с возрастающей ценой ошибки для ИИ

Обычно ИИ делает так:

[A → B]

на основе датасетов.

Насмотренность художника = датасет ИИ = опыт человека (культурный фон и прочее)

Сейчас ИИ при решении задачи идет по такому пути:

5ca6853993c1fd1826542d07b3be4a70

Человек решает творческую задачу так:

2aac3775b758e494075346f568a20fd1

Сам путь (пунктир) творчеством не является. Творчество – комплекс поиска развилок и принятия решений, как на этих развилках поступать, а также последующей саморефлексии (почему было принято то или иное решение?).

Разберем алгоритм творчества.

Опишем ролевую модель: Творец + Менеджер + Клиент (Artist + Manager + Client).

У человека, занимающегося творчеством, эти персоны постоянно “общаются” в голове в процессе внутреннего монолога.

Менеджер организовывает мозговой штурм, помогает формулировать задачи и ставит подзадачи. Творец находится на первом этапе мозгового штурма: он генерирует возможные варианты решения задач. Клиент выступает в роли критика (второй этап мозгового штурма): выбирает из предложенного лучшие варианты.

Базовый алгоритм творческого процесса для ИИ

Спираль AMC (Artist, Manager, Client):

a8f5ac390b5587c47906fc1c1be77b8c

A0

Задание от человека (может включать референсы)

A

Определение числа итераций, машиночитаемое задание на первую итерацию

B1-n

Варианты выполнения задания A (соответствуют заданию A, но отличаются друг от друга, являются MVP для A0)

Bi

Выбранный для дальнейшей проработки вариант (возможно, не один, Менеджер может составить ТЗ по объединению)

C

C = Bi + Btask , где:

C = новое задание Творцу (с исходными материалами в виде Bi + Btask)

Bi  = выбранный для дальнейшей проработки вариант решения задачи A

Btask = задание по доработке Bi с учетом A0 

D1-n

Варианты выполнения задания C (соответствуют заданию C, но отличаются друг от друга, являются MVP+ для A0)

Di

Выбранный для дальнейшей проработки вариант (возможно, не один, Менеджер может составить ТЗ по объединению)

E

E = Di + Dtask , где:

E = новое задание Творцу (с исходными материалами в виде Di + Dtask)

Di  = выбранный для дальнейшей проработки вариант решения задачи A

Dtask = задание по доработке Di с учетом A0

F1-n

Варианты выполнения задания E (соответствуют заданиям E и A0, но отличаются друг от друга)

Fi

Выбранный итоговый вариант (возможно, не один)

Алгоритм можно усовершенствовать, добавив обратную связь:

a171ca540e55612008001f01f637e73a

Штрихом (‘) обозначено получение непосредственно данных по задаче + обратной связи для формирования датасетов и внутренних алгоритмов в каждой роли. Так ИИ будет самообучаться в процессе.

Скорость передачи обратной связи предположительно можно увеличить, передавая ее не пошагово по спирали, а при необходимости перешагивая (например, через Клиента, когда обратная связь передается от Творца Менеджеру), но для простоты визуализации здесь и далее эти “перешагивания” не обозначены.

Вертикальные стрелки (вверх и вниз) – передача информации, горизонтальные (вправо) – обработка.

Циклов (A → Bi, C → Di, E → Fi) должно быть столько, сколько нужно для решения первоначальной задачи.

Количество циклов задает Менеджер на этапе A0 → A. Если циклов недостаточно, получается “Рисуем круг – рисуем остальную сову”. Если слишком много, получается переработка и ненужная детализация.

Человек в процессе творчества прогоняет в голове во внутреннем монологе миллионы микро-циклов (например: нарисовать линию 1, нарисовать линию 2, нарисовать линию 3…) по макро-этапам (например: набросок, подмалёвок, детализация). 

Внутри каждого макро-цикла будут маленькие микро-циклы (спираль из спирали).

Внутри каждой строки может (и будет!) сидеть GAN-пара, позволяющая Роли самообучаться. Также применяется обучение без учителя.

Референсы в данном алгоритме подает (при необходимости подбирает) Менеджер вместе с заданиями Творцу.

Человек может при необходимости вмешиваться в процесс в роли Клиента (при выборе предпочтительного варианта для проработки), реже Менеджера (например, при определении числа итераций или подборе референсов).

При желании можно также провести аналогию приведенного алгоритма с эволюцией в природе, где Творец – это размножение и мутации, Клиент – отбор наиболее приспособленных, а Менеджер – само существо, которое пытается выжить и передать свои гены.

Пример применения алгоритма на практике

Возьмем самое типичное творческое задание: нарисовать картинку по запросу.

Если говорить об изображениях, человек не думает пикселями. 

Вектор с погрешностью в % (поправка на “толщину карандашной линии”) при необходимости переводится в растр для представления человеку.

Нужен векторный датасет (как минимум для начальных итераций).

Шаг к сильному ИИ

У живого человека такой процесс, как на схеме, происходит в режиме нон-стоп, поскольку человек постоянно принимает решения, даже если сам этого не замечает; а его внутренний Менеджер то и дело получает новую информацию в обработку и формирует на ее основании новые задачи. 

Чтобы создать подобие человеческого создания, осталось процесс со схемы сделать бесконечным с учетом поступления новой информации от сенсоров или иных источников ввода.

Ну и, конечно, неплохо бы создать соответствующие датасеты для каждой роли на всевозможные темы; хотя сам человек с рождения собирает свои датасеты (культурный опыт) в процессе получения новых и новых вводных.

Таким образом, в мыслительном процессе человека алгоритм принимает следующий вид.

Алгоритм бесконечного творческого процесса 

Если конкретная творческая задача для ИИ выглядит как спираль AMC (Artist, Manager, Client), то бесконечный творческий процесс выглядит как спираль EAMC (Environment, Artist, Manager, Client).

06dc7676ea0ab9e9b5d61cdf0d9347af

A0

Начало мышления. Нулевой выбор Клиента – рождение. Лунтик: ↑0

A0’

Первые вводные данные из среды. От Клиента данные пока нулевые, кроме “Я родился”: ↑0

A

Первое задание Творцу (пока Менеджер толком ничего не умеет, задание мало отличается от просто данных A0’)

A’

Задание Творцу A + данные, полученные из среды

B1-n

Варианты выполнения задания A’ (соответствуют заданию A, но отличаются друг от друга)

B1-n’

Варианты выполнения задания A’ + данные, полученные из среды

Bi

Выбранный для дальнейшей проработки вариант 

Bi’

Bi + новые данные, полученные из среды + обратная связь 

C

C = Bi’ + Btask , где:

C = новое задание Творцу (с исходными материалами в виде Bi’ и Btask)

Bi’  = Bi + новые данные, полученные из среды + обратная связь 

Btask = задание по доработке Bi с учетом новых данных из среды

C’

Задание Творцу C + данные, полученные из среды + обратная связь 

D1-n

Варианты выполнения задания C’ (соответствуют заданию C, но отличаются друг от друга)

D1-n’

Варианты выполнения задания C’ + данные, полученные из среды, + обратная связь 

Di

Выбранный для дальнейшей проработки вариант 

Di’

Di + новые данные, полученные из среды + обратная связь 

E

E = Di’ + Dtask , где:

E = новое задание Творцу (с исходными материалами в виде Di’ + Dtask)

Di’ = Di + новые данные, полученные из среды + обратная связь 

Dtask = задание по доработке Di с учетом новых данных из среды

E’

Задание Творцу E + данные, полученные из среды + обратная связь 

F1-n

Варианты выполнения задания E’ (соответствуют заданию E, но отличаются друг от друга)

F1-n’

Варианты выполнения задания E’ + данные, полученные из среды, + обратная связь 

Fi

Выбранный для дальнейшей проработки вариант 

Продолжение по аналогии

Среда находится как бы в третьем измерении по отношению к схеме AMC, но спроецирована для демонстрации.

В отличие от AMC, где датасеты заранее сформированы (что не мешает им актуализироваться между задачами), в EAMC в процессе получения новых данных из среды и обратной связи от “коллег”, каждый из “участников” формирует свои датасет и алгоритмы.

Вертикальными стрелками показаны новые данные для формирования датасетов и алгоритмов:

  • черные стрелки – передача пакета информации по основному алгоритму;

  • фиолетовые, рыжие, красные – обратная связь от Творца, Клиента, Менеджера соответственно;

  • зеленые – новые данные из Среды.

Данные из Среды преимущественно помогают формировать датасеты, а обратная связь – совершенствовать внутренние алгоритмы каждой роли.

Например, выступая в роли Среды, человеческое воспитание учит и Творца (предлагать решения), и Менеджера (анализировать данные и ставить задачи), и Клиента (выбирать лучший вариант), показывая, какие бывают варианты базового преобразования [A → B] для каждой роли. 

Разумеется, в зависимости от того, в какой Среде будут находиться ИИ и какие данные будут получать, разные ИИ будут отличным друг от друга – прямо как люди. Правда, у человека в качестве источника информации из Среды (Среды по отношению к сознанию) также выступает собственное тело (в том числе гормоны), внося дополнительный элемент хаоса. При этом в отличие от человека, в ИИ можно загрузить датасеты ещё до рождения.

Следует помнить про макро- и микро-циклы. Спираль EAMC условно фрактальна, решение практически любой задачи может содержать внутри себя более маленькую спираль.

Источник: habr.com

✅ Найденные теги: Алгоритм,, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Текст на изображении: "Программисты всё?" на черном фоне.
ideipro logotyp
Диаграмма базы данных для клона Slack с таблицами пользователей, сообщений и каналов.
ideipro logotyp
ideipro logotyp
Человек работает за ноутбуком, презентация платформы GigaChat Enterprise для бизнеса.
Ноутбук с открытым проектом в Adobe Photoshop, изображение колибри и цветка.
Apple M5 Pro и M5 Max чипы на темном фоне, логотипы в синем и фиолетовом свете.
Ноутбук с открытым приложением для редактирования фотографий на экране.
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых