Робот создаёт мебель из кубов в ответ на команды: стол, стул, корабль, кролик.

«Робот, сделай мне стул!»

Система, управляемая искусственным интеллектом, позволяет пользователям проектировать и создавать простые многокомпонентные объекты, описывая их словами. Смотрите видео Шесть предметов, собранных из модульных решетчатых кубиков: полка, круглый журнальный столик, стул, лампа, миска и сидящий кролик. Предлагаются задания, например: «Соберите двухъярусную полку» или «Задание: соберите лампу; обратная связь: прикрепите панели к абажуру». ↓ Скачать подпись к изображению : На этих шести фотографиях показана роботизированная сборка многокомпонентных объектов с помощью текста, полученного от разных пользователей. Авторские права : Предоставлено исследователями. Стул, изготовленный из модульных решетчатых кубов. Получив подсказку «Сделай мне стул» и ответ «Я хочу, чтобы на сиденье были панели», робот собирает стул и размещает компоненты панелей в соответствии с подсказкой пользователя. Изображение предоставлено исследователями. Шесть предметов, собранных из модульных решетчатых кубиков: полка, круглый журнальный столик, стул, лампа, миска и сидящий кролик. Предлагаются задания, например: «Соберите двухъярусную полку» или «Задание: соберите лампу; обратная связь: прикрепите панели к абажуру». На этих шести фотографиях показана роботизированная сборка многокомпонентных объектов с помощью текста, полученного в ответ на различные запросы пользователя. Авторские права принадлежат исследователям.

Системы автоматизированного проектирования (САПР) — это проверенные временем инструменты, используемые для проектирования многих физических объектов, которыми мы пользуемся каждый день. Однако для освоения программного обеспечения САПР требуется обширный опыт, а многие инструменты содержат настолько высокий уровень детализации, что не подходят для мозгового штурма или быстрого прототипирования.

Стремясь сделать проектирование быстрее и доступнее для неспециалистов, исследователи из Массачусетского технологического института и других учреждений разработали роботизированную систему сборки на основе искусственного интеллекта, которая позволяет людям создавать физические объекты, просто описывая их словами.

Их система использует генеративную модель искусственного интеллекта для построения трехмерного представления геометрии объекта на основе запроса пользователя. Затем вторая генеративная модель искусственного интеллекта анализирует желаемый объект и определяет, где должны располагаться различные компоненты в соответствии с функцией и геометрией объекта.

Система может автоматически создавать объект из набора предварительно изготовленных деталей с помощью роботизированной сборки. Она также может итеративно дорабатывать дизайн на основе отзывов пользователя.

Исследователи использовали эту комплексную систему для изготовления мебели, включая стулья и полки, из двух типов готовых компонентов. Компоненты можно разбирать и собирать по желанию, что снижает количество отходов, образующихся в процессе изготовления.

миниатюра видео Воспроизвести видео

Они оценили эти разработки в ходе пользовательского исследования и обнаружили, что более 90 процентов участников предпочли объекты, созданные их системой на основе искусственного интеллекта, по сравнению с другими подходами.

Хотя эта работа представляет собой лишь первоначальную демонстрацию, данная структура может быть особенно полезна для быстрого прототипирования сложных объектов, таких как компоненты аэрокосмической отрасли и архитектурные объекты. В долгосрочной перспективе ее можно будет использовать в домах для изготовления мебели или других предметов на месте, без необходимости доставки громоздких изделий с центрального предприятия.

«Рано или поздно мы хотим иметь возможность общаться и взаимодействовать с роботом и системой искусственного интеллекта так же, как мы общаемся друг с другом, чтобы вместе что-то создавать. Наша система — это первый шаг к реализации этого будущего», — говорит ведущий автор Алекс Кьяу, аспирант кафедр электротехники и информатики (EECS) и архитектуры Массачусетского технологического института.

В работе над статьей к Кьяу присоединились Рича Гупта, аспирантка архитектурного факультета Массачусетского технологического института; Фаэз Ахмед, доцент кафедры машиностроения; Лоуренс Сасс, профессор и заведующий вычислительной группой на кафедре архитектуры; старший автор Рэндалл Дэвис, профессор кафедры электротехники и информатики и член Лаборатории компьютерных наук и искусственного интеллекта (CSAIL); а также другие сотрудники Google Deepmind и Autodesk Research. Статья была недавно представлена на конференции по нейронным системам обработки информации.

Создание многокомпонентной конструкции

Хотя модели генеративного ИИ хорошо справляются с созданием трехмерных представлений, известных как сетки, на основе текстовых запросов, большинство из них не позволяют получить единообразные представления геометрии объекта, обладающие необходимой детализацией на уровне компонентов для роботизированной сборки.

Разделение этих сеток на компоненты представляет собой сложную задачу для модели, поскольку назначение компонентов зависит от геометрии и функциональности объекта и его частей.

Исследователи решили эти задачи, используя модель визуально-языкового восприятия (VLM) — мощную генеративную модель искусственного интеллекта, предварительно обученную понимать изображения и текст. Перед VLM поставлена задача определить, как два типа сборных деталей — конструктивные элементы и панельные компоненты — должны соединяться, образуя объект.

«Существует множество способов размещения панелей на физическом объекте, но роботу необходимо видеть геометрию и анализировать её, чтобы принять решение. Выполняя функции как глаз, так и мозга робота, VLM позволяет ему это делать», — говорит Кьяу.

Пользователь вводит в систему текст, например, набрав «сделай мне стул», и для начала предоставляет ей сгенерированное ИИ изображение стула.

Затем модель VLM анализирует конструкцию стула и определяет, где разместить панельные компоненты поверх несущих элементов, основываясь на функциональности множества ранее рассмотренных ею примеров объектов. Например, модель может определить, что сиденье и спинка должны иметь панели, чтобы обеспечить поверхности для сидения и опоры на стуле.

Эта информация выводится в виде текста, например, «сиденье» или «спинка». Затем каждая поверхность стула помечается числами, и эта информация передается обратно в VLM.

Затем VLM выбирает метки, соответствующие геометрическим частям стула, к которым на 3D-сетке должны быть прикреплены панели для завершения дизайна.

Совместное проектирование человеком и ИИ

Пользователь остается в курсе всего процесса и может доработать дизайн, задав модели новую подсказку, например: «используйте панели только на спинке, а не на сиденье».

«Пространство для проектирования очень велико, поэтому мы сужаем его, опираясь на отзывы пользователей. Мы считаем, что это лучший способ, потому что у людей разные предпочтения, и создать идеальную модель для всех было бы невозможно», — говорит Кьяу.

«Участие человека в процессе позволяет пользователям направлять разработку дизайна с помощью ИИ и чувствовать себя причастными к конечному результату», — добавляет Гупта.

После завершения создания 3D-сетки роботизированная сборочная система собирает объект, используя предварительно изготовленные детали. Эти многоразовые детали можно разбирать и собирать в различные конфигурации.

Исследователи сравнили результаты своего метода с алгоритмом, который размещает панели на всех горизонтальных поверхностях, обращенных вверх, и с алгоритмом, который размещает панели случайным образом. В ходе пользовательского исследования более 90 процентов респондентов предпочли дизайн, созданный их системой.

Они также попросили VLM объяснить, почему компания решила разместить панели именно в этих местах.

«Мы выяснили, что модель визуального языка способна в определенной степени понимать функциональные аспекты стула, такие как положение спинки и положение сидя, и понимать, почему она размещает панели на сиденье и спинке. Она не просто случайным образом выдает эти задания», — говорит Кьяу.

В будущем исследователи планируют усовершенствовать свою систему для обработки более сложных и тонких запросов пользователей, например, стола, изготовленного из стекла и металла. Кроме того, они хотят включить в систему дополнительные сборные компоненты, такие как шестерни, шарниры или другие движущиеся части, чтобы объекты могли обладать большей функциональностью.

«Мы надеемся значительно снизить барьер доступа к инструментам проектирования. Мы показали, что можем использовать генеративный искусственный интеллект и робототехнику для быстрого, доступного и экологичного воплощения идей в физические объекты», — говорит Дэвис.

Источник: news.mit.edu

✅ Найденные теги: новости, робот, Стул

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Древняя резная табличка с изображением человека и символами на черном фоне.
Рука в воде с густыми зелеными водорослями, детализированная текстура.
Компания ReVision Implant планирует провести клинические испытания на первой фазе разработки интерфейса мозг-компьютер после того, как FDA присвоило ей статус «прорывного продукта» — Medical Device Network.
ideipro logotyp
CMS использует анализ данных и сотрудничество для борьбы с мошенничеством в программе Medicare | MobiHealthNews
Изображение человеческого мозга с нейроинтерфейсом на тёмном фоне.
График планов и мероприятий по эпиднадзору за инфекционными заболеваниями в Африке 2014-2015.
Деревянная скульптура человека в задумчивой позе на синем фоне.
Коричневый свитер с воротником и этикеткой "Quince", сделан из викуньи в Перу.
Image Not Found
Древняя резная табличка с изображением человека и символами на черном фоне.

Символы каменного века могут отодвинуть на второй план самые ранние формы письменности.

Загадочные знаки, выгравированные на предметах, свидетельствуют о том, что форма протописьменности могла использоваться в Европе 40 000 лет назад, за десятки тысяч лет до появления полноценной письменной системы. Фигурка «Адорант», возраст которой составляет приблизительно 38 000 лет,…

Мар 12, 2026
Рука в воде с густыми зелеными водорослями, детализированная текстура.

Ученые обнаружили крошечный океанический грибок, который убивает токсичные водоросли.

Ученые обнаружили новый морской гриб, который поражает и уничтожает токсичные водоросли, вызывающие вредоносное цветение. Этот приспособляемый паразит может раскрыть ранее недооцененную природную силу, которая помогает контролировать рост водорослей и формировать океанические экосистемы. Фото: Shutterstock Исследователи из Йокогамского…

Мар 12, 2026
Компания ReVision Implant планирует провести клинические испытания на первой фазе разработки интерфейса мозг-компьютер после того, как FDA присвоило ей статус «прорывного продукта» — Medical Device Network.

Компания ReVision Implant планирует провести клинические испытания на первой фазе разработки интерфейса мозг-компьютер после того, как FDA присвоило ей статус «прорывного продукта» — Medical Device Network.

Согласно анализу GlobalData, прогнозируется, что к 2034 году объем мирового рынка неврологических устройств превысит 25 миллиардов долларов. (Фото: BLACKDAY / Shutterstock.com) Окулярный интерфейс «мозг-компьютер» (BCI) компании ReVision Implant, предназначенный для лечения слепоты, получил статус прорывного устройства от…

Мар 12, 2026
ideipro logotyp

Новая компания MiniMed получила одобрение ЕС на использование инсулиновой помпы MiniMed 780G и системы непрерывного мониторинга уровня глюкозы Instinct от Abbott

Вскоре после выхода на биржу бывшее подразделение Medtronic по производству препаратов для лечения диабета, MiniMed, заявило о получении европейского разрешения на подключение своей основной инсулиновой помпы к эксклюзивному устройству непрерывного мониторинга уровня глюкозы производства Abbott. В сентябре…

Мар 12, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых