Человек в серебряном костюме готовит яичницу на кухне.

Он разработал идеальный тест для человекоподобных роботов, и они справились с ним за несколько месяцев

Робототехник Бенджи Холсон создал «Гуманоидные Олимпийские игры», полагая, что до домашних роботов осталось 15 лет. Затем они начали складывать белье

Дени Эллис Бешар под редакцией Эрика Салливана

Мужчина в блестящем серебристом костюме разбивает яйцо на сковородку на газовой плите на современной кухне.

В сентябре прошлого года робототехник Бенджи Холсон опубликовал «Олимпийские игры гуманоидов»: набор все более сложных тестов для человекоподобных роботов, которые он продемонстрировал сам он был одет в серебристое боди. Задания, такие как открытие двери с помощью круглой дверной ручки, начинались легко, по крайней мере, для человека, и постепенно превратились в «золотую медаль» за выполнение таких заданий, как правильно застегнуть и повесить мужскую рубашку и открыть дверь ключом.

Идея Холсона заключалась в том, что сложные задачи — это не самые блестящие из них. В то время как в других соревнованиях участвуют роботы, занимающиеся спортом и танцами, Холсон утверждал, что на самом деле нам нужны роботы, которые могут стирать и готовить еду.

Он ожидал, что на решение этих задач уйдут годы. Вместо этого в течение нескольких месяцев робототехническая компания Physical Intelligence выполнила 11 из 15 заданий — от бронзы до золота — с роботом, который мыл окна, намазывал арахисовое масло и использовал пакет для собачьих какашек.

О поддержке научной журналистики

Если вам понравилась эта статья, подумайте о том, чтобы поддержать нашу журналистскую деятельность, отмеченную наградами, подписавшись на нее. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.

Компания Scientific American поговорила с Холсоном о том, почему системы, основанные только на зрении или на камерах, превосходят его ожидания и насколько мы близки к созданию действительно полезной машины. С тех пор он выпустил новый, более сложный набор заданий.

[Ниже приводится отредактированная стенограмма интервью.]

Вы придумали эти задачи так, чтобы они были трудными. Вы были удивлены тем, как быстро пришли результаты?

Это произошло намного быстрее, чем я ожидал. Когда я выбирал задания, я пытался настроить их таким образом, чтобы некоторые из них были бронзовыми в течение первого месяца или двух, затем серебряными и золотыми в течение следующих шести месяцев, а самые сложные могли занять год или полтора. То, что они делают практически все это в течение первых трех месяцев, — это дико.

Что сделало это возможным?

Я начал с предположения, что у нас есть вещи, которые впечатляюще смотрятся при решении довольно узкого круга задач — только зрение, никаких прикосновений, простой манипулятор, а не невероятная точность. Это ограничивает то, в чем вы можете быть хороши. Я попытался придумать задачи, которые потребовали бы от нас выхода за рамки этого набора. Оказывается, я сильно недооценил возможности использования только визуальных и простых манипуляторов.

Когда я посетил Физический интеллект, я узнал, что у них нет никакого ощущения силы. Они делают все это на 100 процентов на основе зрения. Ввод ключа, намазывание арахисовым маслом — я думал, что для этого потребуется приложить усилие. Но, очевидно, вы просто добавляете больше видео-демонстраций, и это работает.

Как именно вы обучаете робота делать это, не кодируя его построчно?

Все это можно почерпнуть из демонстрации. Кто-то управляет роботом, выполняющим задачу сотни раз, на основе этого обучают модель, и затем робот может выполнять задачу.

Существует большая путаница в отношении того, является ли большой объем данных необходимым. языковые модели (LLM) бесполезны для роботов. Так ли это?

Раньше я довольно сильно сомневался в полезности LLMS в робототехнике. Проблема, с которой они успешно справлялись два или три года назад, заключалась в планировании на высоком уровне: «Если я хочу приготовить чай, какие шаги нужно предпринять?» Упорядочение шагов — это самая простая часть. Поднять чайник и наполнить его — это действительно сложная задача.

С другой стороны, мы начали создавать модели «видение-действие», используя ту же архитектуру transformer [которая используется в LLMs]. Вы можете использовать трансформаторы для ввода текста, вывода текста, изображений, вывода текста — но также и для изображений, для действий робота.

Самое интересное, что они начинаются с моделей предварительно обученный работе с текстом, изображениями, возможно, видео. Еще до того, как вы приступите к выполнению своей конкретной задачи, искусственный интеллект уже поймет, что такое чайник, что такое вода и что вы, возможно, захотите наполнить его водой. Таким образом, при выполнении задания необязательно начинать со слов «Позвольте мне разобраться, что такое геометрия». Это может начаться со слов «Я вижу, мы передвигаем чайники», что странно, что это работает.

Как вы придумали «Олимпийские» задания?

Таким образом, отчасти это был вызов, а отчасти — предсказание. Я попытался придумать следующий набор вещей, которые мы не можем делать сейчас, но которые кто-то скоро сможет сделать.

Люди полагаются на прикосновения, например, при поиске ключей в кармане. Как мы обходим это в робототехнике?

Это очень хороший вопрос, на который мы пока не знаем ответа. Сенсорная технология намного хуже, она более дорогая, чувствительная и значительно уступает камерам. Камеры, над которыми мы работали долгое время.

Главный вопрос в том, достаточно ли камер? И Physical Intelligence, и Sunday Robotics (которые выполнили задачу по раскатыванию одинаковых носков, завоевавшую бронзовую медаль) сделали ставку на то, что, поместив камеру на запястье, очень близко к пальцам, вы сможете как бы увидеть силы, наблюдая, как все сминается. Когда робот что-то хватает, он видит, что на пальцах есть резина, которая прогибается; объект прогибается, и на основании этого он определяет силу воздействия. Намазывая арахисовое масло на хлеб, робот наблюдает, как нож опускается вниз и раздавливает хлеб, и оценивает силу воздействия на хлеб по этому показателю. Это работает намного лучше, чем я ожидал.

Как насчет безопасности?

Энергия, необходимая для поддержания баланса, часто довольно высока. высокий. Если робот падает, требуется очень быстрое и жесткое ускорение, чтобы вовремя выставить ногу вперед. Ваша система должна выделять в окружающий мир много энергии, и это небезопасно.

Я большой поклонник роботов-кентавров&передвижная колесная база с подлокотниками и головкой. В целях безопасности, это самый простой способ быстро добраться туда. Если гуманоид потеряет энергию, он упадет. Общий план, похоже, заключается в том, чтобы сделать робота настолько невероятно ценным, что мы, как общество, создадим для него новый класс безопасности — такой же, как для велосипедов и автомобилей. Они опасны, но настолько ценны, что мы готовы пойти на риск.

Изменили ли эти результаты ваш график?

Раньше я думал, что до появления домашних роботов осталось по меньшей мере 15 лет. Теперь, я думаю, по меньшей мере шесть. Разница в том, что я думал, что пройдет гораздо больше времени, прежде чем появится возможность сделать полезную вещь в человеческом пространстве, даже в качестве демонстрации.

Но робототехники не раз убеждались в том, что это долгий путь между «это сработало в лаборатории, и я получил видео» и «Я могу продавать продукт». «Waymo ездила по дорогам в 2009 году; я не мог купить поездку до 2024 года. Требуется много времени, чтобы привести надежность в порядок.

Что осталось самым большим узким местом?

✅ Найденные теги: «Он, Идеальный, новости, Разработка, Тест, Человекоподобные Роботы

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Рабочий в каске работает с монитором на промышленном объекте.
Схема белковой структуры с синими спиралями и зелеными стрелками на светлом фоне.
Чёрно-белое изображение НЛО, документы и схемы, связанные с исследованиями космических объектов.
Игровая консоль с контроллером на белом фоне.
Цветные математические формулы и уравнения на черном фоне.
Презентация Huawei Next Generation FAN Solution на MWC 2021 в Барселоне.
НЛО в космосе на фоне звездного неба.
Абстрактное изображение нервных клеток и нейронных связей в мозге.
Планета в космосе с частичным освещением рядом с другой небесной телой на тёмном фоне.
Image Not Found
Схема белковой структуры с синими спиралями и зелеными стрелками на светлом фоне.

Как красочные ленточные диаграммы стали лицом белков

Белки часто представляют себе как каскады свернутых лент и закрученных нитей, которые одновременно и показывают, и скрывают хаос атомов, составляющих эти невероятно сложные молекулы. Комментарий Сохранить статью Прочитать позже Ленточные диаграммы Джейн Ричардсон превращают абстрактные атомные структуры…

Мар 9, 2026
Чёрно-белое изображение НЛО, документы и схемы, связанные с исследованиями космических объектов.

Не ждите больших сюрпризов в правительственных документах об инопланетянах.

Дональд Трамп распорядился обнародовать файлы, касающиеся инопланетян, НЛО и НЛО. Если судить по предыдущим разоблачениям, готовьтесь к разочарованию. Фотоиллюстрация: сотрудники WIRED; Getty Images Сохранить историю Сохранить эту историю Сохранить историю Сохранить эту историю Инопланетяне снова вторглись в…

Мар 9, 2026
НЛО в космосе на фоне звездного неба.

Космические штормы обвинили в искажениях сообщений от инопланетян

Штормы в космосе мешают установить контакт с внеземной жизнью Новое исследование предполагает, что штормовая космическая погода может искажать сообщения от инопланетян. Исследователи, которые выискивают признаки внеземной жизни, говорят, что сигналы «могут проскальзывать ниже порога обнаружения, даже если…

Мар 9, 2026
Абстрактное изображение нервных клеток и нейронных связей в мозге.

Болезнь Альцгеймера может начинаться с воспаления кожи, легких или кишечника.

В области изучения болезни Альцгеймера происходит кардинальное изменение подхода, поскольку все больше данных указывает на то, что заболевание начинается вне головного мозга за много лет до появления симптомов. Это может означать, что нам придется полностью переосмыслить методы…

Мар 9, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых