Новая модель способна реагировать на сбои и осваивать действия, к которым она не была обучена.
Композиционное изображение, демонстрирующее множество обобщенных задач, которые может выполнять модель искусственного интеллекта GEN-1 от Generalist. Автор: Generalist. Композиционное изображение, демонстрирующее множество обобщенных задач, которые может выполнять модель искусственного интеллекта GEN-1 от Generalist. Автор: Generalist. Настройки текстаТекст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков
Узнать больше Свернуть в навигацию
Компания Generalist, специализирующаяся на робототехнике и машинном обучении, анонсировала GEN-1, новую систему физического искусственного интеллекта, которая, по ее словам, «достигает уровня успешности, сопоставимого с производственными показателями», в «широком спектре физических навыков», которые раньше требовали ловкости и мышечной памяти человеческих рук. Generalist также подчеркивает способность новой модели реагировать на сбои, импровизируя новые движения и «объединяя идеи из разных источников для решения новых проблем».
GEN-1 основана на предыдущей модели GEN-0 компании Generalist, которую в ноябре компания представила как концептуальное доказательство применимости законов масштабирования в обучении роботов, демонстрирующее, как большее количество данных и вычислительного времени до обучения улучшает результаты после обучения. Но в то время как большие языковые модели смогли эффективно обрабатывать триллионы слов, написанных в Интернете, в рамках своего обучения, у роботизированных моделей нет аналогичного, легкодоступного источника качественных данных о том, как люди манипулируют объектами.
Для решения этой проблемы компания Generalist использует «ручные манипуляторы» — носимые щипцы, которые фиксируют микроскопические движения и визуальную информацию, получаемую человеком при выполнении ручных задач. Generalist утверждает, что собрала более полумиллиона часов и «петабайты данных о физическом взаимодействии» для обучения своей физической модели.
В результате получилась автономная система, достаточно точная, чтобы положить деньги в кошелек, и достаточно адаптивная, чтобы складывать белье или сортировать автозапчасти. По данным Generalist, модель теперь достигает 99-процентной успешности при выполнении повторяющихся, но деликатных механических задач, таких как складывание коробок, упаковка телефонов и обслуживание роботов-пылесосов, и примерно в три раза быстрее, чем предыдущая модель GEN-0. По словам компании, GEN-1 может достичь этих показателей всего за час, потраченный на адаптацию предварительного обучения к «роботизированным данным», применимым к конкретному роботизированному воплощению.
Исправление ошибок
В прошлом сложные роботизированные системы обычно полагались на тщательно запрограммированные движения или обучались исключительно выполнению одной задачи с минимальными вариациями. По словам Generalist, GEN-1 отличается от других систем способностью импровизировать на основе своего предыдущего опыта и естественным образом реагировать на сбои, даже если они «значительно выходят за рамки обучающей выборки».
Например, в интервью Forbes инженеры Generalist описывают, как модель слегка встряхивает пластиковый пакет, чтобы мягкая игрушка пошевелилась внутри, хотя такое движение не было явно запрограммировано в обучающих данных. Видео, опубликованное Generalist, также демонстрирует, как роботизированные руки интеллектуально корректируют свои положения, когда гибкие объекты смещаются со своих ожидаемых мест, или как они перекладывают рубашку, которая смещается во время складывания. Generalist также описывает, как модель корректирует и повторно захватывает маленькие шайбы, когда они смещаются, используя обе руки, чтобы вставить их на нужное место.
«Никто не программировал робота на совершение ошибок, следовательно, никто не программировал робота на исправление ошибок», — говорит инженер-универсал Феликс Ван в этом видео. «И это происходит само собой».
Generalist — не единственная компания, работающая над внедрением методов машинного обучения в физическую сферу. В прошлом году Google продемонстрировал возможности «визуального обучения действиям» своих моделей Gemini Robotics, которые могут понимать и реагировать на общие подсказки действий от людей. А компания Physical Intelligence произвела фурор, создав пару роботизированных рук на колесной платформе, обученных в специально разработанных смоделированных домашних условиях выполнять задачи от уборки пролитой жидкости до заправки кроватей.
Затем есть Tesla, которая впервые представила своих человекоподобных роботов Optimus в конце 2024 года, проведя постановочные демонстрации, на самом деле управляемые дистанционно пилотами. В январе генеральный директор Tesla Илон Маск признал, что нынешние роботы Optimus по-прежнему не выполняют «полезную работу» в Tesla, несмотря на предыдущие заявления об обратном.
Однако, по словам Generalist, с появлением GEN-1 физические модели достигли переломного момента, подобного тому, что наблюдался у GPT-3, когда некоторые задачи начинают «превышать уровень производительности, необходимый для экономически целесообразного использования», и когда «мы можем ожидать, что каждое новое поколение моделей будет приводить к появлению нового набора все более сложных задач, которые можно будет освоить». Мы надеемся, что это означает, что в ближайшем будущем мы наконец-то на пути к доступному роботу для складывания белья дома.
Источник: arstechnica.com
























