Image

Google Deepmind использует Gemini для обучения агентов в Goat Simulator 3

SIMA 2, способная решать проблемы в виртуальных мирах, может привести к появлению более универсальных агентов и более совершенных роботов.

4 скриншота из видеоигры

Предоставлено Google DeepMind

Компания Google DeepMind создала нового агента для видеоигр SIMA 2, способного ориентироваться и решать задачи в широком спектре трёхмерных виртуальных миров. Компания утверждает, что это большой шаг к созданию более универсальных агентов и более совершенных роботов для реального мира.

Компания Google DeepMind впервые продемонстрировала SIMA (что расшифровывается как «масштабируемый инструктируемый многомировой агент») в прошлом году. Однако SIMA 2 построена на базе Gemini, флагманской модели компании с большим количеством языков, что значительно расширяет возможности агента.

Исследователи утверждают, что SIMA 2 может выполнять ряд более сложных задач в виртуальных мирах, самостоятельно находить решения некоторых задач и общаться с пользователями. Кроме того, SIMA 2 может совершенствоваться, многократно решая более сложные задачи и обучаясь методом проб и ошибок.

«Игры уже давно являются движущей силой исследований агентов», — заявил на пресс-конференции на этой неделе Джо Марино, исследователь из Google DeepMind. Он отметил, что даже простое действие в игре, например, зажигание фонаря, может состоять из нескольких этапов: «Это действительно сложный набор задач, которые нужно решить для продвижения».

Конечная цель — разработка агентов нового поколения, способных следовать инструкциям и выполнять нестандартные задачи в более сложных средах, чем веб-браузер. В долгосрочной перспективе Google DeepMind планирует использовать таких агентов для управления реальными роботами. Марино заявил, что навыки, освоенные SIMA 2, такие как ориентирование в пространстве, использование инструментов и сотрудничество с людьми для решения задач, являются важнейшими составляющими для будущих роботов-компаньонов.

В отличие от предыдущих работ по игровым агентам, таких как AlphaZero, победивший гроссмейстера по го в 2016 году, или AlphaStar, победивший 99,8% игроков-людей, участвующих в рейтинговых соревнованиях по видеоигре StarCraft 2 в 2019 году, идея SIMA заключается в обучении агента играть в открытую игру без заранее заданных целей. Вместо этого агент учится выполнять инструкции, данные ему людьми.

Управление SIMA 2 осуществляется через текстовый чат, посредством голосовых команд или рисования на экране игры. Агент покадрово считывает пиксели видеоигры и определяет, какие действия необходимо выполнить для выполнения поставленных задач.

Как и его предшественник, SIMA 2 обучался на видеозаписях людей, играющих в восемь коммерческих видеоигр, включая No Man's Sky и Goat Simulator 3, а также в трёх виртуальных мирах, созданных компанией. Агент научился сопоставлять действия с клавиатуры и мыши.

Исследователи утверждают, что при подключении к Gemini SIMA 2 гораздо лучше выполняет инструкции (задает вопросы и предоставляет обновления по ходу дела) и самостоятельно определяет, как выполнять некоторые более сложные задачи.

Google DeepMind протестировала агента в условиях, с которыми он никогда ранее не сталкивался. В одной из серий экспериментов исследователи попросили Genie 3, последнюю версию модели мира компании, создать среды с нуля и поместили в них SIMA 2. Они обнаружили, что агент способен ориентироваться и выполнять инструкции.

Исследователи также использовали Gemini для генерации новых заданий для SIMA 2. Если агент терпел неудачу, Gemini сначала генерировал подсказки, которые SIMA 2 учитывала при следующей попытке. Многократное повторение задачи таким образом часто позволяло SIMA 2 совершенствоваться методом проб и ошибок, пока не добивалась успеха, сказал Марино.

Git gud

SIMA 2 всё ещё находится на стадии эксперимента. Агент испытывает трудности со сложными задачами, требующими многоэтапного выполнения и длительного времени. Он также запоминает только свои последние взаимодействия (чтобы повысить отзывчивость SIMA 2, команда сократила его долговременную память). Кроме того, он пока ещё не так хорошо, как люди, взаимодействует с виртуальным миром с помощью мыши и клавиатуры.

Джулиан Тогелиус, исследователь искусственного интеллекта из Нью-Йоркского университета, работающий над творческими аспектами и видеоиграми, считает это интересным результатом. По его словам, предыдущие попытки обучить одну систему играть в несколько игр не увенчались успехом. Это связано с тем, что обучение моделей управлению несколькими играми, просто глядя на экран, — непростая задача: «Играть в реальном времени, используя только визуальную информацию, — это „сложный режим“», — говорит он.

В частности, Тогелиус упоминает GATO, предыдущую систему от Google DeepMind, которая, несмотря на шумиху в свое время, не могла переносить навыки между значительным количеством виртуальных сред.

Тем не менее, он непредвзято относится к вопросу о том, может ли SIMA 2 привести к созданию более совершенных роботов. «Реальный мир одновременно сложнее и проще видеоигр», — говорит он. Сложнее, потому что нельзя просто нажать A, чтобы открыть дверь. В то же время робот в реальном мире будет точно знать, что его тело может делать, а что нет, в любой момент времени. В видеоиграх всё иначе: правила внутри каждого виртуального мира могут различаться.

Другие настроены более скептически. Мэтью Гуздиал, исследователь искусственного интеллекта из Альбертского университета, не слишком удивлён, что SIMA 2 может играть во множество разных видеоигр. Он отмечает, что у большинства игр очень похожее управление клавиатурой и мышью: изучите одну — и выучите все. «Если дать ей игру со странным управлением, не думаю, что она будет хорошо работать», — говорит он.

Гуздиал также задаётся вопросом, насколько знания SIMA 2 действительно применимы к роботам. «В реальном мире гораздо сложнее понимать визуальные эффекты с камер, чем в играх, где визуальные эффекты легко распознаются игроками-людьми», — говорит он.

Тем не менее, Марино и его коллеги надеются продолжить работу с Genie 3, чтобы позволить агенту совершенствоваться в своего рода бесконечном виртуальном тренировочном додзё, где Genie генерирует миры, в которых SIMA может учиться методом проб и ошибок, руководствуясь отзывами Gemini. «Мы лишь поверхностно коснулись того, что возможно», — сказал он на пресс-конференции.

Источник: www.technologyreview.com

✅ Найденные теги: Google, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых