Google Deepmind использует Gemini для обучения агентов в Goat Simulator 3

Ноя 13, 2025 0

SIMA 2, способная решать проблемы в виртуальных мирах, может привести к появлению более универсальных агентов и более совершенных роботов.

Предоставлено Google DeepMind

Компания Google DeepMind создала нового агента для видеоигр SIMA 2, способного ориентироваться и решать задачи в широком спектре трёхмерных виртуальных миров. Компания утверждает, что это большой шаг к созданию более универсальных агентов и более совершенных роботов для реального мира.

Компания Google DeepMind впервые продемонстрировала SIMA (что расшифровывается как «масштабируемый инструктируемый многомировой агент») в прошлом году. Однако SIMA 2 построена на базе Gemini, флагманской модели компании с большим количеством языков, что значительно расширяет возможности агента.

Исследователи утверждают, что SIMA 2 может выполнять ряд более сложных задач в виртуальных мирах, самостоятельно находить решения некоторых задач и общаться с пользователями. Кроме того, SIMA 2 может совершенствоваться, многократно решая более сложные задачи и обучаясь методом проб и ошибок.

«Игры уже давно являются движущей силой исследований агентов», — заявил на пресс-конференции на этой неделе Джо Марино, исследователь из Google DeepMind. Он отметил, что даже простое действие в игре, например, зажигание фонаря, может состоять из нескольких этапов: «Это действительно сложный набор задач, которые нужно решить для продвижения».

Конечная цель — разработка агентов нового поколения, способных следовать инструкциям и выполнять нестандартные задачи в более сложных средах, чем веб-браузер. В долгосрочной перспективе Google DeepMind планирует использовать таких агентов для управления реальными роботами. Марино заявил, что навыки, освоенные SIMA 2, такие как ориентирование в пространстве, использование инструментов и сотрудничество с людьми для решения задач, являются важнейшими составляющими для будущих роботов-компаньонов.

В отличие от предыдущих работ по игровым агентам, таких как AlphaZero, победивший гроссмейстера по го в 2016 году, или AlphaStar, победивший 99,8% игроков-людей, участвующих в рейтинговых соревнованиях по видеоигре StarCraft 2 в 2019 году, идея SIMA заключается в обучении агента играть в открытую игру без заранее заданных целей. Вместо этого агент учится выполнять инструкции, данные ему людьми.

Управление SIMA 2 осуществляется через текстовый чат, посредством голосовых команд или рисования на экране игры. Агент покадрово считывает пиксели видеоигры и определяет, какие действия необходимо выполнить для выполнения поставленных задач.

Как и его предшественник, SIMA 2 обучался на видеозаписях людей, играющих в восемь коммерческих видеоигр, включая No Man's Sky и Goat Simulator 3, а также в трёх виртуальных мирах, созданных компанией. Агент научился сопоставлять действия с клавиатуры и мыши.

Исследователи утверждают, что при подключении к Gemini SIMA 2 гораздо лучше выполняет инструкции (задает вопросы и предоставляет обновления по ходу дела) и самостоятельно определяет, как выполнять некоторые более сложные задачи.

Google DeepMind протестировала агента в условиях, с которыми он никогда ранее не сталкивался. В одной из серий экспериментов исследователи попросили Genie 3, последнюю версию модели мира компании, создать среды с нуля и поместили в них SIMA 2. Они обнаружили, что агент способен ориентироваться и выполнять инструкции.

Исследователи также использовали Gemini для генерации новых заданий для SIMA 2. Если агент терпел неудачу, Gemini сначала генерировал подсказки, которые SIMA 2 учитывала при следующей попытке. Многократное повторение задачи таким образом часто позволяло SIMA 2 совершенствоваться методом проб и ошибок, пока не добивалась успеха, сказал Марино.

Git gud

SIMA 2 всё ещё находится на стадии эксперимента. Агент испытывает трудности со сложными задачами, требующими многоэтапного выполнения и длительного времени. Он также запоминает только свои последние взаимодействия (чтобы повысить отзывчивость SIMA 2, команда сократила его долговременную память). Кроме того, он пока ещё не так хорошо, как люди, взаимодействует с виртуальным миром с помощью мыши и клавиатуры.

Джулиан Тогелиус, исследователь искусственного интеллекта из Нью-Йоркского университета, работающий над творческими аспектами и видеоиграми, считает это интересным результатом. По его словам, предыдущие попытки обучить одну систему играть в несколько игр не увенчались успехом. Это связано с тем, что обучение моделей управлению несколькими играми, просто глядя на экран, — непростая задача: «Играть в реальном времени, используя только визуальную информацию, — это „сложный режим“», — говорит он.

В частности, Тогелиус упоминает GATO, предыдущую систему от Google DeepMind, которая, несмотря на шумиху в свое время, не могла переносить навыки между значительным количеством виртуальных сред.

Тем не менее, он непредвзято относится к вопросу о том, может ли SIMA 2 привести к созданию более совершенных роботов. «Реальный мир одновременно сложнее и проще видеоигр», — говорит он. Сложнее, потому что нельзя просто нажать A, чтобы открыть дверь. В то же время робот в реальном мире будет точно знать, что его тело может делать, а что нет, в любой момент времени. В видеоиграх всё иначе: правила внутри каждого виртуального мира могут различаться.

Другие настроены более скептически. Мэтью Гуздиал, исследователь искусственного интеллекта из Альбертского университета, не слишком удивлён, что SIMA 2 может играть во множество разных видеоигр. Он отмечает, что у большинства игр очень похожее управление клавиатурой и мышью: изучите одну — и выучите все. «Если дать ей игру со странным управлением, не думаю, что она будет хорошо работать», — говорит он.

Гуздиал также задаётся вопросом, насколько знания SIMA 2 действительно применимы к роботам. «В реальном мире гораздо сложнее понимать визуальные эффекты с камер, чем в играх, где визуальные эффекты легко распознаются игроками-людьми», — говорит он.

Тем не менее, Марино и его коллеги надеются продолжить работу с Genie 3, чтобы позволить агенту совершенствоваться в своего рода бесконечном виртуальном тренировочном додзё, где Genie генерирует миры, в которых SIMA может учиться методом проб и ошибок, руководствуясь отзывами Gemini. «Мы лишь поверхностно коснулись того, что возможно», — сказал он на пресс-конференции.

Источник: www.technologyreview.com

Метки:

Google новости

ПРЕДЫДУЩАЯ ЗАПИСЬ

13.11.2025

Blue Origin попытается второй раз запустить New Glenn в четверг из-за задержки в связи с солнечной бурей

СЛЕДУЮЩАЯ ЗАПИСЬ

13.11.2025

Власти Франции сняли с Павла Дурова ограничения на перемещения по миру — СМИ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

Еще новости рубрики

Архив рубрики ~Обо всем~

Фантазии

Июл 2, 2024

Архив рубрики ~Обо всем~

Мировоззрение

Июл 2, 2024

Архив рубрики ~Обо всем~

Влияние выдумщиков и фантазеров на развитие…

Июл 2, 2024

Архив рубрики ~Обо всем~

Нет ничего невозможного

Июл 2, 2024

Присоединяйтесь
к нам в

TELEGRAM

галерея

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Взаимодействие человека и машины погружается под воду.

НОВОСТИ ДРУГИХ РУБРИК

Архив рубрики ~Лента новостей~

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Вкратце Опубликовано: Изображение предоставлено: Thos Robinson/Getty Images для The New York Times (откроется в новом окне) Джули Борт Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.…

ЧИТАТЬ

Апр 21, 2026

Архив рубрики ~Лента новостей~

Как почистить виниловые пластинки (2026): пылесос, ультразвук, чистящий раствор, щетка.

Эти щелчки и треск недопустимы. Приведите свою музыку в порядок с помощью этого удобного руководства. Источник: www.wired.com

ЧИТАТЬ

Апр 21, 2026

Архив рубрики ~Лента новостей~

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

ЧИТАТЬ

Апр 21, 2026

Архив рубрики ~Лента новостей~