Image

По-настоящему умный Искусственный интеллект мог бы играть по Правилам, какими бы странными они ни были

Чтобы создавать безопасные, но мощные модели искусственного интеллекта, начните с тестирования их способности играть в игры «на лету»

Иллюстрация двух роботов, стоящих друг напротив друга за столом во время игры в шахматы

Крестики-нолики-toe настолько прост, насколько это вообще возможно в играх, но, как отметил почти 70 лет назад легендарный автор Scientific American Мартин Гарднер, у него есть сложные вариации и стратегические аспекты. Они варьируются от «обратных» игр, в которых проигрывает игрок, первым собравший три в ряд, до трехмерных версий, в которые играют на кубиках и не только. Игры Гарднера, даже если они поражают воображение обычного человека, могут указать нам на способ сделать искусственный интеллект более похожим на человеческий.

Это потому, что игры в их бесконечном разнообразии- с правилами, которые нужно представить, понять и соблюдать — это часть того, что делает нас людьми. Навигационные правила также являются ключевой задачей для моделей искусственного интеллекта, поскольку они начинают приближаться к человеческому мышлению. И при нынешнем положении вещей проблема заключается в том, что большинство из этих моделей не оправдывают ожиданий.

Это большое дело, потому что если есть путь к искусственному общему интеллект — конечная цель исследований в области машинного обучения и искусственного интеллекта — может быть достигнут только путем создания ИИ, способных интерпретировать, адаптироваться и строго следовать правилам, которые мы для них устанавливаем.

О поддержке научной журналистики

Если вы&#27. если вам понравилась эта статья, подумайте о том, чтобы поддержать нашу журналистскую деятельность, отмеченную наградами, подписавшись на нее. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.

Чтобы стимулировать разработку такого ИИ, мы должны разработать новый тест — назовем его тестом Гарднера — в котором ИИ удивляют правила поведения. игра, и затем ожидается, что она будет проходить по этим правилам без вмешательства человека. Один из простых способов добиться сюрприза — раскрыть правила только в начале игры.

Тест Гарднера, принося извинения тесту Тьюринга, вдохновлен и опирается на новаторскую работу в области искусственного интеллекта в области общих игр (GGP), которая в значительной степени была разработана профессором Стэнфордского университета Майклом Дженесеретом. В соревнованиях GGP ИИ, работающие на стандартных ноутбуках, соревнуются с другими ИИ в играх, правила которых — написанные на формальном математическом языке — раскрываются только в начале. Предлагаемый здесь тест открывает новые горизонты: принятие правил игры, выраженных на естественном языке, таком как английский. Когда-то это было далекой целью, но теперь это достижимо для современных ИИ благодаря недавним достижениям в области больших языковых моделей (LLM), таких как те, которые поддерживают ChatGPT и которые относятся к семействам Claude и Llama.

Предлагаемое задание должно включать в себя серию тестов, которые изначально могли бы быть ориентированы на игры, являющиеся основой соревнований GGP, такие как Connect Four, Hex и Pentago. В нем также должен быть использован впечатляющий набор игр, о которых писал Гарднер. При разработке тестов может быть задействовано активное международное исследовательское сообщество GGP, разработчики передовых моделей искусственного интеллекта и, конечно же, преданные поклонники Мартина Гарднера.

Но чтобы пройти новый тест, недостаточно создать систему искусственного интеллекта, которая хорошо справляется с одной конкретной заранее определенной игрой или даже со многими. Вместо этого необходимо создать искусственный интеллект, способный «на лету» осваивать любую стратегическую игру. Стратегические игры требуют от человека способности продумывать множество шагов и выходить за их рамки, иметь дело с непредсказуемыми ответными действиями, адаптироваться к меняющимся целям и при этом соблюдать строгий набор правил.

Это большой скачок от это лучшие на сегодняшний день модели искусственного интеллекта для игр, которые полагаются на знание правил заранее для обучения своих алгоритмов. Рассмотрим, например, AlphaZero, революционную модель искусственного интеллекта, которая способна играть в три игры — шахматы, Го и сеги (японские шахматы) — на сверхчеловеческом уровне. AlphaZero учится с помощью техники, известной как «самостоятельная игра» — он постоянно играет против своей копии, и благодаря этому опыту со временем становится лучше. Однако для самостоятельной игры требуется, чтобы правила каждой игры были установлены перед тренировкой. Способность AlphaZero осваивать сложные игры, несомненно, впечатляет, но это хрупкая система: если вы предложите AlphaZero игру, отличную от тех, которые она изучала, она будет полностью сбита с толку. Напротив, модель искусственного интеллекта, хорошо зарекомендовавшая себя в предлагаемом новом тесте, была бы способна адаптироваться к новым правилам даже в отсутствие данных; она могла бы играть в любую игру и следовать любому новому набору правил с мощью и точностью.

Этот последний пункт — точность — является важным. Вы можете предложить многим системам искусственного интеллекта выполнять варианты простых игр, и они будут вам подыгрывать: например, ChatGPT может разыграть 4 раза по 4 или 5 раз по 5 вариантов крестиков-ноликов. Но приглашение LLM лучше всего воспринимать как предложение, а не как конкретный набор правил — вот почему нам часто приходится уговаривать, льстить и подсказывать LLM, чтобы они делали именно то, что мы хотим. Общий интеллект, который прошел бы тест Гарднера, напротив, по определению был бы способен идеально следовать правилам: несоблюдение правил в точности означало бы провал теста.

Специализированные инструменты, которые работают без истинное понимание правил, как правило, выходит за рамки, воспроизводя прошлые ошибки на основе обучающих данных, а не придерживаясь установленных нами правил. Легко представить реальные сценарии, в которых такие ошибки могут привести к катастрофическим последствиям: например, в контексте национальной безопасности необходимы возможности искусственного интеллекта, которые могут точно применять правила ведения боевых действий в динамике или согласовывать тонкие, но важные различия в юридических полномочиях и полномочиях командования. В сфере финансов программируемые деньги становятся новой формой валюты, которая может подчиняться правилам владения и передачи — и неправильное применение этих правил может привести к финансовой катастрофе.

По иронии судьбы, создание систем искусственного интеллекта, которые могли бы строго следовать правилам, в конечном итоге позволило бы создать машинный интеллект, гораздо более похожий на человеческий по своей гибкости и способности адаптироваться к неопределенным и новым ситуациям. Когда мы думаем об игроках-людях, мы склонны думать о специалистах: Магнус Карлсен — великий шахматист, но, возможно, не так силен в техасском холдеме. Однако суть в том, что люди способны к обобщениям; если бы Карлсен когда-нибудь бросил шахматы, он мог бы стать достойным соперником на чемпионате мира по пятиборью, который проводится для лучшего игрока в многоборье.

Игра с новым набором правил имеет решающее значение для дальнейшего развития искусственного интеллекта, поскольку потенциально она позволит нам создавать ИИ, которые будут способны на все, но при этом будут скрупулезно и надежно следовать установленным нами правилам. сервиз для них. Если нам нужен мощный, но безопасный искусственный интеллект, лучшим решением может стать тестирование его возможностей в играх «на лету».

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Vantage Markets представит торговые решения на Blockchain Forum 2026
Моделирование данных для инженеров-аналитиков: полное руководство
В методе моделирования новых материалов обнаружилась «слепая зона»: Химия и науки о материалах
Компания Tesla запускает свою службу роботакси в Далласе и Хьюстоне.
Ученые говорят: Клонировать
dummy-img
Как максимально эффективно использовать возможности коворкинга в Claude
Samsung выпустила стильные колонки Music Studio
Hyundai показала концепты электромобилей Venus и Earth
Image Not Found
Vantage Markets представит торговые решения на Blockchain Forum 2026

Vantage Markets представит торговые решения на Blockchain Forum 2026

14–15 апреля 2026 года в Москве, в Крокус Экспо, пройдет Blockchain Forum 2026 — одно из ключевых событий региона для профессионалов в сфере криптовалют, трейдинга и блокчейн-технологий. По мере того как индустрия продолжает развиваться в направлении цифровых…

Апр 20, 2026
Моделирование данных для инженеров-аналитиков: полное руководство

Моделирование данных для инженеров-аналитиков: полное руководство

Лучшие модели данных затрудняют постановку неправильных вопросов и упрощают ответы на правильные. Делиться Ваша модель данных — это не технические характеристики. Это мышление с точки зрения бизнеса. Рассматривайте её как план всей вашей аналитической системы. Если план…

Апр 20, 2026
В методе моделирования новых материалов обнаружилась «слепая зона»: Химия и науки о материалах

В методе моделирования новых материалов обнаружилась «слепая зона»: Химия и науки о материалах

Графическое резюме исследования © Михаил Медведев / Институт органической химии имени Н.Д. Зелинского РАН. Исследователи показали, что широко используемые методы квантовой химии могут не различать некоторые варианты распределения электронов в молекулах, из-за чего допускают ошибки при моделировании…

Апр 20, 2026
Компания Tesla запускает свою службу роботакси в Далласе и Хьюстоне.

Компания Tesla запускает свою службу роботакси в Далласе и Хьюстоне.

Вкратце Источник изображения: Тим Гессман / Bloomberg / Getty Images Согласно сообщению компании Tesla в социальных сетях, она расширяет свою службу роботакси на Даллас и Хьюстон. В сообщении просто говорится: «Роботакси теперь запускается в Далласе и Хьюстоне…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых