Image

По-настоящему умный Искусственный интеллект мог бы играть по Правилам, какими бы странными они ни были

Чтобы создавать безопасные, но мощные модели искусственного интеллекта, начните с тестирования их способности играть в игры «на лету»

Иллюстрация двух роботов, стоящих друг напротив друга за столом во время игры в шахматы

Крестики-нолики-toe настолько прост, насколько это вообще возможно в играх, но, как отметил почти 70 лет назад легендарный автор Scientific American Мартин Гарднер, у него есть сложные вариации и стратегические аспекты. Они варьируются от «обратных» игр, в которых проигрывает игрок, первым собравший три в ряд, до трехмерных версий, в которые играют на кубиках и не только. Игры Гарднера, даже если они поражают воображение обычного человека, могут указать нам на способ сделать искусственный интеллект более похожим на человеческий.

Это потому, что игры в их бесконечном разнообразии- с правилами, которые нужно представить, понять и соблюдать — это часть того, что делает нас людьми. Навигационные правила также являются ключевой задачей для моделей искусственного интеллекта, поскольку они начинают приближаться к человеческому мышлению. И при нынешнем положении вещей проблема заключается в том, что большинство из этих моделей не оправдывают ожиданий.

Это большое дело, потому что если есть путь к искусственному общему интеллект — конечная цель исследований в области машинного обучения и искусственного интеллекта — может быть достигнут только путем создания ИИ, способных интерпретировать, адаптироваться и строго следовать правилам, которые мы для них устанавливаем.

О поддержке научной журналистики

Если вы&#27. если вам понравилась эта статья, подумайте о том, чтобы поддержать нашу журналистскую деятельность, отмеченную наградами, подписавшись на нее. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.

Чтобы стимулировать разработку такого ИИ, мы должны разработать новый тест — назовем его тестом Гарднера — в котором ИИ удивляют правила поведения. игра, и затем ожидается, что она будет проходить по этим правилам без вмешательства человека. Один из простых способов добиться сюрприза — раскрыть правила только в начале игры.

Тест Гарднера, принося извинения тесту Тьюринга, вдохновлен и опирается на новаторскую работу в области искусственного интеллекта в области общих игр (GGP), которая в значительной степени была разработана профессором Стэнфордского университета Майклом Дженесеретом. В соревнованиях GGP ИИ, работающие на стандартных ноутбуках, соревнуются с другими ИИ в играх, правила которых — написанные на формальном математическом языке — раскрываются только в начале. Предлагаемый здесь тест открывает новые горизонты: принятие правил игры, выраженных на естественном языке, таком как английский. Когда-то это было далекой целью, но теперь это достижимо для современных ИИ благодаря недавним достижениям в области больших языковых моделей (LLM), таких как те, которые поддерживают ChatGPT и которые относятся к семействам Claude и Llama.

Предлагаемое задание должно включать в себя серию тестов, которые изначально могли бы быть ориентированы на игры, являющиеся основой соревнований GGP, такие как Connect Four, Hex и Pentago. В нем также должен быть использован впечатляющий набор игр, о которых писал Гарднер. При разработке тестов может быть задействовано активное международное исследовательское сообщество GGP, разработчики передовых моделей искусственного интеллекта и, конечно же, преданные поклонники Мартина Гарднера.

Но чтобы пройти новый тест, недостаточно создать систему искусственного интеллекта, которая хорошо справляется с одной конкретной заранее определенной игрой или даже со многими. Вместо этого необходимо создать искусственный интеллект, способный «на лету» осваивать любую стратегическую игру. Стратегические игры требуют от человека способности продумывать множество шагов и выходить за их рамки, иметь дело с непредсказуемыми ответными действиями, адаптироваться к меняющимся целям и при этом соблюдать строгий набор правил.

Это большой скачок от это лучшие на сегодняшний день модели искусственного интеллекта для игр, которые полагаются на знание правил заранее для обучения своих алгоритмов. Рассмотрим, например, AlphaZero, революционную модель искусственного интеллекта, которая способна играть в три игры — шахматы, Го и сеги (японские шахматы) — на сверхчеловеческом уровне. AlphaZero учится с помощью техники, известной как «самостоятельная игра» — он постоянно играет против своей копии, и благодаря этому опыту со временем становится лучше. Однако для самостоятельной игры требуется, чтобы правила каждой игры были установлены перед тренировкой. Способность AlphaZero осваивать сложные игры, несомненно, впечатляет, но это хрупкая система: если вы предложите AlphaZero игру, отличную от тех, которые она изучала, она будет полностью сбита с толку. Напротив, модель искусственного интеллекта, хорошо зарекомендовавшая себя в предлагаемом новом тесте, была бы способна адаптироваться к новым правилам даже в отсутствие данных; она могла бы играть в любую игру и следовать любому новому набору правил с мощью и точностью.

Этот последний пункт — точность — является важным. Вы можете предложить многим системам искусственного интеллекта выполнять варианты простых игр, и они будут вам подыгрывать: например, ChatGPT может разыграть 4 раза по 4 или 5 раз по 5 вариантов крестиков-ноликов. Но приглашение LLM лучше всего воспринимать как предложение, а не как конкретный набор правил — вот почему нам часто приходится уговаривать, льстить и подсказывать LLM, чтобы они делали именно то, что мы хотим. Общий интеллект, который прошел бы тест Гарднера, напротив, по определению был бы способен идеально следовать правилам: несоблюдение правил в точности означало бы провал теста.

Специализированные инструменты, которые работают без истинное понимание правил, как правило, выходит за рамки, воспроизводя прошлые ошибки на основе обучающих данных, а не придерживаясь установленных нами правил. Легко представить реальные сценарии, в которых такие ошибки могут привести к катастрофическим последствиям: например, в контексте национальной безопасности необходимы возможности искусственного интеллекта, которые могут точно применять правила ведения боевых действий в динамике или согласовывать тонкие, но важные различия в юридических полномочиях и полномочиях командования. В сфере финансов программируемые деньги становятся новой формой валюты, которая может подчиняться правилам владения и передачи — и неправильное применение этих правил может привести к финансовой катастрофе.

По иронии судьбы, создание систем искусственного интеллекта, которые могли бы строго следовать правилам, в конечном итоге позволило бы создать машинный интеллект, гораздо более похожий на человеческий по своей гибкости и способности адаптироваться к неопределенным и новым ситуациям. Когда мы думаем об игроках-людях, мы склонны думать о специалистах: Магнус Карлсен — великий шахматист, но, возможно, не так силен в техасском холдеме. Однако суть в том, что люди способны к обобщениям; если бы Карлсен когда-нибудь бросил шахматы, он мог бы стать достойным соперником на чемпионате мира по пятиборью, который проводится для лучшего игрока в многоборье.

Игра с новым набором правил имеет решающее значение для дальнейшего развития искусственного интеллекта, поскольку потенциально она позволит нам создавать ИИ, которые будут способны на все, но при этом будут скрупулезно и надежно следовать установленным нами правилам. сервиз для них. Если нам нужен мощный, но безопасный искусственный интеллект, лучшим решением может стать тестирование его возможностей в играх «на лету».

❌ Нет тегов для этой статьи
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых