Игры, в которые играют люди и машины: разгадка стратегической логики для развития ИИ.
Доцент Габриэле Фарина исследует основы принятия решений в сложных сценариях с участием множества агентов.
Габриэле Фарина, доцент кафедры электротехники и информатики Массачусетского технологического института и ведущий исследователь Лаборатории информационных и систем принятия решений, сочетает концепции теории игр с такими инструментами, как машинное обучение, оптимизация и статистика, для развития теоретических и алгоритмических основ принятия решений. Фото: Джерард Уэлком
Габриэле Фарина вырос в небольшом городке в холмистом винодельческом регионе на севере Италии. Ни у одного из его родителей не было высшего образования, и хотя оба были убеждены, что «не понимают математику», — говорит Фарина, — они покупали ему необходимые технические книги и не отговаривали его от обучения в естественнонаучной, а не классической средней школе.
Примерно к 14 годам Фарина сосредоточился на идее, которая станет основополагающей для его карьеры.
«Меня очень рано заворожила идея о том, что машина может делать прогнозы или принимать решения намного лучше, чем человек», — говорит он. «Тот факт, что созданные человеком математические методы и алгоритмы могут создавать системы, которые в некотором смысле превосходят своих создателей, при этом опираясь на простые строительные блоки, всегда вызывал у меня огромное восхищение».
В 16 лет Фарина написал код для решения настольной игры, в которую он играл со своей 13-летней сестрой.
«Я использовал партию за партией, чтобы вычислить оптимальный ход и доказать сестре, что она проиграла задолго до того, как мы сами это поняли», — говорит Фарина, добавляя, что его сестра была не в восторге от его новой системы.
В настоящее время Фарина является доцентом кафедры электротехники и информатики (EECS) Массачусетского технологического института и ведущим научным сотрудником Лаборатории информационных и управленческих систем (LIDS). Он сочетает концепции теории игр с такими инструментами, как машинное обучение, оптимизация и статистика, для развития теоретических и алгоритмических основ принятия решений.
Поступив в Миланский политехнический университет, Фарина изучал автоматизацию и управление. Однако со временем он понял, что его больше интересует не «просто применение известных методов, а понимание и расширение их основ», — говорит он. «Я постепенно все больше и больше склонялся к теории, хотя по-прежнему очень хотел продемонстрировать конкретные примеры применения этой теории».
Научный руководитель Фарины в Миланском политехническом университете, Никола Гатти, профессор и исследователь в области компьютерных наук и инженерии, познакомил Фарину с исследовательскими вопросами в области вычислительной теории игр и посоветовал ему подать заявку на поступление в аспирантуру. В то время, будучи первым в своей семье, кто получил высшее образование, и живя в Италии, где к докторским степеням относятся иначе, Фарина говорит, что даже не знал, что такое докторская степень.
Тем не менее, через месяц после получения степени бакалавра Фарина начал обучение в докторантуре по информатике в Университете Карнеги-Меллона. Там он получил награды за свои исследования и диссертацию, а также стипендию Facebook в области экономики и вычислительной техники.
Завершая работу над докторской диссертацией, Фарина год проработал научным сотрудником в лаборатории фундаментальных исследований искусственного интеллекта компании Meta. Одним из его основных проектов была разработка Цицерона, ИИ, способного обыгрывать игроков-людей в игре, включающей формирование альянсов, ведение переговоров и выявление блефа других игроков.
Фарина говорит: «Когда мы создавали Цицерона, мы проектировали его таким образом, чтобы он не соглашался на заключение союза, если это не в его интересах, и чтобы он также понимал, не лжет ли игрок, потому что его действия противоречили бы его собственным интересам».
В статье 2022 года в журнале MIT Technology Review говорилось, что Цицерон может представлять собой шаг вперед в направлении создания искусственного интеллекта, способного решать сложные проблемы, требующие компромиссов.
После года работы в Meta Фарина присоединился к преподавательскому составу MIT. В 2025 году он был удостоен премии CAREER Национального научного фонда. Его работа, основанная на теории игр и ее математическом языке, описывающем, что происходит, когда у разных сторон разные цели, а затем количественно определяющем «равновесие», при котором ни у кого нет причин менять свою стратегию, направлена на упрощение масштабных и сложных сценариев реального мира, где вычисление такого равновесия могло бы занять миллиард лет.
«Я изучаю, как мы можем использовать оптимизацию и алгоритмы для эффективного поиска этих стабильных точек», — говорит он. «Наша работа направлена на то, чтобы пролить новый свет на математические основы теории, лучше контролировать и прогнозировать эти сложные динамические системы, а также использовать эти идеи для вычисления хороших решений для больших взаимодействий между многоагентными системами».
Фарина особенно интересуется ситуациями с «несовершенной информацией», то есть когда некоторые участники обладают информацией, неизвестной другим. В таких сценариях информация имеет ценность, и участники должны стратегически использовать имеющуюся у них информацию, чтобы не раскрыть её и не снизить её ценность. Примером из повседневной жизни служит игра в покер, где игроки блефуют, чтобы скрыть информацию о своих картах.
По словам Фарины, «мы живем в мире, где машины гораздо лучше умеют блефовать, чем люди».
Ситуация с «огромным количеством неполной информации» заставила Фарину вернуться к истокам его увлечений настольными играми. Стратего — это военная стратегическая игра, которая вдохновила на исследования, потребовавшие миллионов долларов для создания систем, способных обыграть игроков-людей. Требуя сложного расчета рисков и обмана, или блефа, это, возможно, единственная классическая игра, для которой серьезные усилия не привели к сверхчеловеческим результатам, говорит Фарина.
Благодаря новым алгоритмам и обучению, стоимость которых составила менее 10 000 долларов, а не миллионы, Фарина и его исследовательская группа смогли обыграть лучшего игрока всех времен — одержав 15 побед, четыре ничьи и потерпев одно поражение. Фарина говорит, что он очень рад таким экономичным результатам и надеется, что «эти новые методы будут внедрены в будущие системы обработки данных».
«Мы наблюдаем постоянный прогресс в создании алгоритмов, способных к стратегическому мышлению и принятию обоснованных решений, несмотря на большие пространства действий или неполную информацию. Я рад видеть, как эти алгоритмы будут интегрированы в более широкую революцию в области искусственного интеллекта, которая происходит вокруг нас».
Источник: news.mit.edu

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.