Image

Эффективные стратегии для реализации пенальти: как теория игр помогает преодолеть неправильные заблуждения в использовании данных

Введение в теорию игр, равновесие Нэша и стратегическое принятие решений на основе анализа данных.

Делиться

869495bd944001de5406ba4f7d0e7259
Изображение предоставлено Pixabay через Pexels.

Введение

Пенальти — одни из самых решающих и напряженных моментов в футболе. Один-единственный удар, когда остается только обыграть вратаря, может определить исход всего матча или даже чемпионата. С точки зрения анализа данных, они предлагают нечто еще более интересное: уникальную контролируемую среду для изучения принятия решений в условиях стратегической неопределенности.

В отличие от открытой игры, пенальти выполняются на фиксированном расстоянии, с одним бьющим, одним вратарем и ограниченным набором четко определенных действий. Эта простота делает их идеальной средой для понимания того, как данные и стратегия взаимодействуют.

Предположим, мы хотим ответить на, казалось бы, простой вопрос:

Куда должен бить кикер, чтобы максимизировать вероятность забить гол?

На первый взгляд, для ответа на этот вопрос достаточно взглянуть на исторические данные. Однако, как мы увидим, полагаться исключительно на чистую статистику может привести к ошибочным выводам. Когда результаты зависят от стратегического взаимодействия, оптимальные решения нельзя вывести, опираясь только на средние значения.

К концу этой статьи мы увидим, почему наиболее успешной стратегией для выполнения пенальти является не та, которая предполагается на основе исходных данных, как теория игр объясняет этот кажущийся парадокс и как аналогичные рассуждения применимы ко многим реальным задачам, связанным с конкуренцией и стратегическим поведением.

Подводные камни использования необработанных коэффициентов конверсии

Представьте, что у вас есть доступ к набору данных, содержащему множество исторических наблюдений за пенальти. Естественным первым показателем, который мы могли бы подумать измерить, является процент забитых голов при каждом направлении удара.

Предположим, мы обнаружим, что штрафные удары, направленные в центр, реализуются чаще, чем удары по краям. Вывод может показаться очевидным: бьющим игрокам всегда следует целиться в центр.

В основе этой логики лежит скрытое предположение, что поведение вратаря остается неизменным. Однако в действительности пенальти — это не самостоятельные решения. Это стратегическое взаимодействие, в котором оба игрока постоянно адаптируются друг к другу.

Если бы игроки, выполняющие удары по воротам, вдруг начали каждый раз целиться в центр, вратари быстро отреагировали бы, чаще оставаясь в центре. Таким образом, исторический процент успешных ударов в центр отражает скорее стратегическое поведение в прошлом, чем внутреннее превосходство такого выбора.

Следовательно, проблема заключается не в определении наилучшего действия в отрыве от контекста, а в поиске баланса, при котором ни один из игроков не сможет улучшить свой результат, изменив свою стратегию. В теории игр такой баланс известен как равновесие Нэша .

Формализация штрафных санкций как игры с нулевой суммой

Пенальти, естественно, можно смоделировать как игру с нулевой суммой для двух игроков. И бьющий, и вратарь должны одновременно выбрать направление удара. Для простоты предположим, что у них есть всего три возможных варианта:

  • Левая (L)
  • Центр (С)
  • Справа (R)

Принимая решение, бьющие по воротам стремятся максимизировать вероятность забить гол, а вратари — минимизировать её.

Если PP обозначает вероятность забитого гола, то выигрыш бьющего игрока равен PP, а выигрыш вратаря равен −PP. Однако выигрыш не является фиксированной константой, поскольку зависит от совокупного выбора обоих игроков. Мы можем представить выигрыш в виде матрицы:

P=[PLLPLCPLRPCLPCCPCRPRLPRCPRR] P= begin{bmatrix} P_{LL} & P_{LC} & P_{LR}\ P_{CL} & P_{CC} & P_{CR}\ P_{RL} & P_{RC} & P_{RR}\ end{bmatrix},

где каждый элемент PijP_{ij} представляет вероятность забития гола, если бьющий выбирает направление ii, а вратарь — направление jj.

Позже мы оценим эти вероятности на основе прошлых данных, но сначала давайте составим общее представление о проблеме, используя упрощенную модель.

Игрушечная модель

Для определения простой, но разумной модели матрицы выигрышей мы предполагаем, что:

  • Если бьющий и вратарь выбирают разные направления, результатом всегда является гол (Pij=1P_{ij}=1 при i≠jine j).
  • Если оба игрока выбирают центр, удар всегда отражает вратарь (PCC=0P_{CC}=0).
  • Если обе команды выбрали одну и ту же сторону, гол забивается в 60% случаев (PLL=PRR=0.6P_{LL}=P_{RR}=0.6).

В результате получается следующая матрица выигрышей:

P=[0.611101110.6]P= begin{bmatrix} 0.6 & 1 & 1\ 1 & 0 & 1\ 1 & 1 & 0.6\ end{bmatrix}.

Стратегии достижения равновесия

Как найти оптимальные стратегии для кикера, зная матрицу выигрышей?

Легко понять, что фиксированная стратегия, то есть постоянный выбор одного и того же варианта, не может быть оптимальной. Если бы бьющий всегда целился в одном и том же направлении, вратарь мог бы немедленно воспользоваться этой предсказуемостью. Точно так же вратаря, который всегда ныряет в одну и ту же сторону, было бы легко обыграть.

Для достижения равновесия и сохранения неуязвимости для злоупотреблений игроки должны делать свой выбор случайным образом, что в теории игр называется смешанной стратегией .

Смешанная стратегия описывается вектором, элементами которого являются вероятности совершения конкретного выбора. Обозначим смешанную стратегию игрока, выполняющего удар, как

p=(pL,pC,pR)p = (p_L, p_C, p_R),

и смешанная стратегия вратаря как

q=(qL,qC,qR)q = (q_L, q_C, q_R).

Равновесие достигается, когда ни один из игроков не может улучшить свой результат, в одностороннем порядке изменив свою стратегию. В этом контексте это подразумевает, что игроки, выполняющие удары, должны рандомизировать свои броски таким образом, чтобы вратари были безразличны к тому, нырять ли влево, вправо или оставаться по центру. Если бы одно направление предлагало более высокий ожидаемый процент отраженных ударов, вратари воспользовались бы этим, вынуждая игроков, выполняющих удары, корректировать свою стратегию.

Используя матрицу выигрышей, определенную ранее, мы можем вычислить ожидаемую вероятность забития гола для каждого возможного выбора вратаря:

  • Если вратарь ныряет влево, ожидаемая вероятность забитого гола составляет:

VL = 0,6pL + pC + pRV_L = 0,6 p_L + p_C + p_R

  • если вратарь остаётся в центре:

VC = pL + pRV_C = p_L + p_R

  • если вратарь нырнет вправо:

VR = pL + pC + 0,6pRV_R = p_L + p_C + 0,6p_R

Для того чтобы стратегия бьющего игрока была равновесной, нам нужно найти pLp_L, pCp_C, pRp_R такие, чтобы для вратарей вероятность пропущенного гола не менялась в зависимости от их выбора, то есть нам нужно, чтобы

VL=VC=VRV_L = V_C = V_R,

что, вместе с условием нормализации стратегии

pL+pC+pR=1p_L+p_C+p_R=1,

Представляет собой линейную систему из трех уравнений. Решив эту систему, мы обнаруживаем, что равновесная стратегия для игрока, выполняющего удар, заключается в следующем:

p∗≃(0,417,0,166,0,417)p^* simeq (0,417, 0,166, 0,417).

Интересно, что, хотя центральные броски легче всего отразить, если их предусмотреть, при попадании в центр примерно в 16,6% случаев все варианты одинаково эффективны. Центральные броски работают именно потому, что они редки.

Теперь, когда мы вооружены знаниями теории игр и равновесия Нэша, мы наконец можем обратиться к реальным данным и проверить, ведут ли себя профессиональные игроки оптимально.

Обучение на основе данных из реального мира

Мы анализируем открытый набор данных (лицензия CC0), содержащий 103 пенальти из сезона английской Премьер-лиги 2016-2017 годов . Для каждого пенальти в наборе данных зафиксировано направление удара, направление, выбранное вратарем, и окончательный результат.

Анализируя данные, мы обнаруживаем, что общая результативность пенальти составляет приблизительно 77,7%, и что броски по центру поля оказываются наиболее эффективными. В частности, мы получаем следующие показатели результативности для разных направлений бросков:

  • Слева: 78,7%
  • Центр: 88,2%
  • Справа: 71,2%

Однако для определения оптимальных стратегий нам необходимо перестроить матрицу выигрышей, что требует оценки девяти коэффициентов конверсии — по одному для каждой возможной комбинации выбора бьющего и вратаря.

Однако, поскольку в нашем наборе данных всего 103 наблюдения, некоторые комбинации встречаются довольно редко. Следовательно, оценка этих вероятностей непосредственно на основе исходных данных привела бы к значительному шуму.

Поскольку нет веских оснований полагать, что левая и правая стороны ворот принципиально различаются, мы можем повысить надежность нашей модели, наложив симметрию между двумя сторонами и объединив эквивалентные ситуации.

Это позволяет эффективно сократить количество оцениваемых параметров, тем самым снижая дисперсию наших вероятностных оценок и повышая устойчивость результирующей матрицы выплат.

При этих предположениях эмпирическая матрица выигрышей принимает следующий вид:

P≃[0.610.860.9400.940.8610.6]Psimeq begin{bmatrix} 0.6 & 1 & 0.86\ 0.94 & 0 & 0.94\ 0.86 & 1 & 0.6\ end{bmatrix}.

Мы видим, что измеренная матрица выигрышей довольно похожа на модель, которую мы определили ранее, с той лишь разницей, что в реальности игроки, выполняющие удар, могут промахнуться по воротам, даже если вратарь выберет неправильное направление.

Решая задачу определения равновесных стратегий , мы получаем:

p∗≃(0.39,0.22,0.39)q∗≃(0.415,0.17,0.415)begin{aligned} p^* &simeq (0.39, 0.22, 0.39) \ q^* &simeq (0.415, 0.17, 0.415) end{aligned}.

Действительно ли игроки показывают оптимальные результаты?

Сравнивая стратегии достижения равновесия с наблюдаемым поведением, выявляется интересная закономерность.

2669a9ccb5a78818db5c886f95927f91
Сравнение равновесных и наблюдаемых стратегий для бьющих по воротам и вратарей. Изображение предоставлено автором.

Игроки, выполняющие удары по воротам, ведут себя почти оптимально , хотя и целятся в центр несколько реже, чем следовало бы (16,5% случаев вместо 22%).

С другой стороны, вратари значительно отклоняются от своей оптимальной стратегии, оставаясь в центре поля лишь в 6% случаев вместо оптимальных 17%.

Это объясняет, почему удары по центру ворот кажутся необычайно успешными в исторических данных. Высокий процент реализации таких ударов свидетельствует не о каком-либо внутреннем превосходстве, а скорее о систематической неэффективности в поведении вратарей.

Если бы и вратари, и голкиперы идеально следовали своим стратегиям поддержания равновесия, то удары по центру поля забивались бы примерно в 77,8% случаев, что близко к среднемировому показателю.

За пределами футбола: взгляд с точки зрения науки о данных.

Хотя пенальти представляют собой наглядный пример, это же явление встречается во многих реальных приложениях анализа данных.

Системы онлайн-ценообразования, финансовые рынки, алгоритмы рекомендаций и средства защиты от киберугроз — все они предполагают адаптацию агентов к поведению друг друга. В таких средах исторические данные отражают стратегическое равновесие, а не пассивные результаты. Ценовая стратегия, которая кажется оптимальной на основе прошлых данных, может перестать работать, как только отреагируют конкуренты. Аналогично, системы обнаружения мошенничества меняют поведение пользователей сразу после внедрения.

В условиях конкуренции обучение на основе данных требует моделирования взаимодействия, а не только корреляции.

Выводы

Пенальти иллюстрируют более широкий урок по оптимизации принятия решений на основе данных.

Исторические средние значения не всегда указывают на оптимальные решения. Когда результаты формируются в результате стратегического взаимодействия, наблюдаемые данные отражают равновесие между конкурирующими агентами, а не внутреннее качество отдельных действий.

Поэтому понимание механизма, генерирующего данные, имеет важное значение. Без моделирования стратегического поведения описательную статистику легко можно принять за предписывающие рекомендации .

Таким образом, настоящая задача для специалистов по анализу данных заключается не только в анализе произошедшего, но и в понимании того, почему рациональные агенты вообще допустили эти действия.

Эмануэле Боаттини. Все работы Эмануэле Боаттини.

Источник: towardsdatascience.com

✅ Найденные теги: Данные, Заблуждения, новости, Пенальти, Стратегии, Теория Игр, Эффективные

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Химические структуры аминокетонов, азиридинов и митомицина С.
В воскресенье компания по производству человекоподобных роботов достигла оценки в 1,15 млрд долларов для создания бытовых роботов.
ideipro logotyp
5 бесплатных инструментов на основе ИИ для анализа кода и создания документации
Робот взаимодействует с интерфейсом с иконками для анализа данных и искусственного интеллекта.
Миниатюрный белый подводный дрон от RMIT с игловым наконечником, черный фон.
Центр обработки данных с мониторами и серверами в рабочем процессе.
Человек и цифровой аватар, разделенные молнией, символизируют технологическое противостояние.
Мем с персонажем в панике и текстом "Сэм Альтман: Люди перестали доверять ИИ".
Image Not Found
Химические структуры аминокетонов, азиридинов и митомицина С.

Новая химическая реакция позволит улучшить известные лекарства и получить новые

Структуры синтезированных в работе веществ и известного противоопухолевого антибиотика митомицина С © Николай Ростовский Химики разработали метод получения новых органических веществ на основе простой реакции, запускаемой органическими соединениями серы. Для этого авторы провели несколько возможных вариантов превращений,…

Мар 15, 2026
В воскресенье компания по производству человекоподобных роботов достигла оценки в 1,15 млрд долларов для создания бытовых роботов.

В воскресенье компания по производству человекоподобных роботов достигла оценки в 1,15 млрд долларов для создания бытовых роботов.

Вкратце Источник изображения: Дональд Иэн Смит / Getty Images Компания Sunday, занимающаяся робототехникой, привлекла новый раунд финансирования, в результате которого ее стоимость оценивается в «единорога», то есть превышает 1 миллиард долларов, как было объявлено в четверг. Компания…

Мар 15, 2026
ideipro logotyp

Опрос Deloitte выявил резкое расхождение во взглядах на перспективы на этот год.

Автор: сотрудники Bio-IT World 19 февраля 2026 г. | В ходе мероприятия Clinical Trial Venture, Innovation, and Partnering на конференции SCOPE в этом году, компания Deloitte Consulting в своем прогнозе для руководителей в сфере медико-биологических наук на…

Мар 15, 2026
5 бесплатных инструментов на основе ИИ для анализа кода и создания документации

5 бесплатных инструментов на основе ИИ для анализа кода и создания документации

Откройте для себя пять инструментов искусственного интеллекта, которые делают изучение и понимание больших кодовых баз быстрее и проще. Изображение предоставлено автором. # Введение Всем известно, что разобраться в новом коде — задача непростая. Вы открываете файл за…

Мар 15, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых