Недавние исследования показывают, что даже простые алгоритмы ценообразования могут привести к удорожанию. Сохранить статью Прочитать позже

Введение
Представьте себе город с двумя торговцами товарами. Покупатели предпочитают более дешёвые товары, поэтому торговцы вынуждены конкурировать, чтобы установить самую низкую цену. Недовольные скудной прибылью, они встречаются однажды вечером в прокуренной таверне, чтобы обсудить секретный план: если они вместе поднимут цены, вместо того чтобы конкурировать, то смогут заработать больше. Но такой преднамеренный сговор, называемый сговором, давно запрещён. Торговцы товарами решают не рисковать, и все остальные наслаждаются дешёвыми товарами.
Уже более века законодательство США следует этому базовому шаблону: запретить закулисные сделки и поддерживать справедливые цены. В наши дни всё не так просто. Во многих секторах экономики продавцы всё чаще полагаются на компьютерные программы, называемые обучающимися алгоритмами, которые постоянно корректируют цены в ответ на новые данные о состоянии рынка. Они зачастую гораздо проще алгоритмов «глубокого обучения», лежащих в основе современного искусственного интеллекта, но всё же могут демонстрировать непредсказуемое поведение.
Как же регуляторы могут гарантировать, что алгоритмы устанавливают справедливые цены? Их традиционный подход не сработает, поскольку он основан на выявлении явного сговора. «Алгоритмы точно не пьют друг с другом», — заявил Аарон Рот, специалист по информатике из Пенсильванского университета.
Однако в широко цитируемой статье 2019 года было показано, что алгоритмы могут научиться негласному сговору, даже если они не были запрограммированы на это. Группа исследователей сравнила две копии простого обучающегося алгоритма на моделируемом рынке, а затем позволила им изучить различные стратегии увеличения прибыли. Со временем каждый алгоритм методом проб и ошибок научился принимать ответные меры в случае снижения цен другим, снизив свою цену на огромную, непропорционально большую сумму. Конечным результатом стали высокие цены, подкреплённые взаимной угрозой ценовой войны.
Подобные неявные угрозы также лежат в основе многих случаев человеческого сговора. Так что, если вы хотите гарантировать справедливые цены, почему бы просто не потребовать от продавцов использовать алгоритмы, изначально неспособные выражать угрозы?
В недавней статье Рот и четверо других специалистов по информатике показали, почему этого может быть недостаточно. Они доказали, что даже, казалось бы, безобидные алгоритмы, оптимизирующиеся ради собственной выгоды, иногда могут приводить к негативным результатам для покупателей. «Высокие цены всё равно можно получать способами, которые со стороны кажутся вполне разумными», — сказала Натали Коллина, аспирантка, работающая с Ротом и ставшая соавтором нового исследования.
Исследователи не все согласны с выводами этого открытия — многое зависит от того, что вы понимаете под «разумным». Но это показывает, насколько тонкими могут быть вопросы, связанные с алгоритмическим ценообразованием, и насколько сложно его регулировать.
«Без какого-либо представления об угрозе или соглашении регулирующему органу очень сложно прийти и сказать: „Эти цены кажутся нам неправильными“», — сказал Маллеш Пай, экономист из Университета Райса. «Вот почему я считаю эту работу важной».
Никаких сожалений
В недавней статье алгоритмическое ценообразование рассматривается через призму теории игр — междисциплинарной области на стыке экономики и информатики, которая анализирует математические модели стратегической конкуренции. Это один из способов исследовать сбои алгоритмов ценообразования в контролируемых условиях.
«Мы пытаемся создать сговор в лабораторных условиях», — сказал Джозеф Харрингтон, экономист из Пенсильванского университета, написавший влиятельную обзорную статью о регулировании алгоритмического сговора и не принимавший участия в новом исследовании. «Как только мы это сделаем, мы хотим понять, как его разрушить».
Чтобы понять ключевые идеи, полезно начать с простой игры «камень-ножницы-бумага». В данном контексте обучающимся алгоритмом может быть любая стратегия, которую игрок использует для выбора хода в каждом раунде на основе данных из предыдущих раундов. Игроки могут пробовать разные стратегии в ходе игры. Но если они играют хорошо, то в конечном итоге придут к состоянию, которое специалисты по теории игр называют равновесием. В равновесии стратегия каждого игрока является наилучшим возможным ответом на стратегию другого, поэтому ни у одного из них нет стимула меняться.
В игре «камень-ножницы-бумага» идеальная стратегия проста: каждый раунд нужно делать случайный ход, выбирая все три варианта одинаково часто. Обучающиеся алгоритмы особенно эффективны, если один из игроков использует другой подход. В этом случае выбор ходов, основанный на опыте предыдущих раундов, может помочь другому игроку выигрывать чаще, чем при игре наугад.
Предположим, например, что после многих раундов вы понимаете, что ваш оппонент, геолог, выбирал камень более чем в 50% случаев. Если бы вы играли бумагой в каждом раунде, вы бы выигрывали чаще. Специалисты по теории игр называют это болезненное осознание сожалением.
Исследователи разработали простые алгоритмы обучения, которые всегда гарантированно не оставят вас ни с чем сожалеющим. Чуть более сложные алгоритмы обучения, называемые алгоритмами «без сожалений об обмене», также гарантируют, что независимо от того, что сделал ваш оппонент, вы не смогли бы добиться большего, поменяв все случаи любого хода на любой другой ход (скажем, играя бумагу каждый раз, когда вы на самом деле играли ножницы). В 2000 году специалисты по теории игр доказали, что если столкнуть два алгоритма «без сожалений об обмене» друг с другом в любой игре, они придут к определенному виду равновесия — такому, которое было бы оптимальным равновесием, если бы они сыграли только один раунд. Это привлекательное свойство, потому что игры с одним раундом намного проще, чем многораундовые. В частности, угрозы не работают, потому что игроки не могут довести их до конца.
В статье 2024 года Джейсон Хартлайн, специалист по информатике из Северо-Западного университета, и два аспиранта перенесли классические результаты из статьи 2000 года на модель конкурентного рынка, где игроки могут устанавливать новые цены в каждом раунде. В этом контексте результаты подразумевали, что противоборствующие алгоритмы без сожаления о свопах всегда будут достигать конкурентоспособных цен при достижении равновесия. Сговор был невозможен.
Однако алгоритмы без сожалений по обмену — не единственные стратегии ценовой игры в мире онлайн-торговли. Что же происходит, когда алгоритм без сожалений по обмену сталкивается с другим, на первый взгляд безобидным, противником?
Цена неверна
По мнению специалистов по теории игр, лучшая стратегия игры против алгоритма, не допускающего сожалений по обмену, проста: начать с определённой вероятности для каждого возможного хода, а затем выбирать один ход случайным образом в каждом раунде, независимо от действий противника. Идеальное распределение вероятностей для этого «неотзывчивого» подхода зависит от конкретной игры, в которую вы играете.
Летом 2024 года Коллина и её коллега Эшвар Аруначалесваран решили найти оптимальные вероятности для игры с двумя игроками. Они обнаружили, что наилучшая стратегия присваивает поразительно высокие вероятности очень высоким ценам, а также более низкие вероятности широкому диапазону более низких цен. Если вы играете против алгоритма, не допускающего сожалений по свопам, эта странная стратегия максимизирует вашу прибыль. «Для меня это стало полной неожиданностью», — сказал Аруначалесваран.

Эшвар Аруначалесваран и Коллина получили свой результат, исследуя наилучшие ответы на хорошо работающие алгоритмы ценообразования.
Стратегии, не отвечающие требованиям, на первый взгляд кажутся безобидными. Они не способны транслировать угрозы, поскольку никак не реагируют на действия оппонентов. Но они могут заставить обучающиеся алгоритмы повысить цены, а затем получать прибыль, периодически сбивая цены конкурентов.
Поначалу Коллина и Аруначалесваран считали, что этот искусственный сценарий не имеет отношения к реальному миру. Игрок, использующий алгоритм «без сожалений по обмену», наверняка переключился бы на другой алгоритм, поняв, что конкурент наживается за его счёт.
Но по мере дальнейшего изучения проблемы и обсуждения её с Ротом и двумя другими коллегами они поняли, что интуиция их не оправдала. Два игрока в их сценарии уже находились в состоянии равновесия. Их прибыль была практически одинаковой, и обе стороны достигали максимально возможного уровня, пока ни один из них не переключился на другой алгоритм. Ни у одного из игроков не было стимула менять стратегию, поэтому покупатели столкнулись бы с высокими ценами. Более того, точные вероятности не так уж и важны. Множество различных вариантов приводили к высоким ценам при сравнении с алгоритмом, не допускающим сожалений по свопам. Это результат, ожидаемый от сговора, но без какого-либо сговора.
Быть глупым выгодно
Итак, что могут сделать регуляторы? Рот признаёт, что у него нет ответа. Запрещать алгоритмы без сожалений по свопам бессмысленно: если все будут их использовать, цены упадут. Но простая стратегия без обратной связи может быть естественным выбором для продавца на онлайн-площадке вроде Amazon, даже если она сопряжена с риском сожалений.
«Один из способов сожалеть — это просто быть немного глупым», — сказал Рот. «Исторически это не было противозаконным».
По мнению Хартлайна, проблема алгоритмического сговора имеет простое решение: запретить все алгоритмы ценообразования, кроме алгоритмов без сожалений по обмену, которые давно поддерживаются теоретиками игр. Возможно, существуют практические способы сделать это: в своей работе 2024 года Хартлайн и его коллеги разработали метод проверки наличия у алгоритма свойства без сожалений по обмену, не заглядывая в его код.
Хартлайн признал, что его предпочтительное решение не предотвратит все негативные последствия при конкуренции алгоритмов без сожалений о замене с людьми. Однако он утверждал, что сценарии, подобные описанному в статье Рота, не являются примерами алгоритмического сговора.
«Сговор — это двусторонний процесс, — сказал он. — По сути, должны быть предусмотрены действия, которые может предпринять каждый игрок, чтобы избежать сговора».
В любом случае, новая работа по-прежнему оставляет много открытых вопросов о том, как алгоритмическое ценообразование может дать сбой в реальном мире.
«Мы всё ещё не понимаем всего, что хотели бы, — сказал Пай. — Это важный вопрос для нашего времени».
Источник: www.quantamagazine.org



























