Картирование мощности, концентрации и использования в формирующейся экосистеме разработчиков ИИ
Делиться

Написано совместно с Иланом Штраусом , Изобель Мур и Тимом О’Рейли в рамках проекта AI Disclosures Project. Первоначально опубликовано в нашем блоге: Asimov’s Addendum.
1. Расцвет и рост MCP
Протокол контекста модели (MCP) компании Anthropic был выпущен в ноябре 2024 года для обеспечения независимости инструментов и платформ от модели. MCP работает, определяя серверы и клиенты. Серверы MCP — это локальные или удалённые конечные точки, где определяются инструменты и ресурсы. Например, GitHub выпустил сервер MCP, который позволяет LLM-моделям читать данные с GitHub и записывать их в него. Клиенты MCP — это соединение между приложением ИИ и серверами MCP, позволяя LLM-моделям взаимодействовать с контекстом и инструментами с разных серверов. Примером клиента MCP является Claude Desktop, который позволяет моделям Claude взаимодействовать с тысячами серверов MCP.
За относительно короткое время MCP стал основой сотен конвейеров и приложений ИИ . Такие крупные игроки, как Anthropic и OpenAI, встроили его в свои продукты. Инструменты разработки, такие как Cursor (текстовый редактор, или IDE, ориентированный на кодирование) и офисные приложения, такие как Raycast, также используют MCP. Кроме того, тысячи разработчиков используют его для интеграции моделей ИИ и доступа к внешним инструментам и данным без необходимости создавать целую экосистему с нуля.
В предыдущей работе, опубликованной в AI Frontiers, мы утверждали, что MCP может выступать в качестве эффективного инструмента для развязывания «контекста» — данных, которые помогают приложениям ИИ предоставлять потребителям более релевантные ответы. Тем самым он может способствовать децентрализации рынков ИИ. Мы утверждали, что для достижения своих целей MCP необходима поддержка со стороны :
- Открытые API : чтобы приложения MCP могли получать доступ к сторонним инструментам для агентского использования (действия записи) и контекста (чтения)
- Жидкая память : совместимые стандарты памяти LLM, доступ к которым осуществляется через открытые протоколы типа MCP, благодаря чему контекст памяти, накопленный в OpenAI и других ведущих разработчиках, не застревает там, препятствуя последующим инновациям.
Для тех, кто хочет копнуть глубже, мы более подробно рассмотрим эти два момента в недавней аналитической записке.
В более общем плане мы утверждаем, что протоколы , такие как MCP , фактически являются основополагающими «правилами дорожного движения» для рынков ИИ , благодаря которым стандарты открытого раскрытия информации и коммуникации встроены в саму сеть, а не навязываются регулирующими органами постфактум. Протоколы по сути своей являются инструментами формирования рынка, формируя его архитектуру посредством разрешений, правил и взаимодействия самой сети. Они также могут оказывать существенное влияние на функционирование коммерческих рынков, построенных на их основе.
1.1 Но как развивается экосистема MCP?
Однако сегодня у нас нет четкого представления о том, как выглядит экосистема МКП . Каковы наиболее распространённые варианты использования MCP? Какой тип доступа предоставляется серверами MCP и используется клиентами MCP? Доступен ли MCP к данным «только для чтения» в контексте или агенты могут «писать» данные и взаимодействовать с ними, например, редактируя файлы или отправляя электронные письма?
Чтобы начать отвечать на эти вопросы, мы рассмотрим инструменты и контекст, которые агенты ИИ используют через серверы MCP. Это даёт нам представление о том, что разрабатывается и что привлекает внимание. В этой статье мы не анализируем клиенты MCP — приложения, использующие серверы MCP. Вместо этого мы ограничимся анализом того, что серверы MCP предоставляют для разработки.
Мы собрали большой набор данных MCP-серверов (n = 2874), полученный из Pulse. Затем мы дополнили его данными о количестве звёзд на GitHub для каждого сервера. Звёзды на GitHub аналогичны отметкам «Нравится» в Facebook, и разработчики используют их для выражения признательности, добавления проектов в закладки или указания использования.
На практике, несмотря на обилие MCP-серверов, мы обнаружили, что несколько лучших привлекали наибольшее внимание и, вероятно, как следствие, большую часть использования. Только на 10 лучших серверов пришлось почти половина всех звёзд GitHub, присвоенных MCP-серверам .
Некоторые из наших выводов:
- Использование MCP, по-видимому, довольно концентрировано. Это означает, что, если не контролировать, небольшое количество серверов и (как следствие) API могут получить чрезмерный контроль над создаваемой экосистемой MCP.
- Использование MCP (инструментов и данных, к которым осуществляется доступ) доминирует всего в трёх категориях: базы данных и поиск (RAG), компьютерная и веб-автоматизация и программная инженерия. В совокупности они получили почти три четверти (72,6%) всех звёзд на GitHub (который мы учитываем в качестве показателя использования).
- Большинство серверов MCP поддерживают операции как чтения (доступа к контексту), так и записи (изменения контекста), что показывает, что разработчики хотят, чтобы их агенты могли воздействовать на контекст, а не просто потреблять его.
2. Выводы
Для начала мы проанализировали экосистему MCP на предмет риска концентрации.
2.1 Использование сервера MCP сосредоточено
Мы обнаружили, что использование MCP сосредоточено среди нескольких ключевых серверов MCP , судя по количеству звезд GitHub, полученных каждым репозиторием.
Несмотря на то, что существуют тысячи серверов MCP, 10 лучших серверов составляют почти половину (45,7%) всех звезд GitHub, присвоенных серверам MCP (круговая диаграмма ниже), а 10% лучших серверов составляют 88,3% всех звезд GitHub (не показано).

Это означает, что большинство реальных пользователей MCP, вероятно, полагаются на одни и те же сервисы, доступные через несколько API. Такая концентрация, вероятно, обусловлена сетевыми эффектами и практической пользой: все разработчики тяготеют к серверам, решающим универсальные задачи, такие как веб-браузер, доступ к базам данных и интеграция с распространёнными платформами, такими как GitHub, Figma и Blender. Такая концентрация, по-видимому, типична для экосистем инструментов для разработчиков. Несколько хорошо реализованных и широко применимых решений, как правило, доминируют. В то же время более специализированные инструменты занимают более узкие ниши.
2.2 Топ-10 MCP-серверов, которые действительно важны
Далее в таблице ниже показаны 10 лучших серверов MCP, а также их количество звезд и особенности.
Среди 10 лучших MCP-серверов GitHub, Repomix, Context7 и Framelink разработаны для поддержки разработки программного обеспечения: Context7 и Repomix собирают контекст, GitHub позволяет агентам взаимодействовать с проектами, а Framelink передает спецификации проекта из Figma непосредственно в модель. Сервер Blender позволяет агентам создавать 3D-модели любых объектов с помощью популярного приложения Blender с открытым исходным кодом. Наконец, Activepieces и MindsDB подключают агента к нескольким API через единый стандартизированный интерфейс: в случае MindsDB — в первую очередь для чтения данных из баз данных, а в Activepieces — для автоматизации сервисов.

Доминирование агентного просмотра в форме Browser Use (61 000 звезд) и Playwright MCP (18 425 звезд) выделяется . Это отражает фундаментальную потребность в системах ИИ для взаимодействия с веб-контентом. Эти инструменты позволяют ИИ перемещаться по веб-сайтам, нажимать кнопки, заполнять формы и извлекать данные так же, как это делает человек. Агентный просмотр резко возрос, хотя он гораздо менее эффективен с точки зрения токенов, чем вызов API. Агентам просмотра часто приходится пробираться через несколько страниц шаблонного кода, чтобы извлечь фрагменты данных, которые может вернуть один запрос API. Поскольку у многих сервисов нет пригодных для использования API или они жестко их блокируют, агенты на основе браузера часто являются самым простым, а иногда и единственным, способом интеграции, что подчеркивает ограничения современных API.
Некоторые из ведущих серверов являются неофициальными. И Framelink, и Blender MCP — это серверы, взаимодействующие только с одним приложением, но оба они являются «неофициальными» продуктами. Это означает, что они официально не одобрены разработчиками приложения, с которым интегрируются, — владельцами базового сервиса или API (например, GitHub, Slack, Google). Вместо этого они создаются независимыми разработчиками, которые создают мост между клиентом ИИ и сервисом, часто путём реверс-инжиниринга API, создания оболочек для неофициальных SDK или использования автоматизации браузера для имитации взаимодействия с пользователем.
Возможность сторонних разработчиков создавать собственные MCP-серверы полезна, поскольку такая открытость стимулирует инновации. Однако она также создаёт промежуточный уровень между пользователем и API, что создаёт риски, связанные с доверием, проверкой и даже потенциальным злоупотреблением. Локальные серверы с открытым исходным кодом обеспечивают прозрачность кода и возможность его проверки. В отличие от этого, удалённые сторонние серверы сложнее проверять, поскольку пользователи должны доверять коду, который они не могут легко проверить.
На более глубоком уровне репозитории, которые в настоящее время доминируют на серверах MCP, подчеркивают три обнадеживающих факта об экосистеме MCP:
- Во-первых, несколько известных серверов MCP поддерживают множество сторонних сервисов для своей функциональности. MindsDB и Activepieces служат шлюзами для взаимодействия с несколькими (часто конкурирующими) поставщиками услуг через один сервер. MindsDB позволяет разработчикам выполнять запросы к различным базам данных, таким как PostgreSQL, MongoDB и MySQL, через единый интерфейс, а Taskmaster позволяет агенту делегировать задачи различным моделям ИИ от OpenAI, Anthropic и Google, не меняя серверы.
- Во-вторых, агентские MCP-серверы используются для обхода потенциально ограничивающих API. Как отмечалось выше, Browser Use и Playwright получают доступ к интернет-сервисам через веб-браузер, помогая обходить ограничения API, но вместо этого сталкиваются с защитой от ботов. Это позволяет обойти ограничения, которые API могут накладывать на создаваемые разработчиками продукты.
- В-третьих, некоторые серверы MCP выполняют обработку на компьютере разработчика (локально) , что делает их менее зависимыми от поставщика, поддерживающего доступ к API . Некоторые рассмотренные здесь серверы MCP могут работать полностью на локальном компьютере, не отправляя данные в облако, а это значит, что ни один шлюз не сможет вас отключить. Из 10 рассмотренных выше серверов MCP только Framelink, Context7 и GitHub используют всего одну зависимость API, доступную только в облаке, которую невозможно запустить локально на вашем компьютере. Blender и Repomix имеют полностью открытый исходный код и не требуют доступа к Интернету для работы, в то время как MindsDB, Browser Use и Activepieces имеют локальные реализации с открытым исходным кодом.
2.3 Три категории, которые доминируют в использовании МКП
Затем мы сгруппировали серверы MCP по различным категориям в зависимости от их функциональности.
При анализе наиболее популярных типов серверов мы обнаружили, что доминируют три: компьютерная и веб-автоматизация (24,8%) , программная инженерия (24,7%) и базы данных и поиск (23,1%) .

Широкое использование серверов MCP для разработки программного обеспечения (24,7%) согласуется с экономическим индексом Anthropic, который выявил, что значительная часть взаимодействий ИИ связана с разработкой программного обеспечения.
Популярность как Computer & Web Automation (24,8%), так и Database & Search (23,1%) также объяснима. До появления MCP веб-скрапинг и поиск в базах данных представляли собой тесно интегрированные приложения на таких платформах, как ChatGPT, Perplexity и Gemini. Однако с MCP пользователи могут получить доступ к тем же функциям поиска и подключить своих агентов к любой базе данных с минимальными усилиями. Другими словами, эффект разделения, присущий MCP, здесь особенно заметен.
2.4 Агенты взаимодействуют со своей средой
Наконец, мы проанализировали возможности этих серверов: позволяют ли они приложениям ИИ только получать доступ к данным и инструментам (чтение) или вместо этого выполнять с ними агентские операции (запись)?
Во всех рассмотренных категориях MCP-серверов, за исключением двух, наиболее популярные MCP-серверы поддерживали как операции чтения (контекст доступа), так и операции записи (агентские операции) — они выделены бирюзовым цветом. Распространенность серверов с комбинированным доступом на чтение и запись свидетельствует о том, что агенты создаются не только для ответов на вопросы на основе данных, но и для выполнения действий и взаимодействия с сервисами от имени пользователя.

Исключение составляют серверы Database & Search (RAG) и Finance MCP, на которых обычно предоставляется доступ только для чтения. Вероятно, это связано с тем, что целостность данных критически важна для обеспечения надёжности.
3. Важность множественных точек доступа
На этом предварительном этапе можно сделать несколько выводов из нашего анализа.
Во-первых, концентрированное использование серверов MCP увеличивает риски ограничения доступа к API . Как мы обсуждали в разделе «Протоколы и возможности», MCP по-прежнему ограничен тем, «что конкретный сервис (например, GitHub или Slack) раскрывает через свой API». Некоторые крупные поставщики цифровых услуг имеют право закрывать доступ к своим серверам.
Важной мерой защиты от API-шлюзирования является то, что многие ведущие серверы стараются не полагаться на одного провайдера. Кроме того , важны следующие две меры предосторожности :
- Они предлагают локальную обработку данных на компьютере пользователя, когда это возможно, вместо отправки данных на сторонний сервер. Локальная обработка гарантирует невозможность ограничения функциональности.
- Если локальный запуск сервиса (например, электронной почты или веб-поиска) невозможен, сервер должен поддерживать несколько способов получения необходимого контекста через конкурирующие API . Например, MindsDB выполняет функцию шлюза к нескольким источникам данных, поэтому вместо того, чтобы полагаться только на одну базу данных для чтения и записи данных, он прилагает все усилия для поддержки нескольких баз данных в одном унифицированном интерфейсе, что фактически делает внутренние инструменты взаимозаменяемыми.
Во-вторых, наш анализ указывает на то, что текущие ограничительные политики доступа к API не являются устойчивыми. Веб-скрапинг и боты, доступ к которым осуществляется через серверы MCP, вероятно, используются (по крайней мере частично) для обхода чрезмерно ограничительного доступа к API, что усложняет всё более распространённую практику блокировки ботов. Даже OpenAI выходит за рамки API, используя сторонний сервис для доступа к результатам поиска Google через веб-скрапинг, тем самым обходя его ограничительный API.
Расширение структурированного доступа к API имеет жизненно важное значение . Это гарантирует, что легитимная автоматизация ИИ будет осуществляться через стабильные, документированные конечные точки. В противном случае разработчикам придётся прибегать к ненадёжной автоматизации браузера, где вопросы конфиденциальности и авторизации не были должным образом реализованы. Нормативные рекомендации могут подтолкнуть рынок в этом направлении, как это произошло с открытым банкингом в США.
Наконец, поощрение большей прозрачности и раскрытия информации может помочь выявить узкие места в экосистеме MCP.
- Разработчики, управляющие популярными MCP-серверами (с превышением определённого порога использования) или предоставляющие API, используемые ведущими серверами, должны сообщать статистику использования, случаи отказа в доступе и политики ограничения скорости. Эти данные помогут регулирующим органам выявлять возникающие узкие места до того, как они станут серьёзными. GitHub может способствовать этому, например, поощряя раскрытие такой информации.
- Кроме того, серверы MCP, превышающие определённые пороговые значения использования, должны чётко указывать свои зависимости от внешних API и возможные варианты отката на случай недоступности основных API. Это не только полезно для определения структуры рынка, но и является важной информацией для обеспечения безопасности и надёжности последующих приложений.
Цель состоит не в том, чтобы полностью устранить концентрацию в сети, а в том, чтобы обеспечить конкурентоспособность экосистемы MCP, предлагая множество жизнеспособных путей для инноваций и выбора для пользователей. Учитывая как техническую архитектуру, так и динамику рынка, предлагаемые изменения могут помочь MCP раскрыть свой потенциал демократизирующей силы в разработке ИИ, а не просто перекладывать узкие места с одного уровня на другой.
Источник: towardsdatascience.com



























