
После объявления в начале этого года о создании концепции открытой экосистемы искусственного интеллекта, некоммерческая организация Creative Commons высказалась в поддержку технологии «платного сканирования» — системы автоматической компенсации за доступ к контенту веб-сайта для машин, таких как веб-краулеры на основе ИИ.
Creative Commons (CC) наиболее известна тем, что возглавила движение за лицензирование, позволяющее создателям делиться своими работами, сохраняя при этом авторские права. В июле организация объявила о плане создания правовой и технической основы для обмена наборами данных между компаниями, контролирующими данные, и поставщиками ИИ, которые хотят обучать на них свои модели.
Теперь некоммерческая организация предварительно поддерживает системы платного сканирования, заявляя, что она «осторожно их поддерживает».
«При ответственном внедрении платная система индексации сайтов может стать способом для веб-сайтов поддерживать создание и распространение своего контента, а также управлять альтернативными способами его использования, сохраняя контент общедоступным там, где он иначе не был бы доступен или исчез бы за еще более ограничительными платными барьерами», — говорится в сообщении в блоге CC.
Идея платного сбора данных, инициированная такими компаниями, как Cloudflare, заключается в том, чтобы взимать плату с ботов с искусственным интеллектом каждый раз, когда они парсят сайт для сбора его контента, необходимого для обучения и обновления модели.
Раньше веб-сайты свободно позволяли поисковым роботам индексировать свой контент для включения в поисковые системы, такие как Google. Они получали выгоду от этого, видя свои сайты в результатах поиска, что привлекало посетителей и клики. Однако с появлением технологий искусственного интеллекта ситуация изменилась. После того, как потребитель получит ответ через чат-бота с ИИ, он вряд ли перейдет по ссылке на источник.
Этот сдвиг уже нанес издателям сокрушительный удар, резко сократив поисковый трафик, и, похоже, ситуация не изменится.
С другой стороны, система платного сканирования могла бы помочь издателям оправиться от удара, который искусственный интеллект нанес их прибыли. Кроме того, она могла бы лучше подойти небольшим веб-издателям, у которых нет возможности заключать разовые сделки по контенту с поставщиками ИИ. Крупные сделки были заключены между такими компаниями, как OpenAI и Condé Nast, Axel Springer и другими; а также между Perplexity и Gannett; Amazon и The New York Times; и Meta и различными медиа-издателями, среди прочих.
CC привела ряд оговорок в поддержку платного сканирования, отметив, что такие системы могут концентрировать власть в интернете. Они также потенциально могут блокировать доступ к контенту для «исследователей, некоммерческих организаций, учреждений культурного наследия, преподавателей и других субъектов, работающих в общественных интересах».
В документе предложен ряд принципов ответственного платного сканирования, включая отказ от введения платы за сканирование в качестве настройки по умолчанию для всех веб-сайтов и избегание общих правил для всего интернета. Кроме того, в нем говорится, что системы платного сканирования должны допускать ограничение скорости, а не только блокировку, и должны сохранять доступ в интересах общественности. Они также должны быть открытыми, совместимыми и построенными на основе стандартизированных компонентов.
Cloudflare — не единственная компания, инвестирующая в сферу платного сканирования сайтов.
Microsoft также создает рынок ИИ для издателей, и небольшие стартапы, такие как ProRata.ai и TollBit, тоже начали это делать. Другая группа, RSL Collective, анонсировала собственную спецификацию нового стандарта под названием Really Simple Licensing (RSL), который будет определять, к каким частям веб-сайта могут получить доступ поисковые роботы, но не будет фактически блокировать их. Cloudflare, Akamai и Fastly с тех пор приняли RSL, который поддерживают Yahoo, Ziff Davis, O'Reilly Media и другие.
Компания CC также была среди тех, кто объявил о своей поддержке RSL, наряду с другими проектами, направленными на разработку технологий и инструментов для эпохи искусственного интеллекта.
Источник: techcrunch.com























