Архив рубрики ~Лента новостей~

Чаты в Slack, аудиозаписи прогулок и видеопоходы на помойку: какие данные можно продать для обучения ИИ и сколько за это платят

Чаты в Slack, аудиозаписи прогулок и видеопоходы на помойку: какие данные можно продать для обучения ИИ и сколько за это платят
Чаты в Slack, аудиозаписи прогулок и видеопоходы на помойку: какие данные можно продать для обучения ИИ и сколько за это платят

И платят ли вообще.

Источник: Kled AI

Ещё в декабре 2024 года соучредитель OpenAI Илья Суцкевер сказал, что ИИ-разработчики практически исчерпали открытые данные для обучения. Часть из них стали чаще использовать синтетические, но у этого подхода есть риски: если тексты в датасете неполные, неточные и однообразные, соответствующими будут и генерации.

Так как потребность в реальных данных не исчезла, сформировался посреднический рынок, на котором пользователям продают идею о лёгком заработке, а ИИ-компаниям — их данные.

Источник: The Guardian

Архив как актив

Нейросетям, чтобы научиться выполнять рабочие задачи, нужны не только готовые документы-референсы, но ещё и примеры того, как люди выстраивают процессы: обсуждают проекты, принимают решения, согласовывают договоры, исправляют ошибки.

На дефиците этих данных пытаются заработать сервисы, помогающие ликвидировать бизнес, — в частности, американская SimpleClosure. В основном она занимается оформлением документов, расчётами с сотрудниками и инвесторами, налогами, но с 2026 года вдобавок к этому выкупает и перепродаёт корпоративные архивы с рабочими переписками в мессенджерах вроде Slack, задачами в Jira, письмами, файлами и комментариями в Google Drive.

Стоимость одного датасета зависит от объёма данных, «возраста» компании и отрасли, но обычно составляет от $10 тысяч до $100 тысяч. Разработчик сервисов для создания расшифровок и субтитров Cielo24, например, получил за 13-летний архив «сотни тысяч долларов» и смог спокойно закрыть дела, рассказывала Forbes его бывшая глава Шанна Джонсон.

Приятно думать, что наши данные могут жить дальше и приносить пользу другим людям.

Шанна Джонсон, бывшая глава Cielo24

Интерес к подобным архивам столь высокий, что глава SimpleClosure Дори Йона сравнил происходящее с «золотой лихорадкой». За 2025 год компания провела около 100 сделок и, по собственным словам, обеспечила основателям закрывающихся проектов более $1 млн.

Сооснователи SimpleClosure Нимрод Рам и Дори Йона. Источник: SimpleClosureСооснователи SimpleClosure Нимрод Рам и Дори Йона. Источник: SimpleClosure

Похожую модель развивает ещё один «ликвидатор» бизнеса — Sunset. Его гендиректор Брендан Махони подтверждал, что особенно ценятся архивы, в которых можно проследить связи между различными данными и использованными инструментами.

Например, задача в Jira, связанная с конкретным фрагментом кода, полезнее для обучения ИИ, чем отдельные документы, поскольку позволяет восстановить путь от постановки задачи до результата.

Сооснователи Sunset Грант Рейнгольд и Брендан Махони. Источник: SunsetСооснователи Sunset Грант Рейнгольд и Брендан Махони. Источник: Sunset

Маркетплейсы данных

Некоторые стартапы предлагают монетизировать повседневный быт и биометрию и среди прочего выкупают у пользователей фото, видео и аудио, чтобы потом перепродать их разработчикам ИИ-моделей.

Среди таких компаний — Kled AI. Приложение работает по всему миру, но особенно популярно на Филиппинах и в Индонезии, рассказывал основатель Ави Патель. По его словам, сервисом пользуются около 200 тысяч человек, а количество загружаемых в день файлов доходит до 5 млн.

Для пользователей есть условие — нужен iPhone «поновее» для более качественных фотографий и видео. Задания бывают специфические: например, записать, как выбрасываешь мусор, заснять доставленный к двери заказ, сделать фотографию одного и того же места с объектом в кадре и без него.

Сам Патель говорит, что в среднем «регулярный поставщик» данных получает от $20 до $40 в месяц (около 1500-3100 рублей по курсу ЦБ на 1 июля 2026 года).

Житель Кейптауна Якобус Лоу делился с The Guardian, что получил $14 за короткие ролики, снятые на прогулке по городу, чтобы потом нейросети дообучили городской навигации. Это примерно в десять раз больше минимальной часовой ставки в Южной Африке. За несколько недель на съёмке своих будних дней он заработал примерно $50.

Один из самых «высокооплачиваемых» пользователей Kled AI — дальнобойщик из США. Он установил камеры на автомобиль и снимает дороги и стройки и, по словам стартапа, «делает» около $7400 в месяц.

Но в App Store встречаются жалобы — например, на задержку вывода и низкие ставки. Один из пользователей написал, что сервис выкупил у него «несколько сотен» фотографий, а заплатил за них в сумме около $1.

Пользователь Kled AI не смог вывести $25 Пользователь пожаловался, что загрузил целых 300 фотографий в Kled AI, а заработал всего $1 

Пока данные продают прежде всего разработчикам ИИ и роботов, но Патель рассчитывает расширять круг покупателей и сотрудничать в том числе с «хедж-фондами, потребительскими брендами, а также госструктурами, которые уже тратят триллионы долларов на данные».

В марте 2026 года Kled AI привлекла $6,5 млн при оценке в $150 млн. Среди инвесторов — сооснователь Waymo Себастьян Трун и фонд Aglaé Ventures семьи французского миллиардера Бернара Арно. По последним данным, общий объём инвестиций в проект вырос до $14 млн.

Ави Патель, основатель Kled AI.  Источник: Business insiderАви Патель, основатель Kled AI.  Источник: Business insider

Похожую модель использует стартап Luel AI, основанный в конце 2025 года, но вместо повседневных фотографий и видео преимущественно собирает данные о взаимодействии людей, чтобы обучать ИИ-модели, на базе которых работают голосовые помощники и видеогенераторы.

Пользователи участвуют в видеозвонках и интервью, а система фиксирует речь, мимику, жесты и поведение. Они также могут записывать ролики от первого лица, выполнять бытовые задачи перед камерой, предоставлять записи экрана при работе за компьютером, фотографии объектов и документов.

За аудиозапись диалога с разговорным японским, например, обещают $0,2 за минуту или $12 за час. За англоязычную видеоконференцию на группу из четырёх-восьми человек— $0,25 за минуту или $15 за час. Вознаграждение также можно получить за приглашение других участников.

Тарифы для пользователей Luel AI. Источник: Luel AIТарифы для пользователей Luel AI. Источник: Luel AI

В мае 2026 года Luel AI привлекла $31,2 млн в посевном раунде. Его возглавили фонды General Catalyst и Lightspeed Venture Partners. В числе других инвесторов — сооснователь Y Combinator Пол Грэм, фонды SV Angel, Orange Collective и Human Capital.

После того как стартап объявил о привлечении инвестиций, глава Kled AI Патель обвинил конкурента в копировании сайта вплоть до выбора цветов и списка датасетов, а позже — ещё и в искажении комплаенс-практик и пользовательских метрик. Его, в частности, возмутило то, что General Catalyst вложился в «плагиатчика» уже после общения с Kled AI, в который решил не вкладываться.

Ролик Пателя набрал свыше 9,2 млн просмотров. Источник: X

На Luel AI, впрочем, рынок не заканчивается. Есть также сервисы, которые специализируются на определённом типе данных, — вроде Silencio. Для него пользователи записывают аудио: свои разговоры, окружающие звуки. Материалы используют для обучения голосовых агентов, нейросетей для перевода, ИИ-моделей, которые работают с редкими языками.

The Guardian приводило в пример студента из Индии, который зарабатывает на платформе более $100 в месяц и говорит, что этих денег хватает на питание.

Пример на лендинге проекта: за 12 минут аудио на языке йоруба якобы можно получить $4,5. Источник: SilencioПользователь должен дать выраженное согласие на использование своих данных. Источник: Silencio

Neon платит пользователям за записи телефонных разговоров по ставке около 50 центов за минуту. После утечек данных, вплоть до телефонных номеров, компания закрылась, но вскоре объявила о перезапуске. Теперь пользователи сами устанавливают стоимость, правда, сервис не гарантирует, что каждый разговор будет оплачен.

В отзывах в App Store некоторые пишут, что Neon находит предлоги, чтобы не выплачивать деньги за записанные звонки, ссылаясь на излишние помехи, несоблюдение продолжительности, или «на лету» меняет правила в одностороннем порядке.

Чаты в Slack, аудиозаписи прогулок и видеопоходы на помойку: какие данные можно продать для обучения ИИ и сколько за это платят

Экспертиза на аутсорсе

С сегментом пользовательских данных соседствует сегмент человеческой экспертизы, в котором компании покупают, скорее, суждение: способность специалистов из разных отраслей выверять информацию, анализировать логику, отличать точный ответ от ошибочного.

Бизнес на этом строит, например, Mercor. Компания начинала в 2023 году как сервис для найма. С помощью ИИ она анализировала резюме и подбирала кандидатов работодателям. Потом начала собирать базу специалистов, которые помогают обучать языковые модели.

Mercor сотрудничает с OpenAI, Anthropic и другими разработчиками, а число подрядчиков, по её собственным данным, достигло 30 тысяч. Они оценивают и правят ответы чат-ботов, размечают данные и помогают моделям лучше справляться с узкоспециализированными задачами.

Список востребованных специалистов меняется по мере усложнения нейросетей. Сначала привлекали в основном программистов и математиков, а теперь — врачей, юристов, журналистов, банкиров, учёных.

В частности, врачам предлагают около $170 в час при занятости не менее 20 часов в неделю и контракте на шесть недель. Специалисту по американской политике обещали $70 в час за поиск консервативной риторики в ответах ИИ.

Средняя часовая ставка на платформе, по словам WSJ, составляет около $85 в час. Mercor зарабатывает на комиссиях: клиент платит $100 за час работы подрядчика, а Mercor удерживает около 30-35% от суммы.

Основатели Mercor Адарш Хирематх, Брендан Фуди и Сурия Мидха. Осенью 2025 года компания <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ftechcrunch.com%2F2025%2F10%2F27%2Fmercor-quintuples-valuation-to-10b-with-350m-series-c%2F&postId=3004349" rel="nofollow noreferrer noopener" target="_blank">привлекла</a> $350 млн при оценке в $10 млрд. Источник: Forbes Основатели Mercor Адарш Хирематх, Брендан Фуди и Сурия Мидха. Осенью 2025 года компания привлекла $350 млн при оценке в $10 млрд. Источник: Forbes 

Данные, на которые нет прав

В апреле 2026 года WSJ рассказало, что представители Mercor начали обращаться в LinkedIn к киноспециалистам с предложением выкупить материалы завершённых проектов для обучения нейросетей.

Например, у художников по визуальным эффектам просили сцены с данными движения камеры, картами глубины, трекингом объектов и 3D-моделями, помимо прочего. Несколько специалистов отказались. Художник Энтони Барсело, работавший над фильмом «Мстители: Эра Альтрона», объяснил изданию, что контракты запрещают передавать такой контент третьим лицам.

О похожем предложении рассказал художник по свету Кристофер Логан, работавший над проектами Disney и Sony. Он сообщил представителю Mercor, что не владеет ни правами на запрашиваемые материалы, ни доступом к ним, после чего предупредил бывших работодателей о полученном запросе.

В Mercor заявили WSJ, что не покупают чужую интеллектуальную собственность и лицензируют только то, чем человек владеет сам. По этой причине при регистрации пользователь должен подтвердить наличие прав на контент.

Один из опрошенных изданием юристов считает, что такой подход всё равно не исключает риски: если подрядчик по незнанию передаст то, что на бумаге принадлежит работодателю, с судебными исками может столкнуться и он сам, и Mercor.

Без обратного пути

Продать данные легко, а вот вернуть контроль над ними практически невозможно. Отсюда вопросы: как проверить, кому они принадлежат, точно ли пользователь понимает, куда пойдут его данные, и что будет, если они «утекут».

Корпоративные материалы — документы и рабочие файлы — обычно принадлежат работодателю, но в продаваемые архивы попадают и переписки, письма, комментарии. Сотрудники, скорее всего, даже не подозревают, что их сообщения окажутся в датасетах. А гарантий, что данные обезличены, может не быть. Основатель Центра ИИ и цифровой политики Марк Ротенберг, например, считает, что полностью обезличить сообщения в мессенджерах невозможно.

Маркетплейсы данных, как правило, получают широкие лицензии на использование, так что после загрузки файлов пользователь вряд ли сможет повлиять на то, как стартапы будут распоряжаться его образом и голосом.

Патель из Kled AI проблемы не видит: компании и без того собирают массивы данных, а здесь у пользователя появляется возможность хотя бы заработать на этом. Вот только на стабильный заработок это не похоже: обычные пользователи получают пару десятков долларов лишь при регулярных загрузках — и то, судя по отзывам, не всегда.

#редакция

Источник: vc.ru

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Коротко из Telegram~ 🔥 API для генерации речи раздают бесплатно — Fish Audio… Архив рубрики ~Коротко из Telegram~ ✨ В 2015 году OpenAI была всего лишь небольшим проектом,… Архив рубрики ~Коротко из Telegram~ 📁 Пока все обсуждают, насколько хорошо ИИ пишет код, разработчики… Архив рубрики ~Коротко из Telegram~ ‼️ Пока большинство моделей просто генерируют текст, Alibaba делает ставку… Архив рубрики ~Коротко из Telegram~ Автоконцерн Nissan сообщил об утечке данных нынешних и бывших сотрудников… Архив рубрики ~Коротко из Telegram~ ФАС потребовала от Apple устранить дискриминацию российских сервисов и исполнить… Архив рубрики ~Коротко из Telegram~ В I квартале 2026 года объем российского рекламного рынка превысил… Архив рубрики ~Обо всем~ Глава НАСА высоко оценил прогресс, достигнутый компанией Blue Origin после неудачного запуска. Архив рубрики ~Обо всем~ Ассоциативное упражнение К.Юнга — мощный инструмент самоанализа и поиска ответов на важнейшие вопросы Архив рубрики ~Обо всем~ Телефон политика, расследовавшего злоупотребления шпионским ПО, был взломан с помощью шпионской программы Pegasus. Архив рубрики ~Обо всем~ [Перевод] Экспериментальный самолёт DARPA, управляющийся импульсами сжатого воздуха, наконец получил крылья Архив рубрики ~Коротко из Telegram~ CodebayAI — платформа с курсами и ИИ-репетитором. Codebay предназначен для… Архив рубрики ~Коротко из Telegram~ Samsung официально раскрыла дату презентации своего шлема дополненной реальности Дата… Архив рубрики ~Коротко из Telegram~ 🤑 ИИ-агенты обанкротят компанию, если сделать их руководителями — показало… Архив рубрики ~Коротко из Telegram~ 🔥 API для генерации речи раздают бесплатно — Fish Audio… Архив рубрики ~Коротко из Telegram~ ✨ В 2015 году OpenAI была всего лишь небольшим проектом,… Архив рубрики ~Коротко из Telegram~ 📁 Пока все обсуждают, насколько хорошо ИИ пишет код, разработчики… Архив рубрики ~Коротко из Telegram~ ‼️ Пока большинство моделей просто генерируют текст, Alibaba делает ставку… Архив рубрики ~Коротко из Telegram~ Автоконцерн Nissan сообщил об утечке данных нынешних и бывших сотрудников… Архив рубрики ~Коротко из Telegram~ ФАС потребовала от Apple устранить дискриминацию российских сервисов и исполнить… Архив рубрики ~Коротко из Telegram~ В I квартале 2026 года объем российского рекламного рынка превысил… Архив рубрики ~Обо всем~ Глава НАСА высоко оценил прогресс, достигнутый компанией Blue Origin после неудачного запуска. Архив рубрики ~Обо всем~ Ассоциативное упражнение К.Юнга — мощный инструмент самоанализа и поиска ответов на важнейшие вопросы Архив рубрики ~Обо всем~ Телефон политика, расследовавшего злоупотребления шпионским ПО, был взломан с помощью шпионской программы Pegasus. Архив рубрики ~Обо всем~ [Перевод] Экспериментальный самолёт DARPA, управляющийся импульсами сжатого воздуха, наконец получил крылья Архив рубрики ~Коротко из Telegram~ CodebayAI — платформа с курсами и ИИ-репетитором. Codebay предназначен для… Архив рубрики ~Коротко из Telegram~ Samsung официально раскрыла дату презентации своего шлема дополненной реальности Дата… Архив рубрики ~Коротко из Telegram~ 🤑 ИИ-агенты обанкротят компанию, если сделать их руководителями — показало…

Оставить комментарий