
По мере развития компаний, занимающихся ИИ, борьба за высококачественные данные стала одной из самых конкурентных областей в отрасли, что привело к появлению таких компаний, как Mercor, Surge и, что наиболее заметно, Scale AI Александра Вана. Но теперь, когда Ванг перешёл к руководству ИИ в Meta, многие инвесторы видят в этом возможность и готовы финансировать компании, предлагающие новые эффективные стратегии сбора данных для обучения.
Datacurve, выпускник Y Combinator, — одна из таких компаний, специализирующаяся на высококачественных данных для разработки программного обеспечения. В четверг компания объявила о раунде серии A на сумму 15 миллионов долларов, который возглавил Марк Голдберг из Chemistry при участии сотрудников DeepMind, Vercel, Anthropic и OpenAI. Серия A стартовала после посевного раунда на сумму 2,7 миллиона долларов, в который вложился бывший технический директор Coinbase Баладжи Шринивасан.
Datacurve использует систему «охотников за головами» для привлечения квалифицированных инженеров-программистов к работе над самыми труднодоступными наборами данных. Компания оплачивает эти работы, распределив на данный момент более 1 миллиона долларов в виде вознаграждений.
Но соучредитель Серена Джи (на фото выше с соучредителем Чарли Ли) утверждает, что главная мотивация не финансовая. В сфере высокодоходных услуг, таких как разработка программного обеспечения, оплата за работу с данными всегда будет значительно ниже, чем за обычную работу, поэтому главное преимущество компании — это позитивный пользовательский опыт.
«Мы относимся к этому как к потребительскому продукту, а не как к операции по маркировке данных», — сказал Ге. «Мы много времени уделяем размышлениям: как оптимизировать его, чтобы заинтересовать нужных нам людей и привлечь их на нашу платформу?»
Это особенно важно, поскольку требования к данным после обучения становятся всё более сложными. Если раньше модели обучались на простых наборах данных, то современные продукты ИИ полагаются на сложные среды обучения с подкреплением (RL), которые необходимо создавать на основе сбора конкретных и стратегических данных. По мере усложнения сред требования к данным становятся всё более строгими как в плане количества, так и качества — фактор, который может дать преимущество компаниям, занимающимся сбором высококачественных данных, таким как Datacurve.
Datacurve — молодая компания, сосредоточенная на разработке программного обеспечения, но, по словам Джи, эту модель можно с тем же успехом применять в таких областях, как финансы, маркетинг и даже медицина.
«Сейчас мы создаем инфраструктуру для сбора данных после обучения, которая привлекает и удерживает высококомпетентных людей в их собственных областях», — говорит Ге.
Источник: techcrunch.com



























