Сбор данных для обучения роботов — грязная и не самая привлекательная работа. Некоторые лаборатории искусственного интеллекта уже платят XDOF за эту услугу.
Две недели назад OpenAI заявила о возобновлении программы робототехники, закрытой в 2021 году — это последний сигнал о том, что крупнейшие лаборатории ИИ соревнуются в обучении машин работе в физическом мире. Но для создания способных роботов требуется то, чего у индустрии ИИ пока нет, а именно обучающие данные, соответствующие тем, которые используются для языковых моделей.
Этот пробел создает новый тип инфраструктурного бизнеса. В отличие от роботов-моделей, обученных на огромном массиве общедоступного текста, роботам нужны данные, фиксирующие физическое взаимодействие, а таких данных практически нет. Видео на YouTube и записи, сделанные внештатными работниками, имеют низкое качество и их трудно сопоставить с реальным физическим миром.
Компания XDOF (произносится как «экс-дофф»), вышедшая сегодня из режима скрытой разработки, делает ставку на то, что следующим серьезным узким местом в развитии ИИ станут не модели или чипы, а цикл обратной связи, необходимый для обучения роботов взаимодействию с физическим миром.
Стартап стремится создавать конвейеры обработки данных, инструменты сбора данных и системы аннотирования, которые передовые лаборатории и робототехнические компании не могут легко разработать самостоятельно, и для этого привлек 70 миллионов долларов от Thrive Capital, Spark Capital, a16z, Lux и WndrCo. Соучредитель и генеральный директор Филипп Ву говорит, что XDOF, в которой работает около 60 сотрудников, уже сотрудничает с 20 клиентами, включая несколько передовых лабораторий искусственного интеллекта, но не может назвать их имена.
«Все ведущие лаборатории стремятся развивать робототехнику», — сказал Ву. «Мы уже видели некоторые негативные последствия отставания в гонке языковых моделей… не хочется оказаться в ситуации, когда вы слишком поздно внедряете эту технологию, и все оказываются в ситуации, когда следующим рубежом становится физический искусственный интеллект».
Ву сам столкнулся с этой проблемой, будучи аспирантом в Калифорнийском университете в Беркли. Он сосредоточился на том, чтобы научить роботов осваивать навыки на основе больших массивов данных. Была только одна проблема.
«У нас не было больших объемов данных для работы», — сказал он TechCrunch. «Возникла проблема курицы и яйца — сначала нам нужно было собрать данные, прежде чем мы могли даже задаться вопросом, как обучить базовую модель для робототехники».
Ву и его будущий соучредитель и технический директор XDOF, Фред Шенту, работали над проектом GELLO — недорогой системой телеуправления, позволяющей оператору управлять роботизированной рукой для генерации обучающих данных. «В итоге эта статья оказала большое влияние на робототехнику, потому что у многих людей были схожие потребности и проблемы, и многие начали использовать подобные устройства для сбора данных», — сказал Ву.
Увидев эту возможность, Ву, Шенту и третий соучредитель и главный операционный директор Немо Джин запустили XDOF в октябре 2024 года, чтобы предоставить экосистему данных для компаний, занимающихся разработкой моделей робототехники. Понимая, что предоставление одних только данных может оказаться тупиковым бизнесом, компания также сосредоточена на очистке данных, инструментах и аннотировании — создавая самоподдерживающийся цикл обратной связи для тренеров роботов.
В качестве отправной точки компания сотрудничает с лабораторией исследований искусственного интеллекта Калифорнийского университета в Беркли, чтобы выпустить, как она считает, крупнейшую в истории коллекцию высококачественных данных для обучения роботов, получившую название ABC. Она включает 130 000 траекторий манипуляций роботов, 300 часов моделирования и 100 часов оценок. Такие масштабированные данные для предварительного обучения никогда ранее не были доступны академическому сообществу.
«В области лингвистики, генерации изображений и других сферах мы видим, что когда модели и данные публикуются, сообщество достигает результатов, которых вы бы не обязательно ожидали», — сказал TechCrunch Дэвид МакАллистер, аспирант Беркли, который помог организовать публикацию.
Команда уже использовала эти данные для обучения роботов выполнению эталонных задач, таких как складывание футболок и выравнивание коробок, или загрузка AirPods в чехлы.
Неограниченное количество степеней свободы
Компания планирует работать на трех уровнях пирамиды данных. Наиболее ценный уровень — это данные дистанционного управления, собираемые непосредственно на используемом роботе; далее следуют данные, собираемые дистанционно управляемыми роботами, как в случае с GELLO; и, наконец, «эгоцентрические» данные, собираемые людьми при выполнении повседневных задач, для которых XDOF планирует разработать собственные носимые датчики.
«Выбор камеры повлияет на качество данных, а это, в свою очередь, повлияет на работу алгоритма отслеживания движений рук», — сказал Ву. «Если вы изначально не спроектируете оборудование должным образом, собранные данные могут содержать очень специфические проблемы, которые вы не предвидели».
Компания планирует нанимать и обучать целые армии телеоператоров и эгоцентричных операторов данных по всему миру — трудоемкая модель, которая поднимает очевидный вопрос: почему крупные лаборатории не занимаются этой работой по обработке данных самостоятельно?
«Вам нужен склад площадью в сотни тысяч квадратных футов с сотнями роботов, — сказал Ву. — Вам необходимо обслуживать этих роботов, калибровать их физические параметры и должным образом обучать операторов».
Для создания такой инфраструктуры требуются сосредоточенность, капитал и масштабируемость, которые большинство лабораторий искусственного интеллекта предпочли бы передать на аутсорсинг — именно на этот рынок и делает ставку XDOF.
Название XDOF — это игра слов, основанная на термине из области робототехники «степени свободы», который описывает количество независимых движений, которые может выполнять робот. Ваша рука, от плеча до запястья, имеет семь степеней свободы. Новейший робот компании Figure AI, занимающейся разработкой человекоподобных роботов, имеет 30 степеней свободы. Буква X в названии компании отражает её амбиции: «Произвольные степени свободы, неограниченные степени свободы», — говорит Ву.
Источник: techcrunch.com
Оцените материал:
Похожие записи
Ещё не хирург, но неплохой уборщик: Tesla Optimus уже умеет вытирать со стола и складывать бельё
04.11.2025
Sony запатентовала кнопки, способные становиться мягче или твёрже
18.06.2026
Unitree Robotics представила GD01 – робота которым можно управлять с помощью пилота, сидящего внутри машины.
12.06.2026Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
