
С улицы единственным признаком того, что я нашел штаб-квартиру Physical Intelligence в Сан-Франциско, был символ пи, немного отличающийся по цвету от остальной части двери. Когда я вошел, меня сразу же встретила суета. Здесь не было стойки регистрации, не было сверкающего логотипа в свете люминесцентных ламп.
Внутри пространство представляет собой гигантскую бетонную коробку, которая становится немного менее строгой благодаря беспорядочному расположению длинных столов из светлого дерева. Некоторые из них явно предназначены для обеда: на них разбросаны коробки из-под печенья Girl Scout, банки с Веджемайтом (кто-то здесь австралиец) и маленькие проволочные корзинки, набитые лишними приправами. Остальные столы рассказывают совсем другую историю. Многие из них завалены мониторами, запасными частями для робототехники, клубками черных проводов и полностью собранными роботизированными манипуляторами, находящимися в разных состояниях, когда пытаются освоить обыденные задачи.
Во время моего визита одна рука пытается сложить черные брюки. Дела идут не очень хорошо. Другая пытается вывернуть рубашку наизнанку с такой решимостью, что в конце концов ей это удастся, но не сегодня. Третья — похоже, нашла свое призвание — быстро чистит цуккини, после чего должна переложить стружку в отдельный контейнер. По крайней мере, со стружкой все идет хорошо.
«Представьте себе что-то вроде ChatGPT, но для роботов», — говорит мне Сергей Левин, указывая на разворачивающийся в комнате моторизованный балет. Левин, доцент Калифорнийского университета в Беркли и один из соучредителей Physical Intelligence, обладает приветливым видом человека в очках, который потратил немало времени на объяснение сложных концепций тем, кто не сразу их понимает.

«Я наблюдаю, — объясняет он, — за фазой тестирования непрерывного цикла: данные собираются на роботизированных станциях здесь и в других местах — на складах, в домах, везде, где команда может обосноваться, — и эти данные используются для обучения универсальных моделей роботов. Когда исследователи обучают новую модель, она возвращается на такие станции для оценки. Устройство для складывания брюк — это чей-то эксперимент. То же самое относится и к устройству для переворачивания рубашек. Устройство для очистки цуккини может проверять, может ли модель обобщить свои знания на разные овощи, достаточно хорошо освоив основные движения очистки, чтобы справиться с яблоком или картофелем, с которыми она никогда раньше не сталкивалась».
Компания также управляет экспериментальной кухней в этом здании и в других местах, используя стандартное оборудование, чтобы познакомить роботов с различными условиями окружающей среды и задачами. Рядом находится сложная эспрессо-машина, и я предполагаю, что она предназначена для персонала, пока Левин не уточнит, что нет, она нужна роботам для обучения. Любые латте с молочной пенкой — это данные, а не привилегия для десятков инженеров, которые в основном смотрят в свои компьютеры или склоняются над своими механизированными экспериментами.
Само оборудование намеренно выглядит непривлекательно. Эти манипуляторы продаются примерно за 3500 долларов, и это с учетом, как описывает Левин, «огромной наценки» поставщика. Если бы их производили сами, стоимость материалов упала бы ниже 1000 долларов. Несколько лет назад, по его словам, робототехник был бы шокирован тем, что эти штуки вообще способны на что-либо. Но в этом-то и суть — хороший интеллект компенсирует плохой аппарат.
Когда Левин извинился и ушел, ко мне подошел Лачи Грум, двигаясь по залу с целеустремленностью человека, у которого одновременно происходит полдюжины дел. В свои 31 год Грум все еще сохраняет свежесть, присущую вундеркиндам Кремниевой долины, звание, которое он заслужил рано, продав свою первую компанию через девять месяцев после того, как основал ее в 13 лет в своей родной Австралии (это объясняет наличие Веджемайта).
Когда я впервые подошла к нему раньше, когда он приветствовал небольшую группу посетителей в толстовках, на мою просьбу уделить ему время он ответил незамедлительно: «Ни в коем случае, у меня встречи». Теперь у него есть, может быть, 10 минут.
Грум нашел то, что искал, когда начал следить за научными исследованиями, проводимыми в лабораториях Левина и Челси Финн, бывшей аспирантки Левина из Беркли, которая сейчас руководит собственной лабораторией в Стэнфорде, занимающейся робототехническим обучением. Их имена постоянно фигурировали во всех интересных событиях в области робототехники. Услышав слухи о том, что они, возможно, что-то начинают, он разыскал Кароля Хаусмана, исследователя из Google DeepMind, который также преподавал в Стэнфорде и, как узнал Грум, был вовлечен в этот проект. «Это была одна из тех встреч, после которой ты понимаешь: вот оно».
Грум никогда не планировал становиться инвестором на полную ставку, как он мне рассказал, хотя некоторые могут задаться вопросом, почему, учитывая его послужной список. После ухода из Stripe, где он был одним из первых сотрудников, он около пяти лет проработал бизнес-ангелом, делая первые ставки на такие компании, как Figma, Notion, Ramp и Lattice, пока искал подходящую компанию для создания собственного бизнеса или работы в ней. Его первая инвестиция в робототехнику, Standard Bots, состоялась в 2021 году и вернула его в область, которую он любил в детстве, когда собирал конструкторы Lego Mindstorms. Как он шутит, в роли инвестора он «был скорее в отпуске». Но инвестирование было лишь способом оставаться активным и знакомиться с людьми, а не конечной целью. «Я рассчитывал на пять лет, в течение которых компания сможет начать работу после ухода из Stripe», — говорит он. «Хорошие идеи в подходящее время с хорошей командой — это крайне редкое явление. Все дело в реализации, но даже если вы блестяще реализуете плохую идею, она все равно останется плохой».

Двухлетняя компания привлекла уже более 1 миллиарда долларов, и когда я спрашиваю о её финансовых резервах, он быстро уточняет, что на самом деле они не так уж и велики. Большая часть средств уходит на вычислительные мощности. Чуть позже он признаёт, что при правильных условиях и с правильными партнёрами он мог бы привлечь больше. «Нет предела тому, сколько денег мы можем реально вложить», — говорит он. «Всегда найдётся место для дополнительных вычислительных мощностей, которые можно использовать для решения задачи».
Что делает эту ситуацию особенно необычной, так это то, чего Грум не сообщает своим инвесторам: сроки превращения Physical Intelligence в прибыльное предприятие. «Я не даю инвесторам ответов о коммерциализации», — говорит он об инвесторах, среди которых Khosla Ventures, Sequoia Capital и Thrive Capital, которые оценили компанию в 5,6 миллиарда долларов. «Это довольно странно, что люди это терпят». Но терпят они это, и, возможно, не всегда, поэтому компании сейчас необходимо иметь достаточный капитал.
Так в чем же заключается стратегия, если не в коммерциализации? Куан Вуонг, еще один соучредитель, пришедший из Google DeepMind, объясняет, что она основана на кросс-эмбитивном обучении и разнообразных источниках данных. Если кто-то завтра создаст новую аппаратную платформу, ему не нужно будет начинать сбор данных с нуля — он сможет перенести все знания, которыми уже обладает модель. «Предельные затраты на внедрение автономности в новую робототехническую платформу, какой бы она ни была, значительно ниже», — говорит он.
Компания уже сотрудничает с небольшим количеством предприятий из разных отраслей — логистика, продуктовый магазин, производитель шоколада через дорогу — чтобы проверить, достаточно ли хороши их системы для реальной автоматизации. Вуонг утверждает, что в некоторых случаях они уже готовы. Благодаря их подходу «любая платформа, любая задача», область для успеха достаточно велика, чтобы начать отмечать задачи, готовые к автоматизации, уже сегодня.
Компания Physical Intelligence не одинока в стремлении к этой цели. Гонка за созданием универсального роботизированного интеллекта — основы, на которой можно строить более специализированные приложения, подобно моделям LLM, которые три года назад покорили мир, — набирает обороты. Компания Skild AI из Питтсбурга, основанная в 2023 году, в этом месяце привлекла 1,4 миллиарда долларов инвестиций при оценке в 14 миллиардов долларов и использует совершенно иной подход. В то время как Physical Intelligence по-прежнему сосредоточена на фундаментальных исследованиях, Skild AI уже коммерчески внедрила свой «многофункциональный» Skild Brain, заявив, что за несколько месяцев прошлого года он принес 30 миллионов долларов дохода в таких областях, как безопасность, складское хозяйство и производство.

Компания Skild даже публично критиковала конкурентов, утверждая в своем блоге, что большинство «базовых моделей робототехники» — это всего лишь модели обработки изображений и языка, «замаскированные под обычные», которым не хватает «истинного физического здравого смысла», поскольку они слишком сильно полагаются на предварительное обучение в масштабах интернета, а не на моделирование на основе физических принципов и реальные данные робототехники.
Это довольно резкое философское противостояние. Компания Skild AI делает ставку на то, что коммерческое внедрение создаст своего рода «маховик» данных, который будет улучшать модель с каждым реальным примером использования. Компания Physical Intelligence делает ставку на то, что сопротивление соблазну коммерциализации в ближайшем будущем позволит ей создать превосходный общий интеллект. На то, кто «правее», уйдут годы, чтобы разрешить этот вопрос.
Тем временем, по словам Грума, компания Physical Intelligence работает с необычайной ясностью. «Это компания, полностью ориентированная на результат. У исследователя возникает потребность, мы собираем данные для ее удовлетворения — или новое оборудование, или что-то еще — и затем выполняем задачу. Это не зависит от внешних факторов». У компании был план на 5-10 лет, определяющий, что, по мнению команды, будет возможно. К 18-му месяцу они его полностью выполнили, говорит он.
В компании работает около 80 сотрудников, и она планирует расти, хотя, по словам Грума, надеется, что будет расти «как можно медленнее». Самым сложным, по его словам, является оборудование. «С оборудованием очень сложно. Все, что мы делаем, намного сложнее, чем в компании, занимающейся программным обеспечением». Оборудование ломается. Оно доставляется медленно, что задерживает тестирование. Вопросы безопасности усложняют все.
Пока Грум вскакивает, чтобы поспешить на следующее мероприятие, я остаюсь наблюдать за тем, как роботы продолжают свою тренировку. Брюки все еще не совсем сложены. Рубашка упорно остается наизнанку. Опилки от цуккини аккуратно накапливаются.
Возникают очевидные вопросы, в том числе и мои собственные: действительно ли кому-то нужен робот на кухне, чистящий овощи, вопросы безопасности, опасения собак по поводу механических вторжений в дома, а также вопрос о том, решают ли вложенные время и деньги достаточно серьезные проблемы или же создают новые. Между тем, посторонние ставят под сомнение прогресс компании, достижимость ее видения и целесообразность ставки на общий интеллект, а не на конкретные приложения.
Если у Грума и есть какие-либо сомнения, он их не показывает. Он работает с людьми, которые десятилетиями занимаются этой проблемой и которые считают, что наконец-то настал подходящий момент, а это всё, что ему нужно знать.
Кроме того, Кремниевая долина с самого начала поддерживала таких людей, как Грум, и давала им много свободы действий, зная, что даже без четкого пути к коммерциализации, даже без сроков, даже без уверенности в том, как будет выглядеть рынок, когда они туда попадут, есть большая вероятность, что они справятся. Не всегда это получается. Но когда получается, это, как правило, оправдывает многие неудачи.
Источник: techcrunch.com























