Роботы общего назначения остаются редкостью не из-за недостатка аппаратного обеспечения, а потому, что мы все еще не можем наделить машины физической интуицией, которой люди обладают на собственном опыте.

В Westworld,человекоподобные роботы разливают напитки и ездят верхом на лошадях. В «Звездных войнах» «дроиды» так же обычны, как бытовая техника. Это то будущее, которого я продолжаю ожидать, когда смотрю новый любимый жанр Интернета: танцы роботов, кикбоксинг или паркур. Но потом я поднимаю взгляд от своего телефона и вижу, что на тротуаре нет андроидов.
Под роботами я не имею в виду миллионы, которые уже используются на заводах, или десятки тысяч людей. из миллионов, которые потребители ежегодно покупают, чтобы пропылесосить ковры и подстричь газоны. Я имею в виду роботов-гуманоидов, таких как C-3PO, Дейта и Долорес Абернати: гуманоидов общего назначения.
Исследователи робототехники десятилетиями пытались решить проблему, из-за которой они не могут появляться на улицах. Создавать роботов проще, чем заставлять их функционировать в реальном мире. Робот может повторить упражнение TikTok на ровной поверхности, но в мире есть неровные тротуары, скользкие лестницы и люди, которые спешат мимо. Чтобы понять, в чем сложность, представьте, что вы идете в темноте по захламленной спальне, неся тарелку супа; каждое движение требует постоянной переоценки и повторной калибровки.
О поддержке научной журналистики
Если вам понравилась эта статья, подумайте о том, чтобы поддержать нашу журналистику, отмеченную наградами, подписавшись на нее. Приобретая подписку, вы помогаете обеспечить будущее впечатляющих историй об открытиях и идеях, формирующих наш современный мир.
Языковые модели искусственного интеллекта, подобные тем, что используются в ChatGPT, не предлагают простого решения. Они не содержат воплощенных знаний. Они похожи на людей, которые прочитали все книги о парусном спорте, но всегда оставались на суше: они могут описать ветер и волны и процитировать известных моряков, но у них нет физического представления о том, как управлять лодкой или управлять парусом.
«Некоторые люди думают, что мы можем получить данные из видео с людьми — например, с YouTube — но, глядя на фотографии, на которых люди что-то делают, вы не сможете увидеть реальные движения в деталях то, что делают люди, и переход от 2D к 3D, как правило, очень сложен», — сказал робототехник Кен Голдберг в августовском интервью новостному сайту Калифорнийского университета в Беркли.
Чтобы объяснить этот пробел, главный специалист по искусственному интеллекту компании Meta Ян Лекун отметил, что к четырем годам ребенок воспринимает гораздо больше визуальной информации только глазами, чем объем информации, получаемой от других людей. данные, на которых обучаются крупнейшие large language models (LLM). «За 4 года ребенок видит в 50 раз больше данных, чем самые крупные LLM», — написал он в LinkedIn и X в прошлом году. Дети учатся на основе океана воплощенного опыта, а огромные массивы данных, используемые для обучения систем искусственного интеллекта, по сравнению с ними кажутся просто лужицами. К тому же, это неправильный подход: обучение ИИ на миллионах стихов и блогов не улучшит его способность заправлять вашу постель.
Робототехники в первую очередь сосредоточились на двух подходы к устранению этого пробела. Первый — демонстрация. Люди управляют роботизированными манипуляторами дистанционно, часто через виртуальную реальность, поэтому системы могут записывать, как выглядит «хорошее поведение». Это позволило ряду компаний приступить к созданию наборов данных для обучения будущих ИИ.
Вторым подходом является моделирование. В виртуальной среде системы искусственного интеллекта могут отрабатывать задачи в тысячи раз быстрее, чем люди в реальном мире. Но симуляция приводит к разрыву в реальности. Простая задача в симуляторе может оказаться невыполнимой в реальности, потому что реальный мир содержит бесчисленное множество мельчайших деталей — трение, мягкие материалы, особенности освещения.
Этот разрыв в реальности объясняет, почему звезда паркура-робота может&не мойте свою посуду. После первых Всемирных игр человекоподобных роботов, которые прошли в этом году в Пекине, где роботы соревновались в футболе и боксе, робототехник Бенджи Холсон написал о своем разочаровании. По его словам, на самом деле люди хотят робота, который мог бы выполнять домашнюю работу. Он предложил провести новую гуманоидную Олимпиаду, в ходе которой роботам предстояло решить такие задачи, как вывернуть футболку наизнанку, воспользоваться пакетом для собачьих какашек и самостоятельно счистить арахисовое масло с рук.
Сложность этих задач легко недооценить. Представьте себе что-то столь же обыденное, как поиск футболки в спортивной сумке, набитой одеждой. Каждая часть вашей руки и запястья распознает текстуру, форму и сопротивление. Вы можете распознавать предметы на ощупь и с помощью проприоцепции, не снимая и не осматривая их.
Полезная параллель — это тип робота, которому мы обучаем уже много лет, обычно не называя его роботом: самоуправляемый автомобиль. Например, Tesla собирает данные со своих автомобилей, чтобы обучить следующее поколение своего автономного искусственного интеллекта. Во всей отрасли компаниям приходится собирать огромные объемы данных о вождении, чтобы достичь современного уровня автоматизации. Но гуманоидам приходится выполнять более сложную работу, чем автомобилям. Дома, открытые пространства и строительные площадки гораздо более изменчивы, чем шоссе.
Вот почему инженеры разрабатывают множество современных роботов для работы в четко определенных пространствах — на заводах, складах, в больницах и на тротуарах — и поручают им одну работу, которую они должны выполнять очень хорошо. Гуманоид Digit от Agility Robotics переносит складские сумки. Роботы Figure AI работают на сборочных линиях. Walker S2 от UBTECH может поднимать и переносить грузы на производственных линиях и автономно заменять аккумулятор. Человекоподобные роботы Unitree Robotics могут ходить и приседать, поднимать и перемещать предметы, но они по-прежнему в основном используются для исследований или демонстраций. Хотя эти роботы полезны, они все еще далеки от того, чтобы быть универсальными помощниками в домашнем хозяйстве.
Среди тех, кто работает над робототехникой, существуют серьезные разногласия по поводу того, как быстро этот разрыв будет сокращен. В марте 2025 года генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) заявил журналистам: «Это проблема, которая может возникнуть не через пять лет, а через несколько». В сентябре 2025 года робототехник Родни Брукс (Rodney Brooks) написал: «Мы находимся более чем в десяти годах от первого прибыльного внедрения роботы-гуманоиды даже с минимальной ловкостью». Он также предупредил об опасностях, которые представляют роботы из-за отсутствия координации и риска падения. «Мой совет людям — не подходить ближе, чем на 3 метра к полноразмерному шагающему роботу», — написал Брукс.
На данный момент Мейн-стрит не выглядит как научно-фантастическая декорация из-за того, что большинство гуманоидов все еще находятся в детских садах, которые мы для них построили: учатся с помощью телеоператоров или в тренажерах. Чего мы не знаем, так это как долго продлится их обучение. Когда роботы-гуманоиды станут обычным явлением, они будут более динамичными, чем современные системы, но гораздо менее броскими, чем ролики, которые становятся вирусными на TikTok. Будущее по-прежнему за машинами, выполняющими работу, для которой они были подготовлены, день за днем, без драматизма.

























