Гуманоидный робот в движении, демонстрирует баланс и инновационные технологии.

Андроид смог последовательно станцевать и подраться. Раньше сложные трюки не удавалось объединить в одной модели без потери точности

d08937c2906aebb37a8bbc3d81ca7150

Раньше сложные трюки не удавалось объединить в одной модели без потери точности

Китайские инженеры разработали фреймворк OmniXtreme, позволяющий обучить единую нейросетевую политику управления человекоподобным роботом сразу множеству экстремальных движений — от сальто и стоек на руках до брейк-данса и элементов боевых искусств. OmniXtreme решает проблему объединения разнообразных навыков в одной модели без падения качества выполнения. Препринт статьи опубликован на сайте arXiv.org, у проекта есть сайт с демонстрационными видео на GitHub.

Сбер запутанная история

Обучение андроидов точному воспроизведению движений лежит в основе множества практических навыков, среди которых и манипуляции предметами, и взаимодействие с людьми. Методы обучения с подкреплением позволили роботам научиться точно повторять отдельные сложные движения, включая танцы и акробатику. Однако при попытке масштабировать подход и научить одного робота сразу большому набору разнообразных движений возникает проблема — качество повторения движений деградирует по мере роста их разнообразия и сложности. Контроллер начинает усреднять поведение, теряя точность. Закономерность, известная как компромисс между точностью и масштабируемостью, особенно заметна в случае движений с высокой динамикой, когда даже небольшие ошибки приводят к падению робота.

Разработчики под руководством Сыюаня Хуана (Siyuan Huang) из Пекинского института искусственного интеллекта BIGAI и компании Unitree Robotics, стремясь решить эту проблему, создали фреймворк OmniXtreme с двухэтапной схемой обучения. На первом этапе для каждого движения из обширной библиотеки записанных с помощью технологии захвата движений примеров тренируются отдельные экспертные политики. Затем знания всех экспертов объединяются в единую генеративную модель с помощью метода flow matching — подхода, в котором нейросеть учится восстанавливать целевое действие из случайного шума, обучаясь предсказывать направление «потока» от шума к правильному управляющему сигналу.

Вторая стадия решает проблему переноса движений на реальное «железо» андроида. Для этого базовая модель, выучившая все движения, замораживается, а поверх нее обучается небольшая корректирующая нейросеть с помощью метода обучения с подкреплением (Residual RL). Эта остаточная политика вырабатывает небольшие поправки к базовым действиям, учитывая реалистичную модель электроприводов. В частности, в симуляции воспроизводятся зависимости крутящего момента от скорости вращения мотора и добавляются штрафы за чрезмерную мощность на коленных суставах — эффект, при котором моторы генерируют опасные нагрузки во время приземления робота.

Разработчики включили в тестовую выборку около 60 экстремальных движений, включая сальто, брейк-данс, элементы боевых искусств и акробатические трюки. В симуляции OmniXtreme стабильно превосходил базовые методы, в роли которых выступили прямое обучение единой политики на всех движениях сразу и дистилляция отдельных экспертов в обычную нейросеть-перцептрон. Доля успешных трюков составила около 96 процентов против 79 у стандартного обучения с подкреплением.

На реальном роботе Unitree G1 инженеры провели 157 испытаний на выполнение 24 различных движений. Общий показатель успеха составил около 91 процента. Все вычисления работали на бортовом компьютере робота, обеспечивая управление в реальном времени с частотой 50 герц. Возникавшие отказы были связаны в основном с аппаратными ограничениями — срабатыванием защиты от перегрузки моторов при экстремальных приземлениях, — а не с потерей баланса.

С помощью метода обучения с подкреплением инженеры из института RAI научили двухколесного робота на базе детского беговела ездить задом наперед, выполнять прыжки и даже делать сальто.

Роботы и дроны

Источник: nplus1.ru

✅ Найденные теги: Android, Андроид, Модель, новости, Точность, Трюки

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ideipro logotyp
Группа людей на фоне логотипа компании, одеты в деловую одежду.
Схема медицинских данных: текст, изображения, диагностика, MedGemma, MedSigLIP.
ideipro logotyp
Учёные обсуждают идеи в окружении цветных сетевых узлов на синем фоне.
Коллаж с промышленными резервуарами, графиками и облаками на зеленом фоне.
Статистика продаж GPU за неделю 9-11, 2026: AMD, Nvidia, Intel, процентное распределение.
Вручение сертификата TÜV компаниями GoodWe и TÜV Rheinland на сцене мероприятия.
Белое судно у берега с многоэтажками на фоне, солнечный день.
Image Not Found
ideipro logotyp

Индукция и биология: механизмы обнаружения повторов в моделях белкового языка

arXiv:2602.23179v2 Тип объявления: замена-кросс Аннотация: Белковые последовательности изобилуют повторяющимися сегментами, как в виде точных копий, так и в виде приблизительных сегментов с мутациями. Эти повторы важны для структуры и функции белка, что мотивирует десятилетия работы над алгоритмами…

Мар 17, 2026
Группа людей на фоне логотипа компании, одеты в деловую одежду.

В Массачусетском технологическом институте сохраняется стремление к изучению интеллекта.

При поддержке фонда семьи Зигель недавно переименованный проект MIT Siegel Family Quest for Intelligence исследует, как мозг производит интеллект и как его можно воспроизвести для решения проблем. На фотографии (слева направо) Джош Тенебаум, Дэвид Сигел, Джим ДиКарло,…

Мар 17, 2026
Схема медицинских данных: текст, изображения, диагностика, MedGemma, MedSigLIP.

MedGemma: Наши наиболее эффективные открытые модели для разработки искусственного интеллекта в здравоохранении.

Мы объявляем о появлении новых мультимодальных моделей в коллекции MedGemma — наших наиболее функциональных открытых моделей для разработки искусственного интеллекта в сфере здравоохранения. Быстрые ссылки технический отчет MedGemma ХАЙ-ДЕФ МедДжемма обнимает лицо MedGemma на GitHub MedSigLIP на…

Мар 17, 2026
ideipro logotyp

Видео о работе дронов-кладовщиков от Corvus One

Видео о работе дронов-кладовщиков от Corvus One. Благодаря их внедрению в распределительном центре крупного производителя косметики, частота получения инвентарных данных увеличилась на 600%. Одновременно с этим ежемесячно высвобождалось около 120 часов ручного труда. Дроны используют встроенный ИИ…

Мар 17, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых