Почему ИИ 2.0 нуждается в боковой реальности
Физическому ИИ необходимо нечто большее, чем просто данные, чтобы роботы могли работать более эффективно. Источник: Эрика AI, Adobe Stock
Мир искусственного интеллекта переходит от чат-ботов для обработки изображений — ИИ, который живет в роботах и беспилотных автомобилях. Несмотря на то, что мы добились значительных успехов в обучении этих систем с использованием огромных наборов данных и пространственного анализа, остается крайний пробел: мост между тем, что робот “видит” и что на самом деле происходит в нашем беспорядочном мире.
Рассуждений о высоком уровне недостаточно, если система не полностью соответствует нормативному состоянию окружающей среды.
Физический ИИ Разработчик с версии 1.0 до версии 2.0
В настоящее время в отрасли доминирует “физический ИИ 1.0.” На этом этапе определен масштаб: использование огромных объемов видео и текстовых данных, а также гиперреалистических симуляций, таких как платформа NVIDIA Cosmos, для обучения машин, таких как устроенный мир, еще до того, как они делают свои первые шаги.
Однако физическая ИИ 1.0 имеет “прежде всего”видение” предвзятость. Предполагается, что если у робота достаточно камеры и вычислительной мощности, он сможет точно предсказать будущее. Но, как известно любому водителю, камера может быть ослеплена ярким светом, предметы могут быть спрятаны в тени, датчик может выдавать зашумленные и противоречивые данные.
“Физический AI 2.0” вводит новый, критический уровень в стек: восстановление физического состояния.
Этот аргумент имеет значение, поскольку интеграция в конкурентную среду ИИ больше не является просто моделью. Модель цифрового искусственного интеллекта часто является продуктом.
В реализованных универсальных моделях необходимо работать с зондированием, моделированием, обучением политикам, оркестрацией, безопасностью ветра, периферийным развертыванием и обратной связью от различных операций. Робот, который неправильно интерпретирует настоящее, не может найти выход из плохой оценки состояния.
Отправить свою идею сессии для RoboBusiness 2026
Новая архитектура действий
Для безопасного срабатывания в первой мировой системе необходимы четыре различные функции, работающие в цикле:
<ол>
ол>
Рассуждения настолько хороши, насколько хороши оценки состояния, на основании которых они рассуждают. Если наблюдение неполное или привнесенное, даже превосходная модель рассуждения может оказаться совершенно ошибочной.
Это важно. Системы рассуждений влияют на управление, но не действуют напрямую. В надежном и спокойном обсуждении предполагаемых намерений, ограничений, объяснений или возможных действий; логика планирования, управления и безопасности затем преобразует эти выходные в ограниченное движение.
Физический ИИ не просто описательный или прогнозирующий. Оно становится физическим, когда решения преобразуются в движение, и когда это движение меняет мир и порождает следующий набор исследований.
п>
Почему больше данных — единственный ответ
Распространенный контраргумент заключается в том, что если мы просто создадим более крупные “сквозной” моделей, ИИ со временем учится самостоятельно справляться с шумными датчиками.
Выделенный уровень восстановленияявляется более эффективным. Учитывая восстановление состояния состояния в качестве отдельного модуля, разработчики могут использовать специальные датчики (например, радар или прикосновение) и улучшить наблюдение до того, как более высокий уровень “brain” даже начинаю думать. Это позволяет обеспечить каждого нового робота необходимостью “переобучения” законы физики с нуля.
Основное обнаружение заключается между механизмами случаев и случаями, которые плохо наблюдаются. Бенчмарки могут сообщить разработчикам, что система сталкивается с трудностями в цепях с длинным хвостом, такими как звезды или необычное поведение участников дорожного движения.
Но серьёзный случай — это не то же самое, что восстановить то, что не удалось зафиксировать сенсорам. Камера может создавать больше кадров, модель может анализировать их длину, но если ведущее наблюдение структурно ухудшено, результаты рассуждения все равно могут работать с неправильной картинкой.
В таких случаях ответом будет не только увеличение количества данных. Это более сильный уровень восстановления, который использует ограничения, основанные на физике, и более глубокое исследование, чтобы сделать скрытое состояние более очевидным.
| Робот-гуманоид, складывающий белье | Автономное транспортное средство, перемещаемое по городу | |
|---|---|---|
| Модели мира | Предс показывает, как следует менять разные структуры | Предс показывает, как будет проходить трафик дождьвремя> тр> |
| Восстановление состояния | Определяет форму одежды, несмотря на морщины, тени, частичные проекции и неоднозначный контакт | Отслеживает велосипедиста, спрятавшегося за припаркованным грузовиком и на захламленной сцене |
| Распределение | Решает, сложить, перехватить, отложить или воспользоваться помощью | Решает, следует ли уступать, останавливаться, подталкивать или перепланировать |
| Действие | Осторожно с слоями рукава | Осуществляет плавное и безопасное рулевое управление маневр |
Оцените материал:
Похожие записи
Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
