
В понедельник компания Nvidia анонсировала новую инфраструктуру и модели ИИ в рамках работы над созданием базовой технологии для физического ИИ, включая роботов и автономные транспортные средства, способные воспринимать реальный мир и взаимодействовать с ним.
На конференции NeurIPS AI в Сан-Диего, Калифорния, гигант в области полупроводников представил Alpamayo-R1 — открытую модель языка зрительного восприятия для исследований автономного вождения. Компания утверждает, что это первая модель языка зрительного восприятия, ориентированная на автономное вождение. Модели визуального восприятия могут обрабатывать как текст, так и изображения одновременно, позволяя автомобилям «видеть» окружающее пространство и принимать решения на основе восприятия.
Эта новая модель основана на модели Nvidia Cosmos-Reason, которая обдумывает решения перед тем, как реагировать. Nvidia первоначально выпустила семейство моделей Cosmos в январе 2025 года. Дополнительные модели были выпущены в августе.
Как сообщила компания Nvidia в своем блоге, такие технологии, как Alpamayo-R1, имеют решающее значение для компаний, стремящихся достичь уровня автономного вождения 4, что означает полную автономность в определенной области и при определенных обстоятельствах.
Nvidia надеется, что этот тип модели рассуждений даст автономным автомобилям «здравый смысл», который позволит им лучше подходить к принятию тонких решений при вождении, подобно людям.
Эта новая модель доступна на GitHub и Hugging Face.
Наряду с новой моделью машинного зрения, Nvidia также загрузила на GitHub новые пошаговые руководства, ресурсы для вывода и рабочие процессы после обучения, которые в совокупности называются «Cosmos Cookbook» (Кулинарная книга Cosmos), чтобы помочь разработчикам эффективнее использовать и обучать модели Cosmos для конкретных сценариев использования. Руководство охватывает отбор данных, генерацию синтетических данных и оценку моделей.
Эти заявления появились на фоне того, что компания активно продвигает физический ИИ как новое направление для своих усовершенствованных графических процессоров с ИИ.
Соучредитель и генеральный директор Nvidia Дженсен Хуанг неоднократно заявлял, что следующая волна ИИ — это физический ИИ. Билл Далли, главный научный сотрудник Nvidia, поддержал эту точку зрения в интервью TechCrunch этим летом, подчеркнув важность физического ИИ в робототехнике.
«Я думаю, что в конечном итоге роботы станут играть важную роль в мире, и мы хотим, по сути, создавать мозги для всех роботов», — сказал тогда Далли. «Для этого нам нужно начать разрабатывать ключевые технологии».
Спонсор: Смотрите AWS re:Invent 2025 в прямом эфире
Узнайте последние новости обо всем: от агентского ИИ и облачной инфраструктуры до безопасности и многого другого с флагманского мероприятия Amazon Web Services в Лас-Вегасе. Это видео подготовлено совместно с AWS.
Источник: techcrunch.com
























