Image

Nvidia анонсирует новые открытые модели искусственного интеллекта и инструменты для исследований в области автономного вождения

Логотип Nvidia
Авторы изображений: Ли Хунбо/VCG / Getty Images

В понедельник компания Nvidia анонсировала новую инфраструктуру и модели ИИ в рамках работы над созданием базовой технологии для физического ИИ, включая роботов и автономные транспортные средства, способные воспринимать реальный мир и взаимодействовать с ним.

На конференции NeurIPS AI в Сан-Диего, Калифорния, гигант в области полупроводников представил Alpamayo-R1 — открытую модель языка зрительного восприятия для исследований автономного вождения. Компания утверждает, что это первая модель языка зрительного восприятия, ориентированная на автономное вождение. Модели визуального восприятия могут обрабатывать как текст, так и изображения одновременно, позволяя автомобилям «видеть» окружающее пространство и принимать решения на основе восприятия.

Эта новая модель основана на модели Nvidia Cosmos-Reason, которая обдумывает решения перед тем, как реагировать. Nvidia первоначально выпустила семейство моделей Cosmos в январе 2025 года. Дополнительные модели были выпущены в августе.

Как сообщила компания Nvidia в своем блоге, такие технологии, как Alpamayo-R1, имеют решающее значение для компаний, стремящихся достичь уровня автономного вождения 4, что означает полную автономность в определенной области и при определенных обстоятельствах.

Nvidia надеется, что этот тип модели рассуждений даст автономным автомобилям «здравый смысл», который позволит им лучше подходить к принятию тонких решений при вождении, подобно людям.

Эта новая модель доступна на GitHub и Hugging Face.

Наряду с новой моделью машинного зрения, Nvidia также загрузила на GitHub новые пошаговые руководства, ресурсы для вывода и рабочие процессы после обучения, которые в совокупности называются «Cosmos Cookbook» (Кулинарная книга Cosmos), чтобы помочь разработчикам эффективнее использовать и обучать модели Cosmos для конкретных сценариев использования. Руководство охватывает отбор данных, генерацию синтетических данных и оценку моделей.

Эти заявления появились на фоне того, что компания активно продвигает физический ИИ как новое направление для своих усовершенствованных графических процессоров с ИИ.

Соучредитель и генеральный директор Nvidia Дженсен Хуанг неоднократно заявлял, что следующая волна ИИ — это физический ИИ. Билл Далли, главный научный сотрудник Nvidia, поддержал эту точку зрения в интервью TechCrunch этим летом, подчеркнув важность физического ИИ в робототехнике.

«Я думаю, что в конечном итоге роботы станут играть важную роль в мире, и мы хотим, по сути, создавать мозги для всех роботов», — сказал тогда Далли. «Для этого нам нужно начать разрабатывать ключевые технологии».

Спонсор: Смотрите AWS re:Invent 2025 в прямом эфире

Узнайте последние новости обо всем: от агентского ИИ и облачной инфраструктуры до безопасности и многого другого с флагманского мероприятия Amazon Web Services в Лас-Вегасе. Это видео подготовлено совместно с AWS.

Источник: techcrunch.com

✅ Найденные теги: NVIDIA, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Цветные блоки и линии, символизирующие технологическую сеть или блокчейн.
ideipro logotyp
Текст "MIT 2025 in the Media" на фоне цифровой сетки и световых эффектов.
Диаграмма Венна: пересечение U-REGLE, M-REGLE и GWAS Catalog.
Извлечение документов DPT-2, точность 99.16%, DocVQA, текст под подписью.
Новая открытая система «автоисследований» Андрея Карпати позволяет запускать сотни экспериментов с искусственным интеллектом за ночь, что имеет революционные последствия.
Новорожденный в инкубаторе с фототерапией под синим светом.
Паркетный зал с деловой встречей, люди сидят и слушают спикеров за столом.
Детский рисунок: робот и слова на английском с объектами, включая кролика и гитару.
Image Not Found
Цветные блоки и линии, символизирующие технологическую сеть или блокчейн.

Создание надежной инфраструктуры данных для успешной работы агентов искусственного интеллекта.

В сотрудничестве с SAP В гонке за внедрением и демонстрацией преимуществ ИИ предприятия как никогда быстро развертывают агентные системы ИИ в качестве помощников, ассистентов и автономных исполнителей задач. Согласно ежегодному отчету McKinsey об ИИ, к концу 2025…

Мар 14, 2026
ideipro logotyp

Увеличение длины последовательности — это ещё не всё: эффективная интеграция мультимодальных сигналов для прогнозирования экспрессии генов.

arXiv:2602.21550v2 Тип объявления: замена-кросс Аннотация: Прогнозирование экспрессии генов, то есть предсказание уровней экспрессии мРНК на основе последовательностей ДНК, представляет собой серьезную проблему. Предыдущие работы часто фокусировались на увеличении длины входной последовательности для определения дистальных энхансеров, которые могут…

Мар 14, 2026
Текст "MIT 2025 in the Media" на фоне цифровой сетки и световых эффектов.

MIT в СМИ: обзор 2025 года

Члены сообщества MIT привлекли внимание общественности ключевыми научными достижениями и своими усилиями по решению актуальных проблем. Изображение: Новости MIT «В MIT инновации варьируются от впечатляющих технологий до приземленного творчества», — отметили в Chronicle во время визита в…

Мар 14, 2026
Диаграмма Венна: пересечение U-REGLE, M-REGLE и GWAS Catalog.

Раскрытие ценных генетических данных с помощью мультимодального ИИ на основе M-REGLE

M-REGLE (Multimodal REpresentation learning for Genetic discovery on Low-dimensional Embeddings) — это метод искусственного интеллекта, который одновременно анализирует несколько потоков медицинских данных. Совместное обучение на основе различных типов данных создает более полные представления и значительно повышает вероятность…

Мар 14, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых