Компания NVIDIA ассоциируется у пользователей с игровыми видеокартами, решениями для работы и ускорителями высокопроизводительных вычислений, а также генеральным директором, любящим ходить в кожанке. Теперь она вышла на новый для себя рынок, начав продажи системы на кристалле Vera.

Vera – это часть платформы Vera Rubin, где Vera является центральным процессором, а Rubin – графическим процессором. Vera оснащается 88 ядрами Armv9.2 «Olympus» со 176 потоками, разделёнными при помощи технологии многопоточности NVIDIA Spatial Multi-Threading, способными работать с форматом FP8, ориентированным на искусственный интеллект.
Система на кристалле вмещает до 1.5 Тбайта оперативной памяти LPDDR5x, но компания не уточняет, можно ли будет использовать что-то кроме модулей SOCAMM2, предназначенных для работы с Vera Rubin. Также говорится про пропускную способность памяти на уровне 1.2 Тбайта/с и наличие шины NVLink с пропускной способностью до 1.8 Тбайта/с, которая связывает центральный процессор с внешним ускорителем.

NVIDIA Vera является конкурентом серверным процессорам AMD EPYC и Intel Xeon, но включает в себя один гигантский недостаток: без «костылей» она работает только с ускорителями этого же производителя. Это было обнаружено пользователями, сообщающими о наличии аппаратной ошибки с контроллерами PCIe, а точнее с особенностями их работы в плане генерации адреса памяти.
«При определённых условиях они выдают недействительные адреса, которые нарушают надёжную связь со сторонними ускорителями. Это происходит во время операций записи ввода-вывода с отображением памяти PCIe (MMIO), когда центральный процессор пытается выполнить запись с разрешением частичного байта в области MMIO. Проблема особенно обостряется, когда эти области отображаются с использованием обычного некэшируемого атрибута памяти ARM «MT_NORMAL_NC», что создаёт значительные проблемы с совместимостью.
Поскольку ARM использует более упрощённое упорядочивание памяти для обычных атрибутов, не подлежащих кэшированию, это может вызвать ошибку, приводящую к неправильной генерации адреса, повреждению данных и даже отказу устройства PCIe во время рабочих нагрузок с интенсивным использованием прямого доступа к памяти, таких как обучение искусственного интеллекта или крупномасштабное моделирование высокопроизводительных вычислений. Графические процессоры NVIDIA разработаны с учётом особенностей процессоров Vera и их специфической работы памяти, поэтому при совместной работе с ними проблем нет».



























