Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Microsoft представила Surface RTX Spark Dev Box для запуска масштабных моделей искусственного интеллекта без затрат на облачные сервисы.

Майкл Нуньес

Surface RTX Spark Изображение 4

Источник изображения: Microsoft

В понедельник Microsoft представила Surface RTX Spark Dev Box, компактный настольный компьютер, предназначенный для запуска разработчиками программного обеспечения крупных моделей искусственного интеллекта на своих рабочих местах вместо оплаты облачных вычислений. Этот шаг напрямую бросает вызов модели ценообразования за токен, которая определяла экономику индустрии ИИ с момента запуска ChatGPT три с половиной года назад.

Устройство, анонсированное на конференции Microsoft Build 2026, объединяет новый процессор Nvidia Blackwell-architecture RTX Spark и 128 гигабайт унифицированной памяти в компактном корпусе, обеспечивая, по оценкам Nvidia, один петафлоп вычислительной мощности для ИИ. На практике это означает, что разработчик может загружать, запускать и взаимодействовать с моделями ИИ, содержащими более 120 миллиардов параметров, без единого вызова API в облако.

«Мы считаем, что устройства этого класса смогут обрабатывать модели со 100 миллиардами параметров», — заявил Паван Давулури, исполнительный вице-президент Microsoft по Windows и устройствам, во время пресс-брифинга перед мероприятием. Он подчеркнул, что размер модели — это лишь часть уравнения: «Размер модели — это одно, но для того, чтобы модель была эффективной, ей необходимо достаточно контекста, потому что для большей модели требуется больший контекст». Он отметил, что при 100 000 токенов контекста один только кэш типа «ключ-значение» может занимать от 40 до 50 гигабайт памяти — именно поэтому Microsoft и Nvidia разработали устройство на основе унифицированного пула памяти объемом 128 гигабайт, динамически распределяемого между ЦП и ГП.

Устройство поступит в продажу в США позднее в этом году и будет продаваться исключительно через Microsoft.com. Компания не раскрыла информацию о ценах.

Почему Microsoft делает ставку на то, что будущее ИИ будет зависеть от фиксированных затрат, а не от облачных счетчиков?

Surface RTX Spark Dev Box выходит в момент, когда экономические аспекты разработки ИИ стали предметом обсуждения на уровне совета директоров. Крупные и малые компании сталкиваются с непредсказуемыми затратами на облачные графические процессоры: каждый запуск тонкой настройки, каждый вызов функции вывода, каждый рабочий процесс агента, проходящий через перспективную модель, накапливают расходы. Для разработчика, быстро работающего над прототипом — запускающего одну и ту же модель десятки или сотни раз в день — эти затраты быстро увеличиваются.

Microsoft позиционирует Dev Box как предохранительный клапан для этого давления. Эндрю Хилл, корпоративный вице-президент Surface, написал в своем блоге, посвященном анонсу, что устройство «меняет эту ситуацию», позволяя разработчикам «резервировать вызовы передовых моделей для действительно передовых задач и обрабатывать остальное на собственном оборудовании». Суть не в том, что облачные вычисления устарели, а в том, что большая часть работы, которая в настоящее время выполняется в удаленных центрах обработки данных, не требует самых современных моделей и лучше бы выполнялась на мощном локальном оборудовании с предсказуемыми, фиксированными затратами.

Это значительный стратегический сдвиг для Microsoft, компании, которая получает десятки миллиардов долларов ежегодной выручки от облачных сервисов Azure. Продавая оборудование, которое явно снижает зависимость клиентов от облака, Microsoft признает нарастающее в отрасли противоречие: предельные издержки масштабируемого выполнения задач ИИ неприемлемы для многих команд, и рынок требует альтернатив. По всей видимости, делается ставка на то, что разработчики, создающие прототипы локально, все равно будут развертывать их в Azure, когда им потребуется масштабирование, — и что владение обоими этапами этого рабочего процесса более ценно, чем владение только облаком.

Внутри унифицированной архитектуры памяти объемом 128 ГБ, которая делает возможным локальный искусственный интеллект.

Техническая архитектура Dev Box отражает ряд продуманных инженерных решений, направленных на обеспечение стабильной, а не пиковой производительности — различие, которое имеет огромное значение для рабочих нагрузок ИИ, которые могут выполняться в течение нескольких часов.

В основе лежит система на кристалле Nvidia RTX Spark, которая сочетает в себе сверхэффективный процессор на базе ARM и графический процессор RTX поколения Blackwell. Как объяснил Давулури во время брифинга, в традиционном ПК под управлением Windows такая конфигурация потребовала бы четырех отдельных компонентов: процессора, дискретного графического процессора, выделенной графической памяти и системной оперативной памяти. RTX Spark объединяет все это в одном чипе с единым пулом памяти.

Это объединение является важнейшим проектным решением. Обычные игровые ноутбуки с высокопроизводительными графическими процессорами Nvidia имеют максимум около 24 гигабайт памяти, доступной для графического процессора. 128 гигабайт объединенной памяти Dev Box — доступной как для центрального, так и для графического процессора благодаря архитектуре Unified Memory Access от Nvidia — позволяют загружать модели, для которых в противном случае потребовались бы облачные экземпляры графических процессоров со специальными высокоскоростными конфигурациями памяти.

Компания Microsoft проделала значительную работу на уровне операционной системы, чтобы использовать преимущества этой архитектуры. В Windows была реализована новая логика управления памятью, которая повышает максимальный объем системной памяти, доступной для графического процессора, обеспечивает более интеллектуальное распределение размера страниц для областей общей памяти и гарантирует, что ресурсоемкие задачи, выполняемые графическим процессором, не будут лишать центральный процессор необходимых ресурсов для многозадачности. Планировщик задач Windows также был оптимизирован для гетерогенной архитектуры ядер RTX Spark, направляя ресурсоемкие задачи на ядра высокой производительности, оставляя при этом ядра низкой производительности доступными для фоновых задач.

Как алюминиевый корпус, напечатанный на 3D-принтере, служит одновременно и радиатором.

Система охлаждения также продумана до мелочей. Dev Box работает в пределах примерно 100 Вт постоянного теплового диапазона — скромный показатель по меркам настольных компьютеров, но значимый для устройства, предназначенного для непрерывного выполнения задач обучения и вывода результатов. Сам алюминиевый корпус спроектирован таким образом, чтобы функционировать как пассивный радиатор, и метод, использованный Microsoft для его изготовления, является одной из самых примечательных деталей этого устройства.

Верхняя панель изготовлена с использованием 3D-печати металлом — процесса, позволяющего создавать внутренние геометрические формы, слишком сложные для традиционной обработки на станках с ЧПУ или литья под давлением. Перфорации представляют собой не просто сквозные отверстия; они расположены под разными углами вокруг внутреннего вентилятора, чтобы оптимизировать поток воздуха от забора холодного воздуха до отвода тепла. Во время пресс-брифинга Гарри, промышленный дизайнер Surface, объяснил логику: «Такая сложность — это то, чего другие производители не смогли бы достичь, например, с помощью станков с ЧПУ или любого другого литья, из-за сложности формы».

На вопрос о том, ограничит ли 3D-печать массовое производство, дизайнер признал наличие проблемы, но предположил, что Microsoft разработала достаточно надежный процесс для масштабирования. В результате получилась машина, которая работает достаточно тихо для открытого офиса, одновременно поддерживая непрерывные нагрузки на графический процессор, которые замедляли бы работу большинства обычных настольных компьютеров аналогичного размера. Для устройства, которое, как ожидает Microsoft, разработчики будут оставлять работать всю ночь для тонкой настройки, тихая и стабильная работа — это не роскошь, а необходимость.

Ориентированная на разработчиков система, которая избавляет от многочасовой настройки.

Microsoft поставляет Dev Box с предварительно настроенной на уровне образа Windows 11 Pro для работы в разработке — деталь, которая может показаться незначительной, но отражает растущее понимание того, что пользовательский опыт на оборудовании для разработчиков исторически был неудовлетворительным.

При загрузке система отображает темную тему с упрощенной панелью задач, удаленными виджетами и включенным режимом «Не беспокоить». Включен режим разработчика. В качестве оболочки по умолчанию используется PowerShell 7. WSL 2 — подсистема Windows для Linux — предустановлена с поддержкой сквозной передачи GPU и настроенной поддержкой CUDA. Visual Studio Code, GitHub Copilot, Git, Python и Node.js установлены и готовы к работе.

«Мы сказали: „Знаете что, мы вас понимаем, если вы хотите работать быстро“», — рассказал VentureBeat инженер Microsoft, продемонстрировавший конфигурацию во время брифинга. Он пояснил, что суть заключалась в том, что разработчики всё равно собирались установить все эти инструменты — проблемы возникали из-за многочасовой настройки и конфигурации, которые оставались между распаковкой компьютера и написанием первой строки кода.

Dev Box также поставляется с точками интеграции со всем стеком Microsoft в области искусственного интеллекта: AI Toolkit для VS Code для преобразования и тонкой настройки моделей, Windows ML и Windows Copilot Runtime для локального вывода результатов, а также Microsoft Foundry для подключения локальных прототипов к конвейерам развертывания в облаке. Для предприятий устройство интегрируется с Entra ID и Intune для управления идентификацией и устройствами, а также включает в себя архитектуру ПК с защищенным ядром, шифрование BitLocker и Microsoft Defender.

Почему Mac Mini от Apple, возможно, больше не является реальным конкурентом.

Наиболее очевидным конкурентом является Mac Mini от Apple, который доминирует в категории компактных настольных компьютеров и широко используется разработчиками, которых привлекает унифицированная архитектура памяти Apple Silicon и энергоэффективность.

Давулури напрямую затронул сравнение во время брифинга, заявив, что Dev Box «намеренно находится в другом классе производительности, чем Mac Mini». Он отказался поделиться конкретными результатами тестов, отметив, что подробные характеристики и целевые показатели производительности появятся ближе к осеннему запуску. Но архитектурное преимущество, на которое претендует Microsoft, очевидно: в то время как текущий Mac Mini с M4 Pro имеет максимум 48 гигабайт унифицированной памяти, а конфигурация M4 Max достигает 128 гигабайт, RTX Spark Dev Box сочетает свои 128 гигабайт с графическим процессором класса Blackwell, который имеет принципиально иную вычислительную модель на основе CUDA — модель, для которой уже оптимизировано подавляющее большинство инструментов экосистемы ИИ/машинного обучения (PyTorch, TensorRT, llama.cpp, фреймворки Hugging Face).

Преимущества экосистемы CUDA трудно переоценить. Хотя фреймворк Metal от Apple добился прогресса, подавляющее большинство фреймворков для обучения и вывода результатов ИИ сначала создаются и тестируются на основе стека CUDA от Nvidia. Разработчик, запускающий модели на Dev Box, может использовать тот же код, те же библиотеки и те же рабочие процессы, что и на облачном GPU-сервере — уровень переносимости, которого Apple Silicon в настоящее время не может достичь.

От ноутбука до суперкомпьютера: трехступенчатый план Microsoft по созданию локального оборудования для искусственного интеллекта.

Dev Box — это один из элементов трехступенчатой стратегии Microsoft по выпуску аппаратного обеспечения, представленной на конференции Build. Surface Laptop Ultra, анонсированный несколькими днями ранее на Computex, использует тот же процессор RTX Spark в 15-дюймовом форм-факторе ноутбука для разработчиков и создателей контента, которым необходима портативность. На другом конце спектра находится DGX Station для Windows — построенная на базе Nvidia GB300 Grace Blackwell Ultra Superchip — ориентированная на организации, которым необходимо запускать передовые модели с количеством параметров до триллиона на настольном компьютере. Ожидается, что эта машина появится в четвертом квартале этого года.

Эти три устройства соответствуют многоуровневой вычислительной модели, которую Microsoft называет «неограниченным интеллектом»: небольшие встроенные языковые модели (новое семейство Aion 1.0) обрабатывают легковесные задачи с нулевыми предельными затратами; оборудование класса RTX Spark запускает модели среднего уровня локально для основной части работы по разработке; а облачные ресурсы зарезервированы для действительно масштабных задач.

В интерфейсе командной строки GitHub Copilot появляется конкретная реализация этой модели с новой функцией под названием /fleet, которая позволяет облачному основному агенту составлять план, оценивать сложность каждой задачи и направлять соответствующие подзадачи локальной модели, работающей на оборудовании разработчика. Облачный агент обрабатывает то, что требует передовых возможностей; локальная модель обрабатывает то, что не требует. В результате, теоретически, получается снижение затрат без снижения качества.

Главный вопрос заключается в том, сможет ли гибридный ИИ превратиться из модного слова в бизнес-модель.

Оправдается ли ставка Microsoft, зависит от вопросов, на ответы на которые уйдут месяцы. Как Dev Box на самом деле покажет себя при длительных реальных нагрузках? Сколько это будет стоить? Как быстро экосистема моделей с открытым исходным кодом продолжит создавать работоспособные модели с 70-120 миллиардами параметров, которые помещаются в его память? И, пожалуй, самое важное: примут ли корпоративные закупочные команды, привыкшие рассматривать ИИ как статью расходов на облачные технологии, капитальные затраты на офисное оборудование в качестве альтернативы?

Однако стратегическую логику сложно игнорировать. В течение трех лет индустрия ИИ функционировала, исходя из неявного предположения: серьезная работа в области ИИ происходит в облаке, а экономические издержки такого подхода сводятся к простому ведению бизнеса. Microsoft, компания, у которой есть все основания укреплять это предположение, теперь продает машину, которая его подрывает. Это не противоречие — это признание того, что рынок меняется, и что компания, контролирующая локальную среду разработчика и облако, в котором он развертывает приложения, имеет более устойчивое преимущество, чем та, которая контролирует только облако.

Каждый доллар, сэкономленный разработчиком на облачных вычислениях, — это доллар, который можно использовать для финансирования другого эксперимента, другой итерации, другого прототипа. Долгие годы индустрия ИИ внушала разработчикам, что им нужно арендовать их интеллект за символическую плату. Теперь Microsoft задает другой вопрос: а что, если бы его можно было просто купить?

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Microsoft, RTX, Spark, Surface, новости, Представила

Добавить комментарий

Новости других рубрик

Архив рубрики ~Лента новостей~: Компания Cyera рассчитывает на оценку в 12 миллиардов долларов при мультипликаторе 80x годового дохода, несмотря на операционные убытки. Архив рубрики ~Лента новостей~: Исследователи из Массачусетского технологического института обучают модели искусственного интеллекта интерпретации графиков. Архив рубрики ~Лента новостей~: Новая эра открытий: Google Research на конференции I/O 2026 Архив рубрики ~Лента новостей~: Учёные смогли ускорить компьютерные чипы в 1000 раз Архив рубрики ~Лента новостей~: Как НМИЦК им. Е.И. Чазова отслеживает риски сердечно‑сосудистых заболеваний: от ручной работы к инструменту на базе ИИ Архив рубрики ~Лента новостей~: Благотворительные организации осуждают план Великобритании использовать ИИ для оценки возраста молодых просителей убежища. Архив рубрики ~Лента новостей~: Как СССР научил Голливуд снимать космос Архив рубрики ~Лента новостей~: Хакеры обнаружили, что неслышимые звуки, скрытые в подкастах или случайных видеороликах, могут взломать ваш голосовой чат-бот с искусственным интеллектом