Image

Positron считает, что нашла секрет, позволяющий конкурировать с Nvidia в области чипов для вывода ИИ. Вот как это может принести пользу предприятиям.

c16e2e4dffa2ef590f1671dc9c5d7455

Хотите получать более ценную информацию? Подпишитесь на наши еженедельные рассылки, чтобы получать только то, что важно для руководителей в сфере корпоративного ИИ, данных и безопасности. Подпишитесь сейчас

В связи с резким ростом спроса на масштабное развертывание систем искусственного интеллекта малоизвестный частный стартап Positron позиционирует себя в качестве прямого конкурента лидеру рынка Nvidia, предлагая специализированные энергоэффективные чипы вывода с оптимизированным объемом памяти, призванные устранить растущие узкие места в отрасли, связанные с затратами, энергопотреблением и доступностью.

«Наше ключевое отличие — это способность запускать передовые модели ИИ с более высокой эффективностью, достигая производительности в 2–5 раз выше на ватт и доллар по сравнению с Nvidia», — заявил Томас Сохмерс, соучредитель и технический директор Positron, в недавнем видеоинтервью с VentureBeat.

Очевидно, это хорошая новость для крупных поставщиков моделей ИИ, но руководство Positron утверждает, что это полезно и для многих других предприятий, включая те, которые используют модели ИИ в своих рабочих процессах, а не в качестве услуг, предлагаемых клиентам.

«Мы создаем чипы, которые можно развернуть в сотнях существующих центров обработки данных, поскольку им не требуется жидкостное охлаждение или экстремальная плотность мощности», — отметил Митеш Агравал, генеральный директор Positron и бывший главный операционный директор поставщика облачных решений для искусственного интеллекта Lambda , также в том же видеоинтервью с VentureBeat.

Масштабирование ИИ достигает предела

Ограничения мощности, рост стоимости токенов и задержки в выводе данных меняют корпоративный ИИ. Присоединяйтесь к нашему эксклюзивному салону, чтобы узнать, как обстоят дела у лучших команд:

  • Превращение энергии в стратегическое преимущество
  • Разработка эффективного вывода для реального увеличения пропускной способности
  • Обеспечение конкурентоспособной рентабельности инвестиций с помощью устойчивых систем ИИ

Забронируйте свое место, чтобы оставаться впереди : https://bit.ly/4mwGngO

Похоже, венчурные капиталисты и первые пользователи согласны.

Вчера Positron объявила о раунде финансирования серии A на сумму 51,6 млн долларов США, который возглавили Valor Equity Partners, Atreides Management и DFJ Growth при поддержке Flume Ventures, Resilience Reserve, 1517 Fund и Unless.

Что касается ранней клиентской базы Positron, то она включает как известные компании, так и компании, работающие в секторах с высокой интенсивностью обработки данных. Среди подтверждённых проектов – крупный поставщик решений для безопасности и облачного контента Cloudflare , который использует оборудование Positron Atlas в своих глобально распределённых центрах обработки данных с ограниченным энергопотреблением, и Parasail , использующий свою платформу SnapServe для инфраструктуры данных с использованием искусственного интеллекта.

Помимо этого, Positron сообщает о внедрении в нескольких ключевых областях, где критически важен эффективный вывод, таких как сетевые технологии, игры, модерация контента, сети доставки контента (CDN) и поставщики токенов как услуг .

Сообщается, что первых пользователей привлекла способность Atlas обеспечивать высокую пропускную способность и низкое энергопотребление без необходимости специального охлаждения или переработанной инфраструктуры, что делает его привлекательным вариантом для рабочих нагрузок ИИ в корпоративных средах.

Выход на сложный рынок, на котором размер модели ИИ уменьшается, а эффективность растет

Но Positron также выходит на сложный рынок. The Information только что сообщила, что конкурент — стартап Groq, специализирующийся на разработке чипов для вывода данных с помощью искусственного интеллекта (ИИ) , где Сомерс ранее занимал должность директора по технологической стратегии , — снизил свой прогноз выручки на 2025 год с более чем 2 миллиардов долларов до 500 миллионов долларов, что наглядно демонстрирует, насколько нестабильным может быть рынок ИИ-оборудования.

Даже хорошо финансируемые компании сталкиваются с трудностями, конкурируя за мощности центров обработки данных и внимание к корпоративным интересам с такими укоренившимися поставщиками графических процессоров, как Nvidia, не говоря уже о главном: появлении более эффективных и небольших больших языковых моделей (LLM) и специализированных малых языковых моделей (SLM), которые могут работать даже на таких маленьких и маломощных устройствах, как смартфоны.

Однако руководство Positron пока что принимает эту тенденцию и не обращает внимания на возможное ее влияние на траекторию своего роста.

«Эта двойственность всегда существовала: лёгкие приложения на локальных устройствах и ресурсоёмкая обработка в централизованной инфраструктуре», — сказал Агравал. «Мы считаем, что обе эти области будут развиваться».

Сомерс согласился, заявив: «Мы видим будущее, в котором у каждого человека может быть работоспособная модель на его телефоне, но они по-прежнему будут полагаться на большие модели в центрах обработки данных для получения более глубокого понимания».

Atlas — это чип искусственного интеллекта, ориентированный на вывод данных.

Хотя графические процессоры Nvidia способствовали бурному развитию глубокого обучения, ускоряя обучение моделей, Positron утверждает, что вывод — этап, на котором модели генерируют выходные данные в процессе производства, — теперь является настоящим узким местом.

Его основатели называют его самой недооптимизированной частью «стека ИИ», особенно для генеративных рабочих нагрузок ИИ, которые зависят от быстрого и эффективного обслуживания моделей.

Решение Positron — Atlas, ускоритель вывода первого поколения, специально созданный для работы с большими моделями трансформаторов.

В отличие от графических процессоров общего назначения, Atlas оптимизирован под уникальные потребности в памяти и пропускной способности современных задач вывода.

Компания утверждает, что Atlas обеспечивает в 3,5 раза более высокую производительность на доллар и на 66% меньше энергопотребления, чем Nvidia H100, а также достигает 93% использования пропускной способности памяти — намного выше типичного диапазона 10–30%, наблюдаемого в графических процессорах.

От Atlas до Titan, поддержка моделей с несколькими триллионами параметров

Запущенный всего через 15 месяцев после основания и с начальным капиталом всего в 12,5 млн долларов, Atlas уже поставляется и находится в производстве.

Система поддерживает до 0,5 триллиона параметров моделей на одном сервере мощностью 2 кВт и совместима с моделями трансформаторов Hugging Face через конечную точку, совместимую с API OpenAI.

Сейчас Positron готовится запустить в 2026 году платформу следующего поколения Titan.

Titan, созданный на основе специально разработанного кремния «Asimov», будет иметь до двух терабайт высокоскоростной памяти на каждый ускоритель и поддерживать модели с объемом до 16 триллионов параметров .

Современные передовые модели охватывают сотни миллиардов и однозначные триллионы параметров, но предполагается, что более новые модели, такие как GPT-5 от OpenAI, охватывают несколько триллионов параметров, и в настоящее время считается, что для достижения общего искусственного интеллекта (ОИИ) — ИИ, превосходящего людей в большинстве экономически ценных задач, и сверхинтеллекта — ИИ, превосходящего человеческие возможности по пониманию и контролю.

Важно отметить, что Titan предназначен для работы со стандартным воздушным охлаждением в обычных условиях центров обработки данных, избегая конфигураций с высокой плотностью и жидкостным охлаждением, которые все чаще требуются графическим процессорам следующего поколения.

Проектирование для эффективности и совместимости

С самого начала Positron проектировала свою систему как готовую замену, позволяющую клиентам использовать существующие двоичные файлы моделей без переписывания кода.

«Если клиенту приходилось каким-либо образом менять свое поведение или действия, это становилось препятствием», — сказал Сомерс.

Сомерс объяснил, что вместо того, чтобы разрабатывать сложный стек компиляторов или перестраивать программные экосистемы, Positron сосредоточился на выводе, разрабатывая оборудование, которое напрямую использует обученные Nvidia модели.

«CUDA Mode — это не то, с чем нужно бороться, — сказал Агравал. — Это экосистема, в которой нужно участвовать».

Этот прагматичный подход помог компании быстро выпустить свой первый продукт, проверить производительность на реальных корпоративных пользователях и привлечь значительные последующие инвестиции. Кроме того, ориентация на воздушное охлаждение вместо жидкостного делает чипы Atlas единственным вариантом для некоторых развертываний.

«Мы полностью сосредоточены на развертываниях с исключительно воздушным охлаждением… все эти будущие решения на базе Nvidia Hopper и Blackwell требуют жидкостного охлаждения … Единственное место, где можно разместить эти стойки, — это центры обработки данных, которые сейчас строятся в глуши», — сказал Сомерс.

В целом способность Positron действовать быстро и эффективно с точки зрения капиталовложений помогла ей выделиться на переполненном рынке оборудования для ИИ.

Память — это то, что вам нужно

Сомерс и Агравал указывают на фундаментальный сдвиг в рабочих нагрузках ИИ: от сверточных нейронных сетей с ограничением вычислительных мощностей к архитектурам преобразователей с ограничением памяти.

В то время как старые модели требовали большого количества операций с плавающей точкой (FLOP), современным трансформаторам для эффективной работы требуется огромный объем памяти и пропускная способность.

В то время как Nvidia и другие продолжают концентрироваться на масштабировании вычислений, Positron делает ставку на дизайн, ориентированный в первую очередь на память.

Сомерс отметил, что при использовании преобразователя соотношение вычислительных операций и операций с памятью меняется практически до 1:1, а это означает, что повышение использования памяти оказывает прямое и существенное влияние на производительность и энергоэффективность.

Поскольку Atlas уже превосходит современные графические процессоры по ключевым показателям эффективности, Titan намерен пойти еще дальше, предлагая самый высокий в отрасли объем памяти на чип.

Ожидается, что на момент запуска Titan обеспечит прирост производительности по сравнению с типичными конфигурациями памяти GPU — без необходимости специализированного охлаждения или сложных сетевых настроек.

Чипы, произведенные в США

Компания Positron гордится тем, что её производственный конвейер расположен в США. Чипы первого поколения компании производились в США на предприятиях Intel, а окончательная сборка и интеграция серверов также осуществлялись в США.

Производство чипов Asimov будет передано TSMC, хотя команда намерена сохранить как можно большую часть оставшейся части производственной цепочки в США, в зависимости от мощностей литейного завода.

Геополитическая устойчивость и стабильность цепочки поставок становятся ключевыми критериями покупки для многих клиентов — еще одна причина, по которой Positron считает, что ее оборудование, произведенное в США, представляет собой убедительную альтернативу.

Что дальше?

Агравал отметил, что кремниевые решения Positron нацелены не только на широкую совместимость, но и на максимальную полезность для предприятий, облачных сред и исследовательских лабораторий.

Хотя компания пока не назвала ни одного поставщика передовых моделей в качестве клиентов, он подтвердил, что ведется работа и переговоры.

Агравал подчеркнул, что продажа физической инфраструктуры, основанной на экономических показателях и производительности, а не ее объединение с собственными API или бизнес-моделями, является частью того, что обеспечивает Positron доверие на скептически настроенном рынке.

«Если вы не можете убедить клиента использовать ваше оборудование с экономической точки зрения, вы не будете прибыльны», — сказал он.

Источник: venturebeat.com

✅ Найденные теги: Positron, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых