Image

Positron считает, что нашла секрет, позволяющий конкурировать с Nvidia в области чипов для вывода ИИ. Вот как это может принести пользу предприятиям.

c16e2e4dffa2ef590f1671dc9c5d7455

Хотите получать более ценную информацию? Подпишитесь на наши еженедельные рассылки, чтобы получать только то, что важно для руководителей в сфере корпоративного ИИ, данных и безопасности. Подпишитесь сейчас

В связи с резким ростом спроса на масштабное развертывание систем искусственного интеллекта малоизвестный частный стартап Positron позиционирует себя в качестве прямого конкурента лидеру рынка Nvidia, предлагая специализированные энергоэффективные чипы вывода с оптимизированным объемом памяти, призванные устранить растущие узкие места в отрасли, связанные с затратами, энергопотреблением и доступностью.

«Наше ключевое отличие — это способность запускать передовые модели ИИ с более высокой эффективностью, достигая производительности в 2–5 раз выше на ватт и доллар по сравнению с Nvidia», — заявил Томас Сохмерс, соучредитель и технический директор Positron, в недавнем видеоинтервью с VentureBeat.

Очевидно, это хорошая новость для крупных поставщиков моделей ИИ, но руководство Positron утверждает, что это полезно и для многих других предприятий, включая те, которые используют модели ИИ в своих рабочих процессах, а не в качестве услуг, предлагаемых клиентам.

«Мы создаем чипы, которые можно развернуть в сотнях существующих центров обработки данных, поскольку им не требуется жидкостное охлаждение или экстремальная плотность мощности», — отметил Митеш Агравал, генеральный директор Positron и бывший главный операционный директор поставщика облачных решений для искусственного интеллекта Lambda , также в том же видеоинтервью с VentureBeat.

Масштабирование ИИ достигает предела

Ограничения мощности, рост стоимости токенов и задержки в выводе данных меняют корпоративный ИИ. Присоединяйтесь к нашему эксклюзивному салону, чтобы узнать, как обстоят дела у лучших команд:

  • Превращение энергии в стратегическое преимущество
  • Разработка эффективного вывода для реального увеличения пропускной способности
  • Обеспечение конкурентоспособной рентабельности инвестиций с помощью устойчивых систем ИИ

Забронируйте свое место, чтобы оставаться впереди : https://bit.ly/4mwGngO

Похоже, венчурные капиталисты и первые пользователи согласны.

Вчера Positron объявила о раунде финансирования серии A на сумму 51,6 млн долларов США, который возглавили Valor Equity Partners, Atreides Management и DFJ Growth при поддержке Flume Ventures, Resilience Reserve, 1517 Fund и Unless.

Что касается ранней клиентской базы Positron, то она включает как известные компании, так и компании, работающие в секторах с высокой интенсивностью обработки данных. Среди подтверждённых проектов – крупный поставщик решений для безопасности и облачного контента Cloudflare , который использует оборудование Positron Atlas в своих глобально распределённых центрах обработки данных с ограниченным энергопотреблением, и Parasail , использующий свою платформу SnapServe для инфраструктуры данных с использованием искусственного интеллекта.

Помимо этого, Positron сообщает о внедрении в нескольких ключевых областях, где критически важен эффективный вывод, таких как сетевые технологии, игры, модерация контента, сети доставки контента (CDN) и поставщики токенов как услуг .

Сообщается, что первых пользователей привлекла способность Atlas обеспечивать высокую пропускную способность и низкое энергопотребление без необходимости специального охлаждения или переработанной инфраструктуры, что делает его привлекательным вариантом для рабочих нагрузок ИИ в корпоративных средах.

Выход на сложный рынок, на котором размер модели ИИ уменьшается, а эффективность растет

Но Positron также выходит на сложный рынок. The Information только что сообщила, что конкурент — стартап Groq, специализирующийся на разработке чипов для вывода данных с помощью искусственного интеллекта (ИИ) , где Сомерс ранее занимал должность директора по технологической стратегии , — снизил свой прогноз выручки на 2025 год с более чем 2 миллиардов долларов до 500 миллионов долларов, что наглядно демонстрирует, насколько нестабильным может быть рынок ИИ-оборудования.

Даже хорошо финансируемые компании сталкиваются с трудностями, конкурируя за мощности центров обработки данных и внимание к корпоративным интересам с такими укоренившимися поставщиками графических процессоров, как Nvidia, не говоря уже о главном: появлении более эффективных и небольших больших языковых моделей (LLM) и специализированных малых языковых моделей (SLM), которые могут работать даже на таких маленьких и маломощных устройствах, как смартфоны.

Однако руководство Positron пока что принимает эту тенденцию и не обращает внимания на возможное ее влияние на траекторию своего роста.

«Эта двойственность всегда существовала: лёгкие приложения на локальных устройствах и ресурсоёмкая обработка в централизованной инфраструктуре», — сказал Агравал. «Мы считаем, что обе эти области будут развиваться».

Сомерс согласился, заявив: «Мы видим будущее, в котором у каждого человека может быть работоспособная модель на его телефоне, но они по-прежнему будут полагаться на большие модели в центрах обработки данных для получения более глубокого понимания».

Atlas — это чип искусственного интеллекта, ориентированный на вывод данных.

Хотя графические процессоры Nvidia способствовали бурному развитию глубокого обучения, ускоряя обучение моделей, Positron утверждает, что вывод — этап, на котором модели генерируют выходные данные в процессе производства, — теперь является настоящим узким местом.

Его основатели называют его самой недооптимизированной частью «стека ИИ», особенно для генеративных рабочих нагрузок ИИ, которые зависят от быстрого и эффективного обслуживания моделей.

Решение Positron — Atlas, ускоритель вывода первого поколения, специально созданный для работы с большими моделями трансформаторов.

В отличие от графических процессоров общего назначения, Atlas оптимизирован под уникальные потребности в памяти и пропускной способности современных задач вывода.

Компания утверждает, что Atlas обеспечивает в 3,5 раза более высокую производительность на доллар и на 66% меньше энергопотребления, чем Nvidia H100, а также достигает 93% использования пропускной способности памяти — намного выше типичного диапазона 10–30%, наблюдаемого в графических процессорах.

От Atlas до Titan, поддержка моделей с несколькими триллионами параметров

Запущенный всего через 15 месяцев после основания и с начальным капиталом всего в 12,5 млн долларов, Atlas уже поставляется и находится в производстве.

Система поддерживает до 0,5 триллиона параметров моделей на одном сервере мощностью 2 кВт и совместима с моделями трансформаторов Hugging Face через конечную точку, совместимую с API OpenAI.

Сейчас Positron готовится запустить в 2026 году платформу следующего поколения Titan.

Titan, созданный на основе специально разработанного кремния «Asimov», будет иметь до двух терабайт высокоскоростной памяти на каждый ускоритель и поддерживать модели с объемом до 16 триллионов параметров .

Современные передовые модели охватывают сотни миллиардов и однозначные триллионы параметров, но предполагается, что более новые модели, такие как GPT-5 от OpenAI, охватывают несколько триллионов параметров, и в настоящее время считается, что для достижения общего искусственного интеллекта (ОИИ) — ИИ, превосходящего людей в большинстве экономически ценных задач, и сверхинтеллекта — ИИ, превосходящего человеческие возможности по пониманию и контролю.

Важно отметить, что Titan предназначен для работы со стандартным воздушным охлаждением в обычных условиях центров обработки данных, избегая конфигураций с высокой плотностью и жидкостным охлаждением, которые все чаще требуются графическим процессорам следующего поколения.

Проектирование для эффективности и совместимости

С самого начала Positron проектировала свою систему как готовую замену, позволяющую клиентам использовать существующие двоичные файлы моделей без переписывания кода.

«Если клиенту приходилось каким-либо образом менять свое поведение или действия, это становилось препятствием», — сказал Сомерс.

Сомерс объяснил, что вместо того, чтобы разрабатывать сложный стек компиляторов или перестраивать программные экосистемы, Positron сосредоточился на выводе, разрабатывая оборудование, которое напрямую использует обученные Nvidia модели.

«CUDA Mode — это не то, с чем нужно бороться, — сказал Агравал. — Это экосистема, в которой нужно участвовать».

Этот прагматичный подход помог компании быстро выпустить свой первый продукт, проверить производительность на реальных корпоративных пользователях и привлечь значительные последующие инвестиции. Кроме того, ориентация на воздушное охлаждение вместо жидкостного делает чипы Atlas единственным вариантом для некоторых развертываний.

«Мы полностью сосредоточены на развертываниях с исключительно воздушным охлаждением… все эти будущие решения на базе Nvidia Hopper и Blackwell требуют жидкостного охлаждения … Единственное место, где можно разместить эти стойки, — это центры обработки данных, которые сейчас строятся в глуши», — сказал Сомерс.

В целом способность Positron действовать быстро и эффективно с точки зрения капиталовложений помогла ей выделиться на переполненном рынке оборудования для ИИ.

Память — это то, что вам нужно

Сомерс и Агравал указывают на фундаментальный сдвиг в рабочих нагрузках ИИ: от сверточных нейронных сетей с ограничением вычислительных мощностей к архитектурам преобразователей с ограничением памяти.

В то время как старые модели требовали большого количества операций с плавающей точкой (FLOP), современным трансформаторам для эффективной работы требуется огромный объем памяти и пропускная способность.

В то время как Nvidia и другие продолжают концентрироваться на масштабировании вычислений, Positron делает ставку на дизайн, ориентированный в первую очередь на память.

Сомерс отметил, что при использовании преобразователя соотношение вычислительных операций и операций с памятью меняется практически до 1:1, а это означает, что повышение использования памяти оказывает прямое и существенное влияние на производительность и энергоэффективность.

Поскольку Atlas уже превосходит современные графические процессоры по ключевым показателям эффективности, Titan намерен пойти еще дальше, предлагая самый высокий в отрасли объем памяти на чип.

Ожидается, что на момент запуска Titan обеспечит прирост производительности по сравнению с типичными конфигурациями памяти GPU — без необходимости специализированного охлаждения или сложных сетевых настроек.

Чипы, произведенные в США

Компания Positron гордится тем, что её производственный конвейер расположен в США. Чипы первого поколения компании производились в США на предприятиях Intel, а окончательная сборка и интеграция серверов также осуществлялись в США.

Производство чипов Asimov будет передано TSMC, хотя команда намерена сохранить как можно большую часть оставшейся части производственной цепочки в США, в зависимости от мощностей литейного завода.

Геополитическая устойчивость и стабильность цепочки поставок становятся ключевыми критериями покупки для многих клиентов — еще одна причина, по которой Positron считает, что ее оборудование, произведенное в США, представляет собой убедительную альтернативу.

Что дальше?

Агравал отметил, что кремниевые решения Positron нацелены не только на широкую совместимость, но и на максимальную полезность для предприятий, облачных сред и исследовательских лабораторий.

Хотя компания пока не назвала ни одного поставщика передовых моделей в качестве клиентов, он подтвердил, что ведется работа и переговоры.

Агравал подчеркнул, что продажа физической инфраструктуры, основанной на экономических показателях и производительности, а не ее объединение с собственными API или бизнес-моделями, является частью того, что обеспечивает Positron доверие на скептически настроенном рынке.

«Если вы не можете убедить клиента использовать ваше оборудование с экономической точки зрения, вы не будете прибыльны», — сказал он.

Источник: venturebeat.com

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…
Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.
dummy-img
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Image Not Found
Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Вкратце Опубликовано: Изображение предоставлено: Thos Robinson/Getty Images для The New York Times (откроется в новом окне) Джули Борт Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.…

Апр 21, 2026
dummy-img

Как почистить виниловые пластинки (2026): пылесос, ультразвук, чистящий раствор, щетка.

Эти щелчки и треск недопустимы. Приведите свою музыку в порядок с помощью этого удобного руководства. Источник: www.wired.com

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых