
Хотите получать более ценную информацию? Подпишитесь на наши еженедельные рассылки, чтобы получать только то, что важно для руководителей в сфере корпоративного ИИ, данных и безопасности. Подпишитесь сейчас
В связи с резким ростом спроса на масштабное развертывание систем искусственного интеллекта малоизвестный частный стартап Positron позиционирует себя в качестве прямого конкурента лидеру рынка Nvidia, предлагая специализированные энергоэффективные чипы вывода с оптимизированным объемом памяти, призванные устранить растущие узкие места в отрасли, связанные с затратами, энергопотреблением и доступностью.
«Наше ключевое отличие — это способность запускать передовые модели ИИ с более высокой эффективностью, достигая производительности в 2–5 раз выше на ватт и доллар по сравнению с Nvidia», — заявил Томас Сохмерс, соучредитель и технический директор Positron, в недавнем видеоинтервью с VentureBeat.
Очевидно, это хорошая новость для крупных поставщиков моделей ИИ, но руководство Positron утверждает, что это полезно и для многих других предприятий, включая те, которые используют модели ИИ в своих рабочих процессах, а не в качестве услуг, предлагаемых клиентам.
«Мы создаем чипы, которые можно развернуть в сотнях существующих центров обработки данных, поскольку им не требуется жидкостное охлаждение или экстремальная плотность мощности», — отметил Митеш Агравал, генеральный директор Positron и бывший главный операционный директор поставщика облачных решений для искусственного интеллекта Lambda , также в том же видеоинтервью с VentureBeat.
Масштабирование ИИ достигает предела
Ограничения мощности, рост стоимости токенов и задержки в выводе данных меняют корпоративный ИИ. Присоединяйтесь к нашему эксклюзивному салону, чтобы узнать, как обстоят дела у лучших команд:
- Превращение энергии в стратегическое преимущество
- Разработка эффективного вывода для реального увеличения пропускной способности
- Обеспечение конкурентоспособной рентабельности инвестиций с помощью устойчивых систем ИИ
Забронируйте свое место, чтобы оставаться впереди : https://bit.ly/4mwGngO
Похоже, венчурные капиталисты и первые пользователи согласны.
Вчера Positron объявила о раунде финансирования серии A на сумму 51,6 млн долларов США, который возглавили Valor Equity Partners, Atreides Management и DFJ Growth при поддержке Flume Ventures, Resilience Reserve, 1517 Fund и Unless.
Что касается ранней клиентской базы Positron, то она включает как известные компании, так и компании, работающие в секторах с высокой интенсивностью обработки данных. Среди подтверждённых проектов – крупный поставщик решений для безопасности и облачного контента Cloudflare , который использует оборудование Positron Atlas в своих глобально распределённых центрах обработки данных с ограниченным энергопотреблением, и Parasail , использующий свою платформу SnapServe для инфраструктуры данных с использованием искусственного интеллекта.
Помимо этого, Positron сообщает о внедрении в нескольких ключевых областях, где критически важен эффективный вывод, таких как сетевые технологии, игры, модерация контента, сети доставки контента (CDN) и поставщики токенов как услуг .
Сообщается, что первых пользователей привлекла способность Atlas обеспечивать высокую пропускную способность и низкое энергопотребление без необходимости специального охлаждения или переработанной инфраструктуры, что делает его привлекательным вариантом для рабочих нагрузок ИИ в корпоративных средах.
Выход на сложный рынок, на котором размер модели ИИ уменьшается, а эффективность растет
Но Positron также выходит на сложный рынок. The Information только что сообщила, что конкурент — стартап Groq, специализирующийся на разработке чипов для вывода данных с помощью искусственного интеллекта (ИИ) , где Сомерс ранее занимал должность директора по технологической стратегии , — снизил свой прогноз выручки на 2025 год с более чем 2 миллиардов долларов до 500 миллионов долларов, что наглядно демонстрирует, насколько нестабильным может быть рынок ИИ-оборудования.
Даже хорошо финансируемые компании сталкиваются с трудностями, конкурируя за мощности центров обработки данных и внимание к корпоративным интересам с такими укоренившимися поставщиками графических процессоров, как Nvidia, не говоря уже о главном: появлении более эффективных и небольших больших языковых моделей (LLM) и специализированных малых языковых моделей (SLM), которые могут работать даже на таких маленьких и маломощных устройствах, как смартфоны.
Однако руководство Positron пока что принимает эту тенденцию и не обращает внимания на возможное ее влияние на траекторию своего роста.
«Эта двойственность всегда существовала: лёгкие приложения на локальных устройствах и ресурсоёмкая обработка в централизованной инфраструктуре», — сказал Агравал. «Мы считаем, что обе эти области будут развиваться».
Сомерс согласился, заявив: «Мы видим будущее, в котором у каждого человека может быть работоспособная модель на его телефоне, но они по-прежнему будут полагаться на большие модели в центрах обработки данных для получения более глубокого понимания».
Atlas — это чип искусственного интеллекта, ориентированный на вывод данных.
Хотя графические процессоры Nvidia способствовали бурному развитию глубокого обучения, ускоряя обучение моделей, Positron утверждает, что вывод — этап, на котором модели генерируют выходные данные в процессе производства, — теперь является настоящим узким местом.
Его основатели называют его самой недооптимизированной частью «стека ИИ», особенно для генеративных рабочих нагрузок ИИ, которые зависят от быстрого и эффективного обслуживания моделей.
Решение Positron — Atlas, ускоритель вывода первого поколения, специально созданный для работы с большими моделями трансформаторов.
В отличие от графических процессоров общего назначения, Atlas оптимизирован под уникальные потребности в памяти и пропускной способности современных задач вывода.
Компания утверждает, что Atlas обеспечивает в 3,5 раза более высокую производительность на доллар и на 66% меньше энергопотребления, чем Nvidia H100, а также достигает 93% использования пропускной способности памяти — намного выше типичного диапазона 10–30%, наблюдаемого в графических процессорах.
От Atlas до Titan, поддержка моделей с несколькими триллионами параметров
Запущенный всего через 15 месяцев после основания и с начальным капиталом всего в 12,5 млн долларов, Atlas уже поставляется и находится в производстве.
Система поддерживает до 0,5 триллиона параметров моделей на одном сервере мощностью 2 кВт и совместима с моделями трансформаторов Hugging Face через конечную точку, совместимую с API OpenAI.
Сейчас Positron готовится запустить в 2026 году платформу следующего поколения Titan.
Titan, созданный на основе специально разработанного кремния «Asimov», будет иметь до двух терабайт высокоскоростной памяти на каждый ускоритель и поддерживать модели с объемом до 16 триллионов параметров .
Современные передовые модели охватывают сотни миллиардов и однозначные триллионы параметров, но предполагается, что более новые модели, такие как GPT-5 от OpenAI, охватывают несколько триллионов параметров, и в настоящее время считается, что для достижения общего искусственного интеллекта (ОИИ) — ИИ, превосходящего людей в большинстве экономически ценных задач, и сверхинтеллекта — ИИ, превосходящего человеческие возможности по пониманию и контролю.
Важно отметить, что Titan предназначен для работы со стандартным воздушным охлаждением в обычных условиях центров обработки данных, избегая конфигураций с высокой плотностью и жидкостным охлаждением, которые все чаще требуются графическим процессорам следующего поколения.
Проектирование для эффективности и совместимости
С самого начала Positron проектировала свою систему как готовую замену, позволяющую клиентам использовать существующие двоичные файлы моделей без переписывания кода.
«Если клиенту приходилось каким-либо образом менять свое поведение или действия, это становилось препятствием», — сказал Сомерс.
Сомерс объяснил, что вместо того, чтобы разрабатывать сложный стек компиляторов или перестраивать программные экосистемы, Positron сосредоточился на выводе, разрабатывая оборудование, которое напрямую использует обученные Nvidia модели.
«CUDA Mode — это не то, с чем нужно бороться, — сказал Агравал. — Это экосистема, в которой нужно участвовать».
Этот прагматичный подход помог компании быстро выпустить свой первый продукт, проверить производительность на реальных корпоративных пользователях и привлечь значительные последующие инвестиции. Кроме того, ориентация на воздушное охлаждение вместо жидкостного делает чипы Atlas единственным вариантом для некоторых развертываний.
«Мы полностью сосредоточены на развертываниях с исключительно воздушным охлаждением… все эти будущие решения на базе Nvidia Hopper и Blackwell требуют жидкостного охлаждения … Единственное место, где можно разместить эти стойки, — это центры обработки данных, которые сейчас строятся в глуши», — сказал Сомерс.
В целом способность Positron действовать быстро и эффективно с точки зрения капиталовложений помогла ей выделиться на переполненном рынке оборудования для ИИ.
Память — это то, что вам нужно
Сомерс и Агравал указывают на фундаментальный сдвиг в рабочих нагрузках ИИ: от сверточных нейронных сетей с ограничением вычислительных мощностей к архитектурам преобразователей с ограничением памяти.
В то время как старые модели требовали большого количества операций с плавающей точкой (FLOP), современным трансформаторам для эффективной работы требуется огромный объем памяти и пропускная способность.
В то время как Nvidia и другие продолжают концентрироваться на масштабировании вычислений, Positron делает ставку на дизайн, ориентированный в первую очередь на память.
Сомерс отметил, что при использовании преобразователя соотношение вычислительных операций и операций с памятью меняется практически до 1:1, а это означает, что повышение использования памяти оказывает прямое и существенное влияние на производительность и энергоэффективность.
Поскольку Atlas уже превосходит современные графические процессоры по ключевым показателям эффективности, Titan намерен пойти еще дальше, предлагая самый высокий в отрасли объем памяти на чип.
Ожидается, что на момент запуска Titan обеспечит прирост производительности по сравнению с типичными конфигурациями памяти GPU — без необходимости специализированного охлаждения или сложных сетевых настроек.
Чипы, произведенные в США
Компания Positron гордится тем, что её производственный конвейер расположен в США. Чипы первого поколения компании производились в США на предприятиях Intel, а окончательная сборка и интеграция серверов также осуществлялись в США.
Производство чипов Asimov будет передано TSMC, хотя команда намерена сохранить как можно большую часть оставшейся части производственной цепочки в США, в зависимости от мощностей литейного завода.
Геополитическая устойчивость и стабильность цепочки поставок становятся ключевыми критериями покупки для многих клиентов — еще одна причина, по которой Positron считает, что ее оборудование, произведенное в США, представляет собой убедительную альтернативу.
Что дальше?
Агравал отметил, что кремниевые решения Positron нацелены не только на широкую совместимость, но и на максимальную полезность для предприятий, облачных сред и исследовательских лабораторий.
Хотя компания пока не назвала ни одного поставщика передовых моделей в качестве клиентов, он подтвердил, что ведется работа и переговоры.
Агравал подчеркнул, что продажа физической инфраструктуры, основанной на экономических показателях и производительности, а не ее объединение с собственными API или бизнес-моделями, является частью того, что обеспечивает Positron доверие на скептически настроенном рынке.
«Если вы не можете убедить клиента использовать ваше оборудование с экономической точки зрения, вы не будете прибыльны», — сказал он.
Источник: venturebeat.com



























