Архив рубрики ~Коротко из Telegram~

Ловушка для Nvidia: OpenAI показала свой первый чип Jalapeno Помните…

Ловушка для Nvidia: OpenAI показала свой первый чип Jalapeno Помните…
File 2692

Ловушка для Nvidia: OpenAI показала свой первый чип Jalapeno

Помните мой пост про Токенопокалипсис? Так вот, OpenAI несколько дней назад сделала первый шаг к выходу из этой ловушки. 24 июня OpenAI и Broadcom официально представили Jalapeno — первый кастомный чип компании. И название тут не случайное. Острый халапеньо летит прямо в лицо Nvidia.

Но начну с контекста, потому что без него вся история не будет работать.
В посте про Токенопокалипсис я показывал пирамиду ИИ-индустрии. Снизу я указывал реальных хозяев кремния (TSMC, ASML, SK Hynix). Выше уже Nvidia, которая сама ничего не производит, но продает GPU по космическим ценам. Еще выше идут OpenAI, Anthropic и Google, которые сжигают по $40–50 млрд в год на закупку этого железа. И все это тянется деньгами обычных пользователей и венчурных фондов.

В 2025 году OpenAI потратила около $14 млрд только на то, чтобы запускать уже обученные модели и отвечать на запросы в ChatGPT и Codex. Это называется инференс. Не обучение новых моделей, а просто обслуживание текущих. $14 миллиардов в год за то, чтобы нейронка могла выдавать нам ответы.

Jalapeno создавался именно под эту задачу.

Этот чип, это ASIC (специализированная микросхема, заточенная под одну задачу):
максимально быстро и дешево крутить готовые языковые модели.
OpenAI изучила, как работают её алгоритмы изнутри, убрала все лишнее и построила архитектуру под свои нужды.
Инсайдеры из Tom's Hardware раскопали технические детали: "Халапеньо", это огромный кремниевый кристалл площадью 840 мм², что почти равняется физическому пределу современных литографических систем EUV. На этот гигантский чип установили 6 модулей сверхбыстрой памяти HBM и сетевую логику Tomahawk от Broadcom. А сделали это для того, чтобы полностью убрать задержки при передаче данных между памятью и процессором.

В закрытых лабораториях OpenAI инженерные образцы Jalapeno уже вовсю гоняют внутренние нейросетевые нагрузки, проверяя архитектуру на прочность. По официальным данным компании, точные цифры энергопотребления отдельного кристалла пока держат в секрете до публикации финальных бенчмарков, но результаты ранних тестов уже подтверждают, что за счет вырезания лишней универсальной логики, чип выдает рекордную энергоэффективность.

Процессор тратит значительно меньше ватт на генерацию токенов и обещает до 50% экономии на обслуживании моделей по сравнению с текущими моделями конкурентов. Самое безумное в том, что весь цикл от первых чертежей до готового кремния занял всего 9 месяцев, хотя обычно разработка таких сложных ASIC-систем длится годами. Секрет бешеной скорости прост:
OpenAI использовала свои собственные языковые модели для оптимизации и проектирования схем. Чип в буквальном смысле помог спроектировать сам себя.
Самое неочевидное в этой истории то, что OpenAI официально зашла в клуб компаний со своим кремнием. У Google есть TPUs, у Amazon чипы Trainium, у Microsoft — Maia, у Meta серия MTIA. Как отмечает издание Indian Express, когда 5 крупнейших покупателей Nvidia одновременно строят аналог, то это уже не диверсификация рисков. Это жесткий системный вызов монополии Дженсена Хуанга.

Но не думайте, что чипы появятся в дата-центрах завтра. Первые небольшие поставки начнутся в конце 2026 года. Полноценное развертывание в гигаваттных масштабах совместно с Microsoft запланировано на 2027–2028 годы. Финансовые отчеты на инвесторском портале Broadcom подтверждают: компания готовит под этот проект колоссальные объемы производства для обеспечения контракта по развертыванию мощностей.

Кто следующий выпустит свой чип? Ставлю на Anthropic до конца года.

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Лента новостей~ Компания Rocket Lab продолжает серию приобретений, купив спутниковую компанию Iridium. Архив рубрики ~Лента новостей~ Как мы построили сервис компьютерного зрения на базе внешних VLM для контроля выкладки и ценников: опыт Fix Price Архив рубрики ~Лента новостей~ Решения «Базиса» легли в основу системы умного энергоучета РусГидро в облаке МегаФона Архив рубрики ~Лента новостей~ xFusion масштабирует корпоративный ИИ от периферийных рабочих станций до центров обработки данных с жидкостным охлаждением. Архив рубрики ~Лента новостей~ Я устал платить за зарубежные транскрибаторы и собрал своего бота за час, который сам заходит в Яндекс Телемост Архив рубрики ~Лента новостей~ Перспективы ИИ в России: снова на исходной позиции, как и 100 лет назад (про политику) Архив рубрики ~Лента новостей~ АЧХ — это ширма. Что скрывается за ровной кривой? Новости робототехники Перкуссионный массажер разорвал сетчатку молодому британцу. Мужчина использовал его непосредственно на глазах Архив рубрики ~Лента новостей~ Уимблдон 2026: расписание, как смотреть теннисный турнир из любой точки мира. Архив рубрики ~Лента новостей~ 5 ошибок в хедшоте, которые дорого обходятся вам на собеседованиях Архив рубрики ~Лента новостей~ Попросили Claude создать WCAG-доступный DataPicker на React и потратили 3 дня на доработки Архив рубрики ~Лента новостей~ Яндекс открыл доступ к «Трекеру», «Вики» и «Формам» по модели on-premises Новости робототехники В Китае, на Западном искусственном острове в провинции Гуандун, откроют… Архив рубрики ~Лента новостей~ Scam.ai объявляет о партнерстве с Qualcomm и запускает модель обнаружения дипфейков Halo на выставке Computex 2026. Архив рубрики ~Лента новостей~ Компания Rocket Lab продолжает серию приобретений, купив спутниковую компанию Iridium. Архив рубрики ~Лента новостей~ Как мы построили сервис компьютерного зрения на базе внешних VLM для контроля выкладки и ценников: опыт Fix Price Архив рубрики ~Лента новостей~ Решения «Базиса» легли в основу системы умного энергоучета РусГидро в облаке МегаФона Архив рубрики ~Лента новостей~ xFusion масштабирует корпоративный ИИ от периферийных рабочих станций до центров обработки данных с жидкостным охлаждением. Архив рубрики ~Лента новостей~ Я устал платить за зарубежные транскрибаторы и собрал своего бота за час, который сам заходит в Яндекс Телемост Архив рубрики ~Лента новостей~ Перспективы ИИ в России: снова на исходной позиции, как и 100 лет назад (про политику) Архив рубрики ~Лента новостей~ АЧХ — это ширма. Что скрывается за ровной кривой? Новости робототехники Перкуссионный массажер разорвал сетчатку молодому британцу. Мужчина использовал его непосредственно на глазах Архив рубрики ~Лента новостей~ Уимблдон 2026: расписание, как смотреть теннисный турнир из любой точки мира. Архив рубрики ~Лента новостей~ 5 ошибок в хедшоте, которые дорого обходятся вам на собеседованиях Архив рубрики ~Лента новостей~ Попросили Claude создать WCAG-доступный DataPicker на React и потратили 3 дня на доработки Архив рубрики ~Лента новостей~ Яндекс открыл доступ к «Трекеру», «Вики» и «Формам» по модели on-premises Новости робототехники В Китае, на Западном искусственном острове в провинции Гуандун, откроют… Архив рубрики ~Лента новостей~ Scam.ai объявляет о партнерстве с Qualcomm и запускает модель обнаружения дипфейков Halo на выставке Computex 2026.

Оставить комментарий