Архив рубрики ~Лента новостей~

OpenAI и Broadcom представили оптимизированный для LLM чип для выполнения инференции | OpenAI

OpenAI и Broadcom представили оптимизированный для LLM чип для выполнения инференции | OpenAI
OpenAI и Broadcom представили оптимизированный для LLM чип для выполнения инференции | OpenAI

  • Разработана как лучшая платформа для вывода информации для магистерских программ.
  • Запуск проекта занял девять месяцев, что было ускорено благодаря моделям OpenAI.
  • Создание многопоколенной платформы совместно с партнерами.
  • Сделать передовые технологии искусственного интеллекта более доступными для широкого круга пользователей.

Оглавление

  • Разработана как лучшая платформа для вывода информации для магистерских программ.
  • Запуск проекта занял девять месяцев, что было ускорено благодаря моделям OpenAI.
  • Создание многопоколенной платформы совместно с партнерами.
  • Сделать передовые технологии искусственного интеллекта более доступными для широкого круга пользователей.
  • Предварительные испытания показывают, что ускоритель первого поколения обеспечит значительно более высокую производительность на ватт, чем современные передовые технологии.
  • Разработано с нуля для существующих и будущих программ магистратуры в области права в различных отраслях.
  • Разработка от проектирования до производства заняла девять месяцев, чему способствовали модели OpenAI.
  • Расширяет полнофункциональную платформу OpenAI, от продуктов до моделей и теперь до микросхем.
  • Планируется развертывание в масштабах гигаватт совместно с партнерами по центрам обработки данных в течение нескольких поколений.

Сегодня компании OpenAI и Broadcom (NASDAQ: AVGO) представили Jalapeño, первый интеллектуальный процессор OpenAI: акселератор, разработанный в соответствии с видением OpenAI будущего обработки данных с использованием линейных моделей машинного обучения, и первый акселератор ИИ в многопоколенной вычислительной платформе, которую компании создают совместно, чтобы сделать передовой ИИ быстрее, надежнее и доступнее для большего числа людей.

Перец халапеньо был передан генеральному директору OpenAI Сэму Альтману и президенту Грегу Брокману президентом и генеральным директором Broadcom Хоком Таном и президентом Чарли Каввасом, что знаменует собой важный шаг в стратегии OpenAI по созданию полного стека технологий, лежащих в основе ее моделей и продуктов.

Компания OpenAI разработала чип с нуля, опираясь на глубокое понимание основ LLM, а также на свою дорожную карту моделей, ядер, систем обслуживания и потребностей продукта, совместно с партнерами Broadcom и Celestica, что помогло внедрить платформу в промышленность посредством реализации чипа, интеграции плат и стоечных систем, высокопроизводительных сетей и масштабируемых производственных систем. Jalapeño разработан с учетом гибкости для работы со всеми LLM, руководствуясь знаниями OpenAI о потребностях в выводе данных для текущих и будущих моделей ИИ в отрасли. Инженерные образцы чипа Jalapeño работают в лаборатории с задачами машинного обучения на целевой частоте и энергопотреблении, включая GPT‑5.3‑Codex‑Spark.

Хотя OpenAI всё ещё измеряет окончательную производительность, предварительные тесты показывают, что Jalapeño обеспечит производительность на ватт значительно лучше, чем современные передовые технологии. Подробный технический отчёт о производительности будет представлен в ближайшие месяцы. Архитектура уменьшает перемещение данных и балансирует вычислительные, запоминающие и сетевые ресурсы для достижения фактического использования, гораздо более близкого к теоретической пиковой производительности. Реализация микросхем и сетевые технологии Broadcom, включая сетевые микросхемы Tomahawk, помогают вывести платформу на крупномасштабный производственный уровень.

«Мир движется к экономике, основанной на вычислительных ресурсах», — сказал Грег Брокман, президент и соучредитель OpenAI. «Jalapeño является частью нашей долгосрочной стратегии развития комплексной инфраструктуры, направленной на увеличение доступности вычислительных ресурсов, что приведет к созданию более быстрого, надежного и доступного для людей и предприятий ИИ, который сможет решать более важные задачи. Разрабатывая большую часть стека самостоятельно, мы можем предоставлять больше интеллектуальных решений с большей эффективностью и продолжать продвигать передовой ИИ к более широкому доступу».

«Jalapeño был разработан с нуля для выполнения задач LLM с использованием подробных данных, полученных в ходе нашего тесного сотрудничества с исследователями OpenAI», — сказал Ричард Хо, руководитель программы OpenAI по аппаратному обеспечению. «Мы оптимизировали архитектуру, учитывая ядра, перемещение памяти, сетевые возможности и шаблоны обслуживания, которые наиболее важны для передовых моделей ИИ. Судя по предварительным тестам, Jalapeño будет эффективно выполнять наши наиболее важные рабочие нагрузки, работая на уровне, близком к теоретическим пределам возможностей оборудования».

«Наше сотрудничество с OpenAI представляет собой фундаментальное обязательство по масштабированию физической инфраструктуры, необходимой для следующего десятилетия развития ИИ», — сказал Хок Тан, президент и генеральный директор Broadcom. «Это только начало многопоколенной дорожной карты. Благодаря совместной разработке наших передовых микросхем непосредственно с OpenAI мы обеспечиваем развертывание центров обработки данных гигаваттного масштаба совместно с Microsoft и другими партнерами, начиная с 2026 года».

Разработана как лучшая платформа для вывода информации для магистерских программ.

Jalapeño — это совершенно новая разработка для современных задач вывода LLM, а не универсальный ускоритель, адаптированный из более ранних рабочих нагрузок ИИ. Он создан на основе систем, которые OpenAI использует ежедневно в ChatGPT, Codex, API и будущих агентных продуктах, а также разработан для текущих и будущих LLM в отрасли. Цель состоит в том, чтобы объединить мощность и пропускную способность ведущих современных ускорителей ИИ с задержкой, близкой к самым быстрым специализированным системам вывода, что делает Jalapeño хорошо подходящим для интерактивных продуктов LLM в масштабе предприятия.

В этом и заключается преимущество комплексного подхода. OpenAI не только разрабатывает передовые модели или создает на их основе продукты; компания проектирует инфраструктуру под ними: архитектуру чипов, ядра, системы памяти, сети, планирование, системы развертывания и пользовательский опыт. Поскольку OpenAI работает на всех уровнях, каждый слой может быть оптимизирован для достижения одной и той же цели: сделать свои модели быстрее, надежнее и доступнее для пользователей.

Халапеньо усиливает движущую силу прогресса OpenAI. Улучшенная инфраструктура повышает эффективность вычислений. Более высокая эффективность вычислений позволяет улучшить обучение и обслуживание, что в конечном итоге приводит к созданию более совершенных моделей ИИ. Лучшие модели становятся лучшими продуктами для людей, разработчиков и бизнеса. Лучшие продукты приводят к большему использованию, большему количеству клиентов и большему доходу, что позволяет OpenAI реинвестировать в следующее поколение инфраструктуры. Со временем этот цикл помогает сделать интеллект более эффективным, более надежным и менее затратным для всех.

Запуск проекта занял девять месяцев, что было ускорено благодаря моделям OpenAI.

Разработка Jalapeño, от первоначального проектирования до выпуска в производство, заняла всего девять месяцев, а программа ускорения разработки на основе искусственного интеллекта, по нашему мнению, представляет собой самый быстрый цикл разработки ASIC, когда-либо достигнутый в высокопроизводительных передовых полупроводниковых технологиях. Эта скорость отражает глубокое сотрудничество в разработке программного и аппаратного обеспечения с инженерными группами OpenAI, опыт Broadcom в реализации микросхем и использование моделей OpenAI для ускорения отдельных этапов процесса проектирования и оптимизации.

Те же самые модели, которые предоставляются пользователям, помогают улучшать инфраструктуру, используемую для запуска будущих моделей. Если ИИ сможет помочь инженерам быстрее проектировать более совершенные чипы, он сможет снизить стоимость вычислительных ресурсов во всей отрасли и способствовать демократизации доступа к передовым технологиям ИИ.

Создание многопоколенной платформы совместно с партнерами.

Jalapeño — это первый шаг в создании многопоколенной вычислительной платформы, предназначенной для первоначального развертывания к концу 2026 года и расширения в последующие годы. Она сочетает в себе разработанные OpenAI ускорители с технологиями реализации, сетевого оборудования и подключения от Broadcom, а также опытом Celestica в области плат, стоек и систем.

Сделать передовые технологии искусственного интеллекта более доступными для широкого круга пользователей.

Суть этой работы проста: вывод информации — это то, как ИИ достигает людей. Каждое улучшение в плане стоимости, скорости и надежности может проявиться в виде более быстрого ответа в ChatGPT, задачи Codex, которая может выполнять больше шагов с меньшим временем ожидания, более дешевого в разработке API-продукта или более надежного доступа при высоком спросе.

Демократизация ИИ означает обеспечение доступности, надежности и приемлемой стоимости передовых моделей для ежедневного использования всё большим количеством людей. Jalapeño помогает OpenAI преобразовывать большую часть своей инфраструктуры в полезный интеллект для студентов, разработчиков, малых предприятий, исследователей, крупных компаний и всех, кто пытается учиться, создавать или решать сложные задачи.

Источник: openai.com

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Обо всем~ Скидка на этот превосходный OLED-телевизор — это лучшее предложение, которое я нашел до сих пор, если сравнивать с ценой в Prime Day. Новости робототехники GM устанавливает роботов на своем флагманском заводе по производству электромобилей после увольнения 1300 сотрудников. Новости робототехники Mantis Robotics запускает робота двумя руками и без ограждения Новости робототехники Производитель гуманоидов Agility Robotics выйдет на рынок в результате слияния со SPAC Новости робототехники [Перевод] Как , пробежал полумарафон быстрее человека Новости робототехники Сами читают статьи и ставят видеокарты: Nvidia показала самообучающихся роботов ENPIRE Новости робототехники Роботы-уборщики с искусственным интеллектом покидают лаборатории и отправляются в гостиные Китая. Новости робототехники ExRobotics запускает сертифицированную UL инспекционную роботу для программной среды Новости робототехники Первая роботизированная буровая установка на материковой части России создана на базе российских программных продуктов IR-ПАК и IR-OPERBOT от РИГИНТЕЛ Архив рубрики ~Коротко из Telegram~ Google запускает собственную «мини-Википедию» для блогеров и создателей контента. Компания… Архив рубрики ~Коротко из Telegram~ Водители Tesla научились обманывать камеру слежения в салоне головой пластиковой… Архив рубрики ~Коротко из Telegram~ Главная компания ИИ-гонки не выпускает ни моделей, ни чипов ASML… Архив рубрики ~Коротко из Telegram~ DeepSeek-V4-Flash раздают бесплатно по API DeepSeek-V4-Flash временно открыли для бесплатного… Архив рубрики ~Коротко из Telegram~ ИИ помогает работать — и незаметно отучает работать самому Nature… Архив рубрики ~Обо всем~ Скидка на этот превосходный OLED-телевизор — это лучшее предложение, которое я нашел до сих пор, если сравнивать с ценой в Prime Day. Новости робототехники GM устанавливает роботов на своем флагманском заводе по производству электромобилей после увольнения 1300 сотрудников. Новости робототехники Mantis Robotics запускает робота двумя руками и без ограждения Новости робототехники Производитель гуманоидов Agility Robotics выйдет на рынок в результате слияния со SPAC Новости робототехники [Перевод] Как , пробежал полумарафон быстрее человека Новости робототехники Сами читают статьи и ставят видеокарты: Nvidia показала самообучающихся роботов ENPIRE Новости робототехники Роботы-уборщики с искусственным интеллектом покидают лаборатории и отправляются в гостиные Китая. Новости робототехники ExRobotics запускает сертифицированную UL инспекционную роботу для программной среды Новости робототехники Первая роботизированная буровая установка на материковой части России создана на базе российских программных продуктов IR-ПАК и IR-OPERBOT от РИГИНТЕЛ Архив рубрики ~Коротко из Telegram~ Google запускает собственную «мини-Википедию» для блогеров и создателей контента. Компания… Архив рубрики ~Коротко из Telegram~ Водители Tesla научились обманывать камеру слежения в салоне головой пластиковой… Архив рубрики ~Коротко из Telegram~ Главная компания ИИ-гонки не выпускает ни моделей, ни чипов ASML… Архив рубрики ~Коротко из Telegram~ DeepSeek-V4-Flash раздают бесплатно по API DeepSeek-V4-Flash временно открыли для бесплатного… Архив рубрики ~Коротко из Telegram~ ИИ помогает работать — и незаметно отучает работать самому Nature…

Оставить комментарий