🐈 OpenAI представила GPT-5.3-Codex-Spark — облегчённую версию GPT-5.3-Codex и первую…
🐈 OpenAI представила GPT-5.3-Codex-Spark — облегчённую версию GPT-5.3-Codex и первую модель для программирования в реальном времени внутри Codex. Она оптимизирована под ультранизкую задержку и работает на ускорителях Cerebras (Wafer Scale Engine 3), выдавая более 1000 токенов в секунду. Модель доступна в исследовательском превью для пользователей ChatGPT Pro, поддерживает текстовый режим с контекстом 128k и ориентирована на мгновенные правки, быстрые итерации и интерактивную работу без «тяжёлых» фоновых процессов по умолчанию.
📁 В бенчмарках SWE-Bench Pro и Terminal-Bench 2.0 она показывает высокую эффективность при существенно меньшем времени выполнения по сравнению с GPT-5.3-Codex. Параллельно OpenAI переписала часть инфраструктуры: WebSocket по умолчанию, −80% накладных расходов на обмен клиент-сервер, −50% времени до первого токена. GPU остаются базой, а Cerebras добавляет режим минимальной задержки — вместе это формирует гибридную архитектуру для разных сценариев разработки.
❓ Если скорость отклика становится главным ограничением в работе с ИИ, не изменит ли сверхбыстрый инференс сам стиль программирования — от «ждать ответа» к полноценному диалогу с кодом в реальном времени?
#полезное
Оцените материал:
Похожие записи
Claude Haiku 4.5 — компактная, быстрая и точная модель от…
20.10.2025
Диаграммы и схемы из ЛЮБОГО документа — нашли нейронку Fluig…
04.08.2025
Теперь камера не просто фиксирует движение, а понимает, что происходит…
06.01.2026Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
