🐈 OpenAI представила GPT-5.3-Codex-Spark — облегчённую версию GPT-5.3-Codex и первую…
🐈 OpenAI представила GPT-5.3-Codex-Spark — облегчённую версию GPT-5.3-Codex и первую модель для программирования в реальном времени внутри Codex. Она оптимизирована под ультранизкую задержку и работает на ускорителях Cerebras (Wafer Scale Engine 3), выдавая более 1000 токенов в секунду. Модель доступна в исследовательском превью для пользователей ChatGPT Pro, поддерживает текстовый режим с контекстом 128k и ориентирована на мгновенные правки, быстрые итерации и интерактивную работу без «тяжёлых» фоновых процессов по умолчанию.
📁 В бенчмарках SWE-Bench Pro и Terminal-Bench 2.0 она показывает высокую эффективность при существенно меньшем времени выполнения по сравнению с GPT-5.3-Codex. Параллельно OpenAI переписала часть инфраструктуры: WebSocket по умолчанию, −80% накладных расходов на обмен клиент-сервер, −50% времени до первого токена. GPU остаются базой, а Cerebras добавляет режим минимальной задержки — вместе это формирует гибридную архитектуру для разных сценариев разработки.
❓ Если скорость отклика становится главным ограничением в работе с ИИ, не изменит ли сверхбыстрый инференс сам стиль программирования — от «ждать ответа» к полноценному диалогу с кодом в реальном времени?
#полезное


Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.