ideipro logotyp

Новости в мире ИИ: GPT-5.2 Codex, Grok Voice Agent API и VS Code Agent Skills

OpenAI представила GPT-5.2-Codex, которую называет самым продвинутым инструментом для реальной программной инженерии на сегодняшний день. Модель получила нативную поддержку сжатия контекста, улучшенную интеграцию с терминалом Windows и способность проводить глубокий рефакторинг крупных репозиториев без потери логической нити.

Ключевой апдейт коснулся сферы безопасности — Codex резко прибавил способностей в анализе защищенности кода. Модель уже доступна платным пользователям ChatGPT, а API будет открыт в ближайшие недели.

openai.com (https://openai.com/index/introducing-gpt-5-2-codex/)

xAI представила Grok Voice Agent API.

Компания Илона Маска открыла публичный доступ к Grok Voice Agent API — нативному интерфейсу speech-to-speech для создания голосовых ассистентов. Решение построено на полностью собственной архитектуре, что позволило достичь задержки ответа менее 1 секунды.

API поддерживает вызов внешних инструментов, веб-поиск, прямую интеграцию с телефонией через SIP и понимает более 100 языков. В бенчмарке Big Bench Audio модель заняла 1 место с точностью 92,3%, опередив Gemini 2.5 Flash и GPT Realtime.

Главной фишкой стала ценовая политика: единый тариф составляет $0.05 за минуту. Это значительно дешевле, чем у OpenAI и ElevenLabs.

x.ai (https://x.ai/news/grok-voice-agent-api?utm_source=tldrai)

VS Code получил поддержку стандарта Agent Skills.

В VS Code Insiders появилась поддержка Agent Skills — открытого протокола, разработанного Anthropic. Технология позволяет упаковывать инструкции, скрипты и вспомогательные ресурсы в модули, которыми можно пользоваться в разных ИИ-инструментах.

Главное отличие Agent Skills от привычных кастомных инструкций в функциональности: это не текстовые гайдлайны по стилю кода, а полноценные наборы инструментов для автоматизации задач, которые подгружаются в контекст модели динамически и только при необходимости.

Стандарт дает кросс-платформенность: созданный один раз скилл будет работать одинаково как в интерфейсе редактора, так и в CLI-агентах.

code.visualstudio.com (https://code.visualstudio.com/docs/copilot/customization/agent-skills)

Google выпустила T5Gemma 2.

T5Gemma 2 получила серьезные архитектурные изменения по сравнению с первой версией. Чтобы снизить потребление памяти, инженеры внедрили `tied word embeddings` для энкодера и декодера, а также объединили механизмы `self-attention` и `cross-attention` в единый слой. Модели доступны в компактных конфигурациях на 270M, 1B и 4B параметров.

Новинка поддерживает контекстное окно до 128 тыс. токенов и умеет обрабатывать не только текст на 140 языках, но и изображения. В бенчмарках T5Gemma 2 обошла базовую Gemma 3 в задачах на длинный контекст, кодинг и мультимодальное понимание. Модели доступны на Hugging Face и Kaggle для исследовательских целей.

blog.google (https://blog.google/technology/developers/t5gemma-2/)

ИИ-подразделение Марка Цукерберга открыло аудио-визуальный энкодер PE-AV.

Perception Encoder Audiovisual (PE-AV) — техническое ядро, лежащее в основе SAM Audio. Это мультимодальная модель, которая объединяет аудио, видео и текст в единое пространство эмбеддингов.

PE-AV умеет извлекать векторы признаков из аудио или видеокадров и формировать совместные аудиовизуальные представления. Это повышает точность в задачах кросс-модального поиска, детекции звуков и глубокого понимания сцен, где важен синхронный контекст изображения и звука.

В открытом доступе — 6 чекпоинтов модели разного размера (от Small до Large) с вариациями по количеству обрабатываемых кадров. Код опубликован (https://github.com/facebookresearch/perception_models) на GitHub, а веса (https://huggingface.co/collections/facebook/perception-encoder-audio-visual) — на Hugging Face.

huggingface.co (https://huggingface.co/facebook/pe-av-large)

Источник: huggingface.co

Источник: ai-news.ru

✅ Найденные теги: Codex, GPT-5.2, Grok Voice Agent API, VS Code Agent Skills, ИИ, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Человек в кожаной куртке демонстрирует процессор на футуристическом фоне.
ideipro logotyp
Отражение деревьев в воде озера, спокойная гладь.
ideipro logotyp
Цифровой компонент на фоне блокчейн-технологии и сетевых данных.
Пирамида факторов риска, симптомов и локаций для тропических заболеваний.
Улучшение моделей работы мозга с помощью ZAPBench
ideipro logotyp
Программирование в стиле Vibe с чрезмерно усердным ИИ: уроки, извлеченные из использования Google AI Studio как инструмента командной работы.
Image Not Found
Человек в кожаной куртке демонстрирует процессор на футуристическом фоне.

Дженсен Хуанг утверждает, что Nvidia сокращает свое участие в проектах OpenAI и Anthropic, но его объяснение порождает больше вопросов, чем дает ответов.

Автор изображения: Патрик Т. Фэллон / Contributor / Getty Images В среду на конференции Morgan Stanley по технологиям, медиа и телекоммуникациям в центре Сан-Франциско генеральный директор Nvidia Дженсен Хуанг заявил, что недавние инвестиции его компании в OpenAI…

Мар 5, 2026
ideipro logotyp

Лучшие терапевтические пистолеты Theragun и инструменты Therabody для более эффективного восстановления (2026)

От массажных пистолетов до компрессионных сапог и светодиодных масок для лица — это лучшие устройства в линейке оздоровительных продуктов Therabody. Источник: www.wired.com ✅ Найденные теги: Therabody, Theragun, Восстановление, Инструменты, Лучшие, новости, Терапевтические ПистолетыПохожие записиДженсен Хуанг утверждает, что…

Мар 5, 2026
Отражение деревьев в воде озера, спокойная гладь.

Загрузка: как ИИ меняет игру в го и загадка кибербезопасности

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Искусственный интеллект меняет образ мышления лучших в мире игроков в го. Десять лет назад AlphaGo, программа искусственного интеллекта от…

Мар 5, 2026
ideipro logotyp

Материалы учредительного заседания Международного общества трактографии — IST 2025, Бордо.

arXiv:2602.12410v2 Тип объявления: replace-cross Аннотация: Данная подборка включает в себя тезисы докладов, представленных на постерных, презентационных и устных сессиях на первой конференции Международного общества трактографии (IST Conference 2025), состоявшейся в Бордо, Франция, с 13 по 16 октября…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых