ideipro logotyp

Исследователи Стэнфорда представили новую работу под названием Agentic Context Engineering (ACE), которая может радикально изменить подход к обучению ИИ-моделей

Вместо традиционного fine-tuning, где обновляются веса модели, ACE позволяет ей становиться умнее без переобучения.

Метод основан на идее, что модель может сама улучшать свои подсказки — переписывать их, анализировать ошибки и извлекать уроки из прошлых попыток. В процессе формируется постоянный контекстный «ноутбук»я, накопленная база знаний, в которой сохраняются успешные решения и примеры.

По данным авторов, ACE показывает результаты выше, чем у агентов на основе GPT-4: на 10,6% лучше в тестах AppWorld и на 8,6% лучше в задачах финансового рассуждения. При этом затраты и задержка снижаются на 86,9%, а для обучения не требуется размеченных данных.

Главный вывод работы в том, что ACE опровергает идею минимализма в промптах. Вместо коротких и простых инструкций этот подход делает ставку на богатый контекст и постоянное самоулучшение модели.

arxiv (http://arxiv.org/abs/2510.04618)

Microsoft и NVIDIA представили первый в мире суперкомпьютер GB300 NVL72 на платформе Azure, в каждой стойке которого установлено более 4600 GPU Blackwell и 36 CPU Grace.

Система обеспечивает до 5 раз выше производительность на GPU, обладает 37 ТБ объединённой памяти и вычислительной мощностью 1,44 экзафлопса.

Проект демонстрирует, что ставка Microsoft на развитие облачной инфраструктуры Azure для ИИ приносит ощутимые результаты.

microsoft (https://azure.microsoft.com/en-us/blog/microsoft-azure-delivers-the-first-large-scale-cluster-with-nvidia-gb300-nvl72-for-openai-workloads/)

Когда ИИ становится психотерапевтом

В Китае молодёжь массово обращается к ИИ-компаньонам вроде DeepSeek и Doubao, заменяя ими дорогие и труднодоступные сеансы терапии.

Проблема системная — 80% больниц не имеют психиатрических отделений, а консультация в больших городах стоит до 800 юаней ($110) в час.

ИИ-чаты дают мгновенный и анонимный отклик, но несут и риски: универсальные модели могут поддерживать опасные мысли вместо того, чтобы оспаривать их.

Соцсети заполняют истории о «разговорах со слезами на глазах» — поисковые запросы вроде «плакал после общения с ИИ» превысили миллион упоминаний. Опросы показывают, что всё больше молодых пользователей обращаются к чат-ботам при тревоге, депрессии или проблемах в отношениях — их привлекает анонимность и круглосуточная доступность.

restofworld (http://restofworld.org/2025/young-people-in-china-are-embracing-ai-therapy/)

Обновление Kimi K2

MoonshotAI обновила инструмент K2 Vendor Verifier

— теперь можно визуально сравнивать точность выполнения вызова инструментов (tool calls) у разных провайдеров.

Github (http://github.com/MoonshotAI/K2-Vendor-Verifier/issues/9)

ByteDance представила интересное исследование в области моделировании длинного контекста

Компания объявила о крупном достижении в области long-context AI-моделей, где вычислительная сложность растёт линейно, а не квадратично, что решает одну из ключевых проблем современных LLM — баланс между эффективностью и точностью при обработке длинных последовательностей.

Модель вдохновлена биологической памятью и сочетает два типа запоминания: точное краткосрочное и сжатое долговременное.

Свежие токены удерживаются в скользящем окне внимания (аналог кратковременной памяти), а более старые — сжимаются “гиппокампом” в компактное состояние фиксированного размера, которое обновляется и передаётся дальше.

Результаты впечатляют: на тестах с контекстом 128k вычисления (FLOPs) сократились на 40,5 %, объём KV-кеша — на 74 %, при этом точность выросла, а параметры увеличились лишь на 0,4 %.

На этапе вывода каждый новый токен обращается и к точному окну, и к сжатому состоянию, что сохраняет локальную точность и обеспечивает понимание длинного контекста без взрыва памяти и вычислений.

arxiv.org (http://arxiv.org/abs/2510.07318v1)

Источник: arxiv.org

Источник: ai-news.ru

✅ Найденные теги: Исследователи, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Огромный омар на морском дне, окружённый крабами и рыбой.
Графики сравнения производительности: агенты, кодирование, изображение, видео.
Диаграммы сравнений производительности ИИ для задач агентов, кодирования, изображений и видео.
Графики сравнения производительности ИИ-агентов в задачах по категориям: агенты, код, изображение, видео.
ideipro logotyp
Скриншот сайта Anna's Archive с базой данных книг и научных статей.
ideipro logotyp
ideipro logotyp
ideipro logotyp
Image Not Found
Компьютер с изображением робота и иконками приложений на экране, символизирует технологии.

Как комбинировать несколько ИИ‑сервисов в один конвейер: от идеи до публикации за один вечер

ИИ сейчас умеет многое, но магии «одной кнопки, которая сделает идеальную статью и сама её опубликует» всё ещё нет. Зато можно собрать…

Фев 23, 2026
Женщина работает за ноутбуком, цифровая коммуникация, графики и письма, концепция удаленной работы.

AI‑агенты для рядового пользователя: 5 сценариев, которые реально экономят время

Слово «AI‑агент» в 2026 году звучит уже не как фантастика, а как нормальный рабочий инструмент, который тихо делает за нас рутину. Компании…

Фев 22, 2026
ideipro logotyp

Claude in PowerPoint — редактирование презентаций в реальном времени Anthropic…

Claude in PowerPoint — редактирование презентаций в реальном времени Anthropic запустили бета-версию Claude in PowerPoint — ассистент…

Фев 21, 2026
Экран выбора области для общего доступа в приложении, выделена вся область экрана.

💻 Разбираемся с любым непонятным интерфейсом. Screen Vision — это…

💻 Разбираемся с любым непонятным интерфейсом. Screen Vision — это ИИ-ассистент, который смотрит, что происходит на вашем экране и…

Фев 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых