Тонкая настройка приводит к забыванию. RAG теряет контекст. Hypernetworks создают модель, необходимую вашему агенту, по запросу.

20.06.2026 ideipro.ru

Уджас Патель

В корпоративных командах постоянно происходит одно и то же. ИИ-агент демонстрирует блестящую работу, запускается в производство, а затем зависает: он работает недолго, затем требуется помощь человека для обновления контекста и проверки результата, и обещанная эффективность сводится к контролю. Агент выполнил работу; вы наблюдали. Это одна из причин, почему так много пилотных проектов с агентами так и не превращаются в производственные системы.

По ту сторону этой стены находится презентация, в которую хочет верить каждая команда: агент, который самостоятельно выполняет длительную работу, при необходимости за одну ночь, и оставляет человеку проверять только последние 10%. Достижимость этого зависит от проблемы, которую в основном обходят стороной в обсуждениях оркестровки. Когда компания Chroma, занимающаяся разработкой ИИ, протестировала 18 ведущих моделей, каждая из них теряла точность по мере увеличения входных данных — это свойство работы механизма внимания, а не пробел, который заполняет более сильная модель. Агент, получающий все больше и больше данных от вашего бизнеса по мере выполнения работы, не становится более стабильным. Он становится более нестабильным.

Это слой, лежащий в основе гонки оркестровки. Маршрутизация, надежное выполнение и наблюдаемость предполагают, что каждый агент уже достаточно компетентен для координации действий. Более глубокий вопрос заключается в том, как долго агент может работать, прежде чем потребуется вмешательство человека, и это зависит от того, где находятся знания вашей компании относительно модели. Оба стандартных решения оставляют человека в процессе.

Три способа включить свой бизнес в бизнес-модель

Почему обучение модели вашего бизнеса позволяет вам быть в курсе событий

Модели, находящиеся на стыке технологий, постоянно совершенствуются, и разрыв не сокращается, потому что проблема не в их функциональности. Речь идёт о том, где ваши знания находятся относительно модели, и у предприятий есть два способа их размещения.

Первый подход — это тонкая настройка, при которой знания закладываются в веса модели. Однако он по-прежнему подвержен катастрофическому забыванию — проблеме, выявленной в 1980-х годах и до сих пор не решенной в 2026 году: обучение модели чему-то новому, как правило, разрушает то, что она уже знала. Команды обходят эту проблему, изолируя каждую задачу в собственной тонко настроенной модели или адаптере, что приводит к созданию разветвленной системы моделей, увеличивающей затраты и накладные расходы на управление. А тонко настроенная модель — это снимок, устаревающий в день изменения политики, когда начинается дорогостоящий и медленный цикл переобучения.

Второй подход — это контекстное обучение, которое позволяет избежать переобучения, помещая соответствующие правила в подсказку во время выполнения. Именно здесь проявляется проблема «разложения контекста». Извлечение сужает круг вопросов, но ошибка при извлечении выглядит идентично уверенному ответу, а стоимость и задержка возрастают с каждым добавленным токеном.

Эти две ошибки взаимосвязаны. При тонкой настройке модель может уверенно работать, исходя из политики прошлого квартала. При контекстном обучении она может уверенно работать, опираясь на деталь, которую потеряла в середине длинного запроса. В любом случае результат выглядит одинаково надежным, поэтому невозможно определить, какие части неверны, не проверив все. Именно поэтому человек никогда не уходит. Некоторые команды часто запускают оба процесса одновременно, тонко настраивая стабильные знания и восстанавливая остальные. Это смягчает каждую ошибку, но не устраняет ни одну из них: на любом заданном результате вы все равно не можете быть уверены, что модель одновременно актуальна и работает в правильном контексте, поэтому ее все равно приходится проверять.

Третий вариант: генерация специализированной модели по запросу.

Третий подход заключается в переходе от исследований к разработке раннего продукта. Вместо переобучения одной модели или подгонки её параметров, генератор создаёт небольшую, специфичную для задачи модель по запросу на основе ваших правил, во время вывода. Генератор представляет собой гиперсеть: сеть, выход которой — это веса другой сети.

Идея получила своё название в 2016 году; её применение для создания специализированных языковых моделей из текста или документов — относительно новое и активно развивающееся направление. Система Text-to-LoRA от Sakana AI, представленная на ICML 2025, генерирует адаптер модели из описания на простом языке за один проход, а система SHINE, разработанная в 2026 году, называет адаптацию гиперсетей многообещающим новым направлением именно потому, что она позволяет обойти как затраты на переобучение при тонкой настройке, так и контекстные ограничения подсказок.

Смысл генерации адаптеров вместо их обучения и хранения заключается в том, чтобы объединить обширную библиотеку LoRA для каждой задачи в единую сеть, которая может создавать их по запросу, в том числе для задач, с которыми она еще не сталкивалась.

Элегантность заключается в том, как это замыкает цикл решения описанной выше проблемы: создаваемые вручную командами разработчиков адаптеры для каждой задачи, чтобы избежать катастрофического забывания, представляют собой тот же объект, который гиперсеть создает автоматически. Модельный зоопарк перестает быть головной болью в управлении и становится генерируемым результатом.

Гиперсеть — это модель, которая записывает данные в другую модель.

Аргумент в пользу использования небольших моделей был наиболее прямо изложен в статье исследователей Nvidia, опубликованной в 2025 году: для узких, повторяющихся задач, заполняющих рабочие процессы агентов, небольшие модели достаточно эффективны и в 10-30 раз дешевле в эксплуатации, чем универсальные модели. Компания Nace.AI из Пало-Альто, которая в мае привлекла 21,5 миллиона долларов в рамках посевного раунда, является наиболее наглядным коммерческим примером. Ее основная технология, генератор, который она называет метамоделью, создает адаптации параметров для модели во время вывода на основе политики компании, ориентированной на регулируемые виды работ: аудит, соответствие требованиям, оценка рисков. Компания утверждает, что ее агенты обрабатывают основную часть рабочего процесса, в то время как эксперты-люди проверяют результат, — соотношение, которое она позиционирует как 90/10.

Как соотносятся три подхода

	Тонкая настройка	В контексте / RAG	Модель, сгенерированная гиперсетью
Где хранятся знания в сфере бизнеса.	В весовых коэффициентах модели	В подсказке, которая обновлялась при каждом запуске.	В весовых коэффициентах, генерируемых по запросу
Стоимость обновления при изменении полиса.	Высокий: переподготовка	Низкий уровень: отредактируйте исходный код	Низкий уровень: регенерация
Застоя	Высокий: моментальный снимок	Низкий	Низкий уровень: восстановлен на основе текущей политики
Стоимость звонка и задержка	Низкий	Высокий, развивается в зависимости от контекста.	Низкий уровень во время работы
Основной режим отказа	Забвение; разрастание модельного зоопарка	Испорченность контекста; ошибки при скрытом извлечении информации.	Качество генератора; калибровка
Кому принадлежит улучшающийся актив?	Тот, кто обучает модель	Тот, кто владеет хранилищем данных	Зависит от того, где находится генератор и система обратной связи.

Почему модель, построенная на основе гиперсетей, повышает потолок автономности

Узкая, актуальная и небольшая модель имеет меньшую поверхность для ошибок. Меньшее количество ошибок, ограниченных известной областью, означает меньшее количество выходных данных, которые агент должен передавать человеку, что является реальной основой для любого заявления о высокой автономности. Именно отсюда и берется такое число, как 90/10: это не заранее установленный параметр, а результат того, насколько мало система должна вернуть. Сообщаемые показатели автономности лучше всего рассматривать как измерения архитектуры, а не как настройки.

Почему специализированная модель имеет меньше возможностей для ошибок

Два проектных решения определяют, насколько эта автономность заслуживает доверия или же она просто быстрая. Первое — это привязка: каждый результат связан с его источником, чтобы рецензент мог проверить его, а не переделывать. Исследовательские модели, созданные именно для этого, такие как HalluGuard, помечают каждое утверждение как подтвержденное или нет и указывают на отрывок, на который они опирались. Nace поставляет свои агенты с моделями привязки и трассировками рассуждений по той же причине. 10% проверки имеют значение только в том случае, если человек может подтвердить происхождение за считанные секунды.

Второй аспект — это обратная связь, и он заставляет каждого покупателя задать себе вопрос: когда ваши эксперты подтверждают результат, чья модель улучшается и где она хранится? От этого зависит, принадлежит ли накопленный актив поставщику или вам. Варианты решений различаются. Например, Nace использует внешнюю сеть сертифицированных экспертов для некоторых проектов, а для прямого развертывания в масштабах предприятия — собственный персонал заказчика, при этом полученная модель хранится в облаке заказчика. Каждый вариант направляет процесс обучения и владения в разное место.

Там, где третий путь обрывается

Этот подход пока находится на ранней стадии, и лишь несколько вопросов определят, насколько далеко он зайдет. Ключевым моментом является калибровка: ее ценность заключается в том, чтобы модель знала, когда она не уверена. И этот вопрос действительно остается открытым: недавние исследования по созданию этих адаптеров показали, что они не автоматически улучшают калибровку по сравнению с обычной тонкой настройкой, а улучшения проявляются только при определенных ограничениях.

Качество сгенерированной модели также в значительной степени зависит от данных о политике, на основе которых она построена, что делает тщательную проверку данных крайне важной. Масштаб — это открытая область исследований, и гиперсети, показанные в опубликованных работах до сих пор, были небольшими. Именно здесь работа Nace становится интересной: в нашем интервью компания заявила, что ей удалось масштабировать свой генератор значительно за пределы опубликованных размеров и вывести закон масштабирования для роста производительности, результаты которого она начала публиковать и сейчас проходит экспертную оценку. Если эти результаты подтвердятся, это поможет ответить на один из центральных открытых вопросов в этой области, и эта статья заслуживает внимания.

Какой бы подход ни победил, работа все равно заканчивается на этапе, когда ее выполняет человек, и эта передача информации представляет собой отдельную проблему проектирования. Когда компания Deloitte Australia подготовила правительственный отчет стоимостью около 440 000 австралийских долларов, после прохождения старшей проверки в нем содержались сфабрикованные ссылки и вымышленная цитата из суда, поскольку рецензенты проверили выводы, которые были обоснованными, а не происхождение информации, которое было ошибочным. Контролируемые исследования показывают, что эта закономерность является общей: эксперты реже исправляли идентичную ошибочную рекомендацию, когда она была помечена как сгенерированная искусственным интеллектом.

Статья 14 Закона ЕС об ИИ теперь называет это смещением в сторону автоматизации. Урок не касается какого-либо конкретного поставщика: высокая доля автономности концентрирует внимание человека на узком, позднем этапе работы, поэтому ценность этой проверки полностью зависит от того, может ли человек быстро проверить происхождение, что возвращает нас к вопросу о привязке к источнику.

Что строить и какие вопросы задавать перед покупкой

Главный вывод: обычно ваши агенты сдерживаются не оркестровкой или размером модели, а тем, насколько хорошо модель знает ваш бизнес, чтобы её можно было оставить без внимания, и правильное решение зависит от задачи. Для автоматизации длительного, повторяющегося, высокопроизводительного процесса от начала до конца, запуска большей части внутреннего аудита в течение ночи и проверки финального фрагмента вашими собственными экспертами, модель, сгенерированная в гиперсети, — это наиболее экономичный и эффективный подход, позволяющий выполнить задачу за достаточно долгое время. Для короткой задачи, которая выполняется за несколько шагов и никогда не требует автоматического выполнения, разница между этим подходом и хорошо настроенной моделью сокращается почти до нуля и не оправдывает затраты на интеграцию.

Когда поставщик представляет автономных или специализированных агентов, четыре вопроса сразу бросаются в глаза.

Где хранится информация о бизнесе: в весовых коэффициентах, в подсказках или генерируется по запросу?
Что входит в каждый результат, чтобы рецензент мог его проверить, вместо того чтобы переделывать?
Что определяет, какая задача будет передана специалисту?
А чья модель улучшается благодаря этой обратной связи, и где она работает?

Ответы, а не соотношение заголовков, показывают, что вы покупаете.

Подход с использованием гиперсетей — это наиболее убедительная на сегодняшний день попытка заставить небольшую модель изучать конкретный бизнес, не забывая его и не переобъясняя при каждом запуске. Однако он также наименее проверен, а наиболее важные аспекты — калибровка и масштабирование — всё ещё находятся на стадии экспертной оценки. Для решения конкретной задачи следует провести пилотное тестирование прямо сейчас. Для решения неподходящей задачи затраты на интеграцию мало что дадут по сравнению с хорошо разработанной моделью, демонстрирующей новые возможности.

Transform: Посмотрите, кто участвует в CTA

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

Оцените материал:

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Почему обучение модели вашего бизнеса позволяет вам быть в курсе событий

Третий вариант: генерация специализированной модели по запросу.

Как соотносятся три подхода

Почему модель, построенная на основе гиперсетей, повышает потолок автономности

Там, где третий путь обрывается

Что строить и какие вопросы задавать перед покупкой

Подпишитесь, чтобы получать самые свежие новости!

Похожие записи

Похожие записи

Лучшие AirPods 2026 года: тестирование и обзор экспертами.

Amazon делится «первым взглядом» на новый ядерный объект

Компания OpenAI представила ChatGPT Health и сообщила, что 230 миллионов пользователей еженедельно задают вопросы о здоровье.

Оставить комментарий Отменить ответ

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email