Можно ли интегрировать с WordPress?

Да, мы используем REST API и Application Passwords — без передачи логина и пароля. Все публикации идут от имени автора.

Работает ли ИИ с Telegram?

Полностью. ИИ может как читать каналы, так и публиковать в ваш канал. Также подключаем inline-ботов и формы сбора лидов.

Сколько времени занимает настройка?

От 3 до 7 дней. Зависит от сложности интеграции и количества источников.

Есть ли бесплатный демо-доступ?

Да, мы запускаем 5–7 дневный демо-доступ с тестовыми данными, чтобы вы увидели систему в работе.

Безопасна ли система?

Да. Все данные хранятся изолированно. Мы не используем их для обучения моделей. Поддерживаем шифрование и резервное копирование.

Что входит в поддержку?

Обновление агентов, добавление источников, исправление ошибок, масштабирование. Поддержка 24/7 по Telegram или email.

Агентная операционная система — новая парадигма взаимодействия человека и машины

Окт 25, 2025 0

Содержание

Нам привычно взаимодействовать с системами, где мы нажимаем кнопки, и система молча выполняет наши команды. Однако мобильный мир вносит свои коррективы. В сложных сценариях, будь то заказ еды или настройка приложений, необходим посредник, способный понять цель пользователя, сохранять контекст диалога, задавать уточняющие вопросы и действовать последовательно, даже если интерфейс меняется. Разработчики ColorAgent создали агента ОС, который понимает запросы на естественном языке, умеет ориентироваться в изменчивом графическом интерфейсе Android и способен строить дружелюбное и интуитивно понятное взаимодействие с пользователем.

Обзор того, как агент ОС взаимодействует со средой и пользователем.

Модель обучена в два этапа, что повышает точность восприятия экрана, рассуждений и действий.
Система построена на мультиагентной архитектуре, состоящей из отдельных модулей, каждый из которых выполняет специфические функции: извлечение знаний, распределение задач и рефлексия над собственными действиями.

В результате агент не просто нажимает на нужные пиксели, но и демонстрирует адаптивность к пользователю. Он запоминает привычки, отслеживает предпочтения и, когда это требуется, предвосхищая потребности, задает уточняющие вопросы.

Как учили модель

Сначала её учили делать всё по шагам, как маленького ребёнка. То есть, вместо того, чтобы сразу пытаться решить всю задачу целиком, она думает, что сделать на каждом экране и почему. Разработчики специально сделали так, чтобы было несколько правильных вариантов действий (например, открыть приложение через иконку или через команду). И ещё они придумали понятные правила, чтобы поощрять её за хорошие ответы и правильные действия. Это помогает этой модели лучше понимать, что от неё требуется, и не выдавать всякую ерунду, которую она не сможет сделать.

Потом началось самое интересное: она начала учиться сама. Сначала она придумывает разные вопросы, потом пытается на них ответить в разных условиях, как в игре. После этого её ответы проверяют и отбирают только самые лучшие: правильно ли решена задача, нормальные ли были шаги, логично ли она рассуждала. Эти хорошие примеры используют, чтобы ещё лучше её натренировать. И так по кругу. Получается, что она сама себе собирает данные для обучения, и не нужно тратить много времени на ручную работу. И постепенно она становится всё умнее и лучше.

Двухэтапная схема обучения GUI‑модели: 1) пошаговое обучение с подкреплением; 2) саморазвивающееся обучение.

Почему одного «универсального» агента мало

Анализ выявил три проблемы у этих агентов: они тупят на новых интерфейсах, забывают, что делали в длинных задачах, и ломаются после первой же ошибки. Надо что-то придумывать.

Распределение типов ошибок одного агента.

Мультиагентная система: кто за что отвечает

Придумали следующее: сначала задача разбирается на части, если надо, и система помнит самое важное между этими частями. Например, если агент посмотрел чек, то следующая задача уже знает все цифры и категории.

Еще система умеет подтягивать инфу из разных мест: инструкции, интернет, прошлый опыт. Это помогает, когда на экране что-то новенькое вылезает и надо понять, что делать.

И самое главное – система постоянно проверяет себя на трех уровнях: каждый шаг, несколько последних шагов и вся задача целиком. Если что-то идет не так, она сразу же исправляется.

Архитектура мультиагентной системы с оркестрацией, извлечением знаний и иерархической рефлексией.

Что получилось на бенчмарках

На AndroidWorld агент достигает 77.2% успешных завершений задач, на AndroidLab — 50.7%. Это state of the art среди открытых и ряда коммерческих систем. Интересно, как распределен вклад:

само обучение модели (пошаговое RL + самоэволюция) уже заметно поднимает показатели: для одной из базовых моделей рост составляет +29.3 п.п. на AndroidWorld и +14.5 п.п. на AndroidLab;
добавление мультиагентной архитектуры дает дополнительный толчок к 77.2% и 50.7% соответственно.

Отдельно авторы отмечают, что модель большего размера легче переобучается: она показывает более высокую награду на обучении, но хуже обобщает. Баланс между емкостью и устойчивостью остается вызовом.

Динамика вознаграждения при обучении для разных моделей.

Ближе к человеку: память и проактивность

ColorAgent хочет быть другом, а не простым роботом. Если он помнит, что ты делал раньше, он это учитывает: и что ты просил напрямую, и твои привычки. А если не помнит – не проблема. Он лучше спросит, что тебе надо, прежде чем что-то делать. Это особенно важно, когда ты говоришь что-то не очень понятное, типа закажи гамбургер. Лучше уточнить, какой размер и соус, чем сразу налажать.

Сравнение обычного агента и теплого агента ОС: второй уточняет и попадает в ожидания пользователя.

На пользовательских бенчмарках это видно: 58.66% на MobileIAR и 68.98% на VeriOS-Bench — заметный отрыв от бейзлайна. За этими цифрами — аккуратное соединение системных решений (мультиагентность, память, извлечение знаний) с дисциплинированным обучением (пошаговое RL, фильтрация сценариев).

Авторы прямо заявляют о необходимости более точных оценок, включая больше приложений, сложных ситуаций, исключений и показателей, которые не ограничиваются только процентом выполненных задач. Важно также обеспечение безопасности и контроля: необходимо определить, когда обращаться к человеку, как установить лимиты прав и как функционировать в изолированной среде. Вдобавок, интересно развивать взаимодействие между агентами и искать архитектуры, которые лишены слабых мест и позволяют масштабировать взаимодействие.

ColorAgent даёт понять, что будущее операционных систем — не в одном всемогущем интеллекте, а в слаженной работе множества узкоспециализированных агентов, которые:

Постепенно учатся и совершенствуются сами, без ручной разметки данных.
Делятся друг с другом опытом и знаниями.
Умеют исправлять свои ошибки и подстраиваться под нужды пользователя.

Подобная структура позволяет системе работать стабильно, понимать контекст и быть удобной для человека даже в таких изменчивых средах, как Android ОС.

📜 Полная статья

💾 Код

***

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Источник: habr.com

✅ Найденные теги: Агентная, новости

Метки:

Агентная новости

ПРЕДЫДУЩАЯ ЗАПИСЬ

25.10.2025

Правда или мистификация? Как Google AI Overview вывел «тверк-кнопку» в Grand Theft Auto 6

СЛЕДУЮЩАЯ ЗАПИСЬ

25.10.2025

Найденная в Антарктиде исполинская загадочная плита обескуражила ученых

najdennaja-v-antarktide-ispolinskaja-zagadochnaja-plita-obeskurazhila-uchenyh-241a575.jpg

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

Еще новости рубрики

Архив рубрики ~Обо всем~

Фантазии

Июл 2, 2024

Архив рубрики ~Обо всем~

Мировоззрение

Июл 2, 2024

Архив рубрики ~Обо всем~

Влияние выдумщиков и фантазеров на развитие…

Июл 2, 2024

Архив рубрики ~Обо всем~

Нет ничего невозможного

Июл 2, 2024

Присоединяйтесь
к нам в

TELEGRAM

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных

Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…

Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.

Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".

‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…

Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.

Структура эффективного запроса Claude с элементами задачи, контекста и референса.

Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.

НОВОСТИ ДРУГИХ РУБРИК

Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Архив рубрики ~Лента новостей~

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

ЧИТАТЬ

Мар 2, 2026

Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Архив рубрики ~Лента новостей~

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

ЧИТАТЬ

Мар 2, 2026

Черный углеродное волокно с текстурой плетения, отражающий свет.

Архив рубрики ~Лента новостей~

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений. Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

ЧИТАТЬ

Мар 2, 2026

Круглый экран с изображением замка и горы, рядом электронная плата.

Архив рубрики ~Лента новостей~

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран. Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

ЧИТАТЬ

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO

Агентная операционная система — новая парадигма взаимодействия человека и машины

Как учили модель

Почему одного «универсального» агента мало

Мультиагентная система: кто за что отвечает

Что получилось на бенчмарках

Ближе к человеку: память и проактивность

Похожие записи

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ Отменить ответ

Еще новости рубрики

Присоединяйтесь к нам в

Рубрики

галерея

НОВОСТИ ДРУГИХ РУБРИК

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Присоединяйтесь
к нам в