ИИ управляет компьютером лучше людей: Holo3 ставит новый стандарт
Появился Holo3 — агентная модель, которая умеет работать с интерфейсами так, как это делает человек.
Не через API, а напрямую через GUI: кнопки, окна, приложения.
Что внутри:
— мультимодальная модель для управления десктопом
— архитектура Mixture-of-Experts
— две версии:
— 122B (флагман) — платная
— 35B — открытая (Apache 2.0)
Как её обучали:
— сначала генерировали синтетические сценарии работы
— затем расширяли их под нестандартные ситуации
— финально — отбор + обучение с подкреплением
Для этого сделали целую «песочницу» — генератор корпоративных сред, где агенты сами создают задачи и решают их.
Отсюда и сложность сценариев:
— извлечь данные из PDF
— сопоставить с бюджетами
— разослать персонализированные письма
То есть не действия, а полноценные процессы.
Результаты:
— 78,85% на OSWorld-Verified — лучший показатель на тестах работы с десктопом




























