VLM учат в симуляторах — дешевле, быстрее и без боли…

05.06.2026

VLM учат в симуляторах — дешевле, быстрее и без боли с реальными данными

Исследователи из лабы фундаментальных исследований ИИ Т-Банка представили VL-DAC — метод, который обучает визуально-языковые модели новым действиям не на дорогих реальных данных, а в симуляторах.

Смысл в том, что модель сначала тренируется в виртуальных средах: учится понимать интерфейсы, изображения, объекты и пошагово двигаться к цели. Потом эти навыки переносятся на реальные задачи — уже без классического «давайте соберём ещё миллион примеров руками».

В обучении использовали несколько симуляторов под разные навыки:
— навигация
— взаимодействие с объектами
— работа с веб-интерфейсами
— оценка, насколько действие приближает к цели

После такого обучения Qwen2-VL-7B стала более чем на 50% лучше справляться с интерактивными задачами. Плюс: пространственная ориентация выросла на 5%, веб-навигация — на 2%.

Метод представили на конференции AAMAS. Потенциальные применения — робототехника, банкинг, игры, логистика и всё, где ИИ должен не просто «посмотреть на картинку», а выполнить нормальную цепочку действий.

Оцените материал:

Читайте также

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

VLM учат в симуляторах — дешевле, быстрее и без боли…

Оставить комментарий Отменить ответ

🤖 Нельсон AI

Гайды, руководства и полезные статьи

Похожие записи

Похожие записи

Moonshot AI представила Kimi K2 Thinking — модель, которая рассуждает…

Человек ошибается постоянно, человечество — никогда Сэр Фрэнсис Гальтон был…

Новые глазные капли спасают от близорукости VIZZ появятся в США…

Оставить комментарий Отменить ответ

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email

🤖 Нельсон AI