Автономный автомобиль на улице, окружённый датчиками для навигации и безопасности.

Автоматическая оптимизация подсказок для агентов многомодального зрения: пример беспилотного автомобиля

Пошаговое руководство по использованию алгоритмов оптимизации подсказок с открытым исходным кодом на Python для повышения точности работы агента безопасности автономного автомобиля на платформе OpenAI GPT 5.2.

Делиться

c9a798a0d62fcbd4e08d0767581cf4fe

Оптимизация мультимодальных агентов

Мультимодальные агенты искусственного интеллекта, способные обрабатывать текст и изображения (или другие медиафайлы), быстро проникают в реальные области, такие как автономное вождение, здравоохранение и робототехника. В этих областях мы традиционно использовали модели обработки изображений, такие как сверточные нейронные сети (CNN); в эпоху после GPT мы можем использовать модели обработки изображений и мультимодальные языковые модели, которые используют инструкции человека в виде подсказок, а не ориентированные на задачи, узкоспециализированные модели обработки изображений.

Однако для обеспечения хороших результатов работы моделей необходимы эффективные инструкции или, чаще, разработка подсказок. Существующие методы разработки подсказок в значительной степени основаны на методе проб и ошибок, и это часто усугубляется сложностью и более высокой стоимостью токенов при работе с нетекстовыми модальностями, такими как изображения. Автоматическая оптимизация подсказок — это недавнее достижение в этой области, которое систематически настраивает подсказки для получения более точных и согласованных результатов.

Например, система распознавания объектов в беспилотном автомобиле может использовать модель «зрение-язык» для ответа на вопросы об изображениях дорог. Неправильно сформулированная подсказка может привести к недопониманию или ошибкам с серьезными последствиями. Вместо тонкой настройки и обучения с подкреплением мы можем использовать другую мультимодальную модель с возможностями рассуждения, которая будет обучаться и адаптировать свои подсказки.

af6c9f2a25deabcdb07db459cfcb8203

Хотя эти автоматические методы могут применяться к текстовым агентам, они часто недостаточно хорошо документированы для более сложных реальных задач, выходящих за рамки базового набора данных, таких как рукописный ввод или классификация изображений. Чтобы наилучшим образом продемонстрировать, как эти концепции работают в более сложной, динамичной и ресурсоемкой среде, мы рассмотрим пример с использованием агента беспилотного автомобиля.

Источник: towardsdatascience.com

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…
Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.
dummy-img
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Image Not Found
Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Вкратце Опубликовано: Изображение предоставлено: Thos Robinson/Getty Images для The New York Times (откроется в новом окне) Джули Борт Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.…

Апр 21, 2026
dummy-img

Как почистить виниловые пластинки (2026): пылесос, ультразвук, чистящий раствор, щетка.

Эти щелчки и треск недопустимы. Приведите свою музыку в порядок с помощью этого удобного руководства. Источник: www.wired.com

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых