🤖 Искусственный интеллект неожиданно провалил классический тест на внимание. Ученые…
🤖 Искусственный интеллект неожиданно провалил классический тест на внимание.
Ученые дали LLM знаменитый тест Струпа — нужно назвать цвет текста, игнорируя значение слова 🧠
Люди справляются даже со списками до 1500 слов. А вот ИИ начал «ломаться»:
📉 GPT-4o: точность упала до 57% на 10 словах и до 15% на 40 словах
📉 Claude 3.5 Sonnet: до 24% на 40 словах
📉 В смешанных тестах ошибки доходили почти до 100%
Проблема в том, что модели теряют цель задачи и автоматически переключаются на чтение слов вместо определения цвета.
Исследователи считают, что причина — отсутствие у ИИ встроенного механизма «исполнительного контроля», который есть у человеческого мозга ⚠️
Большие языковые модели пока умеют генерировать текст лучше, чем удерживать внимание.
Похожие записи
Оцените материал:
Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
