Архив рубрики ~Коротко из Telegram~

🤖 Искусственный интеллект неожиданно провалил классический тест на внимание. Ученые…

🤖 Искусственный интеллект неожиданно провалил классический тест на внимание. Ученые…
File 2735

🤖 Искусственный интеллект неожиданно провалил классический тест на внимание.

Ученые дали LLM знаменитый тест Струпа — нужно назвать цвет текста, игнорируя значение слова 🧠

Люди справляются даже со списками до 1500 слов. А вот ИИ начал «ломаться»:
📉 GPT-4o: точность упала до 57% на 10 словах и до 15% на 40 словах
📉 Claude 3.5 Sonnet: до 24% на 40 словах
📉 В смешанных тестах ошибки доходили почти до 100%

Проблема в том, что модели теряют цель задачи и автоматически переключаются на чтение слов вместо определения цвета.

Исследователи считают, что причина — отсутствие у ИИ встроенного механизма «исполнительного контроля», который есть у человеческого мозга ⚠️

Большие языковые модели пока умеют генерировать текст лучше, чем удерживать внимание.

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Новости робототехники Apptronik представляет собой «Аполлон-2» и флагманский центр сбора данных и обучения. Новости робототехники 2025-й стал годом, когда человекоподобные роботы 🤖 вышли из лабораторий… Архив рубрики ~Полезное~ AIPowerPoint Maker — продвинутый инструмент AI для PowerPoint. Он позволяет… Архив рубрики ~Полезное~ BindAI — нейросервис, который делает написание кода очень простым. Неважно,… Архив рубрики ~Полезное~ Anthropic выпустили Claude Sonnet 5 — лучшую модель для повседневных… Архив рубрики ~Полезное~ Google выпустили Nano Banana 2 Lite Google выпустили Nano Banana… Архив рубрики ~Лента новостей~ Компания Venice AI стала «единорогом» благодаря привлечению 65 миллионов долларов в рамках раунда финансирования серии А, поскольку ее платформа искусственного интеллекта, ориентированная на конфиденциальность, стремительно развивается. Архив рубрики ~Лента новостей~ Генерация автотестов и локаторов с ИИ: рабочий код и подводные камни Архив рубрики ~Лента новостей~ В «СберБизнес» внедрили ИИ-аналитика для продавцов на маркетплейсах Архив рубрики ~Лента новостей~ 95% ИИ-проектов «не дают эффекта», а лидеры зарабатывают на ИИ миллиарды. Разница начинается с умения управлять и считать. Вот методика, под которой подписались 13 крупнейших банков страны Архив рубрики ~Лента новостей~ Нейросети не сделали игру за меня. Но без них я бы не взялся за эту RPG Архив рубрики ~Лента новостей~ Решение Верховного суда фактически отменяет использование правительством ордеров на обыск с использованием геозон. Архив рубрики ~Лента новостей~ WhatsApp позволяет зарезервировать имя пользователя, что делает ваш номер телефона более конфиденциальным. Архив рубрики ~Лента новостей~ Трамп отменил ограничения на использование моделей Mythos и Fable компании Anthropic. Новости робототехники Apptronik представляет собой «Аполлон-2» и флагманский центр сбора данных и обучения. Новости робототехники 2025-й стал годом, когда человекоподобные роботы 🤖 вышли из лабораторий… Архив рубрики ~Полезное~ AIPowerPoint Maker — продвинутый инструмент AI для PowerPoint. Он позволяет… Архив рубрики ~Полезное~ BindAI — нейросервис, который делает написание кода очень простым. Неважно,… Архив рубрики ~Полезное~ Anthropic выпустили Claude Sonnet 5 — лучшую модель для повседневных… Архив рубрики ~Полезное~ Google выпустили Nano Banana 2 Lite Google выпустили Nano Banana… Архив рубрики ~Лента новостей~ Компания Venice AI стала «единорогом» благодаря привлечению 65 миллионов долларов в рамках раунда финансирования серии А, поскольку ее платформа искусственного интеллекта, ориентированная на конфиденциальность, стремительно развивается. Архив рубрики ~Лента новостей~ Генерация автотестов и локаторов с ИИ: рабочий код и подводные камни Архив рубрики ~Лента новостей~ В «СберБизнес» внедрили ИИ-аналитика для продавцов на маркетплейсах Архив рубрики ~Лента новостей~ 95% ИИ-проектов «не дают эффекта», а лидеры зарабатывают на ИИ миллиарды. Разница начинается с умения управлять и считать. Вот методика, под которой подписались 13 крупнейших банков страны Архив рубрики ~Лента новостей~ Нейросети не сделали игру за меня. Но без них я бы не взялся за эту RPG Архив рубрики ~Лента новостей~ Решение Верховного суда фактически отменяет использование правительством ордеров на обыск с использованием геозон. Архив рубрики ~Лента новостей~ WhatsApp позволяет зарезервировать имя пользователя, что делает ваш номер телефона более конфиденциальным. Архив рубрики ~Лента новостей~ Трамп отменил ограничения на использование моделей Mythos и Fable компании Anthropic.

Оставить комментарий