Архив рубрики ~Коротко из Telegram~

🤖 Искусственный интеллект неожиданно провалил классический тест на внимание. Ученые…

🤖 Искусственный интеллект неожиданно провалил классический тест на внимание. Ученые…
File 2735

🤖 Искусственный интеллект неожиданно провалил классический тест на внимание.

Ученые дали LLM знаменитый тест Струпа — нужно назвать цвет текста, игнорируя значение слова 🧠

Люди справляются даже со списками до 1500 слов. А вот ИИ начал «ломаться»:
📉 GPT-4o: точность упала до 57% на 10 словах и до 15% на 40 словах
📉 Claude 3.5 Sonnet: до 24% на 40 словах
📉 В смешанных тестах ошибки доходили почти до 100%

Проблема в том, что модели теряют цель задачи и автоматически переключаются на чтение слов вместо определения цвета.

Исследователи считают, что причина — отсутствие у ИИ встроенного механизма «исполнительного контроля», который есть у человеческого мозга ⚠️

Большие языковые модели пока умеют генерировать текст лучше, чем удерживать внимание.

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Архив рубрики ~Лента новостей~ Кастомизация Битрикс24 на платформе Вайбкод: создаём паспорт клиента Архив рубрики ~Лента новостей~ Москва формирует сообщество ИТ-специалистов в сфере открытого кода Архив рубрики ~Лента новостей~ «Яндекс Браузер» научился воспроизводить разные голоса и интонации при дубляже видео ещё на семи языках Архив рубрики ~Лента новостей~ Благодаря новой интеграции Square с ChatGPT и Claude, рестораны теперь могут принимать заказы, оформленные напрямую через ChatGPT и Claude. Архив рубрики ~Лента новостей~ Бездумное использование ИИ ведёт к вырождению специалистов Архив рубрики ~Лента новостей~ Гелиорегистратор Новости робототехники Apptronik представляет собой «Аполлон-2» и флагманский центр сбора данных и обучения. Новости робототехники 2025-й стал годом, когда человекоподобные роботы 🤖 вышли из лабораторий… Архив рубрики ~Полезное~ AIPowerPoint Maker — продвинутый инструмент AI для PowerPoint. Он позволяет… Архив рубрики ~Полезное~ BindAI — нейросервис, который делает написание кода очень простым. Неважно,… Архив рубрики ~Полезное~ Anthropic выпустили Claude Sonnet 5 — лучшую модель для повседневных… Архив рубрики ~Полезное~ Google выпустили Nano Banana 2 Lite Google выпустили Nano Banana… Архив рубрики ~Лента новостей~ Компания Venice AI стала «единорогом» благодаря привлечению 65 миллионов долларов в рамках раунда финансирования серии А, поскольку ее платформа искусственного интеллекта, ориентированная на конфиденциальность, стремительно развивается. Архив рубрики ~Лента новостей~ Генерация автотестов и локаторов с ИИ: рабочий код и подводные камни Архив рубрики ~Лента новостей~ Кастомизация Битрикс24 на платформе Вайбкод: создаём паспорт клиента Архив рубрики ~Лента новостей~ Москва формирует сообщество ИТ-специалистов в сфере открытого кода Архив рубрики ~Лента новостей~ «Яндекс Браузер» научился воспроизводить разные голоса и интонации при дубляже видео ещё на семи языках Архив рубрики ~Лента новостей~ Благодаря новой интеграции Square с ChatGPT и Claude, рестораны теперь могут принимать заказы, оформленные напрямую через ChatGPT и Claude. Архив рубрики ~Лента новостей~ Бездумное использование ИИ ведёт к вырождению специалистов Архив рубрики ~Лента новостей~ Гелиорегистратор Новости робототехники Apptronik представляет собой «Аполлон-2» и флагманский центр сбора данных и обучения. Новости робототехники 2025-й стал годом, когда человекоподобные роботы 🤖 вышли из лабораторий… Архив рубрики ~Полезное~ AIPowerPoint Maker — продвинутый инструмент AI для PowerPoint. Он позволяет… Архив рубрики ~Полезное~ BindAI — нейросервис, который делает написание кода очень простым. Неважно,… Архив рубрики ~Полезное~ Anthropic выпустили Claude Sonnet 5 — лучшую модель для повседневных… Архив рубрики ~Полезное~ Google выпустили Nano Banana 2 Lite Google выпустили Nano Banana… Архив рубрики ~Лента новостей~ Компания Venice AI стала «единорогом» благодаря привлечению 65 миллионов долларов в рамках раунда финансирования серии А, поскольку ее платформа искусственного интеллекта, ориентированная на конфиденциальность, стремительно развивается. Архив рубрики ~Лента новостей~ Генерация автотестов и локаторов с ИИ: рабочий код и подводные камни

Оставить комментарий