Экраны с программным кодом и эмодзи, изображающие разные эмоции в ИТ-контексте.

ИИ плохо понимает смайлы и допускает критичные ошибки, показало исследование

Современные системы искусственного интеллекта, способные обрабатывать и создавать тексты на множестве языков, получили широкое распространение среди пользователей по всему миру. Несмотря на популярность и полезность, новые исследования показывают, что даже самые продвинутые модели сталкиваются с серьезной проблемой интерпретации эмодзи (символ или картинка, передающие эмоции). Результаты исследования опубликованы на сервере препринтов arXiv.

ИИ плохо понимает смайлы и допускает критичные ошибки, показало исследование

Фото из открытых источников

Ученые из Сианьского университета совместно с коллегами из Наньянского технологического университета и Массачусетского университета установили, что использование смайлов способно вызывать серьезные искажения в работе больших языковых моделей. Эмодзи, применяемые пользователями для передачи эмоций, воспринимаются моделями как часть инструкции, что приводит к непредсказуемым результатам вплоть до удаления важных данных.

Для проверки гипотезы ученые разработали специальный инструмент, создающий сценарии тестирования. Затем они собрали уникальный набор данных, состоящий из 3757 примеров тестовых запросов для крупных языковых моделей. Примечательно, что большинство используемых смайлов были простыми комбинациями ASCII-символов, изображающих человеческие эмоции.

Испытания проводились на шести популярных моделях, включая Claude-Haiku-4.5, Gemini-2.5-Flash, GPT-4.1-mini, DeepSeek-v3.2, Qwen3-Coder и GLM-4.6. Анализ показал, что примерно в 38% случаев языковые модели выдавали ошибочные ответы, причем почти каждый девятый ответ был фактически некорректным, являясь формально грамматически правильным, но абсолютно несоответствующим ожиданиям пользователя.

Исследование подчеркивает необходимость дальнейших исследований и разработки методов улучшения обработки эмодзи большими языковыми моделями. Авторы считают, что выявление текущих ограничений позволит создать инструменты, минимизирующие риск возникновения ошибок и повышающие надежность систем искусственного интеллекта.

Источник

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов
Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов
Молодой ученый из Лесосибирска вошел в рейтинг Forbes «30 до 30»
Аспирант решил давнюю проблему узла Конвея.
Аспирант решил давнюю проблему узла Конвея.
Ученые дали лососю кокаин, и вы непременно поверите, что произошло дальше.
Ученые дали лососю кокаин, и вы непременно поверите, что произошло дальше.
Тайваньский ценник ноутбука ASUS ROG Zephyrus Duo 2026 с Core Ultra 9 386H и RTX 5090M составляет $8500
Тайваньский ценник ноутбука ASUS ROG Zephyrus Duo 2026 с Core Ultra 9 386H и RTX 5090M составляет $8500
Image Not Found
Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов

Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов

Они могут объединяться в более крупных роботов Американские инженеры разработали робота с одной степенью свободы, которого можно использовать как базовый модуль-ногу для постройки более сложных и крупных роботов со множеством конечностей. Он может самостоятельно передвигаться по пересеченной местности,…

Апр 23, 2026
Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов

Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов

Они могут объединяться в более крупных роботов Американские инженеры разработали робота с одной степенью свободы, которого можно использовать как базовый модуль-ногу для постройки более сложных и крупных роботов со множеством конечностей. Он может самостоятельно передвигаться по пересеченной местности,…

Апр 23, 2026
Молодой ученый из Лесосибирска вошел в рейтинг Forbes «30 до 30»

Молодой ученый из Лесосибирска вошел в рейтинг Forbes «30 до 30»

Уроженец Лесосибирска 30-летний Иван Стельмах попал в лонг-лист ежегодного рейтинга Forbes «30 до 30» в категории «Наука и технологии». Об этом пишут наши коллеги из «Город Прима». После школы он окончил МФТИ, а затем продолжил обучение в…

Апр 23, 2026
Тайваньский ценник ноутбука ASUS ROG Zephyrus Duo 2026 с Core Ultra 9 386H и RTX 5090M составляет $8500

Тайваньский ценник ноутбука ASUS ROG Zephyrus Duo 2026 с Core Ultra 9 386H и RTX 5090M составляет $8500

Тайваньское подразделение ASUS оповестило пользователей о доступности премиального ноутбука ASUS ROG Zephyrus Duo 2026 на местном рынке, вот только приобрести его смогут только самые обеспеченные пользователи, которым, похоже, не жалко отдавать огромную денежную сумму. Этот ноутбук с…

Апр 23, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых