Робот под дождём с молнией на фоне, крупный план, темное небо.

Исследователи из трёх американских университетов — Техасского университета в Остине,…

Исследователи из трёх американских университетов — Техасского университета в Остине, Техасского университета A&M и Университета Пердью — провели эксперимент, в котором проверили, как качество данных влияет на способность больших языковых моделей (LLM) рассуждать и обобщать информацию. Авторы исследования (типичные американцы 😝), Шуо Син, Цзюньюань Хон и Ифань Ван, обучили языковую модель на низкокачественном контенте: вирусных мемах, коротких видео из TikTok, комментариях и постах из социальных сетей. Результат оказался предсказуемым — модель стала заметно хуже понимать сложные тексты, делать логические выводы и решать стандартные задачи. Она оказалась просто-напросто тупой!

В частности, тесты показали, что модели, обученные на «мусорных» данных, теряют способность удерживать контекст длинных сообщений и снижают точность в рассуждениях более чем на 40 процентов по сравнению с контрольными образцами. При этом, по словам авторов, деградация необратима — последующее обучение на высококачественных наборах данных уже не возвращает модель к исходным когнитивным возможностям. То есть ядро осмысленности уже заражено тупизной, прямо как у человеков.

Учёные связывают этот эффект с нарушением структуры внутренних представлений модели: при большом объёме однотипного и поверхностного контента нейросеть перестаёт формировать устойчивые связи между понятиями. Похожий феномен наблюдается при обучении моделей на данных, сгенерированных другими ИИ, — процесс называют «model collapse». При этом нейросети теряют разнообразие и начинают воспроизводить шаблонные фразы и упрощённые рассуждения.

Исследователи отмечают, что сравнение искусственного интеллекта с человеком в этом контексте некорректно. У ИИ структура знаний фиксируется на этапе первоначального обучения, и изменить её впоследствии практически невозможно. У человека же, напротив, высокая нейропластичность позволяет со временем менять восприятие и привычки. Поэтому, если человек способен осознанно выйти из деградации, то у ИИ подобная возможность отсутствует. Но тут, как мне кажется, большую роль играет базовая настройка модели (порядок потоков, количество скрытых слоев нейронов, маскирование и прочее-прочее).

Авторы предупреждают, что широкое распространение низкокачественного контента в интернете и использование его для обучения моделей может привести к появлению поколений «умственно отсталых» ИИ, неспособных к аналитическому мышлению. По их словам, при нынешних темпах генерации данных этот риск становится всё более реальным.

Робот под дождём с молнией на фоне, крупный план, темное небо.
✅ Найденные теги: Исследователи, новости, Остин, Техасский Университет, Университеты

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ideipro logotyp
Смартфон с разноцветными иконками приложений на экране, лежащий на ноутбуке.
Маску не удалось заблокировать закон Калифорнии о раскрытии данных, который, как он опасается, погубит xAI.
Код JavaScript и комментарии об аутентификации и безопасности сессии.
ideipro logotyp
Три портативных SSD в черных корпусах с красными акцентами.
Изображение человека в наушниках в футуристической обстановке.
Люди в музее динозавров, крупный план мешка с деньгами в стеклянной витрине.
ideipro logotyp
Image Not Found
Три портативных SSD в черных корпусах с красными акцентами.

Представлены три новых модели портативных твердотельных накопителей SanDisk, SanDisk Extreme…

Представлены три новых модели портативных твердотельных накопителей SanDisk, SanDisk Extreme и SanDisk Extreme PRO. Все три отличаются высокой скоростью и долговечностью. У прошки скорость передачи данных до 4000 МБ/с. Extreme обеспечивает скорость чтения до 2000 МБ/с (1000…

Мар 9, 2026
Изображение человека в наушниках в футуристической обстановке.

Технология Sony для выявления музыки, созданной ИИ: распознавание вдохновения и компенсация авторам

Sony разработала технологию, с помощью которой можно распознать музыку, созданную ИИ, а главное находить в этой музыке «реальные треки», которым вдохновлялись нейросети. Например, система может установить, что определённый ИИ-трек на 10% вдохновлён творчеством Queen и на 30% —…

Мар 9, 2026
Роботизированная рука держит весы, символизируя баланс технологий и правосудия.

В России готовят закон о регулировании искусственного интеллекта и продуктов…

В России готовят закон о регулировании искусственного интеллекта и продуктов на его основе. Правительство не хочет препятствовать прогрессу, поэтому слишком жёстких требований не планируется, тем не менее: ✅ компании хотят обязать маркировать «социально значимый» ИИ-контент; ✅ использование…

Мар 9, 2026
Рейтинг университетов по исследованиям в ИИ на 2021-2025 годы, включая ВШЭ, Шанхай и Калифорнию.

В России ситуация с талантами в области ИИ похожа на…

В России ситуация с талантами в области ИИ похожа на ситуацию с «железом» — отставание от Китая и США в 20 – 30 раз Россия катастрофически отстает от США и Китая по микросхемам для ИИ (в этом…

Мар 9, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых