Архив рубрики ~Коротко из Telegram~

Исследователи из трёх американских университетов — Техасского университета в Остине,…

Исследователи из трёх американских университетов — Техасского университета в Остине,…

Исследователи из трёх американских университетов — Техасского университета в Остине, Техасского университета A&M и Университета Пердью — провели эксперимент, в котором проверили, как качество данных влияет на способность больших языковых моделей (LLM) рассуждать и обобщать информацию. Авторы исследования (типичные американцы 😝), Шуо Син, Цзюньюань Хон и Ифань Ван, обучили языковую модель на низкокачественном контенте: вирусных мемах, коротких видео из TikTok, комментариях и постах из социальных сетей. Результат оказался предсказуемым — модель стала заметно хуже понимать сложные тексты, делать логические выводы и решать стандартные задачи. Она оказалась просто-напросто тупой!

В частности, тесты показали, что модели, обученные на «мусорных» данных, теряют способность удерживать контекст длинных сообщений и снижают точность в рассуждениях более чем на 40 процентов по сравнению с контрольными образцами. При этом, по словам авторов, деградация необратима — последующее обучение на высококачественных наборах данных уже не возвращает модель к исходным когнитивным возможностям. То есть ядро осмысленности уже заражено тупизной, прямо как у человеков.

Учёные связывают этот эффект с нарушением структуры внутренних представлений модели: при большом объёме однотипного и поверхностного контента нейросеть перестаёт формировать устойчивые связи между понятиями. Похожий феномен наблюдается при обучении моделей на данных, сгенерированных другими ИИ, — процесс называют «model collapse». При этом нейросети теряют разнообразие и начинают воспроизводить шаблонные фразы и упрощённые рассуждения.

Исследователи отмечают, что сравнение искусственного интеллекта с человеком в этом контексте некорректно. У ИИ структура знаний фиксируется на этапе первоначального обучения, и изменить её впоследствии практически невозможно. У человека же, напротив, высокая нейропластичность позволяет со временем менять восприятие и привычки. Поэтому, если человек способен осознанно выйти из деградации, то у ИИ подобная возможность отсутствует. Но тут, как мне кажется, большую роль играет базовая настройка модели (порядок потоков, количество скрытых слоев нейронов, маскирование и прочее-прочее).

Авторы предупреждают, что широкое распространение низкокачественного контента в интернете и использование его для обучения моделей может привести к появлению поколений «умственно отсталых» ИИ, неспособных к аналитическому мышлению. По их словам, при нынешних темпах генерации данных этот риск становится всё более реальным.

Робот под дождём с молнией на фоне, крупный план, темное небо.

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Новости робототехники FAULHABER уделяет особое внимание крутящему моменту, шуму и работе с новыми редукторами GPT. Архив рубрики ~Лента новостей~ Считалось, что искусственный интеллект уничтожит инженерные профессии, но новые данные показывают, что они оказались наиболее устойчивыми. Архив рубрики ~Лента новостей~ Почему не стоит менять клавиатуру на сварочный аппарат, когда рушится первый этаж индустрии Архив рубрики ~Лента новостей~ Компания Amazon представит свою платформу для разработки надежных агентов искусственного интеллекта на конференции VB Transform 2026. Архив рубрики ~Лента новостей~ Вам не нужен ИИ-агент. Нужен workflow — и вот по каким признакам Архив рубрики ~Лента новостей~ Физическая калибровка спектрального разложения интервала в Cl(4,0) Архив рубрики ~Лента новостей~ Как мы реализовали оптимальное обучение моделей в Luna Line. Часть 1. Классификация Архив рубрики ~Лента новостей~ Противоопухолевый препарат улучшил качество спермы у мужчин. Его применяют при раке молочной железы Архив рубрики ~Обо всем~ Скидка на этот превосходный OLED-телевизор — это лучшее предложение, которое я нашел до сих пор, если сравнивать с ценой в Prime Day. Архив рубрики ~Лента новостей~ Обзор Star Fox на Switch 2: Ностальгия по ремейку от Nintendo работает. Это тенденция? Архив рубрики ~Лента новостей~ Резервуар «Содержание» для масштабирования агротехнических стартапов Архив рубрики ~Лента новостей~ Вот почему компания Slate заменила батарею в своем недорогом электромобиле-грузовике. Архив рубрики ~Лента новостей~ OpenAI и Broadcom представили оптимизированный для LLM чип для выполнения инференции | OpenAI Архив рубрики ~Лента новостей~ Размышление для вспоминания: как рассуждение раскрывает параметрические знания в магистерских программах. Новости робототехники FAULHABER уделяет особое внимание крутящему моменту, шуму и работе с новыми редукторами GPT. Архив рубрики ~Лента новостей~ Считалось, что искусственный интеллект уничтожит инженерные профессии, но новые данные показывают, что они оказались наиболее устойчивыми. Архив рубрики ~Лента новостей~ Почему не стоит менять клавиатуру на сварочный аппарат, когда рушится первый этаж индустрии Архив рубрики ~Лента новостей~ Компания Amazon представит свою платформу для разработки надежных агентов искусственного интеллекта на конференции VB Transform 2026. Архив рубрики ~Лента новостей~ Вам не нужен ИИ-агент. Нужен workflow — и вот по каким признакам Архив рубрики ~Лента новостей~ Физическая калибровка спектрального разложения интервала в Cl(4,0) Архив рубрики ~Лента новостей~ Как мы реализовали оптимальное обучение моделей в Luna Line. Часть 1. Классификация Архив рубрики ~Лента новостей~ Противоопухолевый препарат улучшил качество спермы у мужчин. Его применяют при раке молочной железы Архив рубрики ~Обо всем~ Скидка на этот превосходный OLED-телевизор — это лучшее предложение, которое я нашел до сих пор, если сравнивать с ценой в Prime Day. Архив рубрики ~Лента новостей~ Обзор Star Fox на Switch 2: Ностальгия по ремейку от Nintendo работает. Это тенденция? Архив рубрики ~Лента новостей~ Резервуар «Содержание» для масштабирования агротехнических стартапов Архив рубрики ~Лента новостей~ Вот почему компания Slate заменила батарею в своем недорогом электромобиле-грузовике. Архив рубрики ~Лента новостей~ OpenAI и Broadcom представили оптимизированный для LLM чип для выполнения инференции | OpenAI Архив рубрики ~Лента новостей~ Размышление для вспоминания: как рассуждение раскрывает параметрические знания в магистерских программах.

Оставить комментарий