2af9d13c9cf25f13d99c1299499b4485.webp

Нейронные сети и язык: Как искусственные сети учатся языку, как люди

Исследователи обнаружили поразительные параллели в том, как люди и модели машинного обучения приобретают языковые навыки. Сохранить статью Прочитать позже

2af9d13c9cf25f13d99c1299499b4485

Введение

Как мозг обучается? Это загадка, которая касается как губчатых органов в наших черепах, так и их цифровых аналогов в наших машинах. Хотя искусственные нейронные сети (ИНС) построены из сложных сетей искусственных нейронов, якобы имитирующих процесс обработки информации нашим мозгом, мы не знаем, обрабатывают ли они входные данные аналогичным образом. 

«Уже давно ведутся споры о том, обучаются ли нейронные сети так же, как люди», — говорит Всеволод Капацинский, лингвист из Орегонского университета.

Исследование, опубликованное в прошлом месяце, предполагает, что естественные и искусственные сети обучаются схожим образом, по крайней мере, когда речь идёт о языке. Исследователи под руководством Гашпера Бегуша, специалиста по вычислительной лингвистике из Калифорнийского университета в Беркли, сравнили мозговые волны людей, слушающих простой звук, с сигналом, генерируемым нейронной сетью, анализирующей тот же звук. Результаты оказались поразительно схожими. «Насколько нам известно», — пишут Бегуш и его коллеги, — «наблюдаемые реакции на один и тот же стимул — это наиболее схожие сигналы мозга и ИНС, зарегистрированные на сегодняшний день».

Самое важное то, что исследователи протестировали сети, состоящие из универсальных нейронов, подходящих для решения самых разных задач. «Они показывают, что даже очень общие сети, не имеющие эволюционно обусловленных предубеждений в отношении речи или других звуков, тем не менее, демонстрируют соответствие нейронному кодированию человека», — сказал Гэри Лупьян, психолог из Висконсинского университета в Мадисоне, не принимавший участия в исследовании. Результаты не только помогают пролить свет на то, как обучаются искусственные нейронные сети, но и предполагают, что человеческий мозг может не обладать аппаратным и программным обеспечением, специально разработанным для языка.

Чтобы установить исходные данные для человеческого аспекта сравнения, исследователи многократно воспроизводили один слог — «ба» — в двух восьмиминутных блоках для 14 англоговорящих и 15 испаноговорящих участников. Во время воспроизведения исследователи регистрировали колебания средней электрической активности нейронов в стволе мозга каждого слушателя — той части мозга, где происходит первичная обработка звуков.

Кроме того, исследователи подавали одни и те же звуки «ба» двум разным наборам нейронных сетей: один был обучен на английских звуках, другой — на испанских. Затем исследователи регистрировали активность нейронной сети, уделяя особое внимание искусственным нейронам в слое сети, где звуки анализируются в первую очередь (чтобы отразить показания ствола мозга). Именно эти сигналы наиболее точно соответствовали человеческим мозговым волнам.

График, показывающий схожие формы волн человеческого мозга синим цветом и сигналы нейронной сети красным цветом.График, показывающий схожие формы волн человеческого мозга синим цветом и сигналы нейронной сети красным цветом.

Исследователи выбрали разновидность архитектуры нейронной сети, известную как генеративно-состязательная сеть (GAN), изначально разработанную в 2014 году для генерации изображений. GAN состоит из двух нейронных сетей — дискриминатора и генератора, — которые конкурируют друг с другом. Генератор создаёт образец, который может быть изображением или звуком. Дискриминатор определяет, насколько он близок к обучающему образцу, и предоставляет обратную связь, что приводит к повторной попытке генератора, и так далее, пока GAN не выдаст желаемый результат .

В этом исследовании дискриминатор изначально обучался на наборе звуков английского или испанского языка. Затем генератор, который никогда не слышал этих звуков, должен был найти способ их воспроизводить. Сначала он издавал случайные звуки, но после примерно 40 000 раундов взаимодействия с дискриминатором генератор стал работать лучше и в конечном итоге начал воспроизводить правильные звуки. В результате обучения дискриминатор также стал лучше различать реальные и сгенерированные звуки.

Именно в этот момент, после того как дискриминатор был полностью обучен, исследователи воспроизвели звуки «ба». Команда измерила колебания среднего уровня активности искусственных нейронов дискриминатора, которые генерировали сигнал, столь похожий на волны человеческого мозга.

Это сходство между уровнями активности человека и машины предполагает, что обе системы выполняют схожие функции. «Точно так же, как исследования показали, что обратная связь от лиц, осуществляющих уход, формирует звукопроизношение младенца, обратная связь от дискриминаторной сети формирует звукопроизношение генераторной сети», — сказал Капацински, не принимавший участия в исследовании.

Эксперимент также выявил ещё одну интересную параллель между людьми и машинами. Мозговые волны показали, что англо- и испаноговорящие участники слышали звук «ба» по-разному (испаноговорящие чаще слышали «па»), а сигналы GAN также показали, что сеть, обученная на английском языке, обрабатывала эти звуки несколько иначе, чем сеть, обученная на испанском.

«И эти различия работают в одном направлении», — пояснил Бегуш. Ствол мозга носителей английского языка реагирует на звук «ба» немного раньше, чем ствол мозга носителей испанского языка, а генеративно-ассоциированная сеть (GAN), обученная на английском языке, отреагировала на тот же звук немного раньше, чем модель, обученная на испанском языке. И у людей, и у машин разница во времени была практически одинаковой — примерно тысячная доля секунды. По словам Бегуша, это дало дополнительные доказательства того, что люди и искусственные сети, «вероятно, обрабатывают информацию схожим образом».

Гашпер Бегуш в полосатой рубашке-поло с доской перед книгами.

Гашпер Бегуш помог показать, что различия в том, как мозг англоговорящих и испаноговорящих людей обрабатывает звук, сохраняются в нейронных сетях, обученных на английском и испанском языках.

Хотя до сих пор неясно, как именно мозг обрабатывает и усваивает язык, лингвист Ноам Хомский в 1950-х годах предположил, что люди рождаются с врождённой и уникальной способностью понимать язык. Эта способность, утверждал Хомский, буквально запрограммирована в человеческом мозге.

Новая работа, в которой используются универсальные нейроны, не предназначенные для речевой деятельности, предполагает обратное. «В работе определённо приводятся доказательства, опровергающие представление о том, что речь требует специальных встроенных механизмов и других отличительных особенностей», — сказал Капацински.

Бегуш признаёт, что этот спор ещё не решён. Тем временем он продолжает исследовать параллели между человеческим мозгом и нейронными сетями, проверяя, например, соответствуют ли мозговые волны, исходящие из коры головного мозга (которая осуществляет слуховую обработку после того, как ствол мозга завершил свою работу), сигналам, генерируемым более глубокими слоями генеративно-ассоциированной нейронной сети (GAN).

В конечном итоге Бегуш и его команда надеются разработать надёжную модель усвоения языка, описывающую, как машины и люди усваивают языки, что позволит проводить эксперименты, которые были бы невозможны с людьми. «Мы могли бы, например, создать неблагоприятную среду [подобную той, что наблюдается у брошенных младенцев] и посмотреть, приведёт ли это к чему-то, напоминающему расстройства речи», — сказала Кристина Чжао, нейробиолог из Вашингтонского университета, которая стала соавтором новой статьи вместе с Бегушем и Аланом Чжоу, докторантом Университета Джонса Хопкинса.

«Сейчас мы пытаемся понять, насколько далеко мы можем продвинуться, насколько близко к человеческому языку мы можем подойти с помощью универсальных нейронов», — сказал Бегуш. «Можем ли мы достичь человеческого уровня производительности с имеющимися у нас вычислительными архитектурами — просто сделав наши системы больше и мощнее — или это никогда не будет возможно?» Хотя, прежде чем мы сможем сказать наверняка, необходимо провести ещё больше исследований, сказал он, «мы удивлены, даже на этой относительно ранней стадии, насколько схожи внутренние механизмы этих систем — человеческих и ИНС».

Источник: www.quantamagazine.org

✅ Найденные теги: искусственные сети, Люди, нейронные сети, Обучение, язык

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Agentic RAG против Classic RAG: от конвейера к контуру управления
Uber, Wayve и Nissan планируют запустить сервис роботакси в Токио в этом году.
ideipro logotyp
Врачи играют все более важную роль в оценке инструментов искусственного интеллекта для здравоохранения | MobiHealthNews
Топ-7 фреймворков для оркестрации агентов ИИ
Схема взаимосвязей различных эмодзи, сгруппированных по категориям с животными, символами и лицами.
Компания SpaceX может избежать экологических проверок, развернув миллион спутников.
Исследование Йельского университета показало, что стресс родителей может незаметно способствовать развитию детского ожирения.
Компания Smith+Nephew представила пенную повязку для профилактики пролежней.
Image Not Found
Agentic RAG против Classic RAG: от конвейера к контуру управления

Agentic RAG против Classic RAG: от конвейера к контуру управления

Практическое руководство по выбору между однопроходными конвейерами и адаптивными циклами извлечения данных в зависимости от сложности, стоимости и требований к надежности вашего варианта использования. Делиться Введение: Почему это сравнение важно RAG начинала с простой цели: обосновывать результаты…

Мар 13, 2026
Uber, Wayve и Nissan планируют запустить сервис роботакси в Токио в этом году.

Uber, Wayve и Nissan планируют запустить сервис роботакси в Токио в этом году.

Вкратце Источник изображений: Nissan Компания Wayve, занимающаяся разработкой программного обеспечения для беспилотных автомобилей и недавно привлекшая 1,2 миллиарда долларов инвестиций, объединяется с Uber и Nissan для запуска сервиса роботакси в Токио. Пилотный проект запланирован на конец 2026…

Мар 13, 2026
ideipro logotyp

Переосмысление лечения гипертонии с помощью управляющей цепи головного мозга.

Автор: сотрудники Bio-IT World 11 февраля 2026 г. | На протяжении десятилетий подход отрасли к лечению высокого кровяного давления был сосредоточен на различных органах — сердце, почках и кровеносных сосудах. Новое исследование предполагает, что эта стратегия может…

Мар 13, 2026
Врачи играют все более важную роль в оценке инструментов искусственного интеллекта для здравоохранения | MobiHealthNews

Врачи играют все более важную роль в оценке инструментов искусственного интеллекта для здравоохранения | MobiHealthNews

На конференции HIMSS26 руководители Emory Healthcare и Mass General Brigham обсудили, как такие инициативы, как Healthcare AI Challenge, призваны помочь системам здравоохранения принимать более безопасные решения о внедрении ИИ. Набиле Сафдар, директор по искусственному интеллекту в Emory…

Мар 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых