Image

Ухо не выполняет преобразование Фурье

Давайте поговорим о том, как улитка уха вычисляет звук!

Барабанная перепонка приводится в колебания изменениями давления воздуха (звуковыми волнами). Кости среднего уха усиливают и передают эти колебания в заполненную жидкостью спиралеобразную улитку. Колебания перемещаются по жидкости к базилярной мембране, которая выполняет разделение частот1: более жёсткое и лёгкое основание (base на иллюстрации) резонирует с высокочастотными компонентами сигнала, а более гибкая и тяжёлая вершина (apex) резонирует с низкими частотами. Между двумя концами резонирующие частоты логарифмически снижаются в пространстве2.

Резонирующие частоты базилярной мембраны. Внешние большие числа — это частоты (в герцах). Внутренние малые числа — это расстояние вдоль базилярной мембраны (в мм). Иллюстрация взята со слайдов лекции.
Резонирующие частоты базилярной мембраны. Внешние большие числа — это частоты (в герцах). Внутренние малые числа — это расстояние вдоль базилярной мембраны (в мм). Иллюстрация взята со слайдов лекции.

Волосковые клетки в разных частях базилярной мембраны колеблются вперёд и назад на частоте, соответствующей их расположению на мембране. Но как колебания волосковых клеток преобразуются в электрические сигналы? Этот механико-электрический процесс похож на кадры из фантастического фильма: пружины, соединённые с концами волосковых клеток, открывают и закрывают ионные каналы с частотой колебаний, что затем вызывает выброс нейромедиаторов. Вот визуализация этого процесса:

Очевидно, что «железо» уха отлично подходит для частотного анализа. Нервные волокна работают в качестве фильтров, извлекающих временнýю и частотную информацию о сигнале. Ниже показаны примеры фильтров (не все они относятся к уху) в промежутке времени. Слева показаны более локализованные во времени фильтры; например, если фильтр применяется к сигналу, видно, когда в сигнале возникает соответствующая частота. Справа приведены фильтры с меньшей временнóй специфичностью, более равномерно распределённые по частотам по сравнению с примерами слева.

126437c1de1dace25f9550159b658c71

Разве не было бы удобно, если бы улитка выполняла преобразование Фурье, что отлично соответствовало бы тому, как мы анализируем сигналы? Но, увы, всё обстоит не так! Преобразование Фурье не обладает явной временнóй точностью, оно напоминает что-то похожее на волны справа; а фильтры в улитке выглядят совсем иначе.

На рисунке ниже показаны различные схемы фильтрации или заполнения области времени-частот. В самом левом квадрате, где каждый прямоугольник обозначает фильтр, сигнал можно представить с высоким временным разрешением (как на иллюстрации выше слева), но без информации о составляющих его частотах. На противоположной части спектра расположено преобразование Фурье, выполняющее точное разложение частот, но мы не можем сказать, когда в сигнале встречалась конкретная частота (как на иллюстрации выше справа)3. На самом деле, улитка выполняет что-то между вейвлет-преобразованием и преобразованием Габора. На высоких частотах разрешение частоты снижается ради повышения временного разрешения, а на низких частотах — наоборот.

7fb7048d6e80b411236a4b27b764173d

Почему такой компромисс частотно-временной точности оказывается хорошим описанием сигнала? Теория, исследованная в статье Lewicki 2002, гласит, что эти фильтры — стратегия для снижения избыточности описания звуков природы. Майкл Левицки провёл анализ независимых компонент (independent component analysis, ICA), создав фильтры, максимизирующие статистическую независимость при сравнении звуков окружающей среды, голосов животных и человеческой речи. В каждом из случаев компромиссы выглядят по-разному; их можно приблизительно визуализировать показанными ниже графиками.

ICA звуков окружающей среды (треска кустарника, дождя и так далее) и человеческой речи (различных диалектов американского английского) привёл к созданию вейвлетов, а ICA голосов животных (млекопитающих, тропического леса) — к чему-то более похожему на преобразование Фурье.
ICA звуков окружающей среды (треска кустарника, дождя и так далее) и человеческой речи (различных диалектов американского английского) привёл к созданию вейвлетов, а ICA голосов животных (млекопитающих, тропического леса) — к чему-то более похожему на преобразование Фурье.
Примеры показанных выше фильтров
Примеры показанных выше фильтров

Оказалось, человеческая речь занимает отдельное частотно-временное пространство. Некоторые учёные предполагают, что речь эволюционно возникла для заполнения частотно-временного пространства, не занятого другими звуками мира.

+: голоса животных, x: звуки окружающей среды, o: человеческая речь. Lewicki 2002.
+: голоса животных, x: звуки окружающей среды, o: человеческая речь. Lewicki 2002.

Формирование представлений, привязанных к окружающей среде, логично, потому что поведение зависит от неё. Похоже, это происходит и для слуха, и для других видов чувств. Возможно, это может стать основой нового эффективного кодирования, которое мы вскоре реализуем.

Мы рассмотрели некоторые из потрясающих механизмов, находящихся в самом начале процесса кодирования ощущений, но на самом деле, это лишь крошечная верхушка айсберга. Также мы вкратце поговорили о том, как происходят эти вычисления. В следующей статье мы подробнее рассмотрим биофизику вычислений в нейронах.

  1. Это называется тонотопической организацией, то есть отображением частоты на пространство. Такая организация существует в коре мозга и для других чувств, а не только для слуха, например ретинотопия для зрения и соматотопия для осязания.

  2. Взаимосвязь между человеческим восприятием высоты и частоты звука логарифмическая. Совпадение?

  3. Кто-то может заявить, что нужно сравнивать это с преобразованием Фурье на коротких промежутках времени, однако оно имеет проблемы разрешения, и тоже не похоже на то, что делает улитка.

Источник: habr.com

✅ Найденные теги: новости, Ухо

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых