Птица с оранжевой грудкой поёт, звуковые волны на фоне.

Машины учатся слушать птиц

Машины учатся слушать птиц

Биоакустика переживает тихую революцию. Пассивный акустический мониторинг генерирует петабайты аудиозаписей с сотен точек планеты, но превращение этого звукового океана в достоверные списки видов остается узким местом. Существующие инструменты вроде BirdNET работают прилично в Европе и Северной Америке, но спотыкаются на локальных диалектах, эндемиках Мадагаскара и шуме тропических ливней. Финская команда предложила элегантное решение: платформу Bird Sounds Global, где каждый исследователь аннотирует данные для собственных нужд, попутно пополняя общую базу знаний.

Механика проста, как швейцарские часы. Пользователь загружает десятисекундные фрагменты записей, обводит вокализации рамками на спектрограмме, составляет список целевых видов и запускает дообучение нейросети. Классификатор использует эмбеддинги BirdNET как фундамент, но дотренировывается на локальных данных, усиленных слабо размеченными записями из архива xeno-canto. Результат — модель, понимающая особенности конкретной местности: акустическую среду, вариации песен популяций, качество оборудования.

Испытания на шести регионах — от Финляндии до Аргентины — показали статистически значимое улучшение по сравнению с базовым BirdNET. Средний показатель AUC для видов из списка BirdNET вырос с 0,824 до 0,904, а для эндемиков, отсутствующих в глобальной модели, достиг 0,888. Финская модель, итеративно обучавшаяся на записях гражданских ученых через мобильное приложение, оказалась особенно точной. Мексиканский вариант, сфокусированный на 24 видах распространителей семян, продемонстрировал, как целевая аннотация экономит экспертное время.

Платформа уже объединяет 190 пользователей из 30 стран, накопивших 37 тысяч размеченных фрагментов для 807 видов. Архитектура позволяет развернуть готовый классификатор как веб-сервис для быстрых проверок, так и десктопное приложение для обработки гигабайтов данных без облачной загрузки. Калибровка модели — опциональный шаг, где эксперт прослушивает несколько десятков примеров на вид, корректируя вероятностные оценки нейросети. Это превращает сырые скоры уверенности в осмысленные вероятности присутствия вида.

Конечно, система не лишена ограничений. Для видов со сложным репертуаром или голосами, похожими на фоновый шум, требуется несколько сотен аннотированных вокализаций. Некоторые шаги, вроде загрузки данных на серверы BSG, пока требуют ручных действий и закрыты из соображений приватности. Авторы планируют интегрировать активное обучение — алгоритмы будут сами искать редкие виды в неразмеченных записях, предлагая экспертам наиболее информативные фрагменты. Расширение на летучих мышей уже началось, лягушки и насекомые в тестовом режиме.

Главная интрига — в масштабируемости. Вместо того чтобы строить изолированные модели для каждого проекта, BSG создает общий фонд аннотаций, где усилия одного исследователя улучшают классификаторы всех остальных. В эпоху глубокого обучения открытые датасеты ценнее алгоритмов, и платформа может стать образцом для других таксонов. Осталось дождаться, когда к птицам присоединятся голоса всех остальных обитателей планеты, звучащих в человеческом диапазоне слуха.

Источник BioTalks | НАУКА

Источник: www.authorea.com

Источник: ai-news.ru

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Image Not Found
Трое людей используют смартфоны на складе, один в жилете, все с беспроводными наушниками.

Компания DeepL, известная своими функциями перевода текста, теперь хочет переводить и ваш голос.

Источник изображения: DeepL Компания DeepL, специализирующаяся на переводе и известная своими текстовыми инструментами, сегодня выпустила…

Апр 16, 2026
ideipro logotyp

Лучшая камера GoPro (2026): компактная, бюджетная, аксессуары

Вы — герой боевиков, и вам нужна соответствующая камера. Мы поможем вам разобраться во всех моделях, дадим рекомендации по аксессуарам и…

Апр 16, 2026
Родео: ковбой на скачущей лошади в загоне, стильная обработка изображения.

Почему мнения об ИИ так разделились

Стефани Арнетт/MIT Technology Review | Getty Images Эта статья первоначально появилась в The Algorithm, нашей еженедельной рассылке об…

Апр 16, 2026
ideipro logotyp

Вложенное древовидное пространство: геометрическая основа для кофилогении

arXiv:2604.05056v2 Тип объявления: replace-cross Аннотация: Вложенные (или согласованные) филогенетические деревья моделируют…

Апр 16, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO