ideipro logotyp

За пределами познания

arXiv:2507.03005v2 Тип объявления: замена-кросс Аннотация: Вычислительная филогенетика стала устоявшимся инструментом в исторической лингвистике, и многие языковые семьи теперь анализируются с использованием вывода на основе вероятности. Однако стандартные подходы основаны на экспертно аннотированных наборах родственных слов, которые являются разреженными, трудоемкими в создании и ограничены отдельными языковыми семьями. В этой статье рассматриваются альтернативы путем сравнения устоявшегося метода с двумя полностью автоматизированными методами, которые извлекают филогенетический сигнал непосредственно из лексических данных. Один использует автоматическую кластеризацию родственных слов с униграммными/концептуальными признаками; другой применяет множественное выравнивание последовательностей (MSA), полученное из парно-скрытой марковской модели. Оба метода оцениваются на основе экспертных классификаций из Glottolog и типологических данных из Grambank. Также сравниваются внутренние сильные стороны филогенетического сигнала в символах. Результаты показывают, что вывод на основе множественного выравнивания последовательностей (MSA) дает деревья, более соответствующие лингвистическим классификациям, лучше предсказывает типологические различия и обеспечивает более четкий филогенетический сигнал, что позволяет рассматривать его как многообещающую, масштабируемую альтернативу традиционным методам, основанным на родственных словах. Это открывает новые возможности для построения филогений языков глобального масштаба, выходящие за рамки проблем, связанных с экспертной аннотацией.

Источник: arxiv.org

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Image Not Found
Трое людей используют смартфоны на складе, один в жилете, все с беспроводными наушниками.

Компания DeepL, известная своими функциями перевода текста, теперь хочет переводить и ваш голос.

Источник изображения: DeepL Компания DeepL, специализирующаяся на переводе и известная своими текстовыми инструментами, сегодня выпустила…

Апр 16, 2026
ideipro logotyp

Лучшая камера GoPro (2026): компактная, бюджетная, аксессуары

Вы — герой боевиков, и вам нужна соответствующая камера. Мы поможем вам разобраться во всех моделях, дадим рекомендации по аксессуарам и…

Апр 16, 2026
Родео: ковбой на скачущей лошади в загоне, стильная обработка изображения.

Почему мнения об ИИ так разделились

Стефани Арнетт/MIT Technology Review | Getty Images Эта статья первоначально появилась в The Algorithm, нашей еженедельной рассылке об…

Апр 16, 2026
ideipro logotyp

Вложенное древовидное пространство: геометрическая основа для кофилогении

arXiv:2604.05056v2 Тип объявления: replace-cross Аннотация: Вложенные (или согласованные) филогенетические деревья моделируют…

Апр 16, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO