Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Индукция и биология: механизмы обнаружения повторов в моделях белкового языка

arXiv:2602.23179v2 Тип объявления: замена-кросс Аннотация: Белковые последовательности изобилуют повторяющимися сегментами, как в виде точных копий, так и в виде приблизительных сегментов с мутациями. Эти повторы важны для структуры и функции белка, что мотивирует десятилетия работы над алгоритмами идентификации повторов. Недавние исследования показали, что модели белкового языка (PLM) идентифицируют повторы, изучая их поведение при предсказании замаскированных токенов. Чтобы прояснить их внутренние механизмы, мы исследуем, как PLM обнаруживают как точные, так и приблизительные повторы. Мы обнаруживаем, что механизм для приблизительных повторов функционально включает в себя механизм для точных повторов. Затем мы характеризуем этот механизм, выявляя два основных этапа: PLM сначала строят представления признаков, используя как общие позиционные механизмы внимания, так и биологически специализированные компоненты, такие как нейроны, кодирующие сходство аминокислот. Затем индукционные механизмы обращают внимание на выровненные токены в повторяющихся сегментах, способствуя правильному ответу. Наши результаты показывают, как PLM-ы решают эту биологическую задачу, сочетая сопоставление образов на основе языка со специализированными биологическими знаниями, тем самым закладывая основу для изучения более сложных эволюционных процессов в PLM-ах.

Источник: arxiv.org

✅ Найденные теги: биология, Индукция, Механизмы, новости, Обнаружение, Повторы

Добавить комментарий

Нет других записей в этой рубрике.

Новости других рубрик

Архив рубрики ~Лента новостей~: Как подать заявку на участие в Startup Battlefield 2026, что вам понадобится до крайнего срока 8 июня. Архив рубрики ~Лента новостей~: Где обитают дикие животные: идентификация диких животных с помощью SpeciesNet Архив рубрики ~Лента новостей~: Прокачать SQLite и сократить векторы в видеоформате — открытые инструменты для работы с эмбеддингами Архив рубрики ~Лента новостей~: Папа Лев осуждает «культуру власти», которая способствует развитию искусственного интеллекта. Архив рубрики ~Лента новостей~: Как радикальная архитектура DeepSeek разрушает символический барьер Кремниевой долины Архив рубрики ~Лента новостей~: Почему избегать неприятностей — значит избегать жизнь Архив рубрики ~Лента новостей~: Sports Illustrated только что удалил все статьи одного из своих авторов после обвинения в плагиате ИИ Архив рубрики ~Лента новостей~: 9 из 10 авторов на VC — не ваши конкуренты. Вот система из 6 ИИ-агентов, которая это доказывает