ideipro logotyp

Геномные предикторы следующего токена обучаются в контексте.

arXiv:2511.12797v3 Тип объявления: replace-cross Аннотация: Контекстное обучение (ICL) — способность модели выводить и применять абстрактные закономерности из примеров, представленных на входе, — широко изучалось в больших языковых моделях, обученных для предсказания следующего токена в человеческом тексте. Фактически, в предыдущих работах это возникающее поведение часто объяснялось отличительными статистическими свойствами человеческого языка. Это поднимает фундаментальный вопрос: может ли ICL органически возникать в других областях последовательностей исключительно посредством крупномасштабного предиктивного обучения? Чтобы исследовать это, мы обращаемся к геномным последовательностям, альтернативной символической области, богатой статистической структурой. В частности, мы изучаем геномную модель Evo2, обученную преимущественно на предсказании следующего нуклеотида (A/T/C/G), в масштабе, сопоставимом со средними по размеру LLM. Мы разрабатываем контролируемую экспериментальную структуру, включающую задачи символического рассуждения, реализованные как в лингвистической, так и в геномной формах, что позволяет напрямую сравнивать ICL между геномными и лингвистическими моделями. Наши результаты показывают, что геномные модели, подобно своим лингвистическим аналогам, демонстрируют логарифмически-линейный рост в индукции паттернов по мере увеличения числа демонстраций в контексте. Насколько нам известно, это первое свидетельство органически возникающего обучения в контексте в геномных последовательностях, подтверждающее гипотезу о том, что обучение в контексте возникает как следствие крупномасштабного прогностического моделирования на основе обширных данных. Эти результаты расширяют понятие эмергентного метаобучения за пределы языка, указывая на единый, независимый от модальности взгляд на обучение в контексте.

Источник: arxiv.org

✅ Найденные теги: Геномные, Контекст, новости, Предикторы, Токен

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Настольный компьютер с клавиатурой, геймпадом и желтыми очками.
Четыре винтажные камеры Yashica разных цветов на деревянной поверхности.
Ученые впервые описали структуру редкого минерала-«сэндвича»
Два человека в тёмных футболках на сером фоне, лица размыты.
ideipro logotyp
Как ведут себя злоумышленники в ходе активных кампаний кибершпионажа
Честный обзор и цены на Abacus AI: ИИ, который позволяет вам создавать код в режиме реального времени, разрабатывать агентов и заменять более 10 инструментов?
Сравнение классических и квантовых вычислений: бит и кубит в графическом виде.
Грузовик разбрасывает удобрения на сельскохозяйственном поле под голубым небом.
Image Not Found
Настольный компьютер с клавиатурой, геймпадом и желтыми очками.

Тихий ход и мощная батарея: новые механические клавиатуры Epomaker

Компания Epomaker представила клавиатуры TH80 V2 и TH80 V2 Pro, сделав ставку на удобство и продуманную эргономику для повседневной работы.  Обе модели выполнены в компактном формате 75%, который сохраняет функциональные клавиши и стрелки, но избавляет от громоздкого…

Мар 20, 2026
Четыре винтажные камеры Yashica разных цветов на деревянной поверхности.

Ностальгия в кармане: компактная камера Yashica Tank

Компания Yashica вдохновилась эстетикой ранних цифровых камер и выпустила компактную модель Tank, где акцент сделан на базовом управлении и ощущении «живой» фотографии без лишних настроек. Новинка получилась максимально компактной и лёгкой — менее 10 см в длину…

Мар 20, 2026
Ученые впервые описали структуру редкого минерала-«сэндвича»

Ученые впервые описали структуру редкого минерала-«сэндвича»

Кристаллическая структура гидрокалюмита. © Елена Житова / Институт вулканологии и сейсмологии ДВО РАН. Ученые впервые определили точную структуру и химическую формулу минерала гидрокалюмита, используемого в составе цементных материалов, а также в качестве сорбента тяжелых металлов и различных…

Мар 20, 2026
Два человека в тёмных футболках на сером фоне, лица размыты.

Два ветерана Palantir вышли из режима скрытности, получив инвестиции в размере 30 миллионов долларов и одобрение Sequoia.

Вкратце Источник изображения: Edra AI Компания Edra, нью-йоркский стартап, который, по его словам, помогает компаниям автоматизировать рабочие процессы, превращая существующие операционные данные в постоянно обновляемую базу знаний, получила значительное вотум доверия: раунд финансирования серии А на сумму…

Мар 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых