Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Геномные предикторы следующего токена обучаются в контексте.

arXiv:2511.12797v3 Тип объявления: replace-cross Аннотация: Контекстное обучение (ICL) — способность модели выводить и применять абстрактные закономерности из примеров, представленных на входе, — широко изучалось в больших языковых моделях, обученных для предсказания следующего токена в человеческом тексте. Фактически, в предыдущих работах это возникающее поведение часто объяснялось отличительными статистическими свойствами человеческого языка. Это поднимает фундаментальный вопрос: может ли ICL органически возникать в других областях последовательностей исключительно посредством крупномасштабного предиктивного обучения? Чтобы исследовать это, мы обращаемся к геномным последовательностям, альтернативной символической области, богатой статистической структурой. В частности, мы изучаем геномную модель Evo2, обученную преимущественно на предсказании следующего нуклеотида (A/T/C/G), в масштабе, сопоставимом со средними по размеру LLM. Мы разрабатываем контролируемую экспериментальную структуру, включающую задачи символического рассуждения, реализованные как в лингвистической, так и в геномной формах, что позволяет напрямую сравнивать ICL между геномными и лингвистическими моделями. Наши результаты показывают, что геномные модели, подобно своим лингвистическим аналогам, демонстрируют логарифмически-линейный рост в индукции паттернов по мере увеличения числа демонстраций в контексте. Насколько нам известно, это первое свидетельство органически возникающего обучения в контексте в геномных последовательностях, подтверждающее гипотезу о том, что обучение в контексте возникает как следствие крупномасштабного прогностического моделирования на основе обширных данных. Эти результаты расширяют понятие эмергентного метаобучения за пределы языка, указывая на единый, независимый от модальности взгляд на обучение в контексте.

Источник: arxiv.org

✅ Найденные теги: Геномные, Контекст, новости, Предикторы, Токен

Добавить комментарий

Нет других записей в этой рубрике.

Новости других рубрик

Архив рубрики ~Лента новостей~: Обучение магистров права рассуждать по принципу байесовского подхода. Архив рубрики ~Лента новостей~: 1C Code Bench — бенчмарк для оценки способности LLM писать код на 1С Архив рубрики ~Лента новостей~: Google Pay готовится к внедрению ИИ-агентов с использованием протокола Universal Commerce Protocol. Архив рубрики ~Лента новостей~: Сенатор штата Луизиана помог компании Meta получить доступ к крупнейшему дата-центру. Затем он продал землю рядом с ним. Архив рубрики ~Лента новостей~: Дизайнеры — это новые разработчики программного обеспечения? Новая двусторонняя интеграция Figma Make с GitHub превращает дизайн в работающий, готовый к использованию код — со встроенным механизмом управления. Архив рубрики ~Лента новостей~: Строительство Саркофага. Часть 2. Бетонные реки и стальные берега Архив рубрики ~Лента новостей~: Руководители компаний, занимающихся искусственным интеллектом, сбиты с толку ненавистью к своим технологиям Архив рубрики ~Лента новостей~: 👆Настраиваем LM Studio — разбираем все поля