MIT оживили «диффузию для текста» — и это может быть…
MIT оживили «диффузию для текста» — и это может быть большой проблемой для обычных LLM
Команда MIT показала ELF (Embedded Language Flows) — подход, который наконец заставляет непрерывную диффузию нормально работать с текстом.
Это важно, потому что diffusion-модели давно доминируют в изображениях и видео, но с текстом всё упиралось в главную проблему: токены дискретны, а диффузия любит непрерывные пространства.
ELF пытается обойти этот фундаментальный конфликт.
Как работает ELF:
— дискретные токены сначала переводятся в пространство эмбеддингов через замороженный T5
— дальше модель работает только в непрерывном пространстве
— применяется Flow Matching и решение ODE/SDE
— обратно в текст всё превращается только на финальном шаге
Главная идея — не «ломать» токены шумом на каждом шаге генерации.
Ключевые моменты:
— модель на 105M параметров обходит конкурентов около 170M
— обучение потребовало всего 45B токенов
— это примерно в 10 раз меньше, чем у конкурентов
— хорошие результаты:
— машинный перевод
— summarization
— low-step generation
— достаточно около 32 шагов SDE
— поддерживается классический CFG
— scaling внутри диапазона 105M → 652M работает стабильно
— ограничения:
— пока это proof-of-concept
— крупнейшая модель — только 652M параметров
— неизвестно, что будет на масштабе 7B–70B
Если подход масштабируется, это может стать одним из самых интересных альтернативных путей развития текстовых моделей после привычных autoregressive LLM.
Похожие записи
- NTSB начала расследование смертельной аварии с участием Tesla в Техасе.
- Компьютерное зрение против рутины: как мы ускорили анализ поведения лабораторных мышей
- Компания OpenAI представила свой первый специализированный чип для обработки данных с помощью ИИ, Jalapeño, разработанный совместно с Broadcom, — при этом его разработка была ускорена за счет использования собственных моделей OpenAI.
Оцените материал:
Похожие записи
ИТ-бизнес в России молодеет и активно уходит в регионы —…
20.10.2025
Чиним битые пиксели онлайн — JScreenFix спасёт монитор Сервис JScreenFix…
11.11.2025
Россияне активно гуглят гаджеты для личной ЭФФЕКТИВНОСТИ — нейросеть рассказала,…
07.12.2025Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
