Архив рубрики ~Коротко из Telegram~

MIT оживили «диффузию для текста» — и это может быть…

MIT оживили «диффузию для текста» — и это может быть…

MIT оживили «диффузию для текста» — и это может быть большой проблемой для обычных LLM

Команда MIT показала ELF (Embedded Language Flows) — подход, который наконец заставляет непрерывную диффузию нормально работать с текстом.

Это важно, потому что diffusion-модели давно доминируют в изображениях и видео, но с текстом всё упиралось в главную проблему: токены дискретны, а диффузия любит непрерывные пространства.

ELF пытается обойти этот фундаментальный конфликт.

Как работает ELF:

— дискретные токены сначала переводятся в пространство эмбеддингов через замороженный T5
— дальше модель работает только в непрерывном пространстве
— применяется Flow Matching и решение ODE/SDE
— обратно в текст всё превращается только на финальном шаге

Главная идея — не «ломать» токены шумом на каждом шаге генерации.

Ключевые моменты:

— модель на 105M параметров обходит конкурентов около 170M
— обучение потребовало всего 45B токенов
— это примерно в 10 раз меньше, чем у конкурентов

— хорошие результаты:
— машинный перевод
— summarization
— low-step generation

— достаточно около 32 шагов SDE
— поддерживается классический CFG
— scaling внутри диапазона 105M → 652M работает стабильно

— ограничения:
— пока это proof-of-concept
— крупнейшая модель — только 652M параметров
— неизвестно, что будет на масштабе 7B–70B

Если подход масштабируется, это может стать одним из самых интересных альтернативных путей развития текстовых моделей после привычных autoregressive LLM.

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Новости робототехники Смешно и сыро — именно так выглядит будущий миллиард. Архив рубрики ~Обо всем~ Xfinity предоставляет новым клиентам Wi-Fi в тот же день. Архив рубрики ~Лента новостей~ 5 интересных проектов с использованием OpenAI Codex Архив рубрики ~Лента новостей~ Мировые лидеры хотят, чтобы американский ИИ был разработан. Они просто не хотят, чтобы у Америки была возможность его отключить. Архив рубрики ~Лента новостей~ Практически автономный химик на основе искусственного интеллекта улучшает сложную реакцию в медицинской химии | OpenAI Новости робототехники Работает ли Caveman? Тестируем модный скилл для экономии токенов Архив рубрики ~Лента новостей~ Компания Anthropic отключит свои самые передовые модели ИИ после распоряжения США, ограничивающего доступ к ним из-за рубежа. Архив рубрики ~Лента новостей~ «РуПост» обновил корпоративный почтовый клиент Desktop X Архив рубрики ~Лента новостей~ Производитель экообуви Allbirds, который решил заняться продажей облачных решений для ИИ, официально сменил название — акции выросли на 49% Архив рубрики ~Лента новостей~ О конференции OpenTalks.AI 2026: мои впечатления и 5 полезных докладов Архив рубрики ~Обо всем~ Шмели с ходу решили новую задачу. Им не потребовалось обучение Архив рубрики ~Лента новостей~ Новейший гаджет от Commodore — это раскладной телефон, блокирующий социальные сети и браузеры. Архив рубрики ~Обо всем~ Эти полезные гаджеты от Amazon продаются со скидкой до 68% — вот почему я их рекомендую. Архив рубрики ~Лента новостей~ Что извлекает парсер вопросов из пользовательской строки: ключевые слова, область действия, структура, декомпозиция, уточнение. Новости робототехники Смешно и сыро — именно так выглядит будущий миллиард. Архив рубрики ~Обо всем~ Xfinity предоставляет новым клиентам Wi-Fi в тот же день. Архив рубрики ~Лента новостей~ 5 интересных проектов с использованием OpenAI Codex Архив рубрики ~Лента новостей~ Мировые лидеры хотят, чтобы американский ИИ был разработан. Они просто не хотят, чтобы у Америки была возможность его отключить. Архив рубрики ~Лента новостей~ Практически автономный химик на основе искусственного интеллекта улучшает сложную реакцию в медицинской химии | OpenAI Новости робототехники Работает ли Caveman? Тестируем модный скилл для экономии токенов Архив рубрики ~Лента новостей~ Компания Anthropic отключит свои самые передовые модели ИИ после распоряжения США, ограничивающего доступ к ним из-за рубежа. Архив рубрики ~Лента новостей~ «РуПост» обновил корпоративный почтовый клиент Desktop X Архив рубрики ~Лента новостей~ Производитель экообуви Allbirds, который решил заняться продажей облачных решений для ИИ, официально сменил название — акции выросли на 49% Архив рубрики ~Лента новостей~ О конференции OpenTalks.AI 2026: мои впечатления и 5 полезных докладов Архив рубрики ~Обо всем~ Шмели с ходу решили новую задачу. Им не потребовалось обучение Архив рубрики ~Лента новостей~ Новейший гаджет от Commodore — это раскладной телефон, блокирующий социальные сети и браузеры. Архив рубрики ~Обо всем~ Эти полезные гаджеты от Amazon продаются со скидкой до 68% — вот почему я их рекомендую. Архив рубрики ~Лента новостей~ Что извлекает парсер вопросов из пользовательской строки: ключевые слова, область действия, структура, декомпозиция, уточнение.

Оставить комментарий