Научная статья LLda2.1 о токенах и диффузии текста, схема редактирования.

16B-модель, которая запускается на «обычном» железе — LLaDA 2.1-mini Выпущена…

16B-модель, которая запускается на «обычном» железе — LLaDA 2.1-mini

Выпущена LLaDA 2.1-mini с нестандартной архитектурой: модель активируется по частям во время генерации.

Ключевые параметры:
— Общий объём — 16B параметров
— На каждом шаге задействовано около 1,4B
— Снижение требований к видеопамяти за счёт поэтапной активации
— Контекст — 32 000 токенов

Подход позволяет запускать крупную модель на оборудовании, рассчитанном на небольшие LLM.

Научная статья LLda2.1 о токенах и диффузии текста, схема редактирования.

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Image Not Found
dummy-img

OpenAI выпустила крупное обновление Codex OpenAI превратила Codex в полноценного…

OpenAI выпустила крупное обновление Codex OpenAI превратила Codex в полноценного автономного агента для разработчиков. Главные изменения: — Управление компьютером: Codex теперь может взаимодействовать с интерфейсом macOS. Он видит экран, двигает курсор и работает в приложениях, у которых…

Апр 17, 2026
Google выкатили Gemini на Mac Google выпустила официальное приложение Gemini…

Google выкатили Gemini на Mac Google выпустила официальное приложение Gemini…

Google выкатили Gemini на Mac Google выпустила официальное приложение Gemini для macOS, которое интегрирует искусственный интеллект напрямую в рабочий процесс на компьютерах Mac. Возможности: — Универсальный доступ: Приложение вызывается быстрым сочетанием клавиш (Option + Space), позволяя открывать…

Апр 17, 2026
Claude Routines: автопилот для ваших задач Anthropic выпустила Routins —…

Claude Routines: автопилот для ваших задач Anthropic выпустила Routins —…

Claude Routines: автопилот для ваших задач Anthropic выпустила Routins — это способ заставить Claude работать над вашим кодом и задачами автоматически, даже когда вы спите. Если раньше вам нужно было лично общаться с нейросетью, то теперь вы…

Апр 17, 2026
Главный секрет «умных» ответов не в промптах, а в структуре,…

Главный секрет «умных» ответов не в промптах, а в структуре,…

Главный секрет «умных» ответов не в промптах, а в структуре, которую Anthropic зашили под капот. Claude Code — это четырехслойный пирог: — CLAUDE.md: память проекта, правила и архитектурные решения; — Skills: переиспользуемые воркфлоу, которые ИИ дергает сам;…

Апр 17, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO