Image

Intel и Институт Вейцмана ускорили AI с помощью спекулятивного декодирования…

Intel и Институт Вейцмана ускорили AI с помощью спекулятивного декодирования 🖥

На Международной конференции по машинному обучению (ICML 2025) исследователи Intel Labs и Вейцмановского института п<a href=«https://newsroom.intel.com/artificial-intelligence/intel-weizmann-institute-speed-ai-with-speculative-decoding-advance»>оказали универсальное усовершенствование спекулятивного декодирования (speculative decoding) — метода ускорения вывода LLM.

Классическая схема предполагает работу пары: быстрая «черновая» модель создает предварительный ответ, а большая — проверяет и дорабатывает его. Традиционная модель LLM генерирует каждое слово шаг за шагом. К примеру, она вычисляет слово «Париж», затем «знаменитый», затем «город» и так далее, задействовав значительные ресурсы на каждом этапе. Главное ограничение такого подхода — необходимость согласованного словаря и общего обучения моделей.

Новая методика снимает эти ограничения: теперь любая быстрая модель может ускорять любую LLM (независимо от их происхождения и архитектуры). Благодаря спекулятивному декодированию небольшая модель-помощник быстро составляет полную фразу «Париж — знаменитый город…». Затем большая модель проверяет последовательность. Это значительно сокращает количество вычислительных циклов на выходной токен.

Разработчики п<a href="https://arxiv.org/pdf/2502.05202″>редставили три алгоритма, устраняющих зависимость от общего словаря и позволяющих формировать универсальные пары моделей. В результате работа модели ускоряется до 2,8 раза без потери качества.

Алгоритмы уже добавлены в библиотеку Hugging Face Transformers и доступны без дополнительной настройки.

Метод особенно актуален в условиях фрагментированного AI-ландшафта: это повышает совместимость между моделями и платформами и удешевляет стоимость вывода. По словам исследователей, технология превращает speculative decoding из специализированного приема в производственный стандарт с открытым исходным кодом, доступный для любого приложения.

file 555

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Многоразовая ракета New Glenn компании Blue Origin успешно приземлилась, но доставка полезной нагрузки не удалась.
Какой язык выбрать программисту в 2026 году?
Vantage Markets представит торговые решения на Blockchain Forum 2026
Моделирование данных для инженеров-аналитиков: полное руководство
В методе моделирования новых материалов обнаружилась «слепая зона»: Химия и науки о материалах
Компания Tesla запускает свою службу роботакси в Далласе и Хьюстоне.
Ученые говорят: Клонировать
dummy-img
Как максимально эффективно использовать возможности коворкинга в Claude
Image Not Found
Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую платформу — Claude Design, где визуалы собираются прямо из…

Апр 20, 2026
Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla начала сборку своего самого радикального проекта — Cybercab. Что показали: —…

Апр 20, 2026
ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают быть просто инструментом — они начинают влиять на реальные процессы и…

Апр 20, 2026
Google делает поиск в Windows нормальным: новый ИИ-помощник уже доступен…

Google делает поиск в Windows нормальным: новый ИИ-помощник уже доступен…

Google делает поиск в Windows нормальным: новый ИИ-помощник уже доступен Google выпустил десктопное приложение, которое заменяет…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых