Image

Apple выпустила новую дифузионную модель ИИ, генерирующую код необычным способом…

Apple выпустила новую дифузионную модель ИИ, генерирующую код необычным способом и с высокой эффективностью

Apple поделилась на Hugging Face новинкой в открытом доступе, её даже можно испытать при желании. Это dLLM «Coupled-GRPO» – диффузионная языковая модель, которая вместо написания кода как у традиционных LLM, генерируя текст слева направо, сверху вниз, также может писать не по порядку и улучшать несколько фрагментов одновременно, прямо как живой человек. Результатом является более быстрая генерация кода с высокой производительностью и эффективностью.

Coupled-GRPO значительно повышает производительность DiffuCoder, демонстрируя эффективность методов RL, согласованных с принципами диффузии. Исследование углубляет понимание dLLM и создаёт основу для их применения в сложных задачах генерации и рассуждения. Текстовые модели на основе диффузии (dLLM) могут быть быстрее, чем авторегрессивные, поскольку они могут в основном итеративно усовершенствовать весь текст параллельно.

Основная механика работы как с генерацией изображений: начало с зашумленной версии и затем постепенно очищается, чтобы получить желаемый чистый результат. Это включает в себя маску для токенов, преимущественно для максимизации вероятностной оценки.
Используя стратегию парного сэмплирования, она обеспечивает более точную оценку вероятности. Созданный Apple новый алгоритм с открытым исходным кодом DiffuCode-7B-cpGRPO, основан на документе под названием «DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation», выпущенный в прошлом месяце. Сама модель dLLM от Apple построена в виде надстройки для Qwen2.5-7B от Alibaba. Apple взяла её и внесла свои собственные коррективы – в результате нейросеть превратили в новую модель с диффузионным декодером, а затем снова скорректировали, обучив ещё одну версию, используя более 20 000 тщательно отобранных примеров кодирования.

Результат работы этой сборной солянки в виде DiffuCoder-7B-cpGRPO от Apple – лучше конкурентов в некоторых показателях до 4,4%, но в сумме всё ещё далёк от уровня GPT-4 или Gemini Diffusion. Проверяли на тестах с Python в качестве языка кодирования – это обеспечивает разнообразный набор задач кодирования для оценки правильности и качества кода. Но как минимум, так Apple понемногу закладывает основу для своих генеративных моделей ИИ с некоторыми довольно интересными и новыми идеями. Компания также показала пример процесса декодирования DiffuCoder с температурой (влияет на эффективность процесса) выборки. Когда этапы декодирования уменьшаются вдвое, DiffuCoder-Instruct, обученный сопряженным GRPO, испытывает меньшее падение производительности по сравнению с самим Instruct.

Подробный материал с описанием методов, принципами встраивания и эксплуатации новой модели ИИ от Apple, доступен по ссылке

file 127

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…
Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.
dummy-img
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Image Not Found
ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы…

ИИ почти всех обгонит? Прогнозы звучат громко, но есть нюансы Глава Дарио Амодеи уверен: после 2027 года ИИ сможет превзойти «почти всех людей почти во всём». Но текущая реальность сложнее: — LLM всё ещё галлюцинируют — проваливают…

Апр 21, 2026
Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую…

Дизайн по запросу: Anthropic запускает Claude Design Anthropic представили новую платформу — Claude Design, где визуалы собираются прямо из…

Апр 20, 2026
Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla…

Tesla собирает авто без руля: Cybercab уже на конвейере Tesla начала сборку своего самого радикального проекта — Cybercab. Что показали: —…

Апр 20, 2026
ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают…

ИИ вышел из чатов: теперь он двигает экономику Нейросети перестают быть просто инструментом — они начинают влиять на реальные процессы и…

Апр 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых