Apple выпустила новую дифузионную модель ИИ, генерирующую код необычным способом и с высокой эффективностью
Apple поделилась на Hugging Face новинкой в открытом доступе, её даже можно испытать при желании. Это dLLM «Coupled-GRPO» – диффузионная языковая модель, которая вместо написания кода как у традиционных LLM, генерируя текст слева направо, сверху вниз, также может писать не по порядку и улучшать несколько фрагментов одновременно, прямо как живой человек. Результатом является более быстрая генерация кода с высокой производительностью и эффективностью.
Coupled-GRPO значительно повышает производительность DiffuCoder, демонстрируя эффективность методов RL, согласованных с принципами диффузии. Исследование углубляет понимание dLLM и создаёт основу для их применения в сложных задачах генерации и рассуждения. Текстовые модели на основе диффузии (dLLM) могут быть быстрее, чем авторегрессивные, поскольку они могут в основном итеративно усовершенствовать весь текст параллельно.
Основная механика работы как с генерацией изображений: начало с зашумленной версии и затем постепенно очищается, чтобы получить желаемый чистый результат. Это включает в себя маску для токенов, преимущественно для максимизации вероятностной оценки.
Используя стратегию парного сэмплирования, она обеспечивает более точную оценку вероятности. Созданный Apple новый алгоритм с открытым исходным кодом DiffuCode-7B-cpGRPO, основан на документе под названием «DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation», выпущенный в прошлом месяце. Сама модель dLLM от Apple построена в виде надстройки для Qwen2.5-7B от Alibaba. Apple взяла её и внесла свои собственные коррективы – в результате нейросеть превратили в новую модель с диффузионным декодером, а затем снова скорректировали, обучив ещё одну версию, используя более 20 000 тщательно отобранных примеров кодирования.
Результат работы этой сборной солянки в виде DiffuCoder-7B-cpGRPO от Apple – лучше конкурентов в некоторых показателях до 4,4%, но в сумме всё ещё далёк от уровня GPT-4 или Gemini Diffusion. Проверяли на тестах с Python в качестве языка кодирования – это обеспечивает разнообразный набор задач кодирования для оценки правильности и качества кода. Но как минимум, так Apple понемногу закладывает основу для своих генеративных моделей ИИ с некоторыми довольно интересными и новыми идеями. Компания также показала пример процесса декодирования DiffuCoder с температурой (влияет на эффективность процесса) выборки. Когда этапы декодирования уменьшаются вдвое, DiffuCoder-Instruct, обученный сопряженным GRPO, испытывает меньшее падение производительности по сравнению с самим Instruct.
Подробный материал с описанием методов, принципами встраивания и эксплуатации новой модели ИИ от Apple, доступен по ссылке























