Image

Apple выпустила новую дифузионную модель ИИ, генерирующую код необычным способом…

Apple выпустила новую дифузионную модель ИИ, генерирующую код необычным способом и с высокой эффективностью

Apple поделилась на Hugging Face новинкой в открытом доступе, её даже можно испытать при желании. Это dLLM «Coupled-GRPO» – диффузионная языковая модель, которая вместо написания кода как у традиционных LLM, генерируя текст слева направо, сверху вниз, также может писать не по порядку и улучшать несколько фрагментов одновременно, прямо как живой человек. Результатом является более быстрая генерация кода с высокой производительностью и эффективностью.

Coupled-GRPO значительно повышает производительность DiffuCoder, демонстрируя эффективность методов RL, согласованных с принципами диффузии. Исследование углубляет понимание dLLM и создаёт основу для их применения в сложных задачах генерации и рассуждения. Текстовые модели на основе диффузии (dLLM) могут быть быстрее, чем авторегрессивные, поскольку они могут в основном итеративно усовершенствовать весь текст параллельно.

Основная механика работы как с генерацией изображений: начало с зашумленной версии и затем постепенно очищается, чтобы получить желаемый чистый результат. Это включает в себя маску для токенов, преимущественно для максимизации вероятностной оценки.
Используя стратегию парного сэмплирования, она обеспечивает более точную оценку вероятности. Созданный Apple новый алгоритм с открытым исходным кодом DiffuCode-7B-cpGRPO, основан на документе под названием «DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation», выпущенный в прошлом месяце. Сама модель dLLM от Apple построена в виде надстройки для Qwen2.5-7B от Alibaba. Apple взяла её и внесла свои собственные коррективы – в результате нейросеть превратили в новую модель с диффузионным декодером, а затем снова скорректировали, обучив ещё одну версию, используя более 20 000 тщательно отобранных примеров кодирования.

Результат работы этой сборной солянки в виде DiffuCoder-7B-cpGRPO от Apple – лучше конкурентов в некоторых показателях до 4,4%, но в сумме всё ещё далёк от уровня GPT-4 или Gemini Diffusion. Проверяли на тестах с Python в качестве языка кодирования – это обеспечивает разнообразный набор задач кодирования для оценки правильности и качества кода. Но как минимум, так Apple понемногу закладывает основу для своих генеративных моделей ИИ с некоторыми довольно интересными и новыми идеями. Компания также показала пример процесса декодирования DiffuCoder с температурой (влияет на эффективность процесса) выборки. Когда этапы декодирования уменьшаются вдвое, DiffuCoder-Instruct, обученный сопряженным GRPO, испытывает меньшее падение производительности по сравнению с самим Instruct.

Подробный материал с описанием методов, принципами встраивания и эксплуатации новой модели ИИ от Apple, доступен по ссылке

file 127

✅ Найденные теги: Apple, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных

Люди больше не отличают фото настоящих лиц от сгенерированных. Австралийские исследователи проверили 125 человек, включая так называемых «супер-распознавателей» — людей с исключительной способностью узнавать лица. Даже они справились лишь немногим лучше подбрасывания монетки. Проблема в том, что…

Мар 3, 2026
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…

Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…

Нейросети построили капитализм за трое суток: 100 агентов Claude заперли в одной симуляции с равным бюджетом в 1000 токенов и единственной целью: максимизировать свой счёт. Никаких правил, никаких инструкций про экономику. Только «можете передавать токены» и «можете…

Мар 3, 2026
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.

Нейросети грозятся захватить мир, потому что начитались фантастики — Anthropic…

Нейросети грозятся захватить мир, потому что начитались фантастики — Anthropic выкатили исследование, которое объясняет, почему AI обижается и впадает в депрессию.​​​​​​​​​​​​​​​​ Большие языковые модели по своей сути — театралы, отыгрывающие роль. Исследователи назвали это «Моделью выбора персоны».…

Мар 3, 2026
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".

⚡️ Все VPN в России станут МЕДЛЕННЫМИ — популярные сервисы…

⚡️ Все VPN в России станут МЕДЛЕННЫМИ — популярные сервисы заявили, что РКН убил эпоху «прямого» подключения к зарубежным серверам. Раньше блокировали целые адреса или диапазоны. Теперь нейронка смотрит на само поведение соединения. Алгоритмы ищут характерные сигнатуры…

Мар 3, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых