Архив рубрики ~Коротко из Telegram~

DeepSeek-Math-V2: спокойный релиз, громкие цифры Кратко о результатах — Уровень…

DeepSeek-Math-V2: спокойный релиз, громкие цифры Кратко о результатах — Уровень…

DeepSeek-Math-V2: спокойный релиз, громкие цифры

Кратко о результатах

— Уровень золотой медали на IMO 2025 и CMO 2024
— Почти идеальный балл 118/120 на Putnam 2024
— На IMO-ProofBench уверенно обходит GPT-5 и сравнивается с Gemini 2.5 Pro на сложных задачах

Что дальше

— Интересно, как модель покажет себя против будущих Gemini 3, Grok 4 и GPT-5.1

Кратко о результатах

Бенчмарков почти нет: ни MATH, ни GSM8K, ни AIME. Зато имеющиеся цифры выглядят многообещающе.

Как работает:

— Базовая модель DeepSeek-V3.2-Exp-Base
— Два ключевых модуля: генератор и верификатор
— Процесс многошаговый:
— генератор пишет решение
— верификатор проверяет каждый шаг, указывает на ошибки
— генератор переписывает и уточняет
— до 16 итераций, в каждой анализируется до 64 гипотез
— Фактически сотни прогонов на одну задачу: умное масштабирование вычислений во время инференса

Материалы

— Веса: тут
— Статья: тут
— Репозиторий: тут

file_1202.jpg

Оцените материал:

Читайте также
Архив рубрики ~Лента новостей~ Игроки в Pokémon Go невольно внесли свой вклад в развитие технологий, используя военные беспилотники. Архив рубрики ~Обо всем~ Эта простая регулировка антенны роутера улучшила скорость моего интернета больше, чем я ожидал. Архив рубрики ~Лента новостей~ Компания «Прометей» Джеффа Безоса привлекла 12 миллиардов долларов для создания «искусственного инженера-универсала» для физического мира. Архив рубрики ~Обо всем~ Первая роботизированная газонокосилка от Roborock уже здесь! Архив рубрики ~Обо всем~ Анализ PDF-файлов для RAG локально с помощью Docling: расширенные таблицы, без загрузки в облако. Архив рубрики ~Лента новостей~ Можно ли выспаться, не засыпая? Архив рубрики ~Лента новостей~ AMD и Microsoft распространили Advanced Shader Delivery на все архитектуры RDNA Архив рубрики ~Обо всем~ Утро после: стремление Apple сделать искусственный интеллект полезным для своих пользователей Архив рубрики ~Лента новостей~ Уход из Mozilla Архив рубрики ~Лента новостей~ Компания OpenAI находится под следствием генеральных прокуроров штатов. Архив рубрики ~Лента новостей~ OpenAI приобретет компанию Ona | OpenAI Архив рубрики ~Лента новостей~ RPA умер Архив рубрики ~Лента новостей~ Лейбористская партия установит условия для развития центров обработки данных и искусственного интеллекта, пообещав не повторять ошибок, допущенных во время ресурсного бума. Архив рубрики ~Лента новостей~ Где именно происходит «скачок скорости» струи газа в камере сгорания ЖРД? Архив рубрики ~Лента новостей~ Игроки в Pokémon Go невольно внесли свой вклад в развитие технологий, используя военные беспилотники. Архив рубрики ~Обо всем~ Эта простая регулировка антенны роутера улучшила скорость моего интернета больше, чем я ожидал. Архив рубрики ~Лента новостей~ Компания «Прометей» Джеффа Безоса привлекла 12 миллиардов долларов для создания «искусственного инженера-универсала» для физического мира. Архив рубрики ~Обо всем~ Первая роботизированная газонокосилка от Roborock уже здесь! Архив рубрики ~Обо всем~ Анализ PDF-файлов для RAG локально с помощью Docling: расширенные таблицы, без загрузки в облако. Архив рубрики ~Лента новостей~ Можно ли выспаться, не засыпая? Архив рубрики ~Лента новостей~ AMD и Microsoft распространили Advanced Shader Delivery на все архитектуры RDNA Архив рубрики ~Обо всем~ Утро после: стремление Apple сделать искусственный интеллект полезным для своих пользователей Архив рубрики ~Лента новостей~ Уход из Mozilla Архив рубрики ~Лента новостей~ Компания OpenAI находится под следствием генеральных прокуроров штатов. Архив рубрики ~Лента новостей~ OpenAI приобретет компанию Ona | OpenAI Архив рубрики ~Лента новостей~ RPA умер Архив рубрики ~Лента новостей~ Лейбористская партия установит условия для развития центров обработки данных и искусственного интеллекта, пообещав не повторять ошибок, допущенных во время ресурсного бума. Архив рубрики ~Лента новостей~ Где именно происходит «скачок скорости» струи газа в камере сгорания ЖРД?