Архив рубрики ~Коротко из Telegram~

DeepSeek-Math-V2: спокойный релиз, громкие цифры Кратко о результатах — Уровень…

01.12.2025

DeepSeek-Math-V2: спокойный релиз, громкие цифры

Кратко о результатах

— Уровень золотой медали на IMO 2025 и CMO 2024
— Почти идеальный балл 118/120 на Putnam 2024
— На IMO-ProofBench уверенно обходит GPT-5 и сравнивается с Gemini 2.5 Pro на сложных задачах

Что дальше

— Интересно, как модель покажет себя против будущих Gemini 3, Grok 4 и GPT-5.1

Кратко о результатах

Бенчмарков почти нет: ни MATH, ни GSM8K, ни AIME. Зато имеющиеся цифры выглядят многообещающе.

Как работает:

— Базовая модель DeepSeek-V3.2-Exp-Base
— Два ключевых модуля: генератор и верификатор
— Процесс многошаговый:
— генератор пишет решение
— верификатор проверяет каждый шаг, указывает на ошибки
— генератор переписывает и уточняет
— до 16 итераций, в каждой анализируется до 64 гипотез
— Фактически сотни прогонов на одну задачу: умное масштабирование вычислений во время инференса

Материалы

— Веса: тут
— Статья: тут
— Репозиторий: тут

Оцените материал:

Читайте также

Архив рубрики ~Лента новостей~ Как у меня тоже НЕ получился торговый бот на Polymarket Архив рубрики ~Лента новостей~ «МТС Геоэффект» получил ИИ-анализ данных и сегментацию аудитории по интересам Архив рубрики ~Лента новостей~ Как сахар в клетках мозга может способствовать развитию болезни Альцгеймера и как распространенная добавка для суставов может усугублять ее течение. Архив рубрики ~Лента новостей~ В отчете OpenAI показано, как с помощью программистов ускоряется разработка научного программного обеспечения. Архив рубрики ~Лента новостей~ Почему 90% внедрений ИИ в корпоратах заканчиваются пшиком (и при чём тут RAG) Архив рубрики ~Лента новостей~ Старший вице-президент Target утверждает, что настоящая защита компании от угроз со стороны ИИ заключается не в моделях, а во всем, что построено вокруг них. Архив рубрики ~Лента новостей~ Создаем веб‑приложение с Claude Code: деплоим сайт на сервер Архив рубрики ~Лента новостей~ [Перевод] Космический телескоп «Роман» будет искать древние чёрные дыры, наблюдая за тем, как они поглощают звёзды Архив рубрики ~Лента новостей~ Ещё больше технологий кубитов: новые варианты квантовых точек, вакансии в алмазной отрасли. Архив рубрики ~Лента новостей~ Winamp планирует вернуться на рынок благодаря новому партнерству с Deezer. Архив рубрики ~Лента новостей~ Компания Apple накапливает запасы продукции, готовясь к «значительным ограничениям поставок». Архив рубрики ~Лента новостей~ Гипотеза о Языке Мышления как альтернатива Искусственному Интеллекту Архив рубрики ~Лента новостей~ Обзоры искусственного интеллекта от Google становятся все более распространенными в результатах поиска. Архив рубрики ~Лента новостей~ Gemini Plus можно получить на год бесплатно! Архив рубрики ~Лента новостей~ Как у меня тоже НЕ получился торговый бот на Polymarket Архив рубрики ~Лента новостей~ «МТС Геоэффект» получил ИИ-анализ данных и сегментацию аудитории по интересам Архив рубрики ~Лента новостей~ Как сахар в клетках мозга может способствовать развитию болезни Альцгеймера и как распространенная добавка для суставов может усугублять ее течение. Архив рубрики ~Лента новостей~ В отчете OpenAI показано, как с помощью программистов ускоряется разработка научного программного обеспечения. Архив рубрики ~Лента новостей~ Почему 90% внедрений ИИ в корпоратах заканчиваются пшиком (и при чём тут RAG) Архив рубрики ~Лента новостей~ Старший вице-президент Target утверждает, что настоящая защита компании от угроз со стороны ИИ заключается не в моделях, а во всем, что построено вокруг них. Архив рубрики ~Лента новостей~ Создаем веб‑приложение с Claude Code: деплоим сайт на сервер Архив рубрики ~Лента новостей~ [Перевод] Космический телескоп «Роман» будет искать древние чёрные дыры, наблюдая за тем, как они поглощают звёзды Архив рубрики ~Лента новостей~ Ещё больше технологий кубитов: новые варианты квантовых точек, вакансии в алмазной отрасли. Архив рубрики ~Лента новостей~ Winamp планирует вернуться на рынок благодаря новому партнерству с Deezer. Архив рубрики ~Лента новостей~ Компания Apple накапливает запасы продукции, готовясь к «значительным ограничениям поставок». Архив рубрики ~Лента новостей~ Гипотеза о Языке Мышления как альтернатива Искусственному Интеллекту Архив рубрики ~Лента новостей~ Обзоры искусственного интеллекта от Google становятся все более распространенными в результатах поиска. Архив рубрики ~Лента новостей~ Gemini Plus можно получить на год бесплатно!

🤖 Нельсон AI

✍️ Печатает...

Готов помочь

ГАЙДЫ 43