Логотип DeepSeek на экране смартфона, увеличенный через прозрачный куб.

DeepSeek научился находить и проверять свои математические доказательства

6541931fb4557dc484fefec569ae06d6

Китайская компания DeepSeek представила модель искусственного интеллекта DeepSeekMath-V2, которая способна не только решать сложные математические задачи, но и самостоятельно проверять правильность своих рассуждений. Модель набрала 118 из 120 баллов на престижном студенческом математическом конкурсе Уильяма Лоуэлла Патнэма 2024 года, превзойдя человека победителя конкурса, который набрал только 90 баллов.

Ранние модели машинного обучения для математики фокусировались на точности финального ответа. Однако правильный ответ не гарантирует правильных рассуждений — иногда это результат удачной ошибки. При доказательстве математических теорем логика рассуждений важнее итогового результата. Разработчики DeepSeek и Gemini Deep Think работают над преодолением этой проблемы, поощряя корректность рассуждений, а не просто правильность ответа.

DeepSeekMath-V2 показала результаты на уровне золотых медалистов Международной математической олимпиады 2025 года и Китайской математической олимпиады 2024 года. Результаты описаны в препринте, опубликованном на сервере arXiv.

977d2057bfe1ae7253415eacc834f3bb

Решаем задачу.

https://medium.datadriveninvestor.com/

Особенность модели — система самопроверки математических доказательств. В отличие от ранних подходов, которые фокусировались на правильности финального ответа, новая система оценивает корректность логических рассуждений на каждом шаге. Модель включает верификатор, который анализирует математические доказательства и выявляет логические ошибки, а мета-система проверяет точность работы самого верификатора. Модель создает решения и оценивает собственную работу, совершенствуя аргументацию до устранения всех проблем.

Трудная математика пока не поддается искусственному интеллекту

0652cb6563bd59f9915477b77e4696e9

Трудная задача.

https://www.getsmartpaper.com/

«Мы находимся в точке, где ИИ справляется с математикой так же хорошо, как умный студент-бакалавр», — говорит Кевин Баззард, математик из Имперского колледжа Лондона.

Система решила пять из шести задач Международной математической олимпиады 2025 года (83,3%), хотя самые сложные задачи остались нерешенными. Math-V2 использует самопроверку на естественном языке, что снижает потребность в участии человека и делает модель более экономичной по сравнению с конкурентами, такими как Gemini Deep Think, которая использует внешний символьный язык Lean.

Math-V2 — одна из немногих моделей такого уровня с открытыми весами, доступная для свободного скачивания и обучения исследователями.

Источник: www.techinsider.ru

Источник: ai-news.ru

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy
dummy-img
Следующим узким местом в развитии ИИ станут не модели, а способность агентов мыслить сообща.
Image Not Found
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026
dummy-img

Взгляд на количественную генетику глазами гена

arXiv:2502.12831v3 Тип объявления: замена-кросс Аннотация: Моделирование эволюции непрерывного признака в биологической популяции — одна из старейших проблем эволюционной биологии, которая привела к появлению количественной генетики. С недавним развитием методов GWAS стало крайне важно связать эволюцию распределения признака…

Апр 21, 2026
dummy-img

Взгляд на количественную генетику глазами гена

arXiv:2502.12831v3 Тип объявления: замена-кросс Аннотация: Моделирование эволюции непрерывного признака в биологической популяции — одна из старейших проблем эволюционной биологии, которая привела к появлению количественной генетики. С недавним развитием методов GWAS стало крайне важно связать эволюцию распределения признака…

Апр 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых