Логотип DeepSeek на экране смартфона, увеличенный через прозрачный куб.

DeepSeek научился находить и проверять свои математические доказательства

6541931fb4557dc484fefec569ae06d6

Китайская компания DeepSeek представила модель искусственного интеллекта DeepSeekMath-V2, которая способна не только решать сложные математические задачи, но и самостоятельно проверять правильность своих рассуждений. Модель набрала 118 из 120 баллов на престижном студенческом математическом конкурсе Уильяма Лоуэлла Патнэма 2024 года, превзойдя человека победителя конкурса, который набрал только 90 баллов.

Ранние модели машинного обучения для математики фокусировались на точности финального ответа. Однако правильный ответ не гарантирует правильных рассуждений — иногда это результат удачной ошибки. При доказательстве математических теорем логика рассуждений важнее итогового результата. Разработчики DeepSeek и Gemini Deep Think работают над преодолением этой проблемы, поощряя корректность рассуждений, а не просто правильность ответа.

DeepSeekMath-V2 показала результаты на уровне золотых медалистов Международной математической олимпиады 2025 года и Китайской математической олимпиады 2024 года. Результаты описаны в препринте, опубликованном на сервере arXiv.

977d2057bfe1ae7253415eacc834f3bb

Решаем задачу.

https://medium.datadriveninvestor.com/

Особенность модели — система самопроверки математических доказательств. В отличие от ранних подходов, которые фокусировались на правильности финального ответа, новая система оценивает корректность логических рассуждений на каждом шаге. Модель включает верификатор, который анализирует математические доказательства и выявляет логические ошибки, а мета-система проверяет точность работы самого верификатора. Модель создает решения и оценивает собственную работу, совершенствуя аргументацию до устранения всех проблем.

Трудная математика пока не поддается искусственному интеллекту

0652cb6563bd59f9915477b77e4696e9

Трудная задача.

https://www.getsmartpaper.com/

«Мы находимся в точке, где ИИ справляется с математикой так же хорошо, как умный студент-бакалавр», — говорит Кевин Баззард, математик из Имперского колледжа Лондона.

Система решила пять из шести задач Международной математической олимпиады 2025 года (83,3%), хотя самые сложные задачи остались нерешенными. Math-V2 использует самопроверку на естественном языке, что снижает потребность в участии человека и делает модель более экономичной по сравнению с конкурентами, такими как Gemini Deep Think, которая использует внешний символьный язык Lean.

Math-V2 — одна из немногих моделей такого уровня с открытыми весами, доступная для свободного скачивания и обучения исследователями.

Источник: www.techinsider.ru

Источник: ai-news.ru

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.
dummy-img
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.
dummy-img
dummy-img
Взаимодействие человека и машины погружается под воду.
Взаимодействие человека и машины погружается под воду.
Дифференциально приватное машинное обучение в масштабе с использованием JAX-Privacy
Image Not Found
Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.

Вкратце Опубликовано: Изображение предоставлено: Thos Robinson/Getty Images для The New York Times (откроется в новом окне) Джули Борт Компания Anthropic получила от Amazon 5 миллиардов долларов и в обмен пообещала инвестировать 100 миллиардов долларов в облачные сервисы.…

Апр 21, 2026
dummy-img

Как почистить виниловые пластинки (2026): пылесос, ультразвук, чистящий раствор, щетка.

Эти щелчки и треск недопустимы. Приведите свою музыку в порядок с помощью этого удобного руководства. Источник: www.wired.com

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026
Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Загрузка: обход банковских систем кибермошенниками и проблемы с удалением углерода.

Это сегодняшний выпуск The Download, нашей ежедневной новостной рассылки, которая предоставляет вам ежедневную порцию событий в мире технологий. Кибермошенники обходят системы безопасности банков с помощью незаконных инструментов, продаваемых в Telegram. В центре по отмыванию денег в Камбодже…

Апр 21, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых