Математические формулы на черной доске: графики, диаграммы, уравнения и расчеты.

Модели искусственного интеллекта начинают решать сложные математические задачи.

Изображение математических уравнений, написанных на доске.
Источник изображения: andresr (откроется в новом окне) / Getty Images

В минувшие выходные Нил Сомани, инженер-программист, бывший количественный исследователь и основатель стартапа, тестировал математические возможности новой модели OpenAI и сделал неожиданное открытие. После того, как он вставил задачу в ChatGPT и дал ей подумать 15 минут, он вернулся к полному решению. Он оценил доказательство и формализовал его с помощью инструмента Harmonic — и всё оказалось в порядке.

«Мне было любопытно установить базовый уровень, когда студенты магистратуры в области права эффективно решают открытые математические задачи, и определить, в каких областях они испытывают трудности», — сказал Сомани. Неожиданным оказалось то, что, используя новейшую модель, границы прогресса начали немного расширяться.

Логическая цепочка рассуждений ChatGPT еще более впечатляет, в ней быстро перечисляются математические аксиомы, такие как формула Лежандра, постулат Бертрана и теорема о звезде Давида. В конце концов, модель нашла сообщение на Math Overflow от 2013 года, где математик из Гарварда Ноам Элкис предложил элегантное решение аналогичной проблемы. Но окончательное доказательство ChatGPT существенно отличалось от работы Элкиса и давало более полное решение версии проблемы, поставленной легендарным математиком Полем Эрдошем, чья обширная коллекция нерешенных задач стала полигоном для ИИ.

Для тех, кто скептически относится к машинному интеллекту, это удивительный результат — и не единственный. Инструменты ИИ стали повсеместными в математике, от ориентированных на формализацию моделей лингвистического анализа, таких как Aristotle от Harmonic, до инструментов обзора литературы, таких как Deep Research от OpenAI. Но после выпуска GPT 5.2 — которую Сомани описывает как «по неофициальным данным, более совершенную в математическом мышлении, чем предыдущие версии» — огромный объем решенных задач стало трудно игнорировать, что поднимает новые вопросы о способности больших языковых моделей расширять границы человеческих знаний.

Сомани изучал проблемы Эрдоша — набор из более чем 1000 гипотез венгерского математика, которые поддерживаются в режиме онлайн. Эти проблемы стали заманчивой целью для математических вычислений с использованием ИИ, поскольку они значительно различаются как по тематике, так и по сложности. Первая партия автономных решений появилась в ноябре от модели AlphaEvolve, работающей на базе Gemini, — но совсем недавно Сомани и другие обнаружили, что GPT 5.2 удивительно хорошо справляется с математикой высокого уровня.

С Рождества 15 задач на сайте Erdős были переведены из категории «открытые» в категорию «решенные», и в 11 из решений конкретно указано участие моделей искусственного интеллекта в этом процессе.

Известный математик Теренс Тао на своей странице в GitHub более подробно рассматривает достигнутый прогресс, перечисляя восемь различных задач, в решении которых модели ИИ добились значительного автономного прогресса в задаче Эрдоша, а также шесть других случаев, когда прогресс был достигнут за счет поиска и развития предыдущих исследований. До того, чтобы системы ИИ могли выполнять математические вычисления без вмешательства человека, еще далеко, но ясно, что большие модели играют важную роль.

В своей работе о Mastodon Тао предположил, что масштабируемость систем искусственного интеллекта делает их «более подходящими для систематического применения к „длинному хвосту“ малоизвестных проблем Эрдоша, многие из которых на самом деле имеют простые решения».

«Таким образом, многие из этих более простых проблем Эрдоша теперь с большей вероятностью могут быть решены исключительно с помощью методов, основанных на искусственном интеллекте, чем с помощью человеческих или гибридных средств», — продолжил Тао.

Еще одной движущей силой является недавний сдвиг в сторону формализации — трудоемкой задачи, которая упрощает проверку и расширение математических рассуждений. Формализация не требует использования ИИ или даже компьютеров, но новый набор автоматизированных инструментов значительно упростил этот процесс. Открытый программный «помощник по доказательствам» Lean, разработанный в Microsoft Research в 2013 году, получил широкое распространение в этой области как способ формализации доказательств, а такие инструменты ИИ, как Aristotle от Harmonic, обещают автоматизировать большую часть работы по формализации.

Для основателя Harmonic Тудора Ахима внезапный скачок в количестве решенных задач Эрдоша менее важен, чем тот факт, что величайшие математики мира начинают серьезно относиться к этим инструментам. «Меня больше волнует тот факт, что профессора математики и информатики используют [инструменты ИИ]», — сказал Ахим. «Эти люди должны защищать свою репутацию, поэтому, когда они говорят, что используют Aristotle или ChatGPT, это реальное доказательство».

Источник: techcrunch.com

✅ Найденные теги: искусственный интеллект, Математические Задачи, Модели, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых