GPT-5 Pro устанавливает новый рекорд на FrontierMath Tier 4
Новая версия модели от OpenAI — GPT-5 Pro — показала лучший на сегодня результат на FrontierMath Tier 4, решив 6 из 48 задач (13 %). Среди них оказалась одна задача, которую ранее не смогла решить ни одна другая модель.
При повторных запусках итоговый pass@2 вырос до 17 %, что подтверждает стабильность при работе с особенно сложными математическими сценариями.
Для сравнения:
— Grok 4 Heavy набирает всего 2–3 %,
— Gemini 2.5 DeepThink — 12 %, причём на одну задачу меньше, чем GPT-5 Pro.
Результаты закрепляют лидерство OpenAI в области высокоточной reasoning-математики и указывают на быстрое приближение моделей к уровню экспертных математиков.
























