График точности GPT-5.2 и GPT-5.1 в программной инженерии по количеству токенов вывода.

Вчера OpenAI выпустили GPT-5.2, и вот что тут интересно. Может…

Вчера OpenAI выпустили GPT-5.2, и вот что тут интересно.

Может показаться, что это очередная модель на пару процентов лучше предыдущей, но GPT-5.2 стала самой человеческой нейросетью на данный момент.

Есть бенчмарк ARC-AGI-2 на абстрактное мышление. Он проверяет не знания, а способность самостоятельно придумывать правила и комбинировать их для решения новых задач. Его называют тестом на искусственный разум. Средний человек с хорошими умственными способностями набирает 60%, GPT-5.2 показала 53-54%. Впервые разрыв между человеком и AI стал настолько малым.

Второй момент: сложный математический экзамен AIME 2025. Алгебра, геометрия, комбинаторика на уровне олимпиад. GPT-5.2 впервые решила все задачи на 100%. Ни одной ошибки.

Третий: тест GDPval проверяет, может ли AI выполнять реальную работу из разных профессий. Результат 70-74% означает уровень хорошего специалиста. Выше, чем у большинства работников.

Что-то мне подсказывает, что следующий год будет очень интересным для рынка труда.​​​​​​​​​​​​​​​​

#полезное

График точности GPT-5.2 и GPT-5.1 в программной инженерии по количеству токенов вывода.

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Image Not Found
Спасаем макбук от мусора — бесплатная замена CleanMyMac для очистки…

Спасаем макбук от мусора — бесплатная замена CleanMyMac для очистки…

Спасаем макбук от мусора — бесплатная замена CleanMyMac для очистки памяти и оптимизации системы PureMac — полностью бесплатная и открытая альтернатива платному CleanMyMac. Без подписок, без телеметрии, без сбора данных. Что умеет: — App Uninstaller — полное…

Апр 16, 2026
Трое людей используют смартфоны на складе, один в жилете, все с беспроводными наушниками.

Компания DeepL, известная своими функциями перевода текста, теперь хочет переводить и ваш голос.

Источник изображения: DeepL Компания DeepL, специализирующаяся на переводе и известная своими текстовыми инструментами, сегодня выпустила…

Апр 16, 2026
ideipro logotyp

Лучшая камера GoPro (2026): компактная, бюджетная, аксессуары

Вы — герой боевиков, и вам нужна соответствующая камера. Мы поможем вам разобраться во всех моделях, дадим рекомендации по аксессуарам и…

Апр 16, 2026
Родео: ковбой на скачущей лошади в загоне, стильная обработка изображения.

Почему мнения об ИИ так разделились

Стефани Арнетт/MIT Technology Review | Getty Images Эта статья первоначально появилась в The Algorithm, нашей еженедельной рассылке об…

Апр 16, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO