Image

GPT-5 уже здесь. Что дальше?

Этот нашумевший релиз вносит ряд улучшений в пользовательский интерфейс ChatGPT. Но до уровня AGI ему всё ещё далеко.

""

Стефани Арнетт/Обзор технологий MIT | Adobe Stock, Envato

Компания OpenAI наконец-то выпустила GPT-5. Новая система устраняет различие между флагманскими моделями OpenAI и её серией моделей рассуждений, автоматически направляя запросы пользователей к быстрой модели без рассуждений или к более медленной версии с рассуждениями. Теперь она доступна всем через веб-интерфейс ChatGPT, хотя пользователям, не оплатившим подписку, может потребоваться несколько дней, чтобы получить полный доступ к новым возможностям.

Возникает соблазн сравнить GPT-5 с её явным предшественником, GPT-4, но более показательным является сравнение с o1, первой моделью рассуждений OpenAI, выпущенной в прошлом году. В отличие от широкого выпуска GPT-5, o1 изначально была доступна только подписчикам Plus и Team. Эти пользователи получили доступ к совершенно новой языковой модели — модели, которая «обосновывала» свои ответы, генерируя дополнительный текст перед выдачей окончательного ответа, что позволяло ей решать гораздо более сложные задачи, чем её аналоги, не использующие рассуждения.

ИИ внезапно стал темой для обсуждения на обеденном столе

На этой неделе этот термин встречается повсюду, но его значение, как всегда, расплывчато. Важно разработать определение.

В то время как o1 был крупным технологическим достижением, GPT-5 — это, прежде всего, усовершенствованный продукт. Во время пресс-конференции Сэм Альтман сравнил GPT-5 с дисплеями Retina от Apple, и это уместная аналогия, хотя, возможно, и не совсем в том смысле, в каком он её задумал. Подобно беспрецедентно чёткому экрану, GPT-5 обеспечит более приятный и плавный пользовательский опыт. Это не мелочь, но она далека от преобразующего будущего искусственного интеллекта, которое Альтман расхваливал большую часть прошлого года. В ходе пресс-конференции Альтман назвал GPT-5 «значительным шагом на пути к общему искусственному интеллекту» (AGI), и, возможно, он прав, но если так, то это очень небольшой шаг.

Взять, к примеру, демонстрацию возможностей модели, которую OpenAI представила журналу MIT Technology Review перед её выпуском. Ян Дюбуа, руководитель программы постобучения в OpenAI, попросил GPT-5 разработать веб-приложение, которое помогло бы его партнёрше выучить французский язык, чтобы ей было легче общаться с семьёй. Модель блестяще выполнила его инструкции и создала привлекательное и удобное приложение. Но когда я дал GPT-4o практически идентичную подсказку, она создала приложение с точно такой же функциональностью. Единственное отличие заключалось в том, что оно было не таким эстетичным.

Некоторые другие улучшения пользовательского опыта более существенны. Возможность выбора модели, а не пользователя, применять ли обоснование к каждому запросу, устраняет серьёзную проблему, особенно для пользователей, которые не следят за развитием LLM.

И, по словам Альтмана, GPT-5 вычисляет гораздо быстрее, чем модели серии O. Тот факт, что OpenAI предоставляет его бесплатным пользователям, говорит о том, что его эксплуатация обходится компании дешевле. Это важно: быстрейшее и недорогое использование мощных моделей — сложная задача, и её решение — ключ к снижению воздействия ИИ на окружающую среду.

Компания OpenAI также предприняла шаги по снижению галлюцинаций, которые были постоянной проблемой. Оценки OpenAI показывают, что модели GPT-5 значительно реже делают ложные заявления, чем их предшественники, O3 и GPT-4o. Если это достижение выдержит проверку, оно может проложить путь к созданию более надёжных и заслуживающих доверия агентов. «Галлюцинации могут создавать реальные проблемы безопасности», — говорит Дон Сонг, профессор компьютерных наук Калифорнийского университета в Беркли. Например, агент, вызывающий галлюцинации программных пакетов, может загрузить вредоносный код на устройство пользователя.

GPT-5 достигла высочайшего уровня производительности в нескольких бенчмарках, включая тест агентских способностей и тесты кодирования SWE-Bench и Aider Polyglot. Однако, по словам Клементины Фурье, исследователя искусственного интеллекта в компании HuggingFace, эти тесты близки к насыщению, а это означает, что текущие модели достигли практически максимальной производительности.

«По сути, это как смотреть на результаты старшеклассника по задачам для среднего класса», — говорит она. «Если старшеклассник не справляется, это говорит о чём-то, но если справляется, это мало о чём говорит». Фурье сказала, что была бы впечатлена, если бы система набрала 80% или 85% на SWE-Bench, но она набрала всего 74,9%.

В конечном счёте, главный посыл OpenAI заключается в том, что GPT-5 удобнее в использовании. «Эта модель производит очень хорошее впечатление, и я думаю, что люди это почувствуют, особенно те, кто не тратит время на размышления о моделях», — сказал Ник Тёрли, руководитель ChatGPT.

Однако одни только вибрации не приведут к автоматизированному будущему, обещанному Альтманом. Рассуждение казалось важным шагом на пути к ИИОН. Мы всё ещё ждём следующего.

Источник: www.technologyreview.com

✅ Найденные теги: GPT-5:, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых