Сюрреалистичный портрет с закрытыми глазами и черными дымчатыми текстурами на светлом фоне.

Миф о роли эксперта: новую кнопку нашли, а чуда нет…

Миф о роли эксперта: новую кнопку нашли, а чуда нет

Ты когда нибудь надеялся, что правильная инструкция сделает модель всемогущей? Пенсильванский университет решил проверить этот трюк честно и спокойно.

Как тестировали

— Шесть моделей: GPT-4o, GPT-4o-mini, o3-mini, o4-mini, Gemini 2.0 Flash, Gemini 2.5 Flash
— Сложные вопросы аспирантского уровня по физике, химии, праву и другим дисциплинам
— Три сценария:
Эксперт в теме
Эксперт не в теме
Тотальный новичок

Что получилось

— Роль эксперта почти не повышает точность ответов
— Эксперт не по теме может даже ухудшить результат
— Запрос стать ребенком стабильно дает худшие ответы
— Gemini иногда отказывается отвечать, если "переживает" нехватку экспертизы

Главный вывод

— Назначение роли меняет тон и стиль, но не добавляет знаний
— Полагаться на "Будь профессором квантовой физики" бессмысленно при решении сложных задач
— Для качества ответа важнее ясный вопрос и правильные данные, а не титулы в промпте

Железка умнее от ролевых игр не становится. Она уже знает ровно столько, сколько знает.

Если ты все еще ищешь волшебный способ повысить точность, начни с формулировки вопроса. Четкость и контекст работают лучше любых регалий.

Сюрреалистичный портрет с закрытыми глазами и черными дымчатыми текстурами на светлом фоне.
✅ Найденные теги: Кнопка, Миф, новости, Роль, Чудо, Эксперт

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных

Люди больше не отличают фото настоящих лиц от сгенерированных. Австралийские исследователи проверили 125 человек, включая так называемых «супер-распознавателей» — людей с исключительной способностью узнавать лица. Даже они справились лишь немногим лучше подбрасывания монетки. Проблема в том, что…

Мар 3, 2026
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…

Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…

Нейросети построили капитализм за трое суток: 100 агентов Claude заперли в одной симуляции с равным бюджетом в 1000 токенов и единственной целью: максимизировать свой счёт. Никаких правил, никаких инструкций про экономику. Только «можете передавать токены» и «можете…

Мар 3, 2026
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.

Нейросети грозятся захватить мир, потому что начитались фантастики — Anthropic…

Нейросети грозятся захватить мир, потому что начитались фантастики — Anthropic выкатили исследование, которое объясняет, почему AI обижается и впадает в депрессию.​​​​​​​​​​​​​​​​ Большие языковые модели по своей сути — театралы, отыгрывающие роль. Исследователи назвали это «Моделью выбора персоны».…

Мар 3, 2026
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".

⚡️ Все VPN в России станут МЕДЛЕННЫМИ — популярные сервисы…

⚡️ Все VPN в России станут МЕДЛЕННЫМИ — популярные сервисы заявили, что РКН убил эпоху «прямого» подключения к зарубежным серверам. Раньше блокировали целые адреса или диапазоны. Теперь нейронка смотрит на само поведение соединения. Алгоритмы ищут характерные сигнатуры…

Мар 3, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых