Можно ли интегрировать с WordPress?

Да, мы используем REST API и Application Passwords — без передачи логина и пароля. Все публикации идут от имени автора.

Работает ли ИИ с Telegram?

Полностью. ИИ может как читать каналы, так и публиковать в ваш канал. Также подключаем inline-ботов и формы сбора лидов.

Сколько времени занимает настройка?

От 3 до 7 дней. Зависит от сложности интеграции и количества источников.

Есть ли бесплатный демо-доступ?

Да, мы запускаем 5–7 дневный демо-доступ с тестовыми данными, чтобы вы увидели систему в работе.

Безопасна ли система?

Да. Все данные хранятся изолированно. Мы не используем их для обучения моделей. Поддерживаем шифрование и резервное копирование.

Что входит в поддержку?

Обновление агентов, добавление источников, исправление ошибок, масштабирование. Поддержка 24/7 по Telegram или email.

Цветной кристалл, окружённый прозрачными пузырями диалога на белом фоне.

Тестирование показывает, что функции Google AI Overviews разглашают миллионы ложных сведений в час.

Апр 9, 2026 0

Достаточно ли 90-процентной точности для поискового робота?

Значок Близнецов и всплывающие окна чата Источник: Google Настройки текста Текст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков
Узнать больше Свернуть в навигацию

Сегодня поиск информации в Google означает столкновение с AI Overviews, поисковым роботом на базе Gemini, который появляется в верхней части страницы результатов. С момента запуска в 2024 году AI Overviews пережил непростые времена, вызвав недовольство пользователей из-за своей непостоянной точности, но сейчас он улучшается и обычно выдает правильный ответ. Однако это невысокая планка. Новый анализ от The New York Times попытался оценить точность AI Overviews, показав, что он прав в 90% случаев. С другой стороны, 1 из 10 ответов ИИ оказывается неверным, а для Google это означает сотни тысяч ложных результатов каждую минуту дня.

Газета The Times провела этот анализ с помощью стартапа Oumi, который сам активно занимается разработкой моделей искусственного интеллекта. Компания использовала инструменты ИИ для проверки обзоров ИИ с помощью теста SimpleQA, распространенного инструмента для оценки достоверности генеративных моделей, таких как Gemini. SimpleQA, выпущенный OpenAI в 2024 году, представляет собой список из более чем 4000 вопросов с проверяемыми ответами, которые можно ввести в систему ИИ.

Компания Oumi начала проводить тестирование в прошлом году, когда Gemini 2.5 еще была лучшей моделью компании. В то время тест показал точность в 85 процентов. Когда тест был повторен после обновления до Gemini 3, AI Overviews ответил правильно на 91 процент вопросов. Если экстраполировать этот процент ошибок на все поисковые запросы в Google, то AI Overviews генерирует десятки миллионов неверных ответов в день.

В отчете приводится несколько примеров ошибок, допущенных AI Overviews. Когда у модели запросили дату, когда бывший дом Боба Марли стал музеем, AI Overviews сослалась на три страницы, на двух из которых эта дата вообще не упоминалась. На последней странице, в Википедии, были указаны два противоречащих друг другу года, и AI Overviews уверенно выбрала неверный. В эталонном тесте также предлагается определить дату включения Йо-Йо Ма в Зал славы классической музыки. Хотя AI Overviews сослалась на веб-сайт организации, где была указана дата включения Ма, она заявила, что Зала славы классической музыки не существует.

Google не очень-то нравится этот тест. Представитель Google Нед Адрианс заявил газете Times, что, по мнению Google, SimpleQA содержит неверную информацию. Оценка моделей часто основывается на аналогичном тесте под названием SimpleQA Verified, который использует меньший набор вопросов, прошедших более тщательную проверку. «В этом исследовании есть серьезные недостатки, — сказал Адрианс газете Times. — Оно не отражает того, что люди на самом деле ищут в Google».

Проблемы с эталонными показателями

Оценка новых моделей ИИ порой больше напоминает искусство, чем науку, и в этом отчасти заключается проблема. У каждой компании есть свой предпочтительный способ демонстрации возможностей модели, а недетерминированная природа генно-модифицированного ИИ может затруднить проверку чего-либо. Эти роботы могут правильно ответить на фактический вопрос, а затем полностью пропустить его, если запрос повторить сразу же. Oumi даже использует инструменты ИИ для проведения своих оценок, и эти модели тоже могут галлюцинировать.

Ещё один нюанс заключается в том, что AI Overviews не представляет собой единую монолитную модель. Google сообщил Ars Technica, что использует «правильную модель» для каждого запроса. Хотя AI Overviews получал бы наилучшие ответы, постоянно используя Gemini 3.1 Pro, это медленно и затратно. Для быстрой загрузки информации на странице поиска обзор использует более быстрые модели Gemini Flash, когда это возможно (что, по всей видимости, происходит в большинстве случаев).

Реакция Google на этот отчет весьма показательна. В сфере достоверности ИИ 9 из 10 — это даже не так уж плохо. Google недавно опубликовал результаты тестов новых моделей, демонстрирующие достоверность в диапазоне от 60 до 80 процентов — эти тесты проводились без использования таких инструментов, как веб-поиск. Использование большего количества данных, например, обширных знаний людей в интернете, делает ИИ более точным, чем сама модель без данных. Однако истина где-то в синих ссылках, и AI Overviews призывает людей принимать во внимание иногда неточные сводки, вместо того чтобы проверять эти источники вручную.

Хотя Google утверждает, что результаты Times не соответствуют тому, что видят люди, возникает вопрос, откуда компания вообще могла это знать. Вы, вероятно, видели ошибки в обзорах ИИ — все мы их видели, потому что так устроен генеративный ИИ. Как напоминает сама Google внизу каждого обзора: «ИИ может ошибаться, поэтому перепроверяйте ответы».

Источник: arstechnica.com

✅ Найденные теги: AI, Google, Overviews, Ложные Сведения, новости, Тестирование

Метки:

Желто-зеленый туннель с рельсами, яркий свет в конце, графическая обработка.

ПРЕДЫДУЩАЯ ЗАПИСЬ

09.04.2026

Разработчик WireGuard VPN не может выпускать обновления программного обеспечения после блокировки учетной записи компанией Microsoft.

СЛЕДУЮЩАЯ ЗАПИСЬ

09.04.2026

Бимагрумаб в сочетании с семаглутидом: обзор нового препарата для лечения ожирения

Диаграмма процесса отбора участников исследования с условиями и исключениями.

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

Еще новости рубрики

Архив рубрики ~Обо всем~

Фантазии

Июл 2, 2024

Архив рубрики ~Обо всем~

Мировоззрение

Июл 2, 2024

Архив рубрики ~Обо всем~

Влияние выдумщиков и фантазеров на развитие…

Июл 2, 2024

Архив рубрики ~Обо всем~

Нет ничего невозможного

Июл 2, 2024

Присоединяйтесь
к нам в

TELEGRAM

галерея

Цифровой отпечаток пальца на технологической плате; концепция безопасности данных.

Диаграмма языковой эволюции, показывающая связи между разными языковыми семьями.

Компания Boehringer передала 50 миллионов долларов и права на продажу цифровой терапевтической технологии Click — Medical Device Network

STAT+: Все согласны с тем, что ИИ-помощники в медицинской практике увеличивают расходы на здравоохранение. Но никто не может прийти к единому мнению о том, что с этим делать.

Диаграмма назначения капецитабина и паклитаксела с данными об отказах в лечении.

Графики и диаграммы данных, отображающие различные кластеры и показатели анализа.

Клинические исследования показали, что редактирование генов эффективно и при β-талассемии.

Иконки приложений ChatGPT, OpenClaw и Claude на экране смартфона.

НОВОСТИ ДРУГИХ РУБРИК

Архив рубрики ~Лента новостей~

Учетные данные безопасности были случайно скомпрометированы на тысячах веб-сайтов.

Исследователи выявили почти 10 000 веб-сайтов, где можно было найти ключи API, что позволило злоумышленникам получить доступ к конфиденциальной информации. Утечка ключей могла позволить злоумышленникам получить контроль над цифровой инфраструктурой компании. Vertigo3d/Getty Images Критически важные учетные данные…

ЧИТАТЬ

Апр 11, 2026

Архив рубрики ~Лента новостей~

Исследование 1700 языков выявило удивительные скрытые закономерности.

Эволюция универсального порядка слов на глобальном языковом древе. В нашем анализе универсального порядка слов¹ «С частотой, значительно превышающей случайную, языки с нормальным порядком подлежащее-дополнение-глагол являются постпозиционными», отсутствие или наличие двух признаков определяет «состояние»: состояние 11 (красный) —…

ЧИТАТЬ

Апр 11, 2026

Архив рубрики ~Лента новостей~

Компания Boehringer передала 50 миллионов долларов и права на продажу цифровой терапевтической технологии Click — Medical Device Network

В результате этой корректировки сделки компания Click возьмет на себя ответственность за маркетинг и коммерциализацию CT-155. Фото: jiris / Shutterstock.com Компании Boehringer Ingelheim и Click Therapeutics изменили динамику своего долгосрочного сотрудничества, в рамках которого Click возьмет на…

ЧИТАТЬ

Апр 11, 2026

Архив рубрики ~Лента новостей~

Впервые терапия с использованием CAR-T-клеток позволила добиться ремиссии трех аутоиммунных заболеваний у одного пациента.

Терапия с использованием CAR-T-клеток успешно вылечила не одно, не два, а сразу три различных аутоиммунных заболевания у одного пациента, что является еще одним доказательством перспективности этого метода в данной области заболеваний, поскольку, вероятно, приближается быстрое получение первого…

ЧИТАТЬ

Апр 11, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO

Тестирование показывает, что функции Google AI Overviews разглашают миллионы ложных сведений в час.

Проблемы с эталонными показателями

Похожие записи

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ Отменить ответ

Еще новости рубрики

Присоединяйтесь к нам в

Рубрики

галерея

НОВОСТИ ДРУГИХ РУБРИК

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Присоединяйтесь
к нам в