Image

Deloitte возвращает деньги австралийскому правительству за отчёт стоимостью $440K из-за галлюцинаций GPT-4o

7896a8f09d2d3dac6f6aa8f758bcf76a

«У Deloitte проблемы с человеческим интеллектом» — сенатор предложила лучше купить подписку на ChatGPT.

Консалтинговый гигант Deloitte Australia согласился вернуть последний платёж по контракту на $440 тысяч после того, как признал использование ИИ в отчёте, который оказался напичкан ошибками: три несуществующие академические ссылки, выдуманная цитата из решения Федерального суда и неправильно написанное имя судьи.

Отчёт готовили для Департамента занятости и трудовых отношений — он должен был проверить IT-систему для автоматизации штрафов получателям социальных пособий. По иронии, Deloitte критиковала правительственную автоматизацию, используя собственную кривую автоматизацию.

Первую версию опубликовали в июле. Меньше чем через месяц академик из Сиднейского университета Кристофер Радж обнаружил проблемы и предположил, что это галлюцинации генеративного ИИ. Deloitte сначала отмалчивалась.

В новой версии отчёта, тихо загруженной в пятницу перед длинными выходными (снова по иронии, сегодня в Австралии отмечается День труда), удалили дюжину ссылок на несуществующие работы профессора Лизы Бёртон Кроуфорд из Сиднейского университета. Ещё две ссылки — на несуществующий отчёт профессора Бьёрна Регнелля из университета Лунда в Швеции.

Самое жёсткое: выдуманная цитата из ключевого дела о незаконных автоматических возвратах уже выплаченных пособий — Deanna Amato v Commonwealth. GPT-4o написал имя судьи с ошибкой («Justice Davis» вместо Jennifer Davies) и сочинил цитату якобы из параграфов 25 и 26 решения: «Бремя доказывания лежит на лице, принимающем решение. Законные права человека не могут быть урезаны на основе предположения, не подкреплённого доказательствами». Красиво звучит, но такого не было.

Радж заметил интересную деталь в исправленной версии: «Вместо того чтобы заменить одну галлюцинированную ссылку на реальную, они заменили её на пять-шесть-семь-восемь новых. Это говорит о том, что исходное утверждение в отчёте вообще не базировалось ни на каком конкретном источнике». Очень вероятно, что Deloitte попросила GPT придумать обоснование — он и придумал.

В обновлённой версии в разделе методологии Deloitte признала использование «генеративной ИИ большой языковой модели (Azure OpenAI GPT-4o), лицензированной DEWR и размещённой на Azure-инфраструктуре департамента». Якобы её использовали для устранения «пробелов в прослеживаемости и документации».

Радж приравнял это к признанию ошибки из-за ИИ:

«Это больше не «сильная гипотеза». Deloitte выдала признание, пусть и спрятанное в разделе методологии. Они признали использование генеративного ИИ для основной аналитической задачи, но не раскрыли это изначально».

По его словам, рекомендациям отчёта больше нельзя доверять: «Когда сам фундамент отчёта построен на ущербной, изначально нераскрытой и неэкспертной методологии — рекомендациям доверять нельзя».

Сенатор-лейборист Дебора О’Нил (опять этот труд!), участвовавшая в расследовании консалтинговых фирм, заявила:

«У Deloitte проблемы с человеческим интеллектом. Это было бы смешно, если бы не было так печально. Частичный возврат выглядит как частичное извинение за работу ниже стандарта. Возможно, вместо большой консалтинговой фирмы покупателям лучше оформить подписку на ChatGPT».

Департамент занятости настаивает, что «суть независимого обзора сохранена, изменений в рекомендациях нет», но отказался отвечать на вопросы о том, считают ли они ошибки следствием использования ИИ.

Для Deloitte это особенно неловкая ситуация, потому что компания зарабатывает растущую часть своих $107 млрд годовой выручки на консультациях по ИИ, хвастается широким использованием технологии и при этом подчёркивает необходимость человеческой проверки любого вывода ИИ.

С 2021 года Deloitte заключила контрактов с этим департаментом почти на $25 млн. Департамент отказался отвечать, будет ли дальше работать с Deloitte или попытается вернуть весь гонорар.

Но для всех, кто зарабатывает на консалтинге, это тревожный звоночек.

Скрытый текст

Такие посты чаще выходят у меня в Telegram-канале, где в основном пишу про AI и его применение. Что? Сам раскрыл этот спойлер.

Источник: habr.com

✅ Найденные теги: Deloitte, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых