Что такое агент данных?
Простое объяснение того, что такое агент данных и как он работает.
Делиться

Работая в Microsoft, у меня есть возможность тестировать новые аналитические инструменты на основе искусственного интеллекта, включая агент данных Microsoft Fabric. Поэтому я хочу поделиться тем, что я узнал, объяснить, что такое агент данных, и подчеркнуть разницу между ним и «стандартным» агентом ИИ.
Итак, без лишних слов, вот моё определение агента данных:
Агент данных — это отчет, с которым вы можете взаимодействовать.
Для тех из нас, кто работает в сфере аналитики, это означает, что два давних желания наконец-то могут стать реальностью:
#1: Аналитики тратят гораздо меньше времени на создание визуализаций.
#2: Аналитические данные, получаемые в режиме самообслуживания, становятся ближе к бизнес-пользователям.
Позвольте мне подробнее остановиться на каждом из этих пунктов.
Меньше визуализаций, а не меньше аналитических выводов.
Мне очень нравятся хорошие отчеты, которые позволяют мне понять, что происходит с интересующими меня в данный момент показателями. Но, будучи специалистом в области аналитики, я знаю, как отчеты иногда могут искажать данные, заставляя бизнес-пользователей часто обращаться к аналитикам за разъяснениями KPI, обычно за 10 минут до важных совещаний.
И это одна из причин, почему мы часто попадаем в порочный круг, когда панели мониторинга никому не нужны, а заинтересованные стороны постоянно требуют «целевые показатели», предоставляемые по мере необходимости или в виде электронных таблиц.
С другой стороны, визуализация и электронные таблицы никуда не денутся, но предоставление аналитических данных теперь осуществляется по-новому с помощью агента данных Fabric.
Вместо того чтобы заключать запросы в графы, вы можете заключать их в подсказки и инструкции, связанные с готовой к использованию управляемой базой данных в Fabric, например, в хранилище данных, хранилище данных, семантические модели Power BI, базу данных KQL или даже онтологию. Это означает, что базовые данные все еще должны быть подготовлены и смоделированы для ответа на бизнес-вопросы, такие как «Каков был доход на этой неделе по сравнению с прошлой?»
Однако с точки зрения проектирования, вместо создания визуального отчета с заданными параметрами для ответа на этот бизнес-вопрос, теперь вы создаете агент данных с заданными параметрами, который предоставляет этот и другие подмножества ответов, полученных из базовой модели (моделей) данных.
Точнее, поток «затраты-выпуск» выглядит следующим образом:
(1) заинтересованная сторона задает вопрос, (2) агент, работающий на базе API Azure OpenAI Assistant, интерпретирует вопрос и «решает», какой из источников данных с наибольшей вероятностью содержит ответ, основываясь на схемах источников и инструкциях агента, (3) генерирует соответствующий запрос (SQL, DAX или KQL в зависимости от типа источника), (4) проверяет его, (5) выполняет его с использованием учетных данных заинтересованной стороны и (6) возвращает результат в виде текста или таблицы, но (пока) не в виде визуализации.
В итоге, взаимодействие заинтересованных сторон с аналитическими данными через агента данных представляет собой сессию вопросов и ответов на основе тщательно подобранного набора данных, а детализированные визуализации можно заменить уточняющими вопросами, например: «Можете ли вы также разбить выручку по сегментам?»
Таким образом, становится ясно, что работу аналитиков больше не нужно представлять исключительно в виде дашбордов, то есть давно известного наглядного доказательства того, что работа по фиксации бизнес-логики в моделях данных была выполнена.
Теперь давайте поговорим о…
Аналитические данные, получаемые самостоятельно, ближе к «месту обитания» бизнес-пользователей.
Я уже упоминал, что отчеты иногда могут искажать показатели, но это не единственная причина, почему принцип «Если вы это построите, они придут» редко работает для них или для аналитики в целом. Правда в том, что барьер знаний часто слишком высок, чтобы понять лежащие в основе семантические модели и как использовать инструменты бизнес-аналитики для создания визуализаций на их основе.
Хотя это указывает на проблему недостаточной грамотности в работе с данными, которая является проблемой управления изменениями, факт остается фактом: целевая бизнес-аудитория, которая должна быть потребителями отчетов, зачастую слишком занята, чтобы тратить время на изучение инструментов бизнес-аналитики для самостоятельного анализа данных.
Вот почему важно приблизить аналитические данные к тому месту, где «живут» конечные пользователи, что сегодня указывает на инструменты на основе искусственного интеллекта, такие как M365 Copilot.
Благодаря возможности получать доступ к аналитическим данным через агентов обработки данных вне Fabric, аналитики теперь могут сосредоточиться на аналитической логике, лежащей в основе самообслуживаемых агентов обработки данных, а конечные пользователи могут получать доступ к аналитическим данным в тех же инструментах на основе ИИ, которые поддерживают их другие повседневные задачи, без сложностей, связанных с переходом на другую платформу.
Следует отметить, что это не единственный способ интеграции агентов данных Fabric в рабочие процессы, и независимо от того, являетесь ли вы разработчиком или пользователем, полезно знать об этом…
Разница между данными и агентом искусственного интеллекта.

На данный момент мы узнали, что агент данных Fabric — это аналитический агент, ориентированный на доступ к данным только для чтения и управляемый доступ к ним, способный преобразовывать запросы на естественном языке в сложные запросы к базе данных, которые позволяют получить ценные сведения даже за пределами клиента Fabric.
С другой стороны, агент ИИ определяется как система, которая позволяет большим языковым моделям (LLM) выполнять действия, а не просто отвечать на запросы, от имени пользователей или других систем, используя инструменты и знания.
То есть, вся магия заключается в настройке агента ИИ, где вы можете использовать агента данных Fabric в качестве специализированного инструмента или источника знаний.
Я проиллюстрирую это одним простым примером.
Представьте, что авторизованный пользователь просит ИИ-агента «составить электронное письмо команде с кратким обзором доходов за прошедшую неделю по сегментам». Для выполнения этой работы ИИ-агенту, помимо прочего, потребуется подготовить данные о доходах из корпоративной базы данных. Поэтому, чтобы уменьшить количество ошибок в расчетах доходов, разработчик создаст рабочий процесс для агента, который будет направлять запрос в инструмент Fabric, который возьмет на себя основную работу по определению схемы, написанию запроса, его выполнению и возврату точных данных. Наконец, ИИ-агент использует эти данные для завершения своего общего рабочего процесса и написания электронного письма.
В чём же разница между ними? В том, что агент ИИ действует, а агент, работающий с данными, занимает нейтральную позицию.
Спасибо за прочтение.
Если этот пост оказался для вас полезным, поделитесь им со своими знакомыми. 👏
Подписывайтесь на Medium✍️ и LinkedIn 🖇️, чтобы читать больше статей.
Хотите узнать больше об агентах обработки данных?
В таком случае, ознакомьтесь со следующими ресурсами:
Создание агента данных Fabric – Microsoft Fabric
Узнайте, как создать агент данных Fabric, способный отвечать на вопросы о данных. Узнайте больше на сайте data.learn.microsoft.com
Внедрение агентов данных Microsoft Fabric – обучение
Внедрите агенты данных Microsoft Fabric (общайтесь со своими данными) learn.microsoft.com
Марина Тосич. Посмотреть все материалы от Марины Тосич.
Источник: towardsdatascience.com

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.