Image

Как создать мощную систему глубоких исследований

Узнайте, как получить доступ к огромным объемам информации с помощью собственной системы глубоких исследований.

Делиться

Глубокое исследование

Глубокое исследование — популярная функция, которую можно активировать в таких приложениях, как ChatGPT и Google Gemini. Она позволяет пользователям задавать вопросы как обычно, а приложение тратит больше времени на тщательное исследование вопроса и поиск лучшего ответа, чем обычные ответы LLM.

Вы также можете применить это к своей собственной коллекции документов. Например, предположим, у вас есть тысячи документов с внутренней информацией компании. Вы можете создать глубокую исследовательскую систему, которая будет принимать вопросы пользователей, сканировать все доступные (внутренние) документы и выдавать на основе этой информации эффективный ответ.

Система глубоких исследований

Оглавление

  • Зачем создавать глубокую исследовательскую систему?
  • Как построить глубокую исследовательскую систему
    • Сбор и индексация информации
    • Инструменты
    • Собираем все вместе
  • Заключение

Зачем создавать глубокую исследовательскую систему?

Первый вопрос, который вы можете себе задать:

Зачем мне нужна система глубоких исследований?

Это справедливый вопрос, поскольку существуют и другие альтернативы, которые могут быть жизнеспособны во многих ситуациях:

  • Введите все данные в LLM
  • ТРЯПКА
  • Поиск по ключевым словам

Если вам подходят эти более простые системы, то почти всегда стоит их использовать. Самый простой подход — просто загрузить все данные в LLM. Если ваша информация содержится менее чем в 1 миллионе токенов, это определённо хороший вариант.

Более того, если традиционный RAG хорошо работает или вы можете найти релевантную информацию с помощью поиска по ключевым словам, вам также следует выбрать эти варианты. Однако иногда ни один из этих вариантов не может решить вашу проблему. Возможно, вам требуется глубокий анализ множества источников, а метод извлечения фрагментов по сходству (RAG) неэффективен. Или вы не можете использовать поиск по ключевым словам, поскольку недостаточно знакомы с набором данных, чтобы знать, какие ключевые слова использовать. В этом случае вам следует рассмотреть возможность использования системы глубокого исследования.

Как построить глубокую исследовательскую систему

Конечно, вы можете использовать систему глубоких исследований от таких поставщиков, как OpenAI, предоставляющую API для глубоких исследований. Это может быть хорошей альтернативой, если вы предпочитаете простоту. Однако в этой статье я более подробно расскажу о том, как устроена система глубоких исследований и почему она полезна. Компания Anthropic написала очень хорошую статью о своей системе многоагентных исследований (которая и является основой для глубоких исследований), которую я рекомендую прочитать, чтобы узнать больше об этой теме.

Сбор и индексация информации

Первый шаг любой системы поиска информации — собрать всю информацию в одном месте. Возможно, у вас есть информация в таких приложениях, как:

  • Google Диск
  • Понятие
  • Salesforce

Затем вам либо нужно собрать эту информацию в одном месте (например, преобразовать ее в PDF-файлы и сохранить в одной папке), либо вы можете подключиться к этим приложениям, как это сделал ChatGPT в своем приложении.

Собрав информацию, нам нужно её индексировать, чтобы сделать её легкодоступной. Необходимо создать два основных индекса:

  • Индекс поиска по ключевым словам. Например, BM25.
  • Индекс сходства векторов: разделите текст на части, вставьте их и сохраните в базе данных векторов, например Pinecone.

Это делает информацию легкодоступной с помощью инструментов, которые я опишу в следующем сеансе.

Инструменты

Агентам, которых мы будем использовать позже, потребуются инструменты для получения релевантной информации. Поэтому вам следует создать ряд функций, которые упростят получение релевантной информации для LLM. Например, если пользователь запрашивает отчёт о продажах, LLM может выполнить поиск по ключевым словам и проанализировать полученные документы. Эти инструменты могут выглядеть следующим образом:

@tool def keyword_search(query: str) -> str: «»» Поиск ключевых слов в документе. «»» results = keyword_search(query) # форматирование ответов для облегчения чтения LLM formatted_results = «n».join([f»{result['file_name']}: {result['content']}» for result in results]) return formatted_results @tool def vector_search(query: str) -> str: «»» Встраивание запроса и поиск похожих векторов в документ. «»» vector = embed(query) results = vector_search(vector) # форматирование ответов для облегчения чтения LLM formatted_results = «n».join([f»{result['file_name']}: {result['content']}» for result in results]) return formatted_results

Вы также можете разрешить агенту доступ к другим функциям, таким как:

  • поиск в Интернете
  • Поиск только по имени файла

И другие потенциально важные функции

Собираем все вместе

Система глубокого исследования обычно состоит из агента-организатора и множества субагентов. Подход обычно следующий:

  • Агент-оркестратор получает запрос пользователя и планирует подходы к его выполнению.
  • Множество субагентов отправляются для сбора соответствующей информации и передачи обобщенной информации обратно оркестратору.
  • Оркестратор определяет, достаточно ли у него информации для ответа на запрос пользователя. Если нет, мы возвращаемся к последнему пункту списка; если да, мы можем предоставить последний пункт списка.
  • Оркестратор собирает всю информацию воедино и предоставляет пользователю ответ.
332c19afd0b101a9acc46a8856cc02d8

Кроме того, вы можете задать уточняющий вопрос, если вопрос пользователя неопределённый или просто чтобы сузить область его запроса. Вы, вероятно, сталкивались с этим, если использовали какую-либо систему глубоких исследований из передовой лаборатории, где система глубоких исследований всегда начинается с уточняющего вопроса.

Обычно оркестратором выступает более крупная/лучшая модель, например, Claude Opus или GPT-5 с высоким уровнем логического мышления. Субагенты, как правило, меньше, например, GPT-4.1 и Claude Sonnet.

Главное преимущество такого подхода (особенно по сравнению с традиционным RAG) заключается в том, что вы позволяете системе сканировать и анализировать больше информации, снижая вероятность пропуска информации, необходимой для ответа на запрос пользователя. Необходимость сканирования большего количества документов обычно замедляет работу системы. Конечно, это компромисс между временем и качеством ответов.

Заключение

В этой статье я рассказал о том, как создать систему глубокого исследования. Сначала я рассказал о мотивации к созданию такой системы и о том, в каких сценариях следует сосредоточиться на создании более простых систем, таких как RAG или поиск по ключевым словам. Далее я рассказал об основах системы глубокого исследования, которая, по сути, принимает запрос пользователя, планирует ответ на него, отправляет субагентов для получения релевантной информации, агрегирует эту информацию и отвечает пользователю.

👉 Найдите меня в соцсетях:

🧑‍💻 Свяжитесь с нами

🔗 LinkedIn

🐦 X / Твиттер

✍️ Средний

Вы также можете прочитать некоторые другие мои статьи:

  • Как обеспечить надежность заявок на получение степени магистра права
  • Как провести комплексную крупномасштабную проверку LLM

Источник: towardsdatascience.com

✅ Найденные теги: Как, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых