Куча белых полотенец с красными полосками, лежащих на фоне.

Когда (не) следует использовать Vector DB

Когда индексирование приносит больше вреда, чем пользы: как мы поняли, что для нашего варианта использования RAG требуется хранилище типа «ключ-значение», а не векторная база данных.

Делиться

493da5ac99b994ec33a61a30914c08c7

Векторные базы данных — это здорово. Они решают реальную проблему, и во многих случаях являются правильным выбором для систем RAG. Но вот в чем дело: то, что вы используете эмбеддинги, не означает, что вам нужна векторная база данных.

Мы наблюдаем растущую тенденцию, когда каждая реализация RAG начинается с подключения векторной базы данных. Это может быть целесообразно для крупномасштабных, постоянно хранимых баз знаний, но это не всегда самый эффективный путь, особенно когда ваш сценарий использования более динамичен или критичен ко времени.

В Planck мы используем эмбеддинги для улучшения систем на основе LLM. Однако в одном из наших реальных приложений мы решили отказаться от векторной базы данных и вместо этого использовали простое хранилище типа «ключ-значение» , которое оказалось гораздо более подходящим вариантом.

Прежде чем углубиться в это, давайте рассмотрим упрощенную, обобщенную версию нашего сценария, чтобы объяснить, почему.

Пример еды

Представим себе простую систему в стиле RAG. Пользователь загружает несколько текстовых файлов, например, отчеты или протоколы совещаний. Мы разбиваем эти файлы на фрагменты, генерируем эмбеддинги для каждого фрагмента и используем эти эмбеддинги для ответов на вопросы. Пользователь задает несколько вопросов в течение следующих нескольких минут, а затем уходит. В этот момент и файлы, и их эмбеддинги становятся бесполезными и могут быть безопасно удалены.

Иными словами, данные носят временный характер , пользователь задаст лишь несколько вопросов , и мы хотим ответить на них как можно быстрее .

Теперь остановитесь на секунду и задайте себе вопрос:

Где мне следует хранить эти векторные представления?

Источник: towardsdatascience.com

✅ Найденные теги: DB, Vector, Когда, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Pandas против Polar: полное сравнение синтаксиса, скорости и памяти.
Искусственный интеллект и машинное обучение, светящиеся линии и точки над коробкой.
Бегун в яркой форме бежит по дороге с горным пейзажем на фоне.
Женщина с чашкой чая сидит на диване, наслаждаясь утренним солнцем в гостиной.
Правительство Великобритании поддерживает развитие медицинских технологий в рамках новой программы доступа к медицинским технологиям для Национальной службы здравоохранения (NHS) — Сеть медицинских устройств.
ideipro logotyp
Руководители обсуждают, как ИИ меняет структуру рабочей силы в здравоохранении, часть 2 | MobiHealthNews
Искусственный интеллект в медицинской визуализации, ожидание процесса.
ideipro logotyp
Image Not Found
Pandas против Polar: полное сравнение синтаксиса, скорости и памяти.

Pandas против Polar: полное сравнение синтаксиса, скорости и памяти.

Нужна помощь в выборе подходящей библиотеки для работы с фреймами данных на Python? В этой статье сравниваются Pandas и Polar, чтобы помочь вам определиться. Изображение предоставлено автором. # Введение Если вы работаете с данными в Python, вы…

Мар 6, 2026
Искусственный интеллект и машинное обучение, светящиеся линии и точки над коробкой.

Прекратите спрашивать, является ли модель интерпретируемой.

Начните задавать себе вопрос, на какой вопрос должно ответить объяснение. Делиться Изображение предоставлено автором: создано с помощью Gemini. Большинство дискуссий об интерпретируемости в ИИ начинаются с неправильного вопроса. Исследователи, практики и даже регулирующие органы часто спрашивают, является…

Мар 6, 2026
Бегун в яркой форме бежит по дороге с горным пейзажем на фоне.

Ультрамарафоны могут негативно сказаться на крови.

Пробежка на 170 километров по горной местности приводила к тому, что красные кровяные клетки накапливали больше возрастных повреждений, чем у менее амбициозных спортсменов. В спорте всего должно быть в меру. REUTERS/Люси Николсон Хотя физические упражнения важны для…

Мар 6, 2026
Женщина с чашкой чая сидит на диване, наслаждаясь утренним солнцем в гостиной.

Ваш утренний кофе однажды может помочь в борьбе с раком.

Новая система редактирования генов использует кофеин в качестве триггера, позволяя ученым активировать CRISPR внутри модифицированных клеток — и даже активировать Т-клетки, борющиеся с раком. Изображение: Shutterstock Может ли такой распространенный продукт, как кофе, сыграть роль в лечении…

Мар 6, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых