Куча белых полотенец с красными полосками, лежащих на фоне.

Когда (не) следует использовать Vector DB

Когда индексирование приносит больше вреда, чем пользы: как мы поняли, что для нашего варианта использования RAG требуется хранилище типа «ключ-значение», а не векторная база данных.

Делиться

493da5ac99b994ec33a61a30914c08c7

Векторные базы данных — это здорово. Они решают реальную проблему, и во многих случаях являются правильным выбором для систем RAG. Но вот в чем дело: то, что вы используете эмбеддинги, не означает, что вам нужна векторная база данных.

Мы наблюдаем растущую тенденцию, когда каждая реализация RAG начинается с подключения векторной базы данных. Это может быть целесообразно для крупномасштабных, постоянно хранимых баз знаний, но это не всегда самый эффективный путь, особенно когда ваш сценарий использования более динамичен или критичен ко времени.

В Planck мы используем эмбеддинги для улучшения систем на основе LLM. Однако в одном из наших реальных приложений мы решили отказаться от векторной базы данных и вместо этого использовали простое хранилище типа «ключ-значение» , которое оказалось гораздо более подходящим вариантом.

Прежде чем углубиться в это, давайте рассмотрим упрощенную, обобщенную версию нашего сценария, чтобы объяснить, почему.

Пример еды

Представим себе простую систему в стиле RAG. Пользователь загружает несколько текстовых файлов, например, отчеты или протоколы совещаний. Мы разбиваем эти файлы на фрагменты, генерируем эмбеддинги для каждого фрагмента и используем эти эмбеддинги для ответов на вопросы. Пользователь задает несколько вопросов в течение следующих нескольких минут, а затем уходит. В этот момент и файлы, и их эмбеддинги становятся бесполезными и могут быть безопасно удалены.

Иными словами, данные носят временный характер , пользователь задаст лишь несколько вопросов , и мы хотим ответить на них как можно быстрее .

Теперь остановитесь на секунду и задайте себе вопрос:

Где мне следует хранить эти векторные представления?

Источник: towardsdatascience.com

✅ Найденные теги: DB, Vector, Когда, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Человек накачивает копилку-воздушный шар насосом, концепция финансового роста.
ideipro logotyp
eClinicalWorks расширяет возможности взаимодействия благодаря аналитическим данным, полученным с помощью искусственного интеллекта, что преобразует оказание медицинской помощи.
Pandas против Polar: полное сравнение синтаксиса, скорости и памяти.
Искусственный интеллект и машинное обучение, светящиеся линии и точки над коробкой.
Бегун в яркой форме бежит по дороге с горным пейзажем на фоне.
Женщина с чашкой чая сидит на диване, наслаждаясь утренним солнцем в гостиной.
Правительство Великобритании поддерживает развитие медицинских технологий в рамках новой программы доступа к медицинским технологиям для Национальной службы здравоохранения (NHS) — Сеть медицинских устройств.
ideipro logotyp
Image Not Found
Человек накачивает копилку-воздушный шар насосом, концепция финансового роста.

В прошлом месяце лишь три компании доминировали на рынке венчурных инвестиций на сумму 189 миллиардов долларов.

Вкратце Источник изображения: Nuthawut Somsuk / Getty Images Согласно новому отчету Crunchbase, искусственный интеллект продолжает доминировать в мире венчурного капитала. Согласно отчету, в феврале в стартапы было вложено рекордное количество венчурного капитала — 189 миллиардов долларов. В…

Мар 6, 2026
ideipro logotyp

Компания 10x Genomics выводит пространственную биологию на передний план, а искусственный интеллект подпитывает новую волну спроса со стороны клиентов.

Автор: Ирен Йе 14 января 2026 г. | На 44-й ежегодной конференции JP Morgan Healthcare Conference компания 10x Genomics объявила о значительном завершении 2025 года, получив 166 миллионов долларов в четвертом квартале и более 520 миллионов долларов…

Мар 6, 2026
eClinicalWorks расширяет возможности взаимодействия благодаря аналитическим данным, полученным с помощью искусственного интеллекта, что преобразует оказание медицинской помощи.

eClinicalWorks расширяет возможности взаимодействия благодаря аналитическим данным, полученным с помощью искусственного интеллекта, что преобразует оказание медицинской помощи.

Совместимость медицинских данных и инструментов искусственного интеллекта меняет доступ пациентов к данным, решения поставщиков медицинских услуг и результаты, основанные на ценности оказанной помощи. Фото: PonyWang/Getty Images Американская система здравоохранения часто характеризуется как фрагментированная, поскольку многие пациенты обращаются…

Мар 6, 2026
Pandas против Polar: полное сравнение синтаксиса, скорости и памяти.

Pandas против Polar: полное сравнение синтаксиса, скорости и памяти.

Нужна помощь в выборе подходящей библиотеки для работы с фреймами данных на Python? В этой статье сравниваются Pandas и Polar, чтобы помочь вам определиться. Изображение предоставлено автором. # Введение Если вы работаете с данными в Python, вы…

Мар 6, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых