RAG - ИдеиPRO

07.06.2026

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

Недавно делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны,…

02.06.2026

RAG — это не машинное обучение, и инструментарий машинного обучения решает не ту проблему.

Enterprise Document Intelligence [Том 1 #3] – Почему набор инструментов машинного обучения (перебор гиперпараметров, разделение на…

31.05.2026

Proxy-Pointer RAG: Устранение неэффективного извлечения сущностей и связей в графах знаний.

Оптимизация распознавания именованных сущностей с учетом структуры для корпоративных систем GraphRAG. Делиться Сгенерировано с помощью…

30.05.2026

Базовая версия Enterprise RAG: от PDF-файла до выделенного ответа.

Enterprise Document Intelligence [Том 1 #1] Самая компактная версия RAG, которая действительно работает с реальным PDF-файлом, с…

30.05.2026

RAG сжигает деньги — я создал систему контроля затрат, чтобы это исправить.

Большинство систем RAG оптимизируют результаты, ориентируясь на релевантность, а не на стоимость. Я разработал готовый к внедрению слой…

29.05.2026

Встраиваемая векторная БД для RAG на .NET 8: когда внешние сервисы избыточны

Если вы делаете RAG (Retrieval-Augmented Generation) на .NET, то рано или поздно упираетесь в вопрос: куда складывать эмбеддинги и как…

29.05.2026

🔪 Без embeddings, vector DB и RAG. AI-агенту просто дают…

🔪 Без embeddings, vector DB и RAG. AI-агенту просто дают доступ к текстам и терминалу — grep, bash, поиск по файлам. И в ряде задач это…

29.05.2026

🧠 RAG для ИИ — Способы собрать безлимитную память

RAG — технология, которая превращает текстовые документы и файлы в память нейросети. Модель отвечает не по общей эрудиции, а строго по…

28.05.2026

RAG-Anything: Как собрать по-настоящему мультимодальный RAG

Существует множество известных RAG-фреймворков, проверенных на многочисленных бенчмарках, так что точность работы системы в наших реалиях…

27.05.2026

RAG — причина, почему корпоративные AI-ассистенты вообще работают Retrieval-Augmented Generation…

RAG — причина, почему корпоративные AI-ассистенты вообще работают Retrieval-Augmented Generation (RAG) — это подход, который превращает…

25.05.2026

RAG в энтерпрайзе: почему демо работает, а прод нет

Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по…

18.05.2026

Гибридный поиск и переранжирование в Production RAG

Когда семантического поиска недостаточно для RAG Делиться Типичный алгоритм поиска в приложении RAG. Изображение сгенерировано с помощью…

12.05.2026

AI-агенту дают доступ к текстам и терминалу

🔪 Без embeddings, vector DB и RAG. AI-агенту просто дают доступ к текстам и терминалу — grep, bash, поиск по файлам. И в ряде задач это…

10.04.2026

Подготовка к получению степени магистра права: практическое руководство по применению RAG в корпоративных базах знаний

Четкая ментальная модель и практическая основа, на которой можно строить дальнейшее развитие. Делиться Каждый инженер-программист,…

01.04.2026

Что изменила метрика «биты над случайным числом» в моем понимании RAG и агентов?

Почему результаты поиска, которые отлично выглядят на бумаге, в реальных рабочих процессах RAG и работы с агентами могут вести себя как…

22.03.2026

100 млн токенов — прощай RAG или просто новый уровень…

100 млн токенов — прощай RAG или просто новый уровень памяти? Китайский стартап EverMind AI показал архитектуру MSA — и цифры выглядят как…

13.03.2026

Понимание контекста и контекстного поиска в RAG

Почему традиционный метод RAG теряет контекст и как контекстный поиск значительно повышает точность поиска Делиться Фабрицио Матарезе /…

12.03.2026

Безотходная агентная RAG: проектирование архитектур кэширования для минимизации задержки и затрат на LLM в масштабе

Сокращение затрат на LLM на 30% за счет многоуровневого кэширования с учетом проверки подлинности. Делиться Технология генерации с…

26.01.2026

Информационный бюллетень TDS: Не пора ли пересмотреть RAG?

Давайте разберемся в текущем состоянии генерации с расширенными возможностями поиска информации. Делиться Не пропустите новый выпуск The…

26.01.2026

Вероятно, вам пока не нужна векторная база данных для вашей RAG.

Библиотека NumPy или библиотека SciKit-Learn могут удовлетворить все ваши потребности в извлечении данных. Делиться В настоящее время,…

07.01.2026

Улучшение качества RAG: влияние HNSW и способы его уменьшения

Как приблизительный векторный поиск незаметно ухудшает показатель полноты (Recall) — и что с этим делать? Делиться Если вы используете…

07.01.2026

Сравнение Prompt Engineering и RAG для редактирования резюме.

Проведение сравнения без написания кода в Azure Делиться Несмотря на приобретение новых достижений и квалификаций, я наблюдаю снижение…

19.12.2025

Шесть уроков, извлеченных при создании систем RAG в производственной среде

Передовые методы обеспечения качества данных, проектирования и оценки методов поиска в производственных системах RAG. Делиться За последние…

21.10.2025

RAG мертв? Расцвет контекстной инженерии и семантических слоёв для агентного ИИ

Как генерация дополненной поисковой информации развивается от статических конвейеров к управляемым, контекстно-зависимым системам, которые…