Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

e5141ef3aecc12f1556008aae253fe67

Недавно делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны, интеграции с мониторингами, чатами, постмортемы, подсказки дежурным инженерам.

Но довольно быстро стало понятно, что с временными и ресурсными ограничениями лучше не пытаться написать маленький PagerDuty. Поэтому я сузил задачу до более реалистичного ядра: локального RAG-сервиса, который ищет по документации, ранбукам и коду, а затем передаёт найденный контекст в LLM.

Так появился llmortem — FastAPI-сервис, который можно подключить к OpenWebUI как OpenAI-compatible backend.

В статье расскажу, как устроена архитектура, почему я начал с BM25, зачем индексировать docstring’и и какие ограничения у такого подхода.

Читать далее

Источник: habr.com

✅ Найденные теги: RAG, SRE, Ищем, Как, Локальный, новости, Сервис

Добавить комментарий

Новости других рубрик

Архив рубрики ~Лента новостей~: Компания Mbodi AI (YC P25) ищет инженера-основателя по машинному обучению (робототехника). Архив рубрики ~Лента новостей~: Что ожидать от WWDC 2026: долгожданное обновление Siri и обновления Apple Intelligence. Архив рубрики ~Лента новостей~: «Превед, медвед!» возвращается? Как мы сделали мультиконтекстный сайт на статике для 47 аудиторий быстро-дёшево-сердито Архив рубрики ~Лента новостей~: По данным Ofqual, использование «умных» очков и наушников может усугубить списывание на экзаменах в школах. Архив рубрики ~Лента новостей~: ИИ-компаньоны и подростки: что показывают исследования и о чём стоит знать родителям Архив рубрики ~Лента новостей~: Фирма по искусственному интеллекту представила воскресший в цифровом виде труп Стэна Ли, который можно использовать для создания отупляющих помоев Архив рубрики ~Лента новостей~: «Что ж, это случилось быстрее, чем я предсказывал»: глава Cloudflare рассказал, что боты обогнали людей по объёму онлайн-трафика Архив рубрики ~Лента новостей~: Раннее и лучшее владение вторым языком предсказало лучшие исполнительные функции. А в пожилом возрасте — и их сохранность после ковида