Как создать базу знаний на основе кода Клода
Обеспечьте эффективный поиск и извлечение персональных знаний из данных.
Делиться

Claude Code наиболее популярен как инструмент программирования. Как инструмент программирования, он действительно потрясающий и выполняет невероятную работу, и, вероятно, сделал меня в разы более эффективным инженером.
Однако Claude Code можно использовать и во многих других чрезвычайно полезных областях. Его можно применять, например, для создания презентаций, что очень эффективно делается с помощью кода, например, Python или LaTeX. Кроме того, Claude Code можно использовать в ситуациях, совершенно не связанных с программированием, например, для организации работы с клиентами или создания базы знаний, о чем я и расскажу в этой статье.
База знаний, созданная на основе LLM, — это невероятно мощная концепция, которая может значительно повысить вашу эффективность просто потому, что вы можете быстрее получать необходимую информацию. Я расскажу, как её настроить, почему её следует настроить и как вы можете извлечь максимальную пользу из своей базы знаний.

Зачем создавать базу знаний на основе знаний, полученных в рамках программы LLM?
Прежде всего, я расскажу, почему вам следует создать базу знаний на основе языковых моделей. Простая причина заключается в том, что языковые модели работают лучше, чем больше контекста они имеют, а чем больше контекста вы можете предоставить своим языковым моделям, тем лучше они смогут решать различные задачи, которые вы перед ними поставите.
Таким образом, хранение как можно большего количества информации в базе знаний невероятно эффективно, поскольку магистр права может получить к ней доступ, когда это необходимо.
Я стараюсь хранить абсолютно всё, что делаю, в централизованной базе знаний. Это может быть, например, следующее:
- встречи, в которых я участвую
- заметки, о которых я думаю
- Ошибки, которые допускают мои агенты, и как их избежать.
и так далее.
До появления программ магистратуры в области права (LLM) казалось, что нет смысла создавать такую обширную базу знаний с таким количеством информации, потому что просто невозможно было найти нужную информацию, когда она требовалась. Например, если вам нужна была запись с конкретного совещания, сначала нужно было найти стенограмму этого совещания, а затем в этой стенограмме найти нужный пункт и таким образом получить необходимую информацию.
Однако ситуация кардинально изменилась с появлением больших языковых моделей, поскольку внезапно появилась возможность легко получить доступ к огромному объему информации всего за несколько секунд. Доступность информации резко возросла в одночасье.
Значительно возросшая доступность информации в рамках программы LLM сделала базы знаний гораздо более ценными.
Если отвечать коротко, причина, по которой вам следует создавать базу знаний на основе LLM, заключается в том, что она позволяет получать необходимую информацию тогда, когда она больше всего нужна вам или вашему программисту. Тот факт, что вы получаете мощную базу знаний с LLM, делает информацию чрезвычайно легкодоступной, а значит, вы можете хранить огромный объем информации.
Как создать базу знаний на основе диплома магистра права
Теперь я расскажу, как создать собственную базу знаний на основе диплома магистра права (LLM). На самом деле, это довольно просто. Вам нужно всего лишь хранить всю информацию в одной папке на вашем компьютере.
На практике, однако, это немного сложнее, чем кажется, потому что нужно выработать привычку хранить всю информацию в этом месте. Тем не менее, я шаг за шагом расскажу вам, как я начал это настраивать, и как, сосредоточившись на этом, со временем я стал все лучше и лучше обновлять свою базу знаний и добавлять в нее всю необходимую информацию.
Для начала можно использовать программу для ведения протоколов совещаний и убедиться, что она всегда сохраняет записи со всей необходимой информацией, такой как участники совещания, время совещания, название совещания и контекст совещания. Эту информацию можно получить, например, из вашего календаря.
Достаточно просто сложить все ваши заметки и стенограммы совещаний в центральную папку, и этого будет достаточно.
Обратите внимание, что база знаний не обязательно должна быть локальной папкой. Это могут быть и облачные приложения, такие как Notion, где можно хранить текстовые файлы. Базе знаний, по сути, не нужно ничего больше. Ей просто нужно хранить текст.
Продолжая эту тему, я также несколько раз в неделю получаю напоминания о необходимости сохранять в базу знаний информацию, которая приходит мне в голову, уроки, извлеченные из работы, или другую полезную информацию, о которой я подумал. Я стараюсь не слишком задумываться над тем, что добавляю в базу знаний. Самое важное — это добавлять информацию, что я и делаю, просто используя подсказку Клода Кода:
Добавить <фрагмент информации> в мою базу знаний
Затем Claude Code определяет, какой файл или подпапка наиболее подходит для хранения этой информации, и сохраняет её для меня.
Ещё один способ обновления моей базы знаний — это ежедневный анализ всех моих взаимодействий с агентами в течение дня, который я прошу Claude Code. Это могут быть как взаимодействия с моим личным Claude Code, так и взаимодействия с моими ботами OpenClaw или с другими людьми, с которыми я взаимодействовал с ботами OpenClaw. Мы обсуждаем, что прошло хорошо, а что нет, и система автоматически сохраняет соответствующие общие знания в мою общую папку знаний, чтобы они были доступны позже. Это делается простым созданием задания cron, которое запускается ежедневно.
Естественно, у вас будут другие рабочие процессы, чем у меня, и, следовательно, вы будете хранить другую информацию и иметь доступ к другой информации. Поэтому я призываю вас подумать о различных знаниях, которые вы хотели бы хранить, и попытаться сохранить эти знания в базе знаний. Общее правило таково: в базе знаний следует хранить как можно больше контекстной информации; не имеет значения, если база знаний с контекстной информацией раздуется, и следует постараться сделать хранение информации в базе знаний максимально автоматизированным.
Под «автоматизацией» я подразумеваю, например, отсутствие необходимости вручную копировать заметки с совещаний в базу знаний каждый раз, когда вы проводите совещание. Это, конечно, большой объем ручной работы, которая, во-первых, со временем становится утомительной, а во-вторых, вы можете забыть сделать это после совещания. Вместо этого следует настроить автоматический скрипт или поток, который будет сохранять заметки с совещаний в базе знаний за вас.
Как использовать базу знаний
В предыдущем разделе я рассказал о том, как создать базу знаний и хранить в ней информацию. Вторая часть, конечно же, посвящена практическому использованию базы знаний. Для этого я рассмотрю две основные темы.
- Ищите необходимую информацию всякий раз, когда она вам лично нужна.
- Предоставьте Клоду Коду или другим вашим агентам доступ к информации, которую вы сможете получить, когда это будет необходимо для выполнения ими задачи.
Во многих ситуациях мне приходится искать информацию, которую я, как мне кажется, обсуждал на совещании или о которой думал ранее. В таких случаях очень неприятно, если не удается получить доступ к нужной информации. Я прошу Claude Code просмотреть мою базу знаний и найти ответ на мой вопрос. Иногда он не находит прямого ответа, но обнаруживает правдоподобные другие ответы или фрагменты информации, связанные с моим вопросом, что также очень полезно во многих ситуациях.
Вторая область применения базы знаний — предоставление Claude Code доступа к ней, чтобы он мог обращаться к ней всякий раз, когда посчитает это необходимым. Например, если вы попросите его выполнить задание по программированию, полезная информация может быть найдена в базе знаний. Или, например, при подготовке презентаций, вы сможете найти предыдущие презентации.
Если база знаний представляет собой централизованную папку, вам следует прежде всего убедиться, что вы предоставили Клоду Коду или вашему агенту по программированию доступ к этой папке.
Во-вторых, вам необходим файл навыков пользовательского уровня или файл claude.md, чтобы агент программирования знал о базе знаний и как получить к ней доступ в любое время. Важно, чтобы ваш агент программирования знал о базе знаний в любое время, независимо от того, откуда вы задаете модели команду.
Ошибки, которых следует избегать
Я также хочу затронуть некоторые распространенные ошибки, которые легко допустить при создании базы знаний. Первая ошибка, которую я хочу обсудить, — это то, что происходит, когда база знаний устаревает. Конечно, происходит «дрейф» информации. Ваши мнения по темам могут измениться, или отдельные фрагменты информации могут устареть. Поэтому важно регулярно проверять свою базу знаний на наличие устаревшей информации.
Эта проверка может быть просто запущена в виде задачи cron еженедельно, в рамках которой Claude Code будет анализировать все ваши взаимодействия с ним за последнюю неделю и сравнивать их с базой знаний для выявления устаревшей информации.
Ещё одна распространённая ошибка заключается в том, что вы не сообщаете агенту о наличии базы знаний, когда он работает в определённых папках. Например, если вы сообщите агенту, отвечающему за кодирование, о базе знаний только в файле Claude.md на уровне проекта, Claude не будет знать о ней, если он работает в любой другой папке. Это, конечно, очень проблематично, поскольку, когда Claude работает в другой папке, у него не будет доступа ко всей той же информации.
В этом случае полезны файлы Claude или skill.md пользовательского уровня, поскольку они всегда загружаются в ваш агент кодирования, независимо от того, из какой папки вы их запускаете.
Заключение
В этой статье я рассказал, как создать базу знаний на основе кода Клода. По сути, это централизованное хранилище всей информации, с которой вы взаимодействуете ежедневно, и оно дает вам мощное преимущество, поскольку вы можете быстрее получать доступ к информации и осуществлять поиск по базе знаний с помощью LLM (Low-Low-Maker). Агенты-программисты невероятно эффективны при поиске больших объемов информации, таких как папки, и поэтому хранение/доступ к релевантной информации будет быстрым, даже если база знаний большая. Я настоятельно рекомендую вам попробовать создать личную базу знаний. Постарайтесь хранить в ней всю информацию, с которой вы взаимодействуете ежедневно, и активно используйте эту базу знаний как для самостоятельного поиска информации, так и для предоставления ее вашим агентам-программистам, чтобы они могли работать более эффективно. Я считаю, что такие личные базы знаний, основанные на ваших предпочтениях и конкретной информации, будут становиться все более важными в будущем, когда агенты-программисты станут более мощными.
Также ознакомьтесь с моей статьей о том, как заставить код Claude самостоятельно проверять свою работоспособность.
👋 Свяжитесь с нами
👉 Моя бесплатная электронная книга и вебинар:
🚀 Десять раз повысьте свой инженерный уровень с помощью магистратуры (бесплатный 3-дневный курс по электронной почте)
📚 Получите мою бесплатную электронную книгу «Модели визуального языка».
💻 Мой вебинар по языковым моделям зрения
👉 Найдите меня в социальных сетях:
💌 Substack
🐦 X / Twitter
Эйвинд Кьосбаккен Посмотреть все Эйвинд Кьосбаккен
Источник: towardsdatascience.com

Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.