Пройдите локальную магистерскую программу с помощью OpenClaw на вашем Mac Mini.
Устали от ежемесячных платежей за API? Следуйте этому проверенному руководству, чтобы без лишних проблем настроить высокопроизводительную локальную LLM-систему на вашем Mac Mini.
Делиться
Вы купили Mac Mini для Openclaw. Отлично.
К сожалению, в последнее время Anthropic подталкивает пользователей OpenClaw к использованию API с оплатой за токен¹, превращая некогда разовую покупку оборудования в (значительные) постоянные расходы². Даже если вы используете OpenAI, вы все равно будете платить довольно много ежемесячно.
💵💵 Использование локальной модели полностью исключает ежемесячные расходы на агентов OpenClaw. 💵💵
Однако установка и настройка всего необходимого могут быть сложными, особенно если вы новичок в локальных программах магистратуры.
В этой статье я покажу вам, как настроить локальный LLM (самым простым способом) на вашем Mac Mini, который сможет бесплатно запускать ваш агент.
Вы сможете им пользоваться, даже если вы новичок.
🤨 «Я слышал, что программы магистратуры в области права, реализуемые на местном уровне, не так эффективны, это правда?»
Локальная версия LLM (правильно настроенная) будет работать практически так же хорошо для таких задач, как электронная почта, управление календарем, напоминания, автоматизация домашнего интернета вещей и базовый поиск информации в интернете (то, что вы действительно делаете с OpenClaw).
Если вам нужно выполнить более сложные действия, например, использовать OpenClaw для разработки программного обеспечения, внизу есть ссылка, в которой подробно описано, как настроить резервную модель.
⚠️Примечание: Данное руководство не является полным руководством по OpenClaw.
Цель программы – помочь вам как можно быстрее начать обучение по программе LLM в вашем регионе с вашим агентом (агентами).
Аппаратное обеспечение
Данная статья была протестирована на компьютере Mac Mini со следующими характеристиками.
| ОС | macOS Tahoe |
| Версия | 26.3.1 |
| Процессор | М2 |
| Ядра | 8 |
| Единая память | 24 ГБ |
Если вы подумываете о покупке Mac Mini, я бы рекомендовал как минимум процессор M2+ и не менее 24 ГБ оперативной памяти. 16 ГБ тоже подойдут, однако производительности будет мало, и при работе с большими объемами данных могут возникать ошибки.
Настройка оборудования
Сначала установите OpenClaw, следуя официальному руководству. Если вы уже это сделали, пропустите этот шаг.
1. Установите llama.cpp
Мы откажемся от использования Ollama (рекомендуемого локального провайдера) и выберем llama.cpp . Использование квантованной модели вместе с llama.cpp позволит ускорить вывод результатов на целых 70%.
Нам нужно собрать файл llama.cpp из исходного кода с включенными флагами Metal и выключенной CUDA. Это обеспечит некоторые оптимизации, необходимые для запуска модели на вашем Mac на полной скорости. Просто следуйте приведенным ниже инструкциям.
1️⃣ Сначала из вашей домашней директории установите необходимые компоненты с помощью brew.
# paste this into your terminal $ brew install cmake curl
2️⃣ Затем соберите файл llama.cpp с соответствующими флагами.
# Clone llama.cpp git clone https://github.com/ggml-org/llama.cpp # Configure build with Metal acceleration cmake llama.cpp -B llama.cpp/build -DBUILD_SHARED_LIBS=OFF -DGGML_METAL=ON -DGGML_CUDA=OFF # Build cmake --build llama.cpp/build --config Release -j$(sysctl -n hw.ncpu) --clean-first --target llama-cli llama-mtmd-cli llama-server llama-gguf-split
Теперь у нас есть файл llama.cpp, который можно использовать.
2. Загрузите локальную версию LLM.
Как уже упоминалось, ключ к достижению хороших результатов от локальной модели — это квантование .
Квантование позволяет использовать более крупную и мощную модель, интеллектуально «сжатую» таким образом, чтобы она помещалась на более компактном оборудовании. Это позволяет квантованной модели сохранить большую часть производительности исходной модели полного размера.
Если у вас нет мощного графического процессора или Mac с максимальным объемом унифицированной памяти (80 ГБ и более видеопамяти), квантование просто необходимо.
Слепое следование документации OpenClaw при попытке использовать квантованную модель приведет к путанице и разочарованию.
Просто не существует руководства, в котором бы четко описывалось, как заставить квантованные модели работать с агентами.
Ниже приведён проверенный рецепт, который подойдёт вашему агенту.
Выбор модели: Qwen 3.5-9B
Здесь мы используем Qwen 3.5 (версию с 9B параметрами).
По состоянию на июнь 2026 года это одна из лучших моделей среди локальных, превосходящая Gemma 4-12B. Она подходит как для Mac с 16 ГБ, так и с 24 ГБ оперативной памяти, при этом требуется от 6 до 8 ГБ ОЗУ. Пользователи также высоко оценивают её для OpenClaw.
Также помните, что агентам требуются более длинные контексты, что не позволит нам запустить более крупную 27-байтовую версию, даже с квантизацией.
1️⃣ Давайте скачаем модель
# download model curl -L -o models/Qwen3.5-9B-UD-Q4_K_KL.gguf "https://huggingface.co/unsloth/Qwen3.5-9B-MTP-GGUF/resolve/main/Qwen3.5-9B-UD-Q4_K_XL.gguf?download=true"
2️⃣ Скачайте шаблон и сохраните его в папку «Шаблоны».
mkdir templates && curl -o templates/qwen35.jinja "https://huggingface.co/froggeric/Qwen-Fixed-Chat-Templates/resolve/main/chat_template.jinja"
Важно: необходимо использовать шаблон, совместимый с OpenClaw. Без этого шага ничего не будет работать.
3. Запустите llama-server
В качестве бэкэнд-API будет использоваться Llama-server. OpenClaw будет использовать этот веб-сервис вместо прямого вызова API из OpenAI или Anthropic.
Мы уже установили llama-server и скачали нашу модель. Давайте проведём быстрый тест.
1️⃣ Проведите быстрый тест
./llama.cpp/llama-server -m models/Qwen3.5-9B-UD-Q4_K_XL.gguf --chat-template-file templates/qwen35.jinja --temp 0.7 --top-p 0.9 --top-k 20 -c 64000 -ngl 20 --host 127.0.0.1 --port 8080
Вы должны увидеть что-то подобное (без ошибок).
srv llama_server: model loaded llama_server: server is listening on http://127.0.0.1:8080 update_slots: all slots are idle
2️⃣ Теперь давайте напишем демон launchd , чтобы ваш локальный сервер LLM запускался автоматически и оставался доступным после перезагрузки. Если вы знакомы с Linux, launchd это, по сути, systemd для macOS.
Сохраните следующий файл как /Library/LaunchDaemons/com.openclaw.llama-server.plist . Для этого потребуется использовать sudo .
Разверните этот фрагмент, чтобы найти файл plist
❗Убедитесь, что вы заменили YOUR_USERNAME на ваше фактическое имя пользователя в XML-файле.
Label com.openclaw.llama-server UserName YOUR_USERNAME ProgramArguments /Users/YOUR_USERNAME/llama.cpp/llama-server -m /Users/YOUR_USERNAME/models/Qwen3.5-9B-UD-Q4_K_XL.gguf --chat-template-file /Users/YOUR_USERNAME/templates/qwen35.jinja --temp 0.7 --top-p 0.9 --top-k 20 -c 64000 -ngl 20 --host 127.0.0.1 --port 8080 WorkingDirectory /Users/YOUR_USERNAME RunAtLoad KeepAlive StandardOutPath /tmp/llama-server.log StandardErrorPath /tmp/llama-server.err
Теперь включите его.
sudo chown root:wheel /Library/LaunchDaemons/com.openclaw.llama-server.plist && sudo chmod 644 /Library/LaunchDaemons/com.openclaw.llama-server.plist && sudo launchctl bootstrap system /Library/LaunchDaemons/com.openclaw.llama-server.plist
Мы можем проверить, корректно ли работает служба, просмотрев наш лог-файл.
tail -f /tmp/llama-server.err
Теперь у нас загружен и успешно запущен в режиме демона локальный LLM. Всё, что нам нужно сделать, это перенастроить OpenClaw.
4. Перенастройте OpenClaw для использования локальной модели.
Теперь нам нужно добавить эту локальную модель в конфигурацию OpenClaw, чтобы она была доступна для нашего шлюза.
1️⃣ Добавьте в блок “models” в файле .openclaw/openclaw.json
{ "models": { "providers": { "local": { "baseUrl": "http://127.0.0.1:8080/v1", "apiKey": "sk-local", "api": "openai-completions", "models": [ { "id": "qwen3-9b", "name": "Qwen3.5 9B Local", "contextWindow": 64000, "maxTokens": 8192 } ] } /* REMOVE THIS COMMENT */ /* you may add additional providers, like anthropic here */ } } }
Примечание : настройки
contextWindowиmaxTokensвозможно, потребуется скорректировать в соответствии с особенностями ваших рабочих процессов.
Вам также потребуется установить модель по умолчанию для ваших агентов.
"agents": { "defaults": { "model": { "primary": "local/qwen3-9b" }, "models": { "local/qwen3-9b": {} } }
Также полезно проверить правильность конфигурации; для проверки синтаксиса выполните следующую команду.
openclaw config validate
2️⃣ Перезагрузите шлюз, убедившись, что локальная модель теперь доступна.
openclaw gateway restart
3️⃣ Проверьте, правильно ли OpenClaw зарегистрировал нашу локальную модель.
openclaw models list --provider local
Мы также можем выполнить простой вызов функции вывода.
openclaw infer model run --model local/qwen3-9b --prompt "Reply with exactly: pong" --json
В ответ вы должны получить JSON-объект. Важно : убедитесь, что в ответе нет утечек тегов. Этого не должно быть, но это вдвойне важно для безопасности.
{ "ok": true, "capability": "model.run", "transport": "local", "provider": "local", "model": "qwen3-9b", "attempts": [], "outputs": [ { "text": "pong", "mediaUrl": null } ] }
Мы проверили правильность работы всей сантехники. Чтобы быть полностью уверенными (или если это ваш первый агент), давайте настроим тестовый навык и убедимся, что модель корректно рассуждает и выполняет вызов инструментов, как и ожидалось.
5. Проверьте функциональность с помощью тестового навыка.
Давайте создадим тестовый навык 'python-calc', который позволит нам проверить, может ли наша локальная модель правильно рассуждать и выдавать сигналы вызова инструмента.
1️⃣ Запустите эту команду, чтобы создать навык. Это добавит данный инструмент для всех ваших агентов Openclaw.
mkdir -p ~/.openclaw/workspace/skills/python-calc cat << 'EOF' > ~/.openclaw/workspace/skills/python-calc/SKILL.md --- name: python-calc description: A tool that evaluates mathematical expressions by executing a Python one-liner. version: 1.0.0 --- ## Instructions 1. Extract the exact mathematical expression the user wants to calculate. 2. Use your built-in shell tool to run this exact command, replacing `` with the expression: `python3 -c "print()"` 3. Wait for the shell tool to return the stdout output. 4. You MUST generate a final conversational response to the user containing the exact numeric result returned by the script. EOF
Снова перезапустите шлюз.
2️⃣ Теперь мы можем запустить тестовый звонок агенту, чтобы убедиться в правильности результатов работы инструмента:
openclaw agent --local --agent main --verbose on --thinking high --message "Use the python-calc skill to calculate 8664 multiplied by 222. Do not use skill_workshop. Tell me the final answer."
И примерно через секунду, если всё работает правильно, мы должны увидеть что-то вроде:
The final answer is 1,923,408.
Фантастика!
В реальности мы можем наблюдать скорость до 20-70 токенов в секунду*. Хотя это и не скорость Claude (130 токенов в секунду и более), это вполне приемлемо для агента OpenClaw с минимальным набором аппаратных ресурсов.
Помните, что режим мышления настроен на высокий уровень, поэтому ничего страшного, если это займет немного больше времени.
Если вы не уверены, использует ли OpenClaw вашу модель, в другом окне терминала просмотрите лог llama-server, выполнив
tail -f /tmp/llama-server.err
*Фактическая скорость может отличаться
Подводя итоги
Запуск локальной LLM-системы, особенно с пользовательскими шаблонами и квантизацией, может быть довольно сложным. Первая настройка на Mac друга заняла два дня переписки! Спасибо Джейкобу В. за вдохновение.
Вот и всё! Надеюсь, это сэкономит вам много денег 💸
Если это так, или если я избавил вас от лишних хлопот, вы также можете угостить меня кофе здесь.
☕Ура!
1. Твит Бориса Черного, обсуждающего «запрет» OpenClaw.
2 пользователя тратят 420 долларов в месяц на оплату API.
3. Использование нескольких поставщиков услуг с OpenClaw
Сэм Блэк. Посмотреть все материалы от Сэма Блэка.
Источник: towardsdatascience.com
Похожие записи
Оцените материал:
Похожие записи
Строители наживаются на буме искусственного интеллекта
02.12.2025
Программное обеспечение становится чем-то таким, о чем вы говорите, создавая его
31.01.2026
Память DRAM и NAND в консоли Nintendo Switch 2 подорожала на 41% и 8%
12.12.2025Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
