Ноутбук с кодом и цифровым мозгом, символизирующий искусственный интеллект.

Как запустить мощную LLM у себя на компьютере: DeepSeek Coder офлайн за 10 строк кода

75c360bb6ce484142a258ece6e37e8db

Хотите, чтобы нейросеть для генерации кода работала полностью локально, не отправляла ваши данные в облако и легко встраивалась в вашего Telegram-бота? Всё что нужно — Python и несколько гигабайт свободного места.

Базовая установка и запуск

Всё сводится к установке трёх библиотек и простому скрипту:

«`

pip install -U transformers accelerate torch

«`

«`

from transformers import AutoModelForCausalLM, AutoTokenizer

import torch

# Загружаем модель DeepSeek Coder (есть версии 1.3B, 6.7B, 33B параметров)

model_name = «deepseek-ai/deepseek-coder-6.7b-base»

tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

model = AutoModelForCausalLM.from_pretrained(

model_name,

trust_remote_code=True,

torch_dtype=torch.float16, # экономим память на GPU

device_map=»auto» # автоматом использует GPU, если есть

)

model.eval()

# Генерируем код по промпту

prompt = «Напиши telegram бота обратной связи на aiogram»

inputs = tokenizer(prompt, return_tensors=»pt»)

inputs = {k: v.to(model.device) for k, v in inputs.items()}

with torch.inference_mode():

outputs = model.generate(**inputs, max_new_tokens=180)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

«`

Первая загрузка скачает веса модели (несколько ГБ). Дальше она будет работать полностью офлайн.

Ключевые преимущества такого подхода

Полная приватность: Ваши промпты и код никуда не уходят.

Интеграция: Модель — просто Python-объект. Можно встроить в Telegram-бота, веб-сервис или CLI-утилиту.

Контроль: Сами выбираете температуру (temperature), длину ответа и другие параметры.

Оптимизация под ваше железо

Много RAM, но нет мощной GPU? Уберите torch_dtype=torch.float16 и device_map=»auto» — модель будет работать на CPU.

Мало оперативной памяти? Используйте квантованные версии (4-bit, 8-bit через bitsandbytes) или GGUF-формат для llama.cpp.

Есть NVIDIA GPU? device_map=»auto» само всё распределит. Чем больше видеопамяти — тем большую модель сможете запустить.

Сохраняйте этот шаблон — он станет основой для ваших локальных ИИ-инструментов.

Источник: vk.com

Источник: ai-news.ru

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов
Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов
Молодой ученый из Лесосибирска вошел в рейтинг Forbes «30 до 30»
Аспирант решил давнюю проблему узла Конвея.
Аспирант решил давнюю проблему узла Конвея.
Ученые дали лососю кокаин, и вы непременно поверите, что произошло дальше.
Ученые дали лососю кокаин, и вы непременно поверите, что произошло дальше.
Тайваньский ценник ноутбука ASUS ROG Zephyrus Duo 2026 с Core Ultra 9 386H и RTX 5090M составляет $8500
Тайваньский ценник ноутбука ASUS ROG Zephyrus Duo 2026 с Core Ultra 9 386H и RTX 5090M составляет $8500
Image Not Found
Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов

Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов

Они могут объединяться в более крупных роботов Американские инженеры разработали робота с одной степенью свободы, которого можно использовать как базовый модуль-ногу для постройки более сложных и крупных роботов со множеством конечностей. Он может самостоятельно передвигаться по пересеченной местности,…

Апр 23, 2026
Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов

Инженеры сделали модульных роботов из шаров и палок. Они могут объединяться в более крупных роботов

Они могут объединяться в более крупных роботов Американские инженеры разработали робота с одной степенью свободы, которого можно использовать как базовый модуль-ногу для постройки более сложных и крупных роботов со множеством конечностей. Он может самостоятельно передвигаться по пересеченной местности,…

Апр 23, 2026
Молодой ученый из Лесосибирска вошел в рейтинг Forbes «30 до 30»

Молодой ученый из Лесосибирска вошел в рейтинг Forbes «30 до 30»

Уроженец Лесосибирска 30-летний Иван Стельмах попал в лонг-лист ежегодного рейтинга Forbes «30 до 30» в категории «Наука и технологии». Об этом пишут наши коллеги из «Город Прима». После школы он окончил МФТИ, а затем продолжил обучение в…

Апр 23, 2026
Тайваньский ценник ноутбука ASUS ROG Zephyrus Duo 2026 с Core Ultra 9 386H и RTX 5090M составляет $8500

Тайваньский ценник ноутбука ASUS ROG Zephyrus Duo 2026 с Core Ultra 9 386H и RTX 5090M составляет $8500

Тайваньское подразделение ASUS оповестило пользователей о доступности премиального ноутбука ASUS ROG Zephyrus Duo 2026 на местном рынке, вот только приобрести его смогут только самые обеспеченные пользователи, которым, похоже, не жалко отдавать огромную денежную сумму. Этот ноутбук с…

Апр 23, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых