Image

Масштабирование использования LLM: как повысить производительность

Узнайте, как увеличить использование LLM для повышения производительности

Делиться

ac6f54ba11b6cdbd3d24b8d11617e77b

С выходом ChatGPT слово «масштабирование» стало, пожалуй, самым важным в контексте больших языковых моделей (LLM). ChatGPT стал настолько успешным во многом благодаря масштабируемому предварительному обучению , проведённому OpenAI, что сделало его мощной языковой моделью.

После этого лаборатории Frontier LLM начали масштабировать пост-обучение ,   с контролируемой тонкой настройкой и RLHF, в ходе которых модели все лучше следовали инструкциям и выполняли сложные задачи.

И как раз когда мы думали, что LLM вот-вот выйдет на плато, мы начали масштабировать время вывода с выпуском моделей рассуждений, где трата токенов мышления давала огромные улучшения в качестве результатов.

Инфографика: Масштабирование использования LLM

Теперь я утверждаю, что нам следует продолжить это масштабирование с новой парадигмой масштабирования: масштабирование на основе использования , где вы масштабируете то, насколько интенсивно вы используете LLM:

  • Запускайте больше агентов кодирования параллельно
  • Всегда начинайте глубокое исследование интересующей вас темы
  • Запуск рабочих процессов по извлечению информации

Если вы не увольняете агента перед обедом или сном, вы теряете время.

В этой статье я расскажу, почему масштабирование использования LLM может привести к повышению производительности, особенно при работе программистом. Кроме того, я расскажу о конкретных методах, которые вы можете использовать для масштабирования использования LLM как для себя лично, так и для компаний, в которых вы работаете. В этой статье я постараюсь придерживаться общей темы, стремясь вдохновить вас на то, чтобы максимально эффективно использовать ИИ.

Почему вам следует масштабировать использование LLM

Ранее мы уже видели, как масштабирование может быть невероятно эффективным:

  • предварительная подготовка
  • после обучения
  • масштабирование времени вывода

Причина в том, что, как оказалось, чем больше вычислительной мощности вы тратите на что-либо, тем лучшего качества результат вы получите. Конечно, это предполагает, что вы способны эффективно использовать компьютер. Например, для предварительного обучения возможность масштабирования вычислений зависит от

  • Достаточно большие модели (достаточно веса для тренировки)
  • Достаточно данных для обучения

Если масштабировать вычисления без этих двух компонентов, улучшений не будет. Однако, если масштабировать все три, можно получить потрясающие результаты, например, передовые программы LLM, которые мы наблюдаем сейчас, например, с выпуском Gemini 3.

Поэтому я считаю, что вам следует стремиться к максимальному масштабированию своего опыта работы с LLM. Это может быть, например, запуск нескольких агентов для параллельного написания кода или начало углубленного исследования интересующей вас темы в Gemini.

Конечно, использование всё равно должно быть полезным. Нет смысла запускать агент кодирования для какой-то непонятной задачи, которая вам не нужна. Вместо этого следует запустить агент кодирования для:

  • Линейная проблема, на которую у вас никогда не было времени сесть и заняться ею самостоятельно
  • В ходе последнего телефонного разговора по продажам была запрошена быстрая функция
  • Некоторые улучшения пользовательского интерфейса, как вы знаете, сегодняшние агенты кодирования легко справляются
026a2b6b59483289b7d48b46defe1029

Источник: towardsdatascience.com

✅ Найденные теги: Масштабирование, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Извлечение документов DPT-2, точность 99.16%, DocVQA, текст под подписью.
Новая открытая система «автоисследований» Андрея Карпати позволяет запускать сотни экспериментов с искусственным интеллектом за ночь, что имеет революционные последствия.
Новорожденный в инкубаторе с фототерапией под синим светом.
Паркетный зал с деловой встречей, люди сидят и слушают спикеров за столом.
Детский рисунок: робот и слова на английском с объектами, включая кролика и гитару.
Абстрактное изображение в розово-синих тонах, напоминающее фрактал или галактику.
Рейтинг выручки топ-10 мировых литейных заводов за 4Q25, данные TrendForce.
Мужчина в офисе рядом с экраном, на котором написано "SEO - как базовая инфраструктура бизнеса".
Космическая площадка с пусковой установкой для ракет на фоне голубого неба.
Image Not Found
Извлечение документов DPT-2, точность 99.16%, DocVQA, текст под подписью.

Тест DocVQA: точность 99,16% при использовании метода извлечения документов Agentic.

Анкит Кхаре, Шанкар Джагадисан, 12 ноября 2025 г. Поделиться: Вкратце: Мы провели валидацию на наборе данных DocVQA и получили 5286 правильных ответов из 5331 (99,16%) . Из этих 45 неправильных ответов только 18 являются истинными недостатками синтаксического…

Мар 13, 2026
Новая открытая система «автоисследований» Андрея Карпати позволяет запускать сотни экспериментов с искусственным интеллектом за ночь, что имеет революционные последствия.

Новая открытая система «автоисследований» Андрея Карпати позволяет запускать сотни экспериментов с искусственным интеллектом за ночь, что имеет революционные последствия.

Карл Франзен Источник: VentureBeat, создано с помощью Google Gemini 3 Pro. В минувшие выходные Андрей Карпати — влиятельный бывший руководитель направления искусственного интеллекта в Tesla, соучредитель и бывший член OpenAI, придумавший термин «вайб-кодирование» — опубликовал на X…

Мар 13, 2026
Новорожденный в инкубаторе с фототерапией под синим светом.

Обтирание не повлияло на температуру тела недоношенных детей. При их укутывании в окклюзивный мешок

При их укутывании в окклюзивный мешок Клиническое исследование итальянских ученых показало, что обтирание крайне недоношенных детей теплым полотенцем перед их укутыванием в пластиковый окклюзивный мешок не влияет на поддержание нормальной температуры тела. Как сообщается в JAMA Network Open, в испытании приняли участие 354 ребенка. Поддержание теплового…

Мар 13, 2026
Паркетный зал с деловой встречей, люди сидят и слушают спикеров за столом.

ОПЯТЬ ГРОМКИЕ, НО ПУСТЫЕ ОБЕЩАНИЯ АКАДЕМИКОВ

В историческом здании Санкт-Петербургского отделения Российской академии наук состоялось торжественное открытие Центра развития фундаментальных и прикладных исследований Российский академии образования (РАО). Научным руководителем центра стал ректор РГПУ имени А. И. Герцена, академик РАО Сергей Тарасов. Основными направлениями…

Мар 13, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых