LLM - ИдеиPRO

07.06.2026

Что происходит внутри LLM, когда ты отправляешь сообщение

Ты пишешь вопрос и нажимаешь Enter. Через секунду начинают появляться слова. Кажется, будто кто-то думает и печатает. Но внутри не…

07.06.2026

Агентная разработка с LLM: ускорение появляется не из магии, а из процесса

Практический разбор агентной разработки с LLM на реальных задачах: от оценки большого legacy-проекта и разработки фичи до мультиагентной…

05.06.2026

Что происходит, когда LLM остается наедине с собой (неожиданно, но она сходит с ума)

Автор имел примерно такие вайбы после этих экспериментовВсем доброго времени суток. Здесь будет описана история происхождения архитектуры…

04.06.2026

Пока все смотрят на LLM: почему классический ML годами зарабатывает сотни миллионов?

В ленте сплошные языковые модели и агенты, а инвесторы спорят про окупаемость GenAI. Тем временем «скучный» классический ML: градиентный…

03.06.2026

AI inference на K8s: как выживать с LLM в кубере. DRA, GIE, LLM-D

Дрейк тоже шарит за AI inferenceДля многих обывателей, да и инженеров, которые не углублялись в тему, работа с LLM выглядит как работа с…

02.06.2026

Краткое введение в объяснимость LLM

В данной статье обсуждается объяснимость LLM и описываются достижения, тенденции и текущие разработки в этой важной области исследований. #…

02.06.2026

Как нам в Домклик LLM рефакторинг делала

Привет! Меня зовут Сергей, я Android-разработчик команды Новостроек в Домклик. Довольно давно наблюдаю за «сценой» ИИ в разработке, надо…

01.06.2026

Контекст для LLM в тестировании: от калькулятора страховой премии до ТЗ на сотню страниц

Всем привет! Продолжаю цикл статей про применение ИИ в тестирование. Здесь можно прочитать первую статью «ИИ в тестировании: зачем мы пошли…

31.05.2026

Вайбаналитика: как я учил LLM описывать бизнес-процессы, а не имитировать их

Опыт ERP-архитектора: почему ChatGPT сначала выдавал красивые, но непроверяемые процессы — и почему решение оказалось не в промптах, а в…

30.05.2026

Together AI научились ужимать KV-кэш LLM до 2 бит —…

Together AI научились ужимать KV-кэш LLM до 2 бит — почти без потери качества Together AI выложила OSCAR — систему экстремального сжатия…

28.05.2026

[Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 3. Сколько ресурсов нужно для LLM?

Это продолжение цикла статей о масштабировании тренировки и инференса LLM. Предыдущая статьяА теперь перейдем к чему-то более…

25.05.2026

MCP-агрегатор: объединяем инструменты для LLM в один сервер

При работе с локальными LLM через Claude Desktop, Kilo Code, Cursor или другие MCP-клиенты часто возникает одна и та же ситуация: Нужен…

25.05.2026

Базы знаний и LLM: паттерн Андрея Карпаты, который меняет правила игры

Почему RAG — это тупик для большинства баз знаний — и почему модель Карпаты (raw → wiki) лучше, чем “поиск по чанкам”.llm wiki — Андрей…

25.05.2026

Как мы подключили LLM к поддержке, а получили идеального лжеца

Где‑то в начале года мы решили: давайте автоматизируем часть поддержки через LLM. Ну, знаете, идея тогда казалась почти очевидной.У нас…

15.05.2026

LLM-конспектировщики пропускают этап идентификации

Аргумент практикующего специалиста о том, что методы обобщения результатов встреч терпят неудачу так же, как и регрессионный анализ, если…

04.05.2026

Новый инструмент механистической интерпретируемости этого стартапа позволяет отлаживать LLM-ы.

Стефани Арнетт/MIT Technology Review | Adobe Stock Стартап Goodfire из Сан-Франциско выпустил новый инструмент под названием Silico,…

08.04.2026

Повышение точности моделей LLM за счет использования всех их слоев.

Мы представляем SLED — стратегию декодирования, которая повышает точность моделей с линейной логикой и машинным обучением (LLM) за счет…

07.04.2026

Удобный ресурс, где можно посмотреть, какая LLM запустится на вашем…

Удобный ресурс, где можно посмотреть, какая LLM запустится на вашем железе локально. Забавно, что при открытии страницы он даже пытается…

05.04.2026

Новый метод может повысить эффективность обучения LLM.

Используя свободное вычислительное время, исследователи могут удвоить скорость обучения модели, сохраняя при этом точность. ↓ Скачать…

04.04.2026

Предупреждение: Персонализация LLM может привести к подхалимству и снижению точности

Контекст длительных разговоров может привести к тому, что язык программирования начнет отражать точку зрения пользователя, что потенциально…

30.03.2026

Готовые к внедрению агенты LLM: комплексная структура для автономной оценки.

Мы достигли замечательных успехов в создании сложных агентских систем, но нам не хватает той же строгости в доказательстве их…

22.03.2026

Nvidia заявляет, что может уменьшить объем памяти LLM в 20 раз без изменения весовых коэффициентов модели.

Бен Диксон Источник изображения: VentureBeat с ChatGPT Исследователи Nvidia представили новую методику, которая значительно сокращает объем…

20.03.2026

Синтетические и федеративные модели: адаптация домена с сохранением конфиденциальности с помощью LLM для мобильных приложений

Использование синтетических данных, обеспечивающих конфиденциальность, в федеративном обучении может улучшить как небольшие, так и большие…

18.03.2026

Можно ли доверять нейросети (LLM) и насколько достоверны их решения

LLM (Large language model)- продвинутая вычислительная модель, способная анализировать и генерировать тексты на любую тематику….