Image

Зачем бизнесу GPT-платформа, а не просто LLM: опыт JET & Yandex GPT Lab

Меня зовут Антон Чикин, я руковожу отделом интеллектуального анализа в «Инфосистемы Джет». В статье я попробую показать на практическом примере, почему корпоративный ИИ нельзя свести к установке готовой LLM — и что именно приходится выстраивать вокруг неё, чтобы получить реальную ценность для бизнеса.

Этот материал будет полезен тем, кто отвечает за внедрение ИИ в компаниях среднего и крупного масштаба: ИТ-директорам, архитекторам корпоративных систем, специалистам по информационной безопасности и тем, кто рассматривает генеративный ИИ как инструмент автоматизации бизнес-процессов.

4e6a0cef94e7449fed11d52a3da0ba22

Почему одной LLM недостаточно

Сегодня вокруг крупных языковых моделей (LLM) вроде ChatGPT или DeepSeek сформировалось устойчивое впечатление: «достаточно взять готовую модель и подключить её к работе». На практике же бизнес довольно быстро сталкивается с ограничениями.

1. Конфиденциальность и требования регуляторов.

Отправка внутренних документов или клиентских данных в публичное облако несовместима с корпоративными ИБ-политиками и требованиями регуляторов (например, ФСТЭК). В большинстве случаев необходима работа внутри собственного контура и под полным контролем.

2. Контекст компании.

LLM «из коробки» хорошо справляется с общими задачами, но ничего не знает о внутренней ERP-системе, базе знаний в Confluence, процессах в Jira или данных в корпоративных SQL-хранилищах. Без интеграции с этими источниками модель быстро теряет практическую ценность.

3. Инфраструктурные ограничения.

Современные модели — это десятки и сотни миллиардов параметров. Развернуть и поддерживать подобные системы локально — серьёзный вызов даже для технологических гигантов. Необходимы GPU-фермы, системы оркестрации и продуманная стратегия масштабирования под нагрузку.

4. Ассистент вместо «умного чата».

Корпоративному пользователю нужен не собеседник, а инструмент, встроенный в рабочие процессы: генерация отчётов, автоматизация поддержки, поиск информации в узкоспециализированных базах. Интерфейс должен быть привычным и интегрированным в корпоративные сервисы.

5. Управление и безопасность.

Ролевой доступ, аудит действий, мониторинг и интеграция с системами кибербезопасности — обязательные требования к любой корпоративной платформе. Без них внедрение превращается в потенциальный риск.

Таким образом, когда речь идёт о внедрении LLM в корпоративную среду, становится очевидно: «просто взять модель» и встроить её в бизнес-процессы не получится. Необходимы инструменты для интеграции, безопасности, управления и масштабирования. По сути, LLM — это лишь фундамент, на котором нужно выстраивать целый «дом» из сервисов и компонентов. Этот дом дорогой, сложный в проектировании и требует системного подхода.

Что мы сделали в JET & Yandex GPT Lab

db8ce02c08c8267bca62372585ffa6df

Из этих вызовов и сложилась архитектура нашей платформы, которую мы разработали совместно с Yandex Cloud. Её задача — не заменить модель, а дополнить её необходимым окружением:

  • обеспечить локальное и безопасное развертывание;

  • интегрироваться с корпоративными источниками данных (от ERP до SQL-хранилищ);

  • упростить создание ИИ-ассистентов, которые работают именно с данными компании, а не только обучены на общедоступном интернет-контенте.

Поэтому JET & Yandex GPT Lab — это не «очередная LLM», а набор инженерных инструментов, позволяющих строить корпоративные ИИ-сервисы так же системно, как внедряются CRM, BI или системы документооборота.

Принципы архитектуры

4614410464a74d4e554345122cb6b606

Давайте пройдемся по ключевым идеям, которые заложены в основу.

1. Локальность + гибридность

Ядро платформы — это YandexGPT (включая последнюю YandexGPT 5.1 Pro), развёрнутая прямо в контуре компании. Это исключает утечку чувствительных данных во внешние облака.

В то же время архитектура не замыкается только на локальной модели. Через слой абстракции LLM Proxy возможно гибко подключать публичные модели, если политика компании это допускает. Такой гибридный подход позволяет подбирать оптимальную LLM под конкретную задачу.

2. Интеграция как «кровеносная система»

Ассистенты полезны только тогда, когда умеют работать с корпоративными системами: ERP, БД, тикет-системами, хранилищами документов. Для этого используется единый API-шлюз, к которому можно подключать внутренние источники.

Создание ассистентов не требует глубоких знаний программирования: в платформе есть low-code/no-code инструменты, позволяющие бизнес-аналитикам собирать прототипы визуально. Сервисный слой реализован по enterprise-стандартам: авторизация, мониторинг, аудит действий — встроены «по умолчанию».

3. Работа с данными как ключевая способность

  • Ассистенты работают не только с текстом, но и с данными:

  • неструктурированные источники (PDF, документы) индексируются через векторные базы и доступны для семантического поиска;

  • структурированные данные (SQL-хранилища) доступны через безопасное выполнение автоматически сгенерированных запросов в режиме «только чтение»;

  • логика выбора источника автоматизирована: ассистент сам решает, обратиться ли к векторам, SQL или внешнему API.

4. Агентский RAG

Классический RAG («нашёл документ → передал в модель → получил ответ») стал отправной точкой. Но в реальных сценариях этого недостаточно. Мы добавили слой агентского мышления, позволяющий ассистентам планировать действия, выполнять последовательные шаги и комбинировать данные из разных источников.

Важное отступление: что такое ИИ-агенты

За последний год термин «ИИ-агенты» стал одним из самых популярных в индустрии. Его используют почти везде — иногда формально. Но важно понимать, что именно скрывается за этим понятием.

Классическая работа с LLM выглядит линейно: запрос → ответ. Агентский подход предполагает более сложное поведение:

  • планирование шагов для решения задачи;

  • рефлексия — оценка прошлых действий и корректировка стратегии;

  • выбор инструментов из доступного набора;

  • итеративное рассуждение с уточнением результата;

  • даже частичное наличие этих элементов делает систему «агентской».

Смотрим, как агентский RAG работает на практике:

0304c6aa62d1129f1b54aa09581d801d

В корпоративном сценарии сотрудник задаёт вопрос в чат-боте и ожидает ответа из внутренних систем. Чтобы это работало, данные предварительно индексируются с помощью эмбеддинг-моделей, преобразующих тексты в векторы. В процессе поиска осуществляется выбор и ранжирование фрагментов, наиболее близких к запросу. На основе этих фрагментов  LLM строит ответ — это и есть классический RAG.

Агентский RAG — итеративный и управляемый моделью процесс. Модель сама:

  • анализирует найденное и при необходимости переформулирует запрос;

  • может вызывать внешние инструменты;

  • оценивает качество промежуточного результата;

  • при необходимости повторяет процесс (ещё итерации) и только затем формирует итоговый ответ.

Процесс ограничен по времени и итерациям, чтобы избежать слишком долгой обработки. Это превращает ассистента в исследователя: он уточняет гипотезы, комбинирует источники и формирует осмысленный ответ.

Более того, мы даём разработчикам возможность самим собирать ассистентов под свои задачи. Вы можете не ограничиваться простым запросом к языковой модели или использованием RAG, а добавить в арсенал внешние инструменты: загрузку задач из Jira, извлечение данных из Confluence, обновление записей в базах. Так ассистент перестаёт быть просто умным собеседником и превращается в полноценного «цифрового коллегу», который умеет не только отвечать, но и действовать.

Итог: ответы на сложные, комплексные корпоративные запросы становятся качественно глубже и точнее. Это не цитата из одного источника, а согласованный по нескольким источникам ответ.

5. Мультимодальность

Ассистенты работают не только с текстом, но и с мультимодальным контентом. Для этого применяются модели VLM (Visual Language Models), которые умеют:

  • анализировать документы как визуальные объекты;

  • читать встроенный в картинки текст;

  • интерпретировать схемы и чертежи до их индексирования.

Для простых задач используются OCR-модели, которые быстрее извлекают текст без глубокого анализа.

6. Интерфейс

Интерфейс платформы построен на привычных практиках (вроде ChatGPT), но адаптирован для бизнеса:

  • гибкое управление историей;

  • подключение корпоративных хранилищ документов;

  • выбор ассистентов под бизнес-задачи.

Кейсы корпоративных ассистентов

1. Ассистент техподдержки. Работает на базе документации и инструкций. Формирует готовые пошаговые ответы с иллюстрациями, например по SAP.

2. Работа с базами данных. Ассистент может обращаться как к неструктурированным данным (документы), так и к SQL-базам. Подбирает оптимальный инструмент под задачу.

3. ИБ-ассистент. Агрегирует данные из баз данных уязвимостей, описаний сегментов сети и отчётов сканеров уязвимостей (например, MaxPatrol). Приоритизирует уязвимости в контексте конкретной инфраструктуры, чтобы выделить критичные риски. Сила этого ассистента – в умении не просто «сыпать» списками CVE, а мыслить как опытный аналитик по кибербезопасности. Он проводит кросс-анализ и расставляет приоритеты так, чтобы в потоке данных не утонули действительно опасные проблемы.

Вместо заключения: куда движется корпоративный ИИ

Опыт разработки JET & Yandex GPT Lab показывает: генеративный ИИ в бизнесе — это не отдельная модель, а целая экосистема. Чтобы LLM приносила реальную пользу, её нужно окружать инфраструктурой, интеграциями, системами безопасности и удобным интерфейсом.

LLM сегодня — это как процессор в компьютере: без памяти, ОС и приложений он не выполняет полезной работы. То же и с корпоративными платформами: модель — лишь ядро, вокруг которого строится архитектура.

Ключевые направления на ближайшие годы:

  • Рост агентских систем: от поиска к полноценным цифровым сотрудникам.

  • Мультимодальность как стандарт: работа с текстом, изображениями, схемами, видео.

  • Интеграция с процессами: ассистенты станут частью бизнес-цепочек.

  • Фокус на экономике: оценка внедрения по конкретным метрикам эффективности.

  • Мы убеждены: следующий этап — переход от «просто LLM» к корпоративным GPT-платформам, которые станут стандартом наряду с CRM, ERP и BI-системами.

Источник: habr.com

✅ Найденные теги: Зачем, новости
Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых