Онбординг за дни вместо недель: как ИИ собирает обучение из вашей базы знаний на примере сервиса БЗ

24.06.2026 ideipro.ru

В корпоративный искусственный интеллект за последнюю пару лет вложили от 30 до 40 миллиардов долларов. К лету 2025-го выяснилась досадная вещь: 95% этих внедрений не принесли компаниям ничего – ни сэкономленных часов, ни лишнего рубля в годовом отчёте.

Попробую проиллюстрировать:
Новый сотрудник открывает корпоративного ассистента и задаёт первый рабочий вопрос – что-нибудь житейское, вроде «как оформить командировку в другой часовой пояс». Ассистент отвечает обстоятельно и с полной уверенностью в себе.

Но неправильно.
Потому что актуальный регламент лежит в личке у HR-директора, прошлогодняя версия пылится локально в архиве её коллеги-предшественника, куда никто не заглядывал с её увольнения, а ключевая информация, ради которой всё и затевалось, существует только в голове у Марины.

Марина в декрете. Выгрузить перед уходом свой мозг в базу знаний её, разумеется, попросить забыли. Обычная история, кстати. В такую среду приходит большинство корпоративных ИИ-внедрений: знания где-то есть, ассистент подключён – но брать данные ему неоткуда.

В апреле Teamly выпустили большое весеннее обновление – и оно целиком про это. Про то, что должно лежать под ассистентом, чтобы тот отвечал по делу. Разбираю по частям.

Модель тут почти ни при чём

Первое, что приходит в голову: ассистенту достался слабый движок. Сэкономили на лицензии, взяли что подешевле, вот он тупит.

Но те же сотрудники, что кроют корпоративного бота на работе, вечером дома открывают ChatGPT или Gemini и прекрасно с ним ладят – пишут письма, разбирают детям домашку. Модель под капотом частенько стоит та же самая, и вопросов к ней не возникает.

Вся разница в том, о чём вы спрашиваете.
Дома – про общеизвестные вещи, которые модель впитала из половины интернета. На работе – про вашу внутреннюю командировочную политику, которую за пределами вашего офиса не знает ни одна живая душа и ни одна нейросеть.

Откуда тогда боту взять верный ответ, если актуальной версии регламента нет ни в одной подключенной к нему системе? Он сделает единственное, что умеет – уверенно сочинит правдоподобную инструкцию, потому что боту в датасете протянули пустоту и попросили ответить.

Если отжать из всей этой истории воду, остаётся одна довольно обидная мысль:

Корпоративный ИИ умён ровно настолько, насколько полна база знаний под ним.

Под капотом приличного корпоративного ассистента крутится механизм по имени RAG – retrieval-augmented generation, генерация с опорой на поиск.

По-человечески: прежде чем ответить, система сперва лезет в ваши документы, находит подходящий фрагмент и отвечает уже по нему, а не по своим абстрактным знаниям откуда-то из сети. Выглядит надёжно – ровно до того момента, как вы вспомните, что лезет она в те самые документы, которых либо нет, либо они протухли. Мусор на входе оборачивается мусором на выходе, только теперь он подан красиво и уверенным тоном.

Можно было бы списать всё это на моё личное ворчание.
Беда в том, что к тому же выводу приходят люди, которым любить ИИ положено по должности.

Главные виновники провалов — данные и контекст, а сами модели там почти ни при чём. А на весенней отраслевой конференции по корпоративному ИИ шеф команды тренеров большой языковой модели Яндекса вышел с докладом про «чёрный ящик» и проговорил вслух такую вещь: результат всегда упирается в людей, которые с этим ИИ работают. Когда про ограничения ИИ напоминает тот, кто этот ИИ тренирует, стоит прислушаться.

И, к слову, такой созревшей тему считаю далеко не я один. Под мысль «ИИ бесполезен без базы знаний» Teamly вместе с интегратором QSOFT собрали весной целую конференцию.

Со сцены выходили люди из Северстали и Ростелекома – рассказывали, как огромные компании вытаскивают знания сотрудников из голов в общую систему. Был там и Росатом со своим докладом про то, как «перестать зависеть от отдельных людей». А следом Teamly выкатила то самое обновление, которое всё целиком про одно – привести в порядок базу под нейросетью, без которой нейросеть остаётся пустой. Его мы и разберём.

Что должно быть в модели

Начнём с очевидного, которое при этом регулярно игнорируют.

Корпоративный ассистент должен генерировать ответ строго из ваших документов – и только из них. Без примеси интернета и домыслов по аналогии с другими компаниями.

В каждом показывать источник: здесь статья в базе знаний, а вот пункт конкретного регламента. Если ассистент не тычет в источник пальцем, у сотрудника нет способа проверить, где кончается факт и начинается галлюцинация.

В весеннем обновлении Teamly ИИ-ассистент отвечает строго на основе корпоративной базы знаний. Каждый ответ – с прямой ссылкой на источник. Работает с документами в основных рабочих форматах – вытаскивает нужное из PDF, Word и Excel. Это базовая гигиена – но именно её нет у многих корпоративных решений.

Второй момент – тот, про который обычно не думают до первого инцидента. Права доступа.

Представьте: сотрудник спрашивает ассистента про условия бонусного пакета для руководства. Документ есть в базе, ИИ его находит. Только документ помечен как «только для топ-менеджмента» – а ассистент про метки ничего не знает и честно пересказывает его рядовому сотруднику. Retrieval отработал, а права нарушены.

В Teamly ИИ формирует ответ с учётом прав доступа конкретного пользователя – видит ровно то, что ему положено видеть.

Третья проблема – версионность.
Регламент из нашего сценария существует в трёх местах в трёх разных состояниях. RAG тянет из всех сразу, получает противоречия и либо выбирает один ответ случайно, либо синтезирует четвёртый, которого нет нигде. Источник проблемы – не сама идея базы знаний. Один и тот же кусок контента просто живёт в нескольких независимых копиях. Каждый раз, когда кто-то обновил одну и забыл остальные, расхождение растёт.

Под это в Teamly сделали синхронизированные блоки.

Создаёте единый кусок контента – он автоматически подтягивается во все связанные материалы. Меняете в одном месте – меняется везде. Марина перед декретом могла бы один раз привести регламент в порядок, и он бы не расползся по трём архивам.

И четвёртое – то, что в базе копилось годами.
У любой базы знаний старше двух лет неизбежно скапливается мусор: статьи, которые дублируют друг друга, инструкции, которые за это время успели разойтись. Ручная расчистка – это отдельный проект на несколько недель. В Teamly уже анонсировали инструмент: ИИ обходит базу, выявляет дублирующиеся и противоречащие материалы, предлагает варианты объединения.

Все четыре условия – про содержимое базы: что лежит внутри, насколько это актуально, у кого какой доступ. Но это решается в предположении, что знание уже где-то записано.

Знание, которое уходит с человеком

Вернёмся к Марине из декрета. С базой и правами доступа мы разобрались, но есть проблема, которую никакая синхронизация блоков не вылечит.

Часть знаний в компании вообще нигде не записана.
Она живёт в голове у конкретного человека – как он на самом деле согласует бюджет в обход буксующей официальной процедуры и почему конкретно вот этот клиент требует особого обращения. В базе этого нет, потому что туда это никто и не ложил.
В день, когда человек покидает должность, знание уходит вместе с ним.

Здесь вскрывается каскад неприятных вещей.
Долгий онбординг новичка и потеря экспертизы при увольнении – одна и та же дыра, просто с разных сторон. Новичок входит в курс дела месяцами ровно потому, что знание не вынуто из голов в систему: ему приходится собирать его по крупицам, дёргая без того занятых коллег.

А когда носитель уходит – дёргать становится некого. Компания платит за это дважды: сначала временем сеньоров на обучение младших коллег, потом – дырой в процессах, когда передавать знание стало уже некому.

Запретить людям увольняться и уходить в декрет нельзя.
Можно другое – вынимать знание в систему заранее, и делать это так, чтобы эксперт не убил на методичку месяц. Обычно ведь как: чтобы превратить экспертизу в курс для новичков, надо посадить того самого эксперта писать учебник – а у него своя работа, и писать он будет до второго пришествия.

В Teamly зашли иначе.
ИИ собирает курс из того, что уже лежит в базе – берёт статьи и регламенты и разворачивает их в структуру обучения. Тесты к курсу генерируются за минуты, тоже из содержимого. Эксперту не надо писать учебник с нуля – надо, чтобы его знание один раз попало в базу в любом виде, а сборку обучения система берёт на себя.

Отдельные курсы – ещё не система, новичку нужен маршрут: куда смотреть в первый день и что осваивать в первый месяц. В обновлении появились траектории обучения – курсы складываются в последовательные программы. Онбординг превращается в дорожку, по которой человека ведут от первого дня до самостоятельной работы, и прогресс видно на каждом шаге.

В том же Ростелекоме обучение работе с ИИ встроили прямо в повседневную работу: через корпоративный онлайн-университет промпт-инжинирингу обучили больше 80 тысяч сотрудников, а рутину по подготовке курсов и проверке тестов отдали ИИ. На таком масштабе собрать это вручную физически невозможно.

База знаний нужна, чтобы перестать зависеть от отдельных сотрудников как единственных носителей экспертизы. Когда ключевое знание лежит в системе и доступно всем, кому положено, уход человека – уже неприятность, но не катастрофа для команды.

Курсы из материалов, тесты, траектории – пожалуй, самая чувствительная для HR часть релиза: она бьёт прямо в онбординг и в удержание экспертизы.

Что ещё в релизе

Помимо ядра, в обновлении приехало ещё несколько вещей – коротко.

Внешний ИИ-виджет.
Тот же ассистент, выставленный наружу: ставится на сайт или клиентский портал и отвечает посетителям из вашей базы знаний круглосуточно. Часть типовых вопросов закрывает без живого оператора.

Мобильное приложение.
Теперь в нём работает полноценный редактор: можно создавать и править материалы, проходить курсы, спрашивать ИИ-чат – хоть из дороги, хоть с выезда. Прогресс по обучению синхронизируется сам.

Переезд с чужих LMS.
Курсы в формате SCORM импортируются в один клик – платформа сама разворачивает структуру и сохраняет содержимое. Сюда же обновлённый конструктор диалоговых сценариев для саппорта и умные таблицы с фильтрами для тех, кто держит данные в структурированном виде.

Безопасность.
Усиленная on-premise поставка: интеграция с корпоративными Active Directory и SIEM, единый вход через SSO. И главное для тех, кому нельзя в облако – локальную языковую модель можно поднять внутри закрытого контура, чтобы данные компании вообще не уходили наружу. Как раз для банков, госсектора и всех с грифом «секретно».

Что со всем этим делать

Вернёмся к той цифре из начала. 95% корпоративных ИИ-внедрений не дали отдачи, и причина почти всегда была одна – под моделью оказывалось пусто. Модель отличная, спросить у неё нечего.

И если забрать из всей истории одну мысль – вот она.

В ближайшие годы выйграет не самый умный ИИ-ассистент. Выиграет компания, которой есть чем его накормить.

Источник: habr.com

Оцените материал:

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Модель тут почти ни при чём

Что должно быть в модели

Знание, которое уходит с человеком

Что ещё в релизе

Что со всем этим делать

Похожие записи

Похожие записи

Трамп запустил аккаунт TikTok для кабинета министров США: что известно

«Умный» гаджет Move+ 2.0 для глубокого восстановления

Европейская промышленность «расколота» из-за обсуждаемых в ЕС правил локального производства в «критически важных» отраслях — FT

Оставить комментарий Отменить ответ

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email