Архив рубрики ~Лента новостей~

Онбординг за дни вместо недель: как ИИ собирает обучение из вашей базы знаний на примере сервиса БЗ

Онбординг за дни вместо недель: как ИИ собирает обучение из вашей базы знаний на примере сервиса БЗ
Онбординг за дни вместо недель: как ИИ собирает обучение из вашей базы знаний на примере сервиса БЗ

В корпоративный искусственный интеллект за последнюю пару лет вложили от 30 до 40 миллиардов долларов. К лету 2025-го выяснилась досадная вещь: 95% этих внедрений не принесли компаниям ничего – ни сэкономленных часов, ни лишнего рубля в годовом отчёте. 

Попробую проиллюстрировать:
Новый сотрудник открывает корпоративного ассистента и задаёт первый рабочий вопрос – что-нибудь житейское, вроде «как оформить командировку в другой часовой пояс». Ассистент отвечает обстоятельно и с полной уверенностью в себе. 

Но неправильно.
Потому что актуальный регламент лежит в личке у HR-директора, прошлогодняя версия пылится локально в архиве её коллеги-предшественника, куда никто не заглядывал с её увольнения, а ключевая информация, ради которой всё и затевалось, существует только в голове у Марины. 

Марина в декрете. Выгрузить перед уходом свой мозг в базу знаний её, разумеется, попросить забыли. Обычная история, кстати. В такую среду приходит большинство корпоративных ИИ-внедрений: знания где-то есть, ассистент подключён – но брать данные ему неоткуда. 

В апреле Teamly выпустили большое весеннее обновление – и оно целиком про это. Про то, что должно лежать под ассистентом, чтобы тот отвечал по делу. Разбираю по частям.

Модель тут почти ни при чём

Первое, что приходит в голову: ассистенту достался слабый движок. Сэкономили на лицензии, взяли что подешевле, вот он тупит.

Но те же сотрудники, что кроют корпоративного бота на работе, вечером дома открывают ChatGPT или Gemini и прекрасно с ним ладят – пишут письма, разбирают детям домашку. Модель под капотом частенько стоит та же самая, и вопросов к ней не возникает.

Вся разница в том, о чём вы спрашиваете.
Дома – про общеизвестные вещи, которые модель впитала из половины интернета. На работе – про вашу внутреннюю командировочную политику, которую за пределами вашего офиса не знает ни одна живая душа и ни одна нейросеть. 

Откуда тогда боту взять верный ответ, если актуальной версии регламента нет ни в одной подключенной к нему системе? Он сделает единственное, что умеет – уверенно сочинит правдоподобную инструкцию, потому что боту в датасете протянули пустоту и попросили ответить.

Если отжать из всей этой истории воду, остаётся одна довольно обидная мысль:

Корпоративный ИИ умён ровно настолько, насколько полна база знаний под ним.

Под капотом приличного корпоративного ассистента крутится механизм по имени RAG – retrieval-augmented generation, генерация с опорой на поиск. 

По-человечески: прежде чем ответить, система сперва лезет в ваши документы, находит подходящий фрагмент и отвечает уже по нему, а не по своим абстрактным знаниям откуда-то из сети. Выглядит надёжно – ровно до того момента, как вы вспомните, что лезет она в те самые документы, которых либо нет, либо они протухли. Мусор на входе оборачивается мусором на выходе, только теперь он подан красиво и уверенным тоном.

Можно было бы списать всё это на моё личное ворчание.
Беда в том, что к тому же выводу приходят люди, которым любить ИИ положено по должности. 

Главные виновники провалов — данные и контекст, а сами модели там почти ни при чём. А на весенней отраслевой конференции по корпоративному ИИ шеф команды тренеров большой языковой модели Яндекса вышел с докладом про «чёрный ящик» и проговорил вслух такую вещь: результат всегда упирается в людей, которые с этим ИИ работают. Когда про ограничения ИИ напоминает тот, кто этот ИИ тренирует, стоит прислушаться.

И, к слову, такой созревшей тему считаю далеко не я один. Под мысль «ИИ бесполезен без базы знаний» Teamly вместе с интегратором QSOFT собрали весной целую конференцию.

Со сцены выходили люди из Северстали и Ростелекома – рассказывали, как огромные компании вытаскивают знания сотрудников из голов в общую систему. Был там и Росатом со своим докладом про то, как «перестать зависеть от отдельных людей». А следом Teamly выкатила то самое обновление, которое всё целиком про одно – привести в порядок базу под нейросетью, без которой нейросеть остаётся пустой. Его мы и разберём.

Что должно быть в модели

Начнём с очевидного, которое при этом регулярно игнорируют.

Корпоративный ассистент должен генерировать ответ строго из ваших документов – и только из них. Без примеси интернета и домыслов по аналогии с другими компаниями.

В каждом показывать источник: здесь статья в базе знаний, а вот пункт конкретного регламента. Если ассистент не тычет в источник пальцем, у сотрудника нет способа проверить, где кончается факт и начинается галлюцинация. 

В весеннем обновлении Teamly ИИ-ассистент отвечает строго на основе корпоративной базы знаний. Каждый ответ – с прямой ссылкой на источник. Работает с документами в основных рабочих форматах – вытаскивает нужное из PDF, Word и Excel. Это базовая гигиена – но именно её нет у многих корпоративных решений.

8dd58132233f3cf66f30f7892f47f667

Второй момент – тот, про который обычно не думают до первого инцидента. Права доступа.

Представьте: сотрудник спрашивает ассистента про условия бонусного пакета для руководства. Документ есть в базе, ИИ его находит. Только документ помечен как «только для топ-менеджмента» – а ассистент про метки ничего не знает и честно пересказывает его рядовому сотруднику. Retrieval отработал, а права нарушены.

В Teamly ИИ формирует ответ с учётом прав доступа конкретного пользователя – видит ровно то, что ему положено видеть. 

Третья проблема – версионность.
Регламент из нашего сценария существует в трёх местах в трёх разных состояниях. RAG тянет из всех сразу, получает противоречия и либо выбирает один ответ случайно, либо синтезирует четвёртый, которого нет нигде. Источник проблемы – не сама идея базы знаний. Один и тот же кусок контента просто живёт в нескольких независимых копиях. Каждый раз, когда кто-то обновил одну и забыл остальные, расхождение растёт.

Под это в Teamly сделали синхронизированные блоки.

fe8c761577e0f5f180de214498ec60a8

Создаёте единый кусок контента – он автоматически подтягивается во все связанные материалы. Меняете в одном месте – меняется везде. Марина перед декретом могла бы один раз привести регламент в порядок, и он бы не расползся по трём архивам.

И четвёртое – то, что в базе копилось годами.
У любой базы знаний старше двух лет неизбежно скапливается мусор: статьи, которые дублируют друг друга, инструкции, которые за это время успели разойтись. Ручная расчистка – это отдельный проект на несколько недель. В Teamly уже анонсировали инструмент: ИИ обходит базу, выявляет дублирующиеся и противоречащие материалы, предлагает варианты объединения. 

Все четыре условия – про содержимое базы: что лежит внутри, насколько это актуально, у кого какой доступ. Но это решается в предположении, что знание уже где-то записано. 

Знание, которое уходит с человеком

Вернёмся к Марине из декрета. С базой и правами доступа мы разобрались, но есть проблема, которую никакая синхронизация блоков не вылечит. 

Часть знаний в компании вообще нигде не записана.
Она живёт в голове у конкретного человека – как он на самом деле согласует бюджет в обход буксующей официальной процедуры и почему конкретно вот этот клиент требует особого обращения. В базе этого нет, потому что туда это никто и не ложил.
В день, когда человек покидает должность, знание уходит вместе с ним.

Здесь вскрывается каскад неприятных вещей.
Долгий онбординг новичка и потеря экспертизы при увольнении – одна и та же дыра, просто с разных сторон. Новичок входит в курс дела месяцами ровно потому, что знание не вынуто из голов в систему: ему приходится собирать его по крупицам, дёргая без того занятых коллег. 

4cddf43c4c4492498a2ebdb157a8b52a

А когда носитель уходит – дёргать становится некого. Компания платит за это дважды: сначала временем сеньоров на обучение младших коллег, потом – дырой в процессах, когда передавать знание стало уже некому.

Запретить людям увольняться и уходить в декрет нельзя.
Можно другое – вынимать знание в систему заранее, и делать это так, чтобы эксперт не убил на методичку месяц. Обычно ведь как: чтобы превратить экспертизу в курс для новичков, надо посадить того самого эксперта писать учебник – а у него своя работа, и писать он будет до второго пришествия.

В Teamly зашли иначе.
ИИ собирает курс из того, что уже лежит в базе – берёт статьи и регламенты и разворачивает их в структуру обучения. Тесты к курсу генерируются за минуты, тоже из содержимого. Эксперту не надо писать учебник с нуля – надо, чтобы его знание один раз попало в базу в любом виде, а сборку обучения система берёт на себя.

Отдельные курсы – ещё не система, новичку нужен маршрут: куда смотреть в первый день и что осваивать в первый месяц. В обновлении появились траектории обучения – курсы складываются в последовательные программы. Онбординг превращается в дорожку, по которой человека ведут от первого дня до самостоятельной работы, и прогресс видно на каждом шаге.

В том же Ростелекоме обучение работе с ИИ встроили прямо в повседневную работу: через корпоративный онлайн-университет промпт-инжинирингу обучили больше 80 тысяч сотрудников, а рутину по подготовке курсов и проверке тестов отдали ИИ. На таком масштабе собрать это вручную физически невозможно.

База знаний нужна, чтобы перестать зависеть от отдельных сотрудников как единственных носителей экспертизы. Когда ключевое знание лежит в системе и доступно всем, кому положено, уход человека – уже неприятность, но не катастрофа для команды.

Курсы из материалов, тесты, траектории – пожалуй, самая чувствительная для HR часть релиза: она бьёт прямо в онбординг и в удержание экспертизы. 

Что ещё в релизе

Помимо ядра, в обновлении приехало ещё несколько вещей – коротко.

Внешний ИИ-виджет.
Тот же ассистент, выставленный наружу: ставится на сайт или клиентский портал и отвечает посетителям из вашей базы знаний круглосуточно. Часть типовых вопросов закрывает без живого оператора.

Мобильное приложение.
Теперь в нём работает полноценный редактор: можно создавать и править материалы, проходить курсы, спрашивать ИИ-чат – хоть из дороги, хоть с выезда. Прогресс по обучению синхронизируется сам.

Переезд с чужих LMS.
Курсы в формате SCORM импортируются в один клик – платформа сама разворачивает структуру и сохраняет содержимое. Сюда же обновлённый конструктор диалоговых сценариев для саппорта и умные таблицы с фильтрами для тех, кто держит данные в структурированном виде.

Безопасность.
Усиленная on-premise поставка: интеграция с корпоративными Active Directory и SIEM, единый вход через SSO. И главное для тех, кому нельзя в облако – локальную языковую модель можно поднять внутри закрытого контура, чтобы данные компании вообще не уходили наружу. Как раз для банков, госсектора и всех с грифом «секретно».

Что со всем этим делать

Вернёмся к той цифре из начала. 95% корпоративных ИИ-внедрений не дали отдачи, и причина почти всегда была одна – под моделью оказывалось пусто. Модель отличная, спросить у неё нечего.

И если забрать из всей истории одну мысль – вот она. 

В ближайшие годы выйграет не самый умный ИИ-ассистент. Выиграет компания, которой есть чем его накормить.

Источник: habr.com

Оцените материал:

Поделиться
Понравилась статья? Расскажите другим
ВКонтакте
Читайте также
Новости робототехники Сами читают статьи и ставят видеокарты: Nvidia показала самообучающихся роботов ENPIRE Новости робототехники ExRobotics запускает сертифицированную UL инспекционную роботу для программной среды Новости робототехники Первая роботизированная буровая установка на материковой части России создана на базе российских программных продуктов IR-ПАК и IR-OPERBOT от РИГИНТЕЛ Архив рубрики ~Коротко из Telegram~ Google запускает собственную «мини-Википедию» для блогеров и создателей контента. Компания… Архив рубрики ~Коротко из Telegram~ Водители Tesla научились обманывать камеру слежения в салоне головой пластиковой… Архив рубрики ~Коротко из Telegram~ Главная компания ИИ-гонки не выпускает ни моделей, ни чипов ASML… Архив рубрики ~Коротко из Telegram~ DeepSeek-V4-Flash раздают бесплатно по API DeepSeek-V4-Flash временно открыли для бесплатного… Архив рубрики ~Коротко из Telegram~ ИИ помогает работать — и незаметно отучает работать самому Nature… Архив рубрики ~Коротко из Telegram~ GLM-5.2 залетела в дизайн и документы Новости робототехники В Китае кассиров меняют на гуманоидных роботов — сеть Galbot… Архив рубрики ~Коротко из Telegram~ VK Tech и Yadro подписали меморандум о технологическом партнерстве для… Архив рубрики ~Коротко из Telegram~ Яндекс выложил в открытый доступ формат хранения и передачи данных… Архив рубрики ~Коротко из Telegram~ 📷 Вышел новый open-source видеоредактор Palmier, который позволяет AI-модели Claude… Архив рубрики ~Обо всем~ Microsoft добавляет конфигурации с 8 ГБ оперативной памяти, чтобы снизить стартовую цену Surface Pro и Surface Laptop. Новости робототехники Сами читают статьи и ставят видеокарты: Nvidia показала самообучающихся роботов ENPIRE Новости робототехники ExRobotics запускает сертифицированную UL инспекционную роботу для программной среды Новости робототехники Первая роботизированная буровая установка на материковой части России создана на базе российских программных продуктов IR-ПАК и IR-OPERBOT от РИГИНТЕЛ Архив рубрики ~Коротко из Telegram~ Google запускает собственную «мини-Википедию» для блогеров и создателей контента. Компания… Архив рубрики ~Коротко из Telegram~ Водители Tesla научились обманывать камеру слежения в салоне головой пластиковой… Архив рубрики ~Коротко из Telegram~ Главная компания ИИ-гонки не выпускает ни моделей, ни чипов ASML… Архив рубрики ~Коротко из Telegram~ DeepSeek-V4-Flash раздают бесплатно по API DeepSeek-V4-Flash временно открыли для бесплатного… Архив рубрики ~Коротко из Telegram~ ИИ помогает работать — и незаметно отучает работать самому Nature… Архив рубрики ~Коротко из Telegram~ GLM-5.2 залетела в дизайн и документы Новости робототехники В Китае кассиров меняют на гуманоидных роботов — сеть Galbot… Архив рубрики ~Коротко из Telegram~ VK Tech и Yadro подписали меморандум о технологическом партнерстве для… Архив рубрики ~Коротко из Telegram~ Яндекс выложил в открытый доступ формат хранения и передачи данных… Архив рубрики ~Коротко из Telegram~ 📷 Вышел новый open-source видеоредактор Palmier, который позволяет AI-модели Claude… Архив рубрики ~Обо всем~ Microsoft добавляет конфигурации с 8 ГБ оперативной памяти, чтобы снизить стартовую цену Surface Pro и Surface Laptop.

Оставить комментарий