Можно ли интегрировать с WordPress?

Да, мы используем REST API и Application Passwords — без передачи логина и пароля. Все публикации идут от имени автора.

Работает ли ИИ с Telegram?

Полностью. ИИ может как читать каналы, так и публиковать в ваш канал. Также подключаем inline-ботов и формы сбора лидов.

Сколько времени занимает настройка?

От 3 до 7 дней. Зависит от сложности интеграции и количества источников.

Есть ли бесплатный демо-доступ?

Да, мы запускаем 5–7 дневный демо-доступ с тестовыми данными, чтобы вы увидели систему в работе.

Безопасна ли система?

Да. Все данные хранятся изолированно. Мы не используем их для обучения моделей. Поддерживаем шифрование и резервное копирование.

Что входит в поддержку?

Обновление агентов, добавление источников, исправление ошибок, масштабирование. Поддержка 24/7 по Telegram или email.

Человек анализирует данные о рисках на компьютерах с графиками и отчетами, противодействие мошенничеству.

Почему ваша модель машинного обучения работает при обучении, но терпит неудачу в продакшене?

Янв 13, 2026 0

Содержание

Тяжелые уроки, извлеченные из создания производственных систем машинного обучения, где происходят утечки данных, используются некорректные значения по умолчанию, популяции меняются, а время ведет себя не так, как мы ожидаем.

Делиться

Изображение, созданное автором с помощью ИИ.

В начале своей карьеры я работал над системами обнаружения мошенничества в реальном времени и рекомендательными моделями для продуктовых компаний, которые на этапе разработки демонстрировали отличные результаты. Показатели в офлайн-режиме были высокими. Кривые AUC оставались стабильными в течение всего периода валидации. Графики важности функций наглядно и интуитивно представляли картину. Мы выпускали продукт с уверенностью.

Несколько недель спустя наши показатели начали отклоняться от нормы.

Показатели кликабельности рекомендаций начали снижаться. Модели обнаружения мошенничества вели себя непоследовательно в часы пик. Некоторые решения казались чрезмерно уверенными, другие — странно необдуманными. Сами модели не деградировали. Не было внезапных сбоев в обработке данных или проблем с конвейерами. Проблема заключалась в нашем понимании того, как система ведет себя, когда сталкивается с временными, задержечными и отложенными истинами в реальном мире.

Эта статья посвящена именно таким неудачам. Тихим, неприметным проблемам, которые проявляются только тогда, когда системы машинного обучения сталкиваются с реальностью. Не выбору оптимизатора или новейшей архитектуре. Проблемам, которые не отображаются в блокнотах, а всплывают на поверхность в 3 часа ночи, когда изучают панели мониторинга.

Моя мысль проста: большинство сбоев в работе машинного обучения в производственной среде связаны с проблемами данных и времени, а не с проблемами моделирования. Если вы не учитываете при проектировании особенности поступления, обработки и изменения информации, система незаметно сделает эти предположения за вас.

Путешествия во времени: утечка предположений

«Путешествие во времени» — это самая распространённая ошибка машинного обучения в производственной среде, которую я наблюдал, и при этом наименее обсуждаемая в конкретных терминах. Все кивают, когда вы упоминаете утечку информации. Очень немногие команды могут указать на точную строку, где это произошло.

Позвольте мне уточнить.

Представьте себе набор данных о мошенничестве, состоящий из двух таблиц:

транзакции : когда был произведен платеж

Возврат платежей : когда было сообщено о результатах мошенничества.

Нам нужна функция user_chargeback_count_last_30_days .

Пакетное задание запускается в конце дня, незадолго до полуночи, и вычисляет количество возвратов платежей за последние 30 дней. Для пользователя U123 это значение равно 1. По состоянию на полночь это фактически верно.

Теперь взгляните на итоговый объединенный обучающий набор данных.

Утренние транзакции в 9:10 и 11:45 уже имеют счетчик возвратов платежей, равный 1. На момент совершения этих платежей возврат платежа еще не был зарегистрирован. Но обучающие данные этого не знают. Время сглажено.

Вот где модель жульничает.

С точки зрения модели, рискованные транзакции уже сопровождаются подтвержденными признаками мошенничества. Восприятие информации в офлайн-режиме значительно улучшается. На данном этапе ничего подозрительного не наблюдается.

Но в процессе производства предполагается, что модель никогда не будет заглядывать в будущее.

При развертывании на ранних этапах транзакций еще не отображается количество возвратов платежей. Сигнал исчезает, и производительность резко падает.

Это не ошибка моделирования. Это утечка предположений.

Скрытое предположение состоит в том, что функция ежедневной пакетной обработки данных действительна для всех событий этого дня. Это не так. Функция действительна только в том случае, если она могла существовать в тот самый момент, когда был сделан прогноз.

Каждая функция должна отвечать на один вопрос:

«Могло ли это значение существовать именно в тот момент, когда было сделано предсказание?»

Если ответ не является уверенным «да», функция недействительна.

Настройки по умолчанию, которые становятся сигналами

После путешествий во времени это очень распространенная причина сбоев, с которыми я сталкивался в производственных системах. В отличие от утечек, эта причина не зависит от будущего. Она зависит от молчания.

Большинство инженеров относятся к отсутствующим значениям как к гигиенической проблеме. Заполняют их средним значением, медианой или каким-либо другим методом восполнения, а затем переходят к следующему шагу.

Эти значения по умолчанию кажутся безобидными. Достаточно безопасными, чтобы модель могла продолжать работу.

Оказывается, такое предположение дорого обходится.

В реальных системах отсутствие данных редко означает случайность. Часто отсутствие данных означает что-то новое, неизвестное, еще не наблюдавшееся или еще не вызывающее доверия. Когда мы сводим все это к одному значению по умолчанию, модель не видит пробела. Она видит закономерность.

Позвольте мне изложить это конкретно.

Впервые я столкнулся с этим в системе обработки мошеннических операций в реальном времени, где мы использовали функцию под названием avg_transaction_amount_last_7_days . Для активных пользователей это значение работало корректно. Для новых или неактивных пользователей конвейер обработки функций возвращал значение по умолчанию, равное нулю.

Чтобы проиллюстрировать, как значение по умолчанию стало надежным индикатором статуса пользователя, я вычислил наблюдаемый уровень мошенничества, сгруппированный по значению функции:

data.groupby(«avg_txn_amount_last_7_days»)[«is_fraud»].mean()

Как показано, у пользователей со значением, равным нулю, наблюдается значительно более низкий уровень мошенничества — не потому, что нулевые траты по своей природе безопасны, а потому, что это неявно обозначает «нового или неактивного пользователя».

Все пользователи со средней суммой транзакций, равной нулю, не являются мошенниками. Не потому, что ноль сам по себе безопасен, а потому, что эти пользователи новые/неактивные. Модель не учится принципу «низкие расходы — это безопасно». Она учится принципу «отсутствие истории транзакций означает безопасность».

По умолчанию это стало сигналом.

В процессе обучения все выглядит хорошо, поскольку точность повышается. Затем происходит изменение производственного трафика.

В часы пик у нижестоящего сервиса начинают возникать проблемы со временем ожидания. Внезапно активные пользователи временно теряют доступ к истории транзакций. Значение avg_transaction_amount_last_7_days обнуляется. Модель уверенно помечает их как пользователей с низким риском.

Опытные команды подходят к этому иначе. Они отделяют отсутствие от ценности, четко отслеживают доступность функций. И самое главное, они никогда не позволяют молчанию выдаваться за информацию.

Сдвиг численности населения без сдвига распределения

Мне потребовалось гораздо больше времени, чтобы распознать эту неисправность, в основном потому, что все обычные сигналы тревоги оставались незамеченными.

Когда говорят о дрейфе данных, обычно подразумевают сдвиг распределения. Гистограммы признаков смещаются. Процентили меняются. Тесты Колмогорова-Смирнова загораются на панелях мониторинга. Всем понятно, что делать дальше. Исследовать исходные данные, переобучить, перекалибровать.

Изменение численности популяции без изменения распределения — это совсем другое дело. В этом случае распределение признаков остается стабильным. Сводные статистические данные практически не меняются. Панели мониторинга выглядят обнадеживающе. И все же поведение модели неуклонно ухудшается.

Впервые я столкнулся с этим в крупномасштабной системе управления рисками платежей, работающей с несколькими сегментами пользователей. Модель учитывала такие характеристики транзакций, как сумма, время суток, сигналы устройства, счетчики скорости и коды категорий продавцов. Все эти характеристики тщательно отслеживались. Их распределение практически не менялось из месяца в месяц.

Тем не менее, уровень мошенничества начал постепенно расти в очень специфическом сегменте трафика. Изменились не данные, а то, кого эти данные представляют.

Со временем продукт расширился и охватил новые группы пользователей. Новые географические регионы с различными платежными привычками. Новые категории продавцов с непривычными моделями транзакций. Рекламные кампании, которые привлекли пользователей, ведущих себя иначе, но все же попадающих в те же числовые диапазоны. С точки зрения распределения, ничего необычного не наблюдалось. Но основная масса пользователей изменилась.

Модель обучалась в основном на опытных пользователях с длительной историей поведения. По мере роста пользовательской базы, всё большая доля трафика приходилась на новых пользователей, чьё поведение статистически выглядело схожим, но семантически отличалось. Сумма транзакции в 2000 означала совершенно разное для давнего пользователя и для новичка. Модель этого не знала, потому что мы её этому не научили.

См. рисунок выше. Он показывает, почему этот тип сбоя трудно обнаружить на практике. Первые два графика показывают распределение объема транзакций и краткосрочной скорости обращения для опытных и новых пользователей. С точки зрения мониторинга, эти характеристики кажутся стабильными, с учетом перекрытия. Если бы это был единственный доступный сигнал, большинство команд пришли бы к выводу, что конвейер обработки данных и входные данные модели остаются работоспособными.

Третий график выявляет реальную проблему. Несмотря на то, что распределения признаков практически идентичны, уровень мошенничества существенно различается в разных группах населения. Модель применяет одни и те же границы принятия решений к обеим группам, поскольку входные данные выглядят знакомыми, но лежащий в их основе риск не одинаков. Изменились не сами данные, а то, кого эти данные представляют.

По мере изменения состава трафика в результате роста или расширения эти предположения перестают быть верными, даже несмотря на то, что данные по-прежнему выглядят статистически нормальными. Без явного моделирования контекста популяции или оценки производительности по группам эти недостатки остаются незаметными до тех пор, пока бизнес-показатели не начнут ухудшаться.

Прежде чем уйти

Ни одна из неудач, описанных в этой статье, не была вызвана некачественными моделями.

Архитектура была разумной. Функционал был продуман до мелочей. Недостатком стала система, лежащая в основе модели, а именно сделанные нами предположения о времени, отсутствии и о том, кого представляют данные.

Время — это не статичный индекс. Метки поступают с задержкой. Признаки развиваются неравномерно. Границы пакетов редко совпадают с моментами принятия решений. Когда мы это игнорируем, модели обучаются на информации, которую они больше никогда не увидят.

Главный вывод таков: высокие показатели в офлайн-режиме не являются доказательством правильности модели. Они доказывают, что модель соответствует заданным вами предположениям. Настоящая работа машинного обучения начинается тогда, когда эти предположения сталкиваются с реальностью.

Проектируйте с учетом конкретного момента.

Список литературы и дополнительные материалы

[1] ROC-кривые и AUC (Краткий курс Google по машинному обучению)
https://developers.google.com/machine-learning/crash-course/classification/roc-and-auc

[2] Тест Колмогорова – Смирнова (Википедия).
https://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test[3] Сдвиги распределения данных и мониторинг (чип Хюен)
https://huyenchip.com/2022/02/07/data-distribution-shifts-and-monitoring.html

Источник: towardsdatascience.com

✅ Найденные теги: машинное обучение, Модель, Неудача, новости, Обучение, Почему, Продакшен

Метки:

Стена с логотипом WhatsApp на улице в тени деревьев, виден магазин Apple.

ПРЕДЫДУЩАЯ ЗАПИСЬ

13.01.2026

Бразилия обязала Meta приостановить действие политики, запрещающей использование сторонних чат-ботов с искусственным интеллектом в WhatsApp.

СЛЕДУЮЩАЯ ЗАПИСЬ

13.01.2026

Тенденции развития ИИ в 2026 году: ключевые направления роста

Цифровой профиль человека на фоне Кремля, технологии и будущее России.

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

Еще новости рубрики

Архив рубрики ~Обо всем~

Фантазии

Июл 2, 2024

Архив рубрики ~Обо всем~

Мировоззрение

Июл 2, 2024

Архив рубрики ~Обо всем~

Влияние выдумщиков и фантазеров на развитие…

Июл 2, 2024

Архив рубрики ~Обо всем~

Нет ничего невозможного

Июл 2, 2024

Присоединяйтесь
к нам в

TELEGRAM

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных

Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…

Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.

Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".

‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…

Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.

Структура эффективного запроса Claude с элементами задачи, контекста и референса.

Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.

НОВОСТИ ДРУГИХ РУБРИК

Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Архив рубрики ~Лента новостей~

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

ЧИТАТЬ

Мар 2, 2026

Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Архив рубрики ~Лента новостей~

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

ЧИТАТЬ

Мар 2, 2026

Черный углеродное волокно с текстурой плетения, отражающий свет.

Архив рубрики ~Лента новостей~

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений. Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

ЧИТАТЬ

Мар 2, 2026

Круглый экран с изображением замка и горы, рядом электронная плата.

Архив рубрики ~Лента новостей~

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран. Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

ЧИТАТЬ

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых

ИдеиPRO

Почему ваша модель машинного обучения работает при обучении, но терпит неудачу в продакшене?

Путешествия во времени: утечка предположений

Настройки по умолчанию, которые становятся сигналами

Сдвиг численности населения без сдвига распределения

Прежде чем уйти

Список литературы и дополнительные материалы

Похожие записи

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ Отменить ответ

Еще новости рубрики

Присоединяйтесь к нам в

Рубрики

галерея

НОВОСТИ ДРУГИХ РУБРИК

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ
Отменить ответ

Присоединяйтесь
к нам в