Цифровая сеть с графиком роста, центральный процессор, соединения, производство.

От связей к смыслу: почему гетерогенные графовые трансформеры (HGT) меняют прогнозирование спроса

Как графы, учитывающие взаимосвязи, превращают взаимосвязанные прогнозы в оперативную информацию.

Делиться

31151f51bf0360cf62daafd9ceca1b29

Большинство ошибок в прогнозировании цепочек поставок вызваны не некачественными моделями временных рядов.

Они вызваны игнорированием структуры .

Товарные позиции (SKU) не существуют независимо друг от друга. Они взаимодействуют через общие заводы, группы товаров, склады и места хранения. Резкий рост спроса на одну товарную позицию часто распространяется на другие — однако большинство систем прогнозирования моделируют каждую товарную позицию изолированно.

В моей предыдущей статье мы показали, что явное моделирование этих связей имеет значение. Используя реальный граф цепочки поставок товаров повседневного спроса, простая графовая нейронная сеть (GraphSAGE) снизила ошибку прогнозирования на уровне SKU более чем на 27% по сравнению с надежным базовым методом, просто позволив информации передаваться между связанными SKU.

Однако GraphSAGE делает упрощающее предположение: все отношения равноправны .

Общий производственный объект рассматривается так же, как и общая группа товаров. Товары-заменители и товары-дополнители усредняются в единый сигнал. Это ограничивает способность модели прогнозировать реальные изменения спроса.

В этой статье рассматривается, что происходит, когда модели предоставляется возможность не только видеть сеть поставок, но и понимать смысл каждой взаимосвязи внутри нее .

Мы показываем, как гетерогенные графовые трансформеры (HGT) внедряют обучение с учетом взаимосвязей в прогнозирование спроса, и почему это, казалось бы, небольшое изменение приводит к более упреждающим прогнозам, более узкому распределению ошибок и существенно лучшим результатам — даже при прерывистом, ежедневном спросе на каждый товар — превращая взаимосвязанные прогнозы в осмысленные, оперативно обоснованные предсказания.

Краткий обзор: что нам рассказала компания GraphSAGE.

В предыдущей статье мы обучили пространственно-временную модель GraphSAGE на реальном графе цепочки поставок товаров повседневного спроса, используя следующие параметры:

  • 40 наименований продукции
  • 9 растений
  • 21 группа товаров
  • 36 подгрупп
  • 13 мест хранения

Каждый товар был связан с другими через общие заводы, группы и местоположения, создавая плотную сеть операционных зависимостей. Временные характеристики демонстрировали неравномерное производство и непостоянный спрос, что является распространенным сценарием в сфере товаров повседневного спроса.

GraphSAGE позволил каждому SKU агрегировать информацию от своих соседей. Это привело к значительному улучшению качества прогнозов.

Модель WAPE (SKU-daily)
Наивная базовая линия 0,86
GraphSAGE ~0,62

На самом высоком уровне — ежедневном, по каждому артикулу, с прерывистым спросом — показатель WAPE около 0,62 уже практически соответствует уровню, необходимому для производства товаров повседневного спроса.

Но графики погрешностей показали нечто важное:

  • Модель хорошо следовала тенденциям.
  • Она хорошо обрабатывала нули.
  • Но это сгладило резкие скачки.
  • И оно отреагировало, вместо того чтобы предвидеть.

Поскольку GraphSAGE предполагает, что все отношения равнозначны, предположение о том, что все отношения имеют одинаковый вес, означает, что модель не может научиться следующему:

  • Резкий рост спроса на сопутствующий товар на том же заводе должен повысить мой прогноз.
  • Однако всплеск спроса на замещающий товар в той же товарной группе должен снизить его.

Давайте посмотрим, как Heterogeneous Graph Transformer (HGT) решает эту задачу.

Что добавляет HGT: Обучение с учетом взаимосвязей

Гетерогенные графовые трансформеры создаются для графов, в которых:

  • Существует несколько типов узлов (артикулы, заводы, склады, группы) и/или
  • Существует несколько типов связей (общие предприятия, группы товаров и т. д.).

В данном случае, хотя все узлы в графе являются артикулами (SKU), отношения между ними неоднородны . Здесь HGT используется не для моделирования множественных типов сущностей, а для обучения передаче сообщений с учетом отношений .

Модель обучается отдельным механизмам преобразования и внимания для каждого типа взаимосвязи между товарными позициями (SKU-SKU), что позволяет сигналам спроса распространяться по-разному в зависимости от причины связи двух товарных позиций.

Оно учится:

«Как должна происходить передача информации в каждом типе взаимоотношений

Формально, вместо одной агрегирующей функции, HGT обучается следующим образом:

[
h_i = sum_{r in {text{plant}, text{group}, text{subgroup}, text{storage}}}
sum_{j in N_r(i)} alpha_{r,i,j} W_r h_j
[

где

  • r обозначает тип операционных взаимоотношений между товарными позициями (общий завод, группа товаров и т. д.).
  • Wᵣ позволяет модели обрабатывать каждое отношение по-разному.
  • αᵣ,ᵢ,ⱼ позволяет модели сосредоточиться на наиболее влиятельных соседях.
  • Множество Nr(i) содержит все артикулы, которые напрямую связаны с артикулом i посредством общей связи r.

Это позволяет модели обучаться, например:

  • Границы производственных площадей передают сигналы о мощности и производстве.
  • Связи между группами товаров способствуют замещению и перераспределению спроса.
  • Границы складских помещений способствуют буферизации запасов.

Граф приобретает не только топологическую связь, но и экономический смысл .

Реализация (на высоком уровне)

Как и в модели GraphSAGE, мы используем:

  • Тот же набор данных SupplyGraph, временные характеристики, нормализация log1p и скользящее окно в 14 дней.

Разница заключается в пространственном кодировщике. Ниже представлен общий обзор архитектуры.

  1. Гетерогенный кодировщик графов
    • Узлы: SKU
    • Ребра: общий завод, общая группа, общая подгруппа и общее хранилище.
    • Слои HGT обучаются передаче сообщений, специфичной для конкретных отношений.
  2. Временной кодировщик
    • Кодировщик временных рядов обрабатывает данные за последние 14 дней.
    • Это показывает, как график меняется со временем.
  3. Выходная головка
    • Регрессор прогнозирует продажи по каждому артикулу на следующий день в логарифмическом масштабе (log1p).

Всё остальное — обучение, потери, оценка — остаётся идентичным GraphSAGE. Поэтому любые различия в производительности обусловлены исключительно лучшим пониманием структуры .

Аналогия с рынком жилья — теперь со смыслом.

В предыдущей статье мы использовали простую аналогию с рынком жилья, чтобы объяснить, почему прогнозирование на основе графов работает.

Давайте обновим его.

GraphSAGE: структура без смысла

GraphSAGE — это как прогнозирование цены вашего дома на основе следующих данных:

  • Историческая цена вашего дома
  • Среднее изменение цен на дома в окрестностях

Это уже лучше, чем обработка всего дома по отдельности. Но GraphSAGE делает важное упрощающее предположение:

Все соседи одинаково влияют на ваш дом.

На практике это означает, что GraphSAGE рассматривает все находящиеся поблизости объекты как идентичные сигналы. Роскошная вилла, школа, торговый центр, автомагистраль или завод — все это просто «соседи», чьи ценовые сигналы усредняются.

Модель изучает, что дома соединены между собой, но не понимает, почему они соединены.

HGT: структура со смыслом

Теперь представьте себе более реалистичную модель жилищного строительства.

Каждая точка данных по-прежнему представляет собой дом — нет разных типов узлов.
Но дома связаны между собой различными видами взаимоотношений :

  • Некоторые из них находятся в одном школьном округе.
  • Некоторые имеют одинаковый застройщик или одинаковое качество строительства.
  • Некоторые из них расположены рядом с парками.
  • Другие расположены вблизи автомагистралей или промышленных зон.

Каждое из этих взаимодействий по-разному влияет на цены.

  • Школы и парки, как правило, повышают свою ценность.
  • Автомагистрали и заводы часто снижают его
  • Роскошные дома важнее заброшенных.

Гетерогенный графовый трансформер (HGT) явно изучает эти различия. Вместо усреднения всех соседних сигналов, HGT изучает:

  • какой тип отношений представляет собой сосед, и
  • насколько сильно эта взаимосвязь должна влиять на прогноз.

Именно это различие превращает взаимосвязанный прогноз спроса в осмысленный, оперативно обоснованный прогноз .

Сравнение результатов

Вот сравнение WAPE HGT с GraphSAGE и базовым алгоритмом:

Модель ВЕЙП
Наивный базовый уровень 0,86
GraphSAGE 0,62
HGT 0,58

При среднесуточном показателе WAPE для каждого SKU ниже 0,60, гетерогенный графовый преобразователь (HGT) обеспечивает явное улучшение показателей, пригодное для производственных целей, по сравнению как с традиционным прогнозированием, так и с GraphSAGE. Результаты показывают снижение неэффективного распределения спроса примерно на 32% по сравнению с традиционным прогнозированием и дальнейшее улучшение на 6–7% по сравнению с GraphSAGE.

На следующей диаграмме рассеяния показаны фактические и прогнозируемые продажи в логарифмическом масштабе (log1p) для моделей GraphSAGE (фиолетовые точки) и HGT (голубые точки). Хотя обе модели хороши, фиолетовые точки в модели GraphSAGE более разбросаны по сравнению с плотным скоплением голубых точек в модели HGT, что соответствует улучшению средневзвешенной цены покупки (WAPE) на 6%.

049fce9621a332e54409ca7a7b7155e7

В масштабе этого набора данных (≈ 1,1 миллиона единиц ) такое улучшение выражается в уменьшении количества неправильно распределенных единиц примерно на 45 000 за период оценки.

В операционном плане сокращение нерационального распределения ресурсов на такую величину приводит к следующим результатам:

  • Меньше аварийных изменений в производстве
  • Снижение затрат на ускоренную и премиальную доставку.
  • Более стабильная работа производственных и складских помещений.
  • Улучшение уровня обслуживания при работе с товарами большого объема.
  • Меньше товаров, застрявших не в тех местах.

Важно отметить, что эти улучшения достигаются без добавления бизнес-правил, переопределения параметров планировщика или ручной настройки .

А сравнение погрешностей выглядит следующим образом:

Модель Средний прогноз Смещение (единицы измерения) Предвзятость %
Наивный ~701 0 0%
GraphSAGE ~733 +31 ~4,5%
HGT ~710 ~8,4 ~1,2%

Горизонтальный перенос генов вносит очень небольшое положительное смещение — примерно 1–2% .

Это находится в пределах допустимых для производства значений и соответствует тому, как планировщики в сфере товаров повседневного спроса работают на практике, где часто предпочтительнее небольшой завышенный уклон, чтобы избежать дефицита товаров. Следующая гистограмма подтверждает гауссово распределение с центром около нуля, что указывает на непредвзятую эффективность в типичные дни прогнозирования.

016f81f7bd0a63ea5f7254cdd15b333c

Реальная разница между GraphSAGE и HGT становится очевидной, когда мы сравниваем прогнозы для 4 самых популярных по объему продаж товаров. Вот диаграмма GraphSAGE:

086cd4f9ff698079e825fc275541d1e6

То же самое относится и к HGT:

ee5fa719b47d567917dfc784bed35223

Различие очевидно из области, выделенной на первом графике, а также по всем остальным артикулам:

  • HGT не реагирует на изменения, как GraphSAGE. Это более точный прогноз, предвосхищающий и отслеживающий пики и спады фактического спроса, а не сглаживающий колебания.
  • Это результат дифференцированного обучения структурным связям между соседними товарными позициями, что позволяет с уверенностью прогнозировать изменение спроса еще до того, как оно начнется.

И наконец, анализ показателей по товарным позициям с ненулевым объемом продаж наглядно показывает, что для всех товарных позиций с высоким объемом продаж средневзвешенная прибыль на акцию (WAPE) составляет < 0,60 , что желательно для прогнозирования производства и является улучшением по сравнению с GraphSAGE.

3fc5fb0ee58d28a54befb84e322b26ff

Объясняемость

HGT позволяет практично реализовать объяснимость прогнозов — это крайне важно для планировщиков, чтобы быть уверенными в причинно-следственной связи между факторами. Когда модель прогнозирует спад, и мы можем показать, что это происходит потому, что «сосед X в той же подгруппе демонстрирует тенденцию к снижению», планировщики могут проверить этот сигнал на основе реальной логистики, превращая прогноз ИИ в полезную бизнес-информацию.

Рассмотрим влияние различных пространственных и временных характеристик на прогнозирование на первые 7 и последние 7 дней периода для товара с наибольшим объемом продаж (SOS001L12P). Ниже приведено сравнение временных характеристик:

302d260887e4d2627111f0e7d25d93c2

А также пространственные характеристики:

22a9af4a22667e1b8a5c646f7a92b85a

Диаграммы показывают, что различные характеристики и артикулы/преимущества играют роль в разные периоды времени:

  • В течение первых 7 дней наибольшее влияние оказывает задержка продаж (7 дней) (23%), за которой в течение последних 7 дней следует скользящее среднее (21%).
  • Аналогично, в течение первых 7 дней наблюдается сильная зависимость от SOS005L04P, вероятно, основного узла хранения или предшествующего SKU, определяющего немедленную доступность. К концу тестового периода влияние перераспределяется. SOS005L04P делит место с SOS002L09P (примерно по 40% каждый), оба из той же подгруппы, что и наш целевой SKU. Это говорит о том, что модель теперь агрегирует сигналы из более широкой подгруппы связанных продуктов для формирования более целостной картины.

Этот тип анализа имеет решающее значение для понимания и прогнозирования влияния маркетинговых кампаний и рекламных акций, а также внешних факторов, таких как процентные ставки, на конкретные товарные позиции. Их следует включить в пространственную структуру в качестве дополнительных узлов в графе, к которым будут привязаны соответствующие товарные позиции.

Не все цепочки поставок одинаковы.

В данном случае рассматривается относительно простая ситуация, где в качестве узлов выступают только артикулы товаров (SKU). Это объясняется тем, что в сфере товаров повседневного спроса (FMCG) заводы и склады в основном выступают в роли буферов — они сглаживают колебания, но редко резко останавливают систему. Именно поэтому HGT может многое узнать об их влиянии, используя в качестве ориентира только такие типы ребер , как общий завод или общий склад, без моделирования их в виде явных узлов. Цепочки поставок могут быть гораздо сложнее. Например, автомобильные цепочки поставок сильно отличаются. Малярный цех, линия по производству двигателей или региональный распределительный центр представляют собой жесткое узкое место : когда оно ограничено, спрос на определенные отделки или цвета резко падает независимо от рыночного спроса. В таких условиях HGT по-прежнему выигрывает от типизированных связей, но также требует явных узлов «Завод» и «Склад» с собственными временными рядами (мощность, объем производства, задержки), чтобы моделировать взаимодействие физических процессов предложения со спросом клиентов. Другими словами, FMCG нужны графы, учитывающие структуру; автомобильной отрасли нужны графы, учитывающие причинно-следственные связи .

К другим факторам, общим для всех отраслей, относятся рекламные акции, маркетинговые расходы, сезонность, внешние факторы, такие как экономические условия (например, цены на топливо) или выход конкурентов на рынок в определенном сегменте. Эти факторы также по-разному влияют на товарные позиции. Например, повышение цен на топливо или введение новых правил могут снизить продажи автомобилей с двигателями внутреннего сгорания и увеличить продажи электромобилей. Такие факторы необходимо включить в граф в виде узлов и их связей с товарными позициями, включенными в пространственную модель. Их временные характеристики должны включать исторические данные о моментах событий. Это позволит HGT изучить влияние этих факторов на спрос в течение недель и месяцев после события.

Основные выводы

  • Спрос в цепочке поставок не просто взаимосвязан — он структурирован . Рассмотрение всех взаимосвязей между товарными позициями как равноправных не позволяет в полной мере использовать потенциал прогнозирования.
  • GraphSAGE доказывает, что сети имеют значение : простое предоставление возможности обмена информацией между товарными позициями на общих заводах, в группах и местах обеспечивает значительное повышение точности по сравнению с классическим прогнозированием.
  • Heterogeneous Graph Transformers идут еще дальше , изучая причины взаимосвязи товарных позиций (SKU). Общий завод, общая подгруппа и общий склад не одинаково влияют на спрос — и HGT узнает об этом различии непосредственно из данных.
  • Такое понимание структуры приводит к реальным результатам : снижению средневзвешенной вероятности ошибки прогнозирования (WAPE), более узкому разбросу прогнозов, лучшему прогнозированию пиковых нагрузок и существенному уменьшению количества неправильно распределенных единиц продукции — без бизнес-правил, ручной настройки или вмешательства планировщика.
  • Объяснимость становится операциональной, а не косметической . Внимание, учитывающее взаимосвязи, позволяет планировщикам отслеживать связь прогнозов с экономически значимыми факторами, превращая прогнозы в надежные решения.
  • Более широкий вывод : по мере того, как цепочки поставок становятся все более взаимозависимыми, модели прогнозирования должны эволюционировать от систем, основанных только на временных рядах, к системам, учитывающим взаимосвязи. В сфере товаров повседневного спроса это означает графы, учитывающие структуру; в более ограниченных отраслях, таких как автомобильная промышленность, это означает графы, учитывающие причинно-следственные связи с явно обозначенными узкими местами.

Короче говоря: когда модель понимает значение связей, прогнозирование перестаёт быть реактивным и начинает становиться упреждающим.

Что дальше? От концепций к коду.

В этой и предыдущей статьях мы шаг за шагом проследили эволюцию прогнозирования спроса — от моделей изолированных временных рядов до GraphSAGE и, наконец, до гетерогенных графовых трансформеров — показав, как каждый этап постепенно улучшает качество прогнозов, лучше отражая особенности функционирования реальных цепочек поставок.

Следующий логический шаг — переход от концепций к коду .

В следующей статье мы воплотим эти идеи в комплексный, реализуемый рабочий процесс. Используя конкретные примеры кода, мы подробно рассмотрим, как:

  • Постройте граф цепочки поставок и определите типы взаимосвязей.
  • Разработайте временные характеристики для учета прерывистого спроса на уровне отдельных товарных позиций.
  • Разработка и обучение моделей GraphSAGE и HGT.
  • Оцените производительность, используя показатели, соответствующие производственным стандартам.
  • Визуализируйте прогнозы, ошибки и внимание, учитывающее взаимосвязи.
  • Добавьте пояснения, чтобы планировщики могли понять, почему изменился прогноз.

Цель состоит не просто в том, чтобы показать, как обучить модель, а в том, как создать готовую к применению, интерпретируемую систему прогнозирования на основе графов , которую специалисты смогут адаптировать к своим собственным цепочкам поставок.

Если в этой статье объяснялось, почему структура и смысл имеют значение, то в следующей будет показано , как именно заставить их работать в коде .

Свяжитесь со мной и поделитесь своими комментариями на сайте www.linkedin.com/in/partha-sarkar-lets-talk-AI

Ссылка

SupplyGraph: эталонный набор данных для планирования цепочки поставок с использованием графовых нейронных сетей: Авторы: Азмин Тушик Васи, доктор медицинских наук Шафикул Ислам, Адипто Райхан Акиб

Изображения, использованные в этой статье, сгенерированы с помощью Google Gemini. Диаграммы и соответствующий код созданы мной.

Источник: towardsdatascience.com

✅ Найденные теги: Гетерогенные, Графовые, новости, От, Прогнозирование, Спрос, Трансформеры

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Фото сгенерированных лиц: исследование показывает, что люди не могут отличить настоящие лица от сгенерированных
Нейросети построили капитализм за трое суток: 100 агентов Claude заперли…
Скетч: цифровой осьминог и виртуальный мир внутри компьютера с человечком.
Сцена с жестами пальцами, где один жест символизирует "VPN", а другой "KHP".
‼️Paramount купила Warner Bros. Discovery — сумма сделки составила безумные…
Скриншот репозитория GitHub "Claude Scientific Skills" AI для научных исследований.
Структура эффективного запроса Claude с элементами задачи, контекста и референса.
Эскиз и готовая веб-страница платформы для AI-дизайна в современном темном режиме.
ideipro logotyp
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых