Данные и аналитика: люди изучают графики и статистику. Работа в офисе с отчетами.

Демократизация моделей маркетингового микса (MMM) с помощью открытого исходного кода и искусственного интеллекта.

Практическая системная разработка, сочетающая в себе открытый исходный код Bayesian MMM и GenAI для получения прозрачных, независимых от поставщиков аналитических данных в области маркетинга.

Делиться

dd659d85fd9ffdc031b30c55ad01b1af
Источник изображения: Freepik

Модели маркетингового микса (MMM) существуют в отрасли уже несколько лет, и в последнее время они переживают возрождение. В связи с тем, что цифровые сигналы, отслеживаемые с помощью цифровых технологий, становятся всё менее востребованными из-за ужесточения ограничений на защиту данных, маркетологи возвращаются к моделям MMM в поисках стратегической, надежной и безопасной с точки зрения конфиденциальности системы измерения и атрибуции.

В отличие от инструментов отслеживания на уровне отдельных пользователей, MMM использует агрегированные временные ряды и данные поперечного сечения для оценки того, как маркетинговые каналы влияют на ключевые показатели эффективности бизнеса. Достижения в байесовском моделировании с расширенными вычислительными мощностями вновь вывели MMM в центр маркетинговой аналитики.

В течение многих лет рекламодатели и медиаагентства использовали и полагались на байесовский метод MMM для понимания вклада маркетинговых каналов и распределения маркетингового бюджета.

Роль искусственного интеллекта в современной MMM

Всё больше компаний в настоящее время используют функции GenAI в качестве усовершенствования MMM различными способами.

1. Подготовка данных и разработка признаков
2. Автоматизация конвейера: генерация кода для конвейера MMM.
3. Объяснение полученных данных – перевод результатов моделирования на простой и понятный для бизнеса язык.
4. Сценарное планирование и оптимизация бюджета

Несмотря на свою мощь, эти возможности основаны на запатентованных движках MMM.

Цель этой статьи — не показать, как работает байесовская модель MMM, а продемонстрировать потенциальную систему с открытым исходным кодом и бесплатным доступом, которую маркетологи могут изучить без необходимости подписываться на готовые решения MMM, предоставляемые поставщиками в отрасли .

Данный подход сочетает в себе:

1. Google Meridian как движок байесовской MMM с открытым исходным кодом.
2. Открытая языковая модель (LLM) – Mistral 7B в качестве слоя для анализа и взаимодействия поверх результатов байесовского вывода Meridian.

Здесь представлена архитектурная схема, иллюстрирующая предлагаемый проект системы с открытым исходным кодом для маркетологов.

0349ce13a2fa6a3fbbb6addf86cac143
Данная архитектурная схема была создана с использованием инструментов проектирования с поддержкой искусственного интеллекта для быстрого прототипирования.

Этот рабочий процесс с открытым исходным кодом имеет ряд преимуществ:

  1. Демократизация байесовской модели MMM: устраняет проблему «черного ящика», присущую проприетарным инструментам MMM.
  2. Экономическая эффективность: снижает финансовые барьеры для доступа малых и средних предприятий к передовой аналитике.
  3. Такое разделение сохраняет статистическую строгость, необходимую для алгоритмов MMM, и делает их просто более доступными.
  4. Благодаря слою аналитических данных GenAI, аудитории не нужно разбираться в байесовской математике; вместо этого они могут просто взаимодействовать с помощью подсказок GenAI, чтобы узнать об аналитических данных модели о вкладе каналов, рентабельности инвестиций и возможных стратегиях распределения бюджета.
  5. Адаптируемость к новым инструментам с открытым исходным кодом: слой GenAI можно заменить новыми LLM-моделями по мере их появления в открытом доступе, чтобы получить более глубокие аналитические данные.

Практический пример реализации модели Google Meridian MMM со слоем LLM.

Для этой демонстрации я использовал модель с открытым исходным кодом Mistral 7B , загруженную локально с платформы Hugging Face , размещенной на движке Llama .

Предполагается, что эта структура не зависит от предметной области, то есть можно использовать любые альтернативные модели MMM с открытым исходным кодом, такие как Robyn от Meta, PyMC и т. д., а также версии LLM для моделей GPT и Llama, в зависимости от масштаба и объема необходимых аналитических данных.

Важное примечание:

  1. Был создан синтетический набор маркетинговых данных, содержащий такой ключевой показатель эффективности (KPI), как «Конверсии», и маркетинговые каналы, такие как телевидение, поисковая реклама, платная реклама в социальных сетях, электронная почта и наружная реклама (OOH).
  2. Google Meridian выдает обширные результаты, такие как ROI, коэффициенты каналов и их вклад в ключевые показатели эффективности, кривые отклика и т. д. Хотя эти результаты статистически обоснованы, для их интерпретации часто требуются специальные знания. Именно здесь на помощь приходит специалист с дипломом магистра права (LLM), который может выступать в роли переводчика полученных данных .
  3. Для запуска модели Meridian MMM на созданных синтетических маркетинговых данных использовались примеры кода Python от Google Meridian. Более подробную информацию о запуске кода Meridian можно найти на этой странице.
  4. Для моделирования LLM была использована модель с открытым исходным кодом Mistral 7B, поскольку она совместима с бесплатным уровнем ресурсов GPU Google Colab, а также потому, что является подходящей моделью для генерации аналитических данных на основе инструкций без необходимости доступа к API.

Пример: приведенный ниже фрагмент кода на Python был выполнен на платформе Google Colab:

 # Install meridian: from PyPI @ latest release !pip install --upgrade google-meridian[colab,and-cuda,schema] # Install dependencies import IPython from meridian import constants from meridian.analysis import analyzer from meridian.analysis import optimizer from meridian.analysis import summarizer from meridian.analysis import visualizer from meridian.analysis.review import reviewer from meridian.data import data_frame_input_data_builder from meridian.model import model from meridian.model import prior_distribution from meridian.model import spec from schema.serde import meridian_serde import numpy as np import pandas as pd

Был создан синтетический маркетинговый набор данных (не показан в этом коде), и в соответствии с требованиями рабочего процесса Meridian был создан экземпляр конструктора входных данных, как показано ниже:

 builder = data_frame_input_data_builder.DataFrameInputDataBuilder( kpi_type='non_revenue', default_kpi_column='conversions', default_revenue_per_kpi_column='revenue_per_conversion', ) builder = ( builder.with_kpi(df) .with_revenue_per_kpi(df) .with_population(df) .with_controls( df, control_cols=["sentiment_score_control", "competitor_sales_control"] ) ) channels = ["tv","paid_search","paid_social","email","ooh"] builder = builder.with_media( df, media_cols=[f"{channel}_impression" for channel in channels], media_spend_cols=[f"{channel}_spend" for channel in channels], media_channels=channels, ) data = builder.build() #Build the input data

Настройте и запустите модель Meridian MMM:

 # Initializing the Meridian class by passing loaded data and customized model specification. One advantage of using Meridian MMM is the ability to set modeling priors for each channel which gives modelers ability to set channel distribution as per historical knowledge of media behavior. roi_mu = 0.2 # Mu for ROI prior for each media channel. roi_sigma = 0.9 # Sigma for ROI prior for each media channel. prior = prior_distribution.PriorDistribution( roi_m=tfp.distributions.LogNormal(roi_mu, roi_sigma, name=constants.ROI_M) ) model_spec = spec.ModelSpec(prior=prior, enable_aks=True) mmm = model.Meridian(input_data=data, model_spec=model_spec) mmm.sample_prior(500) mmm.sample_posterior( n_chains=10, n_adapt=2000, n_burnin=500, n_keep=1000, seed=0 )

Этот фрагмент кода запускает меридианную модель с заданными априорными распределениями для каждого канала на сгенерированном входном наборе данных. Следующий шаг — оценка производительности модели. Хотя существуют выходные параметры модели, такие как R-квадрат, MAPE, P-значения и т. д., которые можно оценить, для целей этой статьи я приведу только пример визуальной оценки:

 model_fit = visualizer.ModelFit(mmm) model_fit.plot_model_fit() 
876543c0ae50593a970e412e2d74fa2e

Теперь, когда модель Meridian MMM выполнена, у нас есть выходные параметры модели для каждого медиаканала, такие как ROI, кривые отклика, коэффициенты модели, уровни затрат и т. д. Мы можем объединить всю эту информацию в единый входной JSON-объект, который можно использовать непосредственно в качестве входных данных для LLM для получения аналитических выводов:

 import json # Combine everything into one dictionary genai_input = { "roi": roi.to_dict(orient='records'), "coefficients": coeffs.to_dict(orient='records'), "priors": priors.to_dict(orient='records'), "response_curves": response_curves.to_dict(orient='records') } # Convert to JSON string for the LLM genai_input_json = json.dumps(genai_input, indent=2)

Загрузка Mistral 7B LLM с платформы Hugging Face локально и установка необходимого движка Llama для выполнения LLM:

 # Download the Mistral 7B llm from Hugging Face !wget -O /content/models/mistral-7b-instruct-v0.2.Q4_K_M.gguf  https://huggingface.co/TheBloke/Mistral-7B-Instruct-v0.2-GGUF/resolve/main/mistral-7b-instruct-v0.2.Q4_K_M.gguf # Install Llama for python engine !pip install llama-cpp-python --upgrade

Выполнение Mistral LLM с использованием входного JSON-файла, содержащего выходные данные Meridian MMM, и включением соответствующей инструкции:

 from llama_cpp import Llama # Initialize the model llm = Llama( model_path="/content/models/mistral-7b-instruct-v0.2.Q4_K_M.gguf", n_ctx=2048, n_gpu_layers=35, seed=42, verbose=False, temperature=0.2 ) # Convert JSON to a prompt for recommendations prompt = f""" You are a marketing mix modeling expert. 1. Summarize the effeciency of each marketing channel based on MMM output 2. Explain the key drivers of ROI for each channel in simple business terms. 3. Channels with diminishing returns 4. If we want to maximize total ROI with the current budget, how should we reallocate spend across channels JSON: {genai_input_json} """ # Generate recommendations response = llm(prompt, max_tokens=300) # Print only the text output print(response["choices"][0]["text"])

Пример выходных данных:

1. Согласно результатам моделирования маркетингового микса (MMM), реклама на телевидении, наружная реклама и контекстная реклама имеют положительный ROI (3,0, 2,5 и 1,5 соответственно), в то время как социальные сети и электронная почта имеют более низкий ROI (0,9 и 0,7 соответственно).

2. Ключевые факторы, определяющие рентабельность инвестиций для каждого канала, если говорить простыми бизнес-терминами, следующие:

– Телевидение: Каждый доллар, потраченный на телевизионную рекламу, приносит 3 доллара продаж.

– Социальные сети: Каждый доллар, потраченный на рекламу в социальных сетях, приносит 0,9 доллара продаж.

– Поисковая реклама: Каждый доллар, потраченный на поисковую рекламу, приносит 2,5 доллара продаж.

– Электронная почта: Каждый доллар, потраченный на email-маркетинг, приносит 0,7 доллара продаж.

– Наружная реклама: Каждый доллар, потраченный на наружную рекламу, приносит 1,5 доллара продаж.

3. Каналами с убывающей отдачей являются социальные сети и электронная почта, поскольку их кривые отклика показывают, что рост продаж не пропорционален увеличению маркетинговых расходов.

4. Для максимизации общей рентабельности инвестиций при текущем бюджете следует рассмотреть возможность перераспределения средств с социальных сетей и электронной почты на телевидение и наружную рекламу, поскольку они имеют более высокую рентабельность.

Практические соображения

  • Качество модели и получаемые результаты по-прежнему зависят от качества входных данных.
  • Своевременное проектирование имеет решающее значение для предотвращения получения вводящих в заблуждение результатов.
  • Автоматизация обработки входных данных, а также формирования отчетов и визуализации результатов моделирования поможет этому комплексу работать в масштабе.

Заключительные мысли

В этом пошаговом руководстве показано, как потенциальная модель байесовского MMM на основе открытого исходного кода, дополненная рабочим процессом GenAI, может преобразовывать сложные результаты байесовского анализа в практические рекомендации для маркетологов и руководителей.

Этот подход не ставит целью упростить математические основы моделей маркетингового микса, а вместо этого сохраняет их и пытается сделать более доступными для широкой аудитории с ограниченными знаниями о моделях и бюджетными ресурсами в своей организации.

Поскольку маркетинговая аналитика, обеспечивающая конфиденциальность, становится нормой, системы MMM с открытым исходным кодом и поддержкой GenAI предлагают устойчивый путь: прозрачный, адаптируемый и разработанный для развития как вместе с бизнесом, так и с базовыми технологиями.

Ресурсы и справочные материалы:

  • Google Meridian : https://developers.google.com/meridian/notebook/meridian-getting-started
  • Mistral 7B LLM : Открытая языковая модель с оптимизированными инструкциями, разработанная на платформе Hugging Face. https://huggingface.co/TheBloke/Mistral-7B-Instruct-v0.2-GGUF
  • Hugging Face : Репозиторий и хостинг для моделей искусственного интеллекта с открытым исходным кодом. https://huggingface.co/
  • Байесовское моделирование маркетингового микса : общая методология и отраслевое применение.
  • Google Colab : Бесплатная среда для прототипирования с использованием графических процессоров.
  • Все фрагменты кода и результаты выполнения, представленные в этой статье, носят иллюстративный характер и предназначены исключительно для образовательных целей.
  • Данная статья отражает и представляет собой независимое исследование инструментов с открытым исходным кодом. Никакой коммерческой рекламы не подразумевается.

Шакти Котари Посмотреть все от Шакти Котари

Источник: towardsdatascience.com

✅ Найденные теги: Демократизация, искусственный интеллект, Маркетинговый Микс, Модели, новости, Открытый Исходный Код

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Послеродовую депрессию можно быстро вылечить
Силуэты матери и ребёнка на фоне жалюзи.
Происходит ли генетическая деградация человечества, приводящая к снижению интеллекта?
ideipro logotyp
ideipro logotyp
ideipro logotyp
ideipro logotyp
ideipro logotyp
ideipro logotyp
Image Not Found
Происходит ли генетическая деградация человечества, приводящая к снижению интеллекта?

Происходит ли генетическая деградация человечества, приводящая к снижению интеллекта?

Неужели мы эволюционируем в сторону большей глупости? У людей относительно высокая частота генетических мутаций, которая, как считалось, снижает нашу физическую и умственную работоспособность, — но обозреватель Майкл Ле Пейдж обнаружил, что эти мутации не представляют собой такой…

Апр 13, 2026
Ученые, возможно, нашли способ сохранить кости крепкими на всю жизнь.

Ученые, возможно, нашли способ сохранить кости крепкими на всю жизнь.

Ученые обнаружили скрытый «переключатель для костей», способный восстанавливать и защищать кости. Фото: Shutterstock Растет спрос на методы…

Апр 13, 2026
Ученые, возможно, нашли способ сохранить кости крепкими на всю жизнь.

Ученые, возможно, нашли способ сохранить кости крепкими на всю жизнь.

Ученые обнаружили скрытый «переключатель для костей», способный восстанавливать и защищать кости. Фото: Shutterstock Растет спрос на методы…

Апр 13, 2026
«Действительно ли это сработает?»: Почему крупные фармацевтические компании совершают скачок в квантовую реальность

«Действительно ли это сработает?»: Почему крупные фармацевтические компании совершают скачок в квантовую реальность

Искусственный интеллект долгое время рассматривался как способ значительно ускорить разработку лекарств. Но в передовых лабораториях по…

Апр 12, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых