Покажите свою ценность, выйдя за рамки технических аспектов
Делиться

Введение
Как специалист по данным, ваша задача — использовать данные для решения бизнес-задач и создания ценности, как правило, путём построения моделей. Обычно это включает в себя проведение серии экспериментов, в ходе которых множество идей перебираются до тех пор, пока не будет выбрано наилучшее решение, являющееся частью бизнес-предложения. Оценка наилучшей модели обычно осуществляется путём минимизации или максимизации какого-либо показателя эффективности, например, среднеквадратической ошибки для регрессионных моделей или оценки F1 для моделей бинарной классификации.
Однако создание модели — лишь часть общего процесса. В основе вашей модели лежат два важных вопроса: отвечает ли ваше решение на исходную проблему и какую пользу оно приносит бизнесу. На эти вопросы могут ответить только заинтересованные стороны проекта, устанавливая требования и критерии успеха. В идеальном мире они должны быть четко определены, но зачастую это не так. Требования могут быть довольно расплывчатыми и общими, иногда сводятся к предотвращению оттока клиентов или защите клиентов от мошенничества. В этом случае специалистам по данным и заинтересованным сторонам предстоит совместно работать над уточнением этих вопросов и определением того, что означает успех. Для этого им необходимо, так сказать, понимать друг друга, поскольку невыполнение этого требования может привести к недопониманию и разногласиям, которые неизбежно приведут к провалу проекта.
На протяжении всей своей карьеры я наблюдал, как заинтересованные стороны и специалисты по данным говорят друг с другом на разных языках: один из них ориентирован на бизнес, а другой – на данные. В результате хорошие проекты не достигают цели и не вызывают должного энтузиазма, что приводит к их неразвертыванию. Я убеждён, что для успеха в качестве хорошего специалиста по данным необходимо уметь преодолевать этот разрыв между бизнесом и техническими аспектами. Ключ к привлечению заинтересованных сторон к вашему решению – наглядно продемонстрировать его влияние на бизнес и показать, какие преимущества оно может принести. В этой статье я хочу изложить некоторые философские подходы, которые помогли мне улучшить взаимодействие с бизнесом в целом.
Требования к переводу и отчетность по эффективности
Начало нового проекта — это напряжённое время, сопровождающееся множеством установочных совещаний, сбором участников команды и установлением требований к доступу, и это лишь некоторые из них. Однако есть один аспект, в котором вы, как специалист по анализу данных, возможно, не принимали участия, — это тот, который изначально определил необходимость проекта. Этим занимаются заинтересованные стороны и владельцы продукта, как правило, представители руководства организации. Это означает, что общие цели проекта определяются ещё до того, как к проекту присоединяется специалист по анализу данных.
Поскольку требования уже определены, специалисты по данным могут сразу приступить к экспериментам, не уделив должного внимания целям проекта. Они знают его общую цель и считают, что этого достаточно для продвижения. Однако на этом этапе крайне важно уделить время уточнению бизнес-задачи до набора чётких требований. Это гарантирует:
- Не существует двусмысленности между специалистами по анализу данных и более широким бизнесом.
- Есть четкое понимание того, что нужно решить.
- Существуют четкие показатели, которые определяют, достигнута ли цель.
В качестве примера вернёмся к предыдущему запросу заинтересованной стороны, желающей защитить клиентов от мошенничества. Существует множество возможных вариантов реализации такого запроса, и уточнение этого требования имеет ключевое значение для того, чтобы ваш проект достиг цели. Поэтому крайне важно проводить встречи, чтобы можно было задать уточняющие вопросы. Вот несколько примеров:
- Хотим ли мы предотвращать мошенничество по мере его возникновения или информировать клиентов, если они подвергаются риску?
- Хотим ли мы получить ответ «да/нет» или что-то более конкретное?
- Хотим ли мы чего-то более автономного в принятии решений или чего-то, что дополняет текущие процессы?
- Как часто будет выполняться решение? Будет ли это пакетная обработка в автономном режиме или в режиме реального времени?
- Существуют ли какие-либо эксплуатационные ограничения, о которых нам следует знать?
Например, требование о разработке решения по защите от мошенничества в режиме реального времени существенно отличается от прогнозирования того, что клиент может подвергнуться риску мошенничества в течение следующих 30 дней. Задавая эти вопросы, вы найдёте решения, которые стоит изучить более подробно.

Завершение эксперимента над проектом может быть таким же суматошным, как и его начало. На этом этапе вам необходимо выбрать оптимальное решение и представить его бизнесу. Это крайне важно, поскольку нет гарантии, что ваше решение будет принято и превратится в новый продукт. Внедрение любого нового процесса, например, модели, в промышленную эксплуатацию сопряжено с затратами, которые необходимо сопоставить с выгодой. Необходимо учитывать, кто отвечает за его развертывание и мониторинг, а также за обслуживание, если его производительность перестанет соответствовать требованиям. Необходимо учитывать частоту возникновения неблагоприятных последствий, их потенциальную серьёзность и любые последствия. Возможно, потребуется учесть любые дополнительные эксплуатационные воздействия, которые может оказать ваш новый процесс. Рассмотрите платформу обнаружения мошенничества. Необходимо учесть:
- Как часто ваш детектор пропускает мошеннические транзакции?
- Как часто ваш детектор ошибочно классифицирует подлинные транзакции как мошенничество и влияет на клиента?
- Каков общий объем транзакций, которые будут отмечены как мошенничество, и имеются ли оперативные возможности для расследования всех этих событий?
Чтобы преодолеть любые опасения и сомнения, вам нужно уметь продавать своё решение, а не просто создавать его. Демонстрируя своё решение, вам следует:
Начните с проблемы, а не с технологии
Возникает соблазн сосредоточиться на технической стороне вашего решения, например, на используемой модели или на конвейере обработки данных. Именно этому вы посвятили последние месяцы своей жизни и хотите показать, что усердно работали над решением этой проблемы. Поэтому, представляя решение заинтересованным сторонам, вы будете склонны рассказывать, например, о том, как вы использовали одно горячее кодирование, выполнили импутацию среднего значения и использовали библиотеку Optuna для настройки гиперпараметров модели LightGBM.
Проблема в том, что для заинтересованных сторон приоритетнее не то, как работает модель, а то, что она может сделать. Их волнует, как решается бизнес-вопрос и какую выгоду это может принести. В этом случае нам необходимо переосмыслить представление результатов, сделав его ориентированным на бизнес, и сосредоточиться на том, что решило наше решение, а не на том, как оно было решено. Поэтому следует реже использовать предложения вроде:
Мы разработали бинарную классификацию LightGBM для обнаружения мошенничества.
И еще предложения типа
Предлагаемое нами решение улучшает возможности наших текущих систем по обнаружению мошенничества.
Эффективность бизнеса против модели
В связи с вышеизложенным, слишком часто основное внимание уделяется отчётности об эффективности модели. Такие метрики, как F1, AUC и т. д., дают объективный способ определить наилучшую модель, и эту информацию необходимо донести до заинтересованных сторон. Специалисту по анализу данных очевидно, в чём разница между отзывом 0,8 и 0,9.
Однако для заинтересованных сторон эффективность модели не отражает ценность решения для бизнеса. Им необходимо знать, какое влияние оно окажет на текущие процессы и процедуры. Поэтому специалисты по анализу данных должны оценивать эффективность модели с точки зрения ключевых показателей эффективности (KPI) на уровне бизнеса. Рекомендуется всегда учитывать:
Приносит ли это деньги, экономит деньги или время? Если да, то сколько?
Чёткая количественная оценка того, что ваши решения дают, поможет повысить вовлечённость и значительно повысит вероятность их принятия. Поэтому нам следует меньше говорить о:
Наша модель LightGBM достигла отзыва 0,9
и многое другое:
Наше решение позволяет ежегодно выявлять случаи мошенничества на сумму 10 миллионов фунтов стерлингов.
Никогда не пренебрегайте объяснимостью
Умение понимать и обосновывать принятые решения, применяемые в вашем решении, играет ключевую роль в построении доверия со стороны заинтересованных сторон. Например, если вы внедряете решение, связанное с приемом заявок на ипотеку, крайне важно уметь обосновать причины отклонения заявок, если клиенты оспаривают это решение. Это также гарантирует, что модель не учитывает какие-либо предубеждения или предубеждения, которые могут привести к возникновению юридических или нормативных проблем.
Объясняемость также может служить средством проверки восприятия или даже оспаривания предвзятых представлений о том, какая информация полезна. Всё это означает, что внедрение объяснимости на протяжении всего процесса может дать заинтересованным сторонам уверенность в том, что к процессу были проявлены внимание и внимание. Ключевые моменты, на которые следует обратить внимание:
- Уметь сказать, на каких характеристиках основана модель
- Уметь объяснить решение с точки зрения его особенностей
Это означает либо придерживаться модели, которая имеет хорошую объяснимость (регрессия, деревья решений и т. д.), либо полагаться на сторонние библиотеки объяснимости (SHAP, LIME и т. д.).

Представление результатов для максимального вовлечения
После завершения экспериментов и выбора решения следующим шагом будет представление результатов заинтересованным сторонам для получения их одобрения. Обычно это делается в форме презентации, в которой вам необходимо обосновать проблему и показать, почему ваше решение является правильным. Это критически важный момент, когда вам необходимо четко и ясно донести свою позицию до заинтересованных сторон. Я видел, как хорошие предложения проваливались из-за того, что презентации либо не увлекали аудиторию, либо, что еще хуже, отталкивали ее. Создание увлекательной презентации — это сочетание искусства и мастерства, и над этим нужно активно работать.
Вот несколько общих советов, которые можно использовать в качестве руководства:
Знай свою аудиторию и цель
Приступая к написанию презентации, вам необходимо задать себе следующие вопросы:
Что я пытаюсь продать и кому я это продаю?
Хотя презентация, призванная просто продемонстрировать свою работу, имеет свои преимущества, если вы хотите заручиться поддержкой своего проекта, вам следует сосредоточиться на сути, которую вы пытаетесь донести. Попытка охватить слишком много в рамках одной презентации приведёт к путанице и может привести к размыванию общей идеи. Спросите себя: «Что именно я хочу, чтобы моя аудитория знала?», и постройте презентацию вокруг этого.
Знание уровня технических и проектных знаний вашей аудитории может повлиять на то, как вы решите донести своё сообщение. Если заинтересованная сторона более глубоко знакома с предметом, то можно предположить наличие у неё базовых знаний. Но если нет, вам нужно будет тщательно продумать, что можно и что нельзя предполагать, чтобы убедиться, что все участники поняли ваше сообщение. Если у вашей заинтересованной стороны более технический уровень, то можно подробнее рассказать об использованных вами методах, но я бы рекомендовал свести это к минимуму. Как уже обсуждалось, мы хотим подчеркнуть бизнес-преимущества проекта.

Стиль имеет значение
Способность понимать суть презентации во многом зависит от факторов. Вашей аудитории приходится одновременно слушать вас и смотреть на экран, поэтому стиль вашей презентации оказывает огромное влияние на их способность это делать. Эти советы при разработке презентации помогли мне добиться максимального эффекта:
- Используйте тему: либо предоставленную вашей компанией, либо с готового сайта. Наличие предустановленной цветовой схемы, размера шрифта и т. д. имеет большое значение.
- Используйте разделители для привлечения внимания: выделение важных моментов цветными рамками поможет направлять внимание аудитории по слайду.
- Не переусердствуйте с текстом и визуальными эффектами: не пишите абзацы, которые аудитория не сможет прочитать, и используйте визуальные элементы, такие как графики, большими и упрощенными.

All Killer No Filler
При взаимодействии с заинтересованными сторонами время ограничено. Вам необходимо произвести впечатление и удержать их внимание, одновременно убеждая их в вашем решении. Поэтому необходимо найти баланс между базой знаний, теорией, решением и воздействием. Поэтому важно убедиться, что каждый слайд несёт в себе что-то полезное. Вот несколько способов сделать это:
- Начните с результатов: это не детективный роман, ведущий к грандиозному разоблачению, покажите себя с самой лучшей стороны и расскажите именно то, что вы продаете.
- Используйте заголовки, чтобы произвести впечатление: заголовки представляют собой краткое изложение того, что содержится на слайде, и должны содержать самую важную информацию.
- Подавайте пример: если вы пытаетесь объяснить, как что-то работает, используйте данные для обоснования своей точки зрения. Не живите абстрактно.

Заключение
В этой статье я рассказал о важности взаимодействия с заинтересованными сторонами для демонстрации ценности предлагаемых решений в области науки о данных. Уточнение требований и учет влияния на бизнес в вашей работе могут гарантировать, что ваши результаты будут легко интерпретируемыми и применимыми на практике. Всё это воплощено в создании увлекательной и информативной презентации, которая показывает заинтересованным сторонам, что вы можете преобразовать требования в практические результаты.
Источник: towardsdatascience.com



























