Практическое руководство и пример из практики
Делиться

В предыдущей статье был представлен целостный обзор концептуальных фреймворков – аналитических структур для представления абстрактных концепций и организации данных. Специалисты по данным используют такие фреймворки в самых разных контекстах: от разработки идей для вариантов использования и валидации моделей машинного обучения до внедрения и эксплуатации пользовательских решений. Тип фреймворка (например, иерархия, матрица, поток процессов, реляционная карта) и измерения фреймворка (например, категориальный, порядковый, непрерывный) во многом определяют внешний вид и восприятие концептуального фреймворка. В то время как в предыдущей статье больше внимания уделялось обсуждению типов фреймворков, в этой статье основное внимание будет уделено измерениям фреймворка. На примере реального примера мы увидим, как изменение измерений фреймворка может привести к изменению восприятия, открывающему новые возможности. Цель этого подробного исследования – помочь читателям эффективнее использовать и создавать концептуальные фреймворки.
Примечание: Все рисунки в следующих разделах созданы автором данной статьи.
Введение в размеры каркаса
В то время как тип фреймворка определяет структуру того, что вы пытаетесь представить, измерения фреймворка определяют его содержание. Измерения обычно делятся на три класса: категориальные, порядковые и непрерывные. В следующих разделах эта классификация измерений фреймворка рассматривается более подробно, а также рассматриваются некоторые аспекты, которые следует учитывать при включении нескольких измерений в фреймворк.
Большая тройка
Начнём с класса категориальных измерений, который, возможно, является самым простым классом измерений. Как следует из названия, измерение состоит из конечного набора дискретных категорий, которые не обязательно должны располагаться в каком-либо определённом порядке. Например, если измерение представляет рынки компании, его можно разделить на географические категории, такие как «США», «Германия» и «Китай». Аналогичным образом, можно использовать категориальное измерение, которое разбивает продукцию компании на различные сегменты (например, по ингредиентам, релевантности для клиентов и так далее). Также рекомендуется помнить о принципе MECE (взаимоисключающий и кумулятивно исчерпывающий) при разбиении измерения на более мелкие категории; в конце концов, категории должны полностью охватывать область действия измерения и избегать избыточных категорий.
Порядковые измерения похожи на категориальные, но с той дополнительной особенностью, что категории, составляющие измерение, также упорядочены определенным образом. Упорядочение позволяет утверждать, что одна категория «больше», «меньше», «равна» или «неравна» другой. Предположим, вы взяли набор рынков компании и ранжировали их по такому критерию, как прибыльность. Ранжирование накладывает упорядочение на набор рынков, тем самым создавая порядковое измерение, представляющее собой упорядочение рынков по прибыли (по возрастанию или убыванию). Однако ранжирование не обязательно подразумевает, что значения прибыльности стран равномерно распределены; разрыв в прибыльности между страной, занимающей первое и второе места, может отличаться от разрыва между странами, занимающими второе и третье места. Порядковые измерения также часто используются для построения вопросов опросов, принимая форму шкалы Лайкерта (например, «не согласен», «нейтрально», «согласен»). Такой порядок позволяет проанализировать ответы участников опроса с точки зрения их местонахождения на шкале по каждому вопросу.
Наконец, непрерывное измерение даёт количественную меру чего-либо. В отличие от категориальных и порядковых измерений (состоящих из дискретных категорий или значений), непрерывные измерения потенциально могут принимать любое значение (каким бы малым оно ни было) в заданном диапазоне. Например, вероятность наступления какого-либо события в процентах может находиться в диапазоне от 0% до 100%; допустимы такие значения, как 5%, 10% и 10,00123%. Значения непрерывного измерения также изначально упорядочены.
Мудрый выбор размеров
Важно учитывать сильные и слабые стороны каждого класса измерений, прежде чем применять их в своей системе. Например, можно оценить информационное содержание каждого класса измерений. Наличие упорядоченности и способность принимать всё более мелкие значения в заданном диапазоне способствуют глубине информационного содержания. Исходя из информационного содержания, порядковые измерения следует предпочитать категориальным, а непрерывные измерения – двум другим, если их можно измерить детально, количественно. Однако информационная насыщенность достигается за счёт ресурсов, необходимых для получения и анализа данных, лежащих в основе измерений. Кроме того, представление и объяснение информативно насыщенных измерений аудитории может быть сложным, поскольку существует большой объём информации, которую необходимо расшифровать и усвоить. Таким образом, даже если вы используете непрерывные измерения для проведения анализа, может иметь смысл «разделить» непрерывные данные на порядковые или даже категориальные данные, чтобы упростить представление аудитории.
Кроме того, поскольку фреймворки могут включать несколько измерений, важно добиться оптимального взаимодействия между ними. В этой связи необходимо принять как минимум два основных решения: сколько измерений и какие типы включить в фреймворк. Особенно на ранних этапах анализа проблемы, как правило, щедро учитывают количество рассматриваемых измерений, поскольку на данном этапе проблема может быть недостаточно понята, и существует риск преждевременного исключения потенциально ценных измерений. Но по мере развития анализа несколько измерений обычно выделяются среди остальных как особенно важные; эти измерения могут наиболее полно и кратко объяснять решение или открывать новые идеи. Количество измерений также может зависеть от типа фреймворка, который вы хотите использовать. Например, в то время как матрица размером два на два может обрабатывать только два измерения, иерархия потенциально может обрабатывать гораздо больше.
При выборе типов измерений для включения в фреймворк вы можете выбрать измерения одного и того же класса или разных классов. Каждый класс имеет уникальный способ мышления о базовых данных. Использование измерений одного класса имеет преимущество в том, что позволяет переносить один способ мышления на измерения в фреймворке. Например, если вы знаете, что фреймворк использует только непрерывные измерения, то вы потенциально можете применить один и тот же количественный способ мышления — и связанный с ним аппарат, такой как арифметические операторы и статистика — ко всем из них. Таким образом, вы также можете легче сравнивать измерения одного и того же класса (например, «яблоки с яблоками» и «яблоки с апельсинами»). Однако использование измерений разных классов также имеет свои преимущества. В иерархическом фреймворке использование разных классов измерений для каждого уровня иерархии может помочь более четко различать уровни друг от друга. Например, понятия верхнего уровня в данной иерархии могут быть категориальными, в то время как подпонятия могут быть порядковыми или непрерывными; В этом случае более глубокое проникновение в иерархическую структуру будет также сопровождаться увеличением информационной насыщенности рассматриваемых измерений, что может помочь вашему аналитическому мыслительному процессу.
В конечном счёте, выбор измерений фреймворка с точки зрения количества и разнообразия, скорее всего, станет частью итеративного процесса. Измерения, с которых вы начинаете процесс его построения, не обязательно будут теми, которые вы в итоге включите в финальный фреймворк. Кроме того, как и во многих других случаях, «идеального» измерения, вероятно, не существует, есть только измерения, более или менее подходящие для вашей цели. Понимание сильных и слабых сторон измерений и восприятие построения фреймворка как итеративного процесса поможет снизить напряжение на начальном этапе и позволит вам сосредоточиться на создании полезной концептуальной фреймворка.
Пример: Эффективность продаж в SoftCo
Огромное разнообразие параметров фреймворка и их тесная связь с его целью означают, что выбор «наиболее важных» параметров (или выбор на основе каких-либо других критериев) может быть затруднительным. Однако изменение параметров при сохранении того же типа фреймворка может привести к совершенно разным интерпретациям фреймворка. В следующем анонимном исследовании мы увидим, как даже незначительные изменения параметров могут иметь большое значение и способствовать получению новых знаний.
SoftCo — это средняя по размеру технологическая компания, предлагающая бизнесу программные продукты и услуги, связанные с маркетингом. Компания работает в США и имеет около двух десятков торговых представителей, работающих по всей стране в разных регионах. Торговые представители отвечают за развитие бизнеса на своей территории, что включает в себя все: от поиска потенциальных клиентов до взаимодействия с ними и заключения сделок. В конце каждого месяца Салли, опытный руководитель отдела продаж SoftCo, анализирует эффективность работы по всем территориям и отчитывается о своих выводах перед генеральным директором. Она также дает торговым представителям обратную связь, чтобы отметить достижения и предложить пути улучшения. За годы работы Салли выделила несколько факторов, которые могут влиять на эффективность работы отдельных торговых представителей, включая объем взаимодействия с клиентами (обычно телефонные звонки с несколькими выездами на места). На рисунке 1 показана простая диаграмма рассеяния (матричная структура с двумя непрерывными измерениями), которая сравнивает эффективность продаж с взаимодействием с клиентами для отдельных торговых представителей.

Выбор измерений на рисунке 1 во многом определяет интерпретацию фреймворка, помимо того, что Салли специально решила исследовать взаимодействие с клиентами как ключевой предиктор эффективности продаж. Использование непрерывных измерений естественным образом подходит для количественных измерений. Таким образом, эффективность продаж измеряется суммой денег, которую каждый торговый представитель генерирует в месяц, в то время как взаимодействие с клиентами измеряется количеством звонков от продавцов в месяц. Конечно, одних этих показателей, вероятно, недостаточно для полного отражения двух измерений фреймворка. Например, количество звонков ничего не говорит нам о качестве и распределении звонков между клиентами, а стоимость сделок, заключенных торговым представителем за месяц, мало что говорит нам о стратегическом характере этих сделок (например, были ли они направлены на развитие бизнеса с существующими клиентами или на «открытие дверей» для нового потока бизнеса с новыми клиентами). Тем не менее, изучая диаграмму рассеяния на рисунке 1, мы можем сделать несколько интересных выводов:
- В рассматриваемом месяце в SoftCo работало 23 торговых представителя. В общей сложности за этот период отдел продаж заработал около 858 000 долларов США.
- В среднем каждый торговый представитель за рассматриваемый месяц заработал около 37 300 долларов США. Максимальная и минимальная сумма продаж составила около 50 000 и 14 000 долларов США соответственно.
- Самый эффективный и самый неэффективный торговые представители (с точки зрения доллара за звонок) заработали около 2000 долларов за звонок и 160 долларов за звонок соответственно; это примерно 12-кратная разница в эффективности.
- По всей видимости, существует нелинейная зависимость между взаимодействием с клиентами и эффективностью продаж. Примерно до 75 звонков каждый дополнительный звонок, по-видимому, коррелирует со значительным ростом эффективности продаж. Но после 75 звонков связь с эффективностью продаж ослабевает.
Таким образом, рисунок 1 позволяет получить ряд аналитических выводов, полученных путем анализа эффективности работы отдельных торговых представителей и всей группы. Некоторые из этих выводов довольно просты (например, количество торговых представителей, средняя эффективность продаж), что дает нам общее представление о масштабе продаж SoftCo и специфике бизнеса. Другие выводы, такие как разница между наиболее и наименее эффективными торговыми представителями и нелинейная зависимость между эффективностью продаж и взаимодействием с клиентами, потенциально более информативны; помимо выявления возможных различий в способностях разных торговых представителей и снижения доходности при слишком большом количестве звонков, эти выводы также предполагают, что другие факторы, помимо взаимодействия с клиентами, также могут быть хорошими предикторами эффективности продаж. Диаграмма рассеяния также позволяет легко выявить выбросы среди торговых представителей, что может быть полезно для дальнейшего анализа того, что отличает этих выбросы от остальных торговых представителей.
Теперь, чтобы показать, как изменение класса измерений может привести к иной перспективе, на рисунке 2 представлена матрица два на два, основанная на той же информации, что и предыдущая диаграмма рассеяния. Два непрерывных измерения диаграммы рассеяния были преобразованы в порядковые измерения путем их разделения по определенным пороговым значениям. Показатели эффективности продаж ниже 25 000 долларов США в месяц считаются «низкими», а выше — «высокими». Аналогично, показатели взаимодействия с клиентами ниже 75 звонков в месяц считаются «низкими», а выше — «высокими». Выбор порогового значения, безусловно, важен и должен основываться на разумных аргументах. Например, пороговое значение эффективности продаж может быть основано на минимальном целевом показателе продаж, которого должен достичь каждый торговый представитель, а пороговое значение взаимодействия с клиентами может быть связано с точкой, в которой кривая на рисунке 1 начинает выравниваться (что указывает на смещение предельной ценности дополнительных звонков с продажами).

В то время как диаграмма рассеяния на рисунке 1 привлекла наше внимание к эффективности работы отдельных торговых представителей и общей тенденции взаимосвязи между эффективностью продаж и взаимодействием с клиентами, матрица «два на два» на рисунке 2 позволяет получить более упрощенное представление, которое позволяет сегментировать торговых представителей на различные группы. В соответствии с общепринятыми нормами, нижний левый квадрант матрицы «два на два» показывает группу торговых представителей, которые могут оказаться в невыгодном положении; эти представители совершают относительно мало звонков и генерируют мало продаж. Верхний правый квадрант содержит «звездных исполнителей», которые, очевидно, активно взаимодействуют с клиентами и обеспечивают воплощение своей напряженной работы в реальные продажи. Динамика в двух других квадрантах представляется менее очевидной. Представители в верхнем левом квадранте, по-видимому, достигают высоких продаж, несмотря на относительно небольшое количество звонков. В чем секрет их эффективности и является ли она устойчивой? У представителей в нижнем правом квадранте противоположная динамика: они совершают множество звонков, которые, судя по всему, не приносят результата. Если эти представители по сути работают так же усердно, как и лучшие исполнители, почему они не достигают столь же высоких показателей продаж?
Обращая внимание на различные сегменты отдела продаж, матрица «два на два» может быть использована для разработки индивидуальных стратегий, учитывающих уникальные характеристики каждого сегмента. Для тех, кто находится в левом нижнем квадранте матрицы, важно выяснить, почему взаимодействие с клиентами и эффективность продаж относительно низкие. Приходится ли этим торговым представителям работать со сложными клиентами, нуждаются ли они в дополнительном обучении или тратят часть своего времени на другие важные задачи, не учтенные в показателях продаж за этот месяц (например, обучение других сотрудников, стратегическое планирование и личностное развитие)? Вооружившись этими дополнительными сведениями, Салли может разработать показатели, которые лучше отражают истинную ценность, создаваемую торговыми представителями в левом нижнем квадранте рисунка 2 для SoftCo.
Аналогично, для нижнего правого квадранта может потребоваться новая стратегия для повышения эффективности за счет перевода относительно высокого уровня взаимодействия с клиентами в реальные продажи; это может включать в себя расстановку приоритетов для определенных лидов по сравнению с другими, обучение торговых представителей более упорному закрытию каждой продажи и мотивацию их на дальнейшую работу. Для оставшихся двух квадрантов достижение устойчивости может быть ключевой целью. Стоит понять, что делает торговых представителей в верхнем левом квадранте настолько эффективными и чему другие торговые представители могут у них научиться. В то же время представителям в верхнем левом квадранте также нужна стратегия для снижения риска скатывания вниз, если их взаимодействие с клиентами не всегда приносит результаты. Наконец, необходима стратегия для поддержания мотивации торговых представителей в верхнем правом квадранте (например, посредством социального признания, денежного вознаграждения, возможностей продвижения по службе), чтобы они постоянно работали на высоком уровне.
В заключение предлагаем вашему вниманию полезное видео Майка Гастина, в котором более подробно рассматриваются некоторые из рассмотренных выше соображений при выборе размеров для матриц размером два на два:
Вопросы для размышления
Этот раздел состоит из трёх блоков вопросов для размышления, которые побудят вас глубже осмыслить пройденный материал. Цель — помочь вам быстро понять основные принципы и задуматься о том, как их можно использовать в своей работе.
Задание 1: Возьмите существующий фреймворк (например, тот, который вы использовали или создали в реальном проекте по анализу данных) и более подробно проанализируйте его измерения. Сколько измерений содержит фреймворк и к каким из трёх рассмотренных нами классов они относятся? Влияет ли изменение класса любого из измерений на вашу интерпретацию фреймворка и получаемые результаты?
Набор 2: Если вы уже видели и/или создали несколько фреймворков, возможно, сейчас самое время проанализировать измерения, которые вы видите чаще всего. К каким классам относятся эти измерения? В какой степени популярность этих измерений является плюсом или минусом с точки зрения достижения целей каждого фреймворка?
Набор 3: Можете ли вы назвать какие-либо другие классы измерений, помимо трёх, рассмотренных в этой статье? Насколько эти альтернативные классы отличаются от тех, которые мы обсудили?
Обертка
В то время как тип фреймворка определяет, как фреймворк будет что-то говорить (структура), измерения фреймворка определяют, что конкретно будет сказано (содержание). На практике особенно распространены три класса измерений фреймворка: категориальные (неупорядоченные, дискретные категории), порядковые (упорядоченные, дискретные категории) и непрерывные (числовая прямая в заданном диапазоне). Измерение можно преобразовать из одного класса в другой, изменив глубину информационного содержания (например, группируя непрерывные данные для получения порядкового измерения). Важно учитывать количество и разнообразие измерений, которые фреймворк должен иметь для достижения общей цели. Включайте только столько измерений, сколько действительно необходимо, особенно при представлении фреймворка. Ограничение измерений одним классом может иметь некоторые преимущества, хотя взаимодействие измерений из разных классов также имеет свои преимущества.
Источник: towardsdatascience.com



























