Нетехническое и доступное руководство по базовой концепции визуального дизайна: каналы визуального кодирования
Делиться

Это вторая статья из моей серии, посвящённой визуализации данных. См. предыдущую статью: «Визуализация данных: что это такое и почему она важна».
Итак, теперь вы узнали основную идею о том, что лежит в основе визуализации данных и почему она является важнейшим компонентом экосистемы науки о данных. (Если вы с этим не знакомы, обязательно ознакомьтесь со статьей, ссылка на которую приведена выше.)
Как мы обсуждали в предыдущей статье, основная идея визуализации данных заключается в поиске эффективного способа визуального представления данных различных типов.
Ключевая концепция, лежащая в основе такого представления, известна как канал визуального кодирования. Канал визуального кодирования — это, по сути, средство, с помощью которого числовые, текстовые или другие данные преобразуются в визуальный знак. Лучше всего рассматривать его как визуальный признак, соответствующий всем данным или их части. Эффективная визуализация данных часто использует несколько каналов визуального кодирования для различных аспектов данных.
Во второй статье мы подробно рассмотрим каналы визуального кодирования и попрактикуемся в разбиении сложной визуализации на составные части. Это подготовит вас к разработке собственных визуализаций в ближайшем будущем.
Введение в визуальные переменные
В своей работе 1967 года «Семиология графики» французский картограф Жак Бертен выделил семь «сетчаточных» переменных, названных так потому, что сетчатка человеческого глаза чувствительна к ним [1]:
- Положение (например, координаты на графике)
- Размер
- Форма
- Цветовой оттенок
- Значение цвета (от светлого к темному)
- Ориентация
- Текстура
Хотя Бертин опубликовал свою работу несколько десятилетий назад, его визуальные переменные остаются отличным руководством для современного проектирования визуализации данных. На ранних этапах разработки визуализации рекомендуется изучить доступные визуальные переменные и определить, какие из них использовать для конкретных переменных в данных.
Это может показаться запутанным, и проще понять это на примере. Представленная ниже графика, часто считающаяся мастерским примером визуализации, была разработана и нарисована Шарлем Минаром. Она изображает неудачное вторжение Наполеона в Россию.

Это упрощенная и переведенная версия карты для удобства чтения; оригинал см. здесь [2].
Какие визуальные переменные используются на графике выше? ( Подсказка: их довольно много .) В качестве упражнения возьмите ручку и бумагу и попробуйте определить это самостоятельно. Мы подробно рассмотрим это чуть позже.
Максимизация эффективности визуальных переменных
Выбор оптимальной визуальной переменной для конкретной визуализации зависит от данных. Здесь мы рассмотрим три различных типа данных:
- Количественные : числовые данные с естественным порядком, подходящим для математических операций (т.е. имеет смысл складывать/вычитать/умножать/делить отдельные значения данных). Например, зарплата и возраст являются количественными переменными.
- Порядковые данные : категориальные данные (т. е. нечисловые данные, которые могут принимать фиксированное количество значений), сохраняющие естественный порядок. Если вы когда-либо проходили опрос с вариантами ответа, такими как «Полностью согласен», «Согласен», «Нейтрально», «Не согласен» и «Полностью не согласен», то вы видели порядковые данные в действии. Хотя математические операции с этими данными не имеют смысла, различные значения всё равно можно упорядочить от «лучшего» к «худшему», так сказать.
- Сюда также входят переменные, которые могут иметь порядок, не будучи технически «ранжированными», например, схемы работы светофора.
- Номинальные данные : категориальные данные, не имеющие естественного порядка. Отличный пример — цвет. Хотя цвета можно различать, они не имеют естественной последовательности. (Это также объясняет, почему цвет является отличным визуальным кодом для номинальных переменных в целом, как мы увидим ниже!)
Важно: То, что переменная является числом, не делает её автоматически количественной. Например, почтовые индексы — это числа, но они не имеют естественного порядка, и над ними нельзя выполнять математические операции. Таким образом, почтовый индекс — номинальная переменная.
Следующая таблица, представляющая собой вариант таблицы, разработанной экспертами по визуализации Джоком Д. Маккинли и Стюартом Кардом, описывает эффективность различных визуальных переменных в зависимости от типа данных [2]:
| Количественный | Порядковый | Номинальный |
| Позиция | Позиция | Позиция |
| Длина | Плотность | Оттенок |
| Угол | Насыщенность | Текстура |
| Склон | Оттенок | Связь |
| Область | Текстура | Сдерживание |
| Объем | Связь | Плотность |
| Плотность | Сдерживание | Насыщенность |
| Насыщенность | Длина | Форма |
| Оттенок | Угол | Длина |
| Текстура | Склон | Угол |
| Связь | Область | Склон |
| Сдерживание | Объем | Область |
| Форма | Форма | Объем |
Несколько ключевых моментов относительно этих рейтингов:
- Позиция — оптимальный вариант для всех типов переменных. Например, в столбчатой диаграмме с именами по оси X и артериальным давлением по оси Y позиция используется как для номинальной, так и для количественной переменной соответственно.
- После позиции желательность меняется для каждого типа переменной. Это важно знать, поскольку при построении графика с несколькими переменными вам в конечном итоге придётся использовать что-то другое, а не позицию, поскольку она уже используется (обычно на двумерном графике с двумя осями).
- Длина является продолжением положения, но особенно полезна для количественных сравнений.
- Плотность и насыщенность отлично подходят для порядковых переменных, поскольку вашим зрителям не нужно определять точные значения — им нужно просто увидеть рейтинги.
- Оттенок и форма хорошо подходят для номинальных переменных, что позволяет легко увидеть категориальные различия.
- Некоторые варианты полностью вычеркнуты, поскольку они просто не имеют смысла. Например, форма не может быть кодом для количественных или порядковых переменных, поскольку в этом случае невозможно будет сравнивать количества или понимать порядки.
Теперь давайте подробно рассмотрим пример того, как разбить каналы визуального кодирования.
Карта Минара: разложение переменных
Давайте вместе посмотрим на карту вторжения Наполеона, составленную Минаром. Вот она ещё раз для удобства. Этот пример взят из знаменитой книги Эдварда Тафти по визуализации «Визуальное отображение количественной информации» [3].

Внимательное изучение этой карты показывает, что Чарльз Минар блестяще владел каналами визуального кодирования. Его визуализация отображает шесть различных переменных :
- Географическое положение (количественное) : позиция используется для отображения местоположения армии Наполеона на двумерной поверхности (то есть, технически, это две переменные). Вторжение началось в левой части карты, на польско-российской границе. Мы также видим, как части армии иногда расходятся в разные места в соответствии со стратегией Наполеона.
- Географическое положение (количественное) : см. выше.
- Время (количественное) : При внимательном рассмотрении мы видим, что различные моменты времени указаны на оси X диаграммы в нижней части визуализации. Опять же, для отображения этой переменной используется положение.
- Температура (количественная) : температура отображается в зависимости от времени на графике под картой. Местоположение также используется, на этот раз по оси Y.
- Количество оставшихся в армии войск (количественное) : ширина фигуры, движущейся по карте, соответствует количеству войск в армии Наполеона. Очевидно, что по мере вторжения армия Наполеона становилась всё меньше и меньше. В конце концов, из первоначальных 422 000 оставшихся в живых солдат они вернулись в Польшу всего с 10 000.
- Направление движения армии (номинальное) : цвет используется для обозначения направления движения армии на различных позициях. Бежевый/бежевый цвет (белый на упрощённом изображении выше) обозначает движение армии к Москве, а чёрный — отступление в Польшу.
В своей книге [3] Тафти называет карту Минара, возможно, «лучшей статистической графикой, когда-либо созданной». Ее изучение может вдохновить нас на разработку умных способов визуального кодирования наших собственных данных.
Заключительные мысли и взгляд в будущее
Во второй статье вы познакомились с основополагающей идеей проектирования визуализации: каналами визуального кодирования. Размышляя над прочитанным, помните о следующих ключевых моментах:
- Выбор канала визуального кодирования часто может стать решающим фактором в успехе визуализации. У вас может быть прекрасная графика, но если каналы визуального кодирования сложно интерпретировать, зрители не поймут, что вы пытаетесь сказать.
- Позиция играет решающую роль для всех типов переменных, но пространство в двумерной среде ограничено. Поэтому тщательно продумайте, какие переменные вы отображаете с позицией; зачастую они оказываются наиболее важными.
- Попробуйте разные варианты! Идеального решения не существует. Вместо этого нужно перерабатывать и переделывать, пока не достигнете желаемого результата.
В следующей статье мы обсудим важные советы по дизайну визуализации и то, как развивались и расширялись методы визуализации за последние несколько десятилетий. До свидания!
Ссылки
[1] Семиотика графики, Жак Бертен (перевод Дж. Рональда Истмена)
[2] https://ageofrevolution.org/200-object/flow-map-of-napoleons-invasion-of-russia/
[2] Чтения в визуализации информации: использование зрения для мышления (Кард, Маккинли и Шнейдерман)
[3] Визуальное отображение количественной информации, Эдвард Тафти
Источник: towardsdatascience.com



























