четверг, 5 июня 2014 г.

[Перевод] Худшая диаграмма в мире: почему вам следует отказаться от использования круговых диаграмм

Предлагаю вашему вниманию свой вольный перевод одной интересной статьи Уолтера Хики с "Бизнесинсайдера" (Walter Hickey) по поводу использования круговых диаграмм. Есть много интересных моментов, к которым следует прислушаться.

Круговая диаграмма — это, пожалуй, самый худший в мире способ представления информации за всю историю визуализации данных.
Конечно, существуют и другие куда более неуклюжие способы визуализации, но ни один из них не имеет такой популярности и широкого распространения, как круговая диаграмма.
Ниже, я объясню вам почему нет ничего хуже круговых диаграмм и почему вам следует как можно быстрее отказаться от их использования. Для начала давайте подумаем, почему мы вообще решаем использовать диаграммы? Итак:
  • Диаграммы — это способ наглядно отобразить информацию;
  • В общем случае, диаграммы призваны облегчить сравнение различных множеств данных;
  • Чем больше информации диаграмма способна передать без повышения своей сложности, тем лучше;
Однако теперь я покажу вам, почему круговые диаграммы проваливаются практически по всем перечисленным параметрам и уступают другим видам диаграмм.
Суть круговой диаграммы — отобразить соотношение частей чего-то целого между собой. Давайте взглянем, как плохо справляются круговые диаграммы с задачей, для которой они, в общем-то, предназначены. Смотрим на рисунок ниже.


Представим, что они отображают ход голосования с пятью кандидатами в три различных временных среза: время А, время В и время С. Итак, какую же полезную информацию мы можем извлечь из этих диаграмм? Так как это доли голосов за каждого кандидата, читателю должно быть хорошо и наглядно видно, каков результат выборной гонки. Однако, читатель здесь этого не видит.
Набрал ли кандидат № 5 больше голосов, чем кандидат №3 в момент времени А? Кто набрал больше голосов между моментами времени А и В: кандидат № 2 или кандидат № 4? Кто стремительнее всего набирает голоса?
Если цель диаграммы сделать информацию нагляднее и проще для восприятия, то справилась ли с этой задачей круговая диаграмма?
Действительно, не было ли бы проще мне дать вам таблицу с результатами голосования, чтобы при беглом взгляде вы смогли узнать ответы на интересующие вас вопросы, чем смотреть на эту круговую диаграмму?
А сейчас, давайте взглянем на ту же самую информацию — о частях целого — представленную в виде гистограммы. Посмотрите, насколько нагляднее и понятнее стала эта информация.


Мы можем точно сказать о том, сколько набирает каждый кандидат в каждый момент времени голосования. Даже эта гистограмма гораздо лучше справляется с задачей отображения части целого, чем круговая диаграмма, хотя это и является прерогативой круговой диаграммы.
Однако, давайте взглянем на другой недостаток круговой диаграммы, имеющий отношение к реальному восприятию кругов людьми. Ниже представлена круговая диаграмма состава Европарламента по партиям.


И главный наш вопрос : а способны ли мы в действительности сравнивать выделенные секторы круга между собой, замечать различия в размерах между ними? Если мы просто пытаемся узнать, что, да, доля EPP в парламенте больше , чем доля S&D, то на кой чёрт нам вообще эта диаграмма? Я смогу рассказать это всего двумя цифрами.
Но нет, диаграммы полезны только в том случае, когда нам нужно сравнить по размерам друг с другом каждый элемент в составе какого-то одного множества.


На рисунке выше изображены все секторы круговой диаграммы, извлечённые из неё и расположенные рядом для сравнения. Взгляните на них и попробуйте-ка расположить их в порядке убывания размера. В реальности, людям довольно плохо удаётся визуально сравнивать секторы круга по размеру, особенно, когда размеры этих секторов близки. Это одна из причин, по которой, возможно, тригонометрия и измерение углов в радианах давались вам в школе сложнее, чем привычная базовая Эвклидова геометрия. В этом нет ничего плохого, но такие мелочи неплохо бы иметь в виду, когда вы пытаетесь наглядно представить какую-либо информацию в удобном и воспринимаемом виде.
Вот точно те же данные в виде гистограммы.


Заметьте, как вы сравниваете все части гистограммы друг с другом. На деле вы просто сравниваете длину прямоугольников и сразу понимаете, что вам пытаются донести! Если очень хочется, можете даже изменить левую ось на проценты, чтобы оценить распределение партий в парламенте. Однако, сейчас вы можете видеть, сколько мандатов имеет каждая партия — информация, которая не могла адекватно представляться в круговой диаграмме.
А теперь давайте взглянем, как легко можно манипулировать круговыми диаграммами. Вот те же данные, что и выше, но представленные в виде трёхмерной круговой диаграммы:


Люди постоянно, раз за разом рисуют такие объёмные круговые диаграммы, просто потому, что это отличный способ наврать вам с три короба.
Глядя на эту диаграмму кажется, что доля партии S&D (красный сектор) примерно такая же, как доля партии EPP (ярко-голубой сектор). Но в реальности, объём сектора искажается из-за перспективы самой диаграммы, и красный сектор кажется больше, чем он есть на самом деле. Делается подобное очень просто, к величайшему стыду какого-нибудь Excel.
Ниже на рисунке вы видите ещё один недостаток круговых диаграмм. Факт состоит в том, что 10% мужчин, которые взглянут на этот рисунок вообще не поймут, на что мы тут жалуемся. (Название диаграммы — "Дальтонизм у мужчин" — прим.перев.)


Хорошие диаграммы вообще не требуют подписей к отображаемым данным. Нет необходимости использовать какие-то дополнительные цифры для своих данных, чтобы донести людям их суть. Если такая необходимость возникла — вы просто используете не те диаграммы. Так вот, в большинстве случаев круговые диаграммы — это НЕ те диаграммы, которые в действительности вам нужны!
Так что давайте подведем итог:
  • Всякие раз, когда есть сходства в отображаемой информации (цифры, проценты и т.д.), круговые диаграммы вам не нужны;
  • Всякий раз, когда имеется несколько (3 и более) различных частей одного целого, которые необходимо сравнивать — круговые диаграммы вам не нужны;
  • Круговые диаграммы очень легко исказить;
  • Если вам нужно подписывать числа или проценты, чтобы пояснить диаграмму — круговые диаграммы вам не нужны.
Прежде чем мы произведем контрольный выстрел критики для круговых диаграмм, неплохо бы упомянуть случай, в котором они действительно хороши.
Единственный случай, когда круговая диаграмма имеет право на жизнь — это когда вы сравниваете 2-3 части одного целого, которые сильно отличаются друг от друга по размерам (процентам,цифрам и т.п.). Всё.
И когда вы вдруг находите подходящий для этого случая пример, всё же единственный вариант использования такой диаграммы — наглядно показать людям, как выглядит конкретная доля чего-либо на общем фоне. Например, оправдание для круговой диаграммы — показать, как выглядит 32% от ста.
На прошлой неделе я написал в комментарии, что круговая диаграмма — это Nickelback* в визуализации данных. Коммент ушел в народ. Но после раздумий, я нашел более подходящую метафору. Круговые диаграммы — это Аквамен в визуализации данных.
Аквамен действительно хорош только в одной ситуации. Но при всем уважении, другие супергерои делают работу Аквамена даже лучше, чем сам Аквамен: Супермен может задерживать дыхание под водой, у Бэтмэна вообще своя подводная лодка. Если дошло до того, что нефтяной танкер терпит бедствие посреди океана, кого вы позовёте: Аквамена или Супермена?
Всем всегда было интересно, зачем вообще Аквамена зовут, когда нужен супергерой? Ведь единственный звездный час для Аквамена, или круговой диаграммы — если вдруг вам понадобится поговорить с рыбами или объяснить, как доля в 32% выглядит в стопроцентном круге. Вот и остаётся только удивляться, зачем люди не задумываясь начинают строить круговые диаграммы или зовут на помощь такого «узкого» специалиста, как Аквамен?
Короче, прекращайте использовать круговые диаграммы. Они бесполезны, с их помощью легко исказить информацию и они не справляются с задачей, которую должны решать диаграммы — они не делают информацию наглядной и легковоспринимаемой. Круговые диаграммы — это Аквамен.
Что же изображать взамен "старых добрых" круговых диаграмм?
Как сказал Эдвард Тафте — специалист по данным, который также описывал недостатки круговых диаграмм: «Люди, использующие круговые диаграммы, заслуживают тех же подозрений и скептицизма как и те, кто вечно путает its и it’s или their и there. Для сравнения данных используйте маленькие таблицы, выражения, но не круговые диаграммы».



*Nickelback — канадская пост-гранж группа, ставшая в последняя время объектом шуток по причине крайнего однообразия и показной лиричности своих песен.

1 комментарий:

  1. В комиксах ничего не понимаю, но "Nickelback в визуализации данных" - это пять!
    p.s. круговые диаграммы использую сам где внешний вид важнее содержания. Например, в дипломе ;-)

    ОтветитьУдалить