- Оригинальный адрес:Ошибки, мы нарисовали несколько
- Оригинальный автор:Sarah Leo
- Перевод с:Программа перевода самородков
- Постоянная ссылка на эту статью:GitHub.com/rare earth/gold-no…
- Переводчик:ccJia
- Корректор:Charlo-O, cyz980908
Обучение визуализации данных на ошибках
существуетЭкономист, мы очень серьезно относимся к визуализации данных. Мы публикуем около 40 графиков в неделю в печатных изданиях, на веб-сайте или в приложении. Для каждой диаграммы мы стараемся сделать ее как можно более точной, чтобы лучше всего соответствовать предмету, который мы описываем. Но иногда мы тоже ошибаемся. Если мы учимся на этих ошибках, мы можем добиться большего успеха в будущем, и другие могут чему-то научиться на них.
Копаясь в наших архивах, я нашел несколько примеров ценности обучения. Я сгруппировал их в три категории: (1) вводящие в заблуждение, (2) запутанные и (3) диаграммы, которые не рассказывают историю. Для каждой неправильной классификации я предоставляю улучшенную версию с аналогичным размером, что является важным соображением, когда речь идет о печатных версиях.
(Короткая оговорка: большинство «оригинальных» диаграмм были опубликованы до того, как они были переработаны. Улучшенные диаграммы нарисованы в соответствии с нашими новыми спецификациями. Данные те же.)
вводящая в заблуждение диаграмма
Давайте начнем с худшего преступления в визуализации данных: представления данных вводящим в заблуждение образом. мыникогдаДелай это нарочно! Но это происходит регулярно. Давайте рассмотрим следующие три примера из нашего случая.
ошибка: усеченная шкала
этот графикЧтобы показать среднее количество лайков на Facebook для поста от левой партии. Цель диаграммы — показать, чем пост г-на Корбина отличается от других.
Исходный график не только занижал лайки поста мистера КорБина, но и завышал лайки постов других людей. В переработанной версии мы показываем гистограмму мистера КорБина полностью, в то время как гистограммы всех остальных по-прежнему видны.(Поклонники, интересующиеся этим блогом, могут увидеть эту ошибкудругой пример. )
Еще одна странность — выбор цветов. Чтобы имитировать цветовую схему лейбористов, мы использовали три темно-оранжевых/красных оттенка, чтобы отличить Джереми Корбина от других парламентов, партий/групп. Мы этого не объясняли. Значение цветов очевидно для большинства читателей, но не для тех, кто не знаком с британской политикой.
Ошибка: подчеркивание набора отношений с помощью кураторской шкалы.
Вышеприведенная диаграмма описываетСлучаи, связанные с потерей веса собаки. На первый взгляд, вес собаки и размер шеи тесно связаны. Но так ли это? Должна быть релевантной только до некоторой степени.
В исходной таблице обе шкалы упали на 3 единицы (с 21 до 18 слева, с 45 до 42 справа). В процентном отношении шкала слева уменьшилась на 14%, а шкала справа уменьшилась на 7%. В переработанной диаграмме я сохранил обе шкалы, но скорректировал диапазон изменений, чтобы результаты лучше отражали сравнительное изменение шкалы.
Учитывая эту занимательную тему, ошибка не так уж и серьезна. В конце концов, информация, используемая в двух версиях диаграммы, одинакова. Тем не менее, стоит отметить, что если два набора данных тесно связаны между собой, рекомендуется тщательно обдумать выбор масштаба.
Ошибка: выбран неправильный метод визуализации
Мы опубликовали этот опрос в нашей ежедневной новостной программе Espresso. Он использует линейный график, чтобы показать отношение к результатам референдума ЕС. Благодаря этому набору данных взгляды респондентов на результаты референдума очень изменчивы и меняются во времени.
Вместо того, чтобы использовать точки разброса и плавную кривую для отображения тенденций, мы связали результаты для каждого респондента. Скорее всего, это вызвано тем, что наши внутренние инструменты не позволяют рисовать плавные кривые. До недавнего времени мы не привыкли к статистическому программному обеспечению (например, R), которое предлагало более сложные инструменты визуализации. На самом деле, все мы сегодня можем нарисовать карту голосования, подобную той, что была изменена выше.
Как обрезать шкалу — еще один вопрос, требующий внимания на этой диаграмме. Диапазон отображения данных на исходной диаграмме выходит за рамки того, чем должны быть данные. В переработанной диаграмме я зарезервировал некоторое пространство между начальной точкой шкалы и наименьшей точкой данных.Francis Gagnonв блоге обобщает формулу для этого: для линейных диаграмм, которые не начинаются с нуля, зарезервируйте не менее 33% площади.
загроможденная диаграмма
Сложные диаграммы не так вредны, как вводящие в заблуждение диаграммы, но также означают, что диаграмма — это плохая работа по визуализации.
Ошибка: слишком расходящееся мышление
существуетЭкономист, мы рекомендуем создавать новости с дивергентным мышлением. Однако иногда мы заходим слишком далеко.над таблицейПоказывает зависимость между торговым дефицитом товаров в США и количеством рабочих, занятых на фабриках.
Эта схема ужасно непонятна. У него две основные проблемы. Во-первых, все цифры торгового дефицита отрицательны, а все цифры занятости на фабриках положительны. Нецелесообразно объединять два набора данных в одну таблицу без нормализации их до одинакового масштаба. Такой прямолинейный подход приводит ко второй проблеме: два набора данных не имеют одного и того же базового уровня. Базовая линия для торгового дефицита — красная линия в верхней левой половине графика, а базовая линия для шкалы справа — в нижней части диаграммы.
На самом деле нет необходимости объединять два набора данных в одну таблицу.На нашей переработанной диаграмме взаимосвязь между торговым дефицитом и занятостью на предприятиях более ясна, но занимает лишь небольшое дополнительное место.
Ошибка: путаное использование цветов
графикВзаимосвязь между долей населения старше 65 лет и государственной пенсионной поддержкой сравнивается в отдельных странах, уделяя особое внимание Бразилии. Чтобы сделать диаграмму меньше, только избранные страны помечены и выделены железно-синим цветом, а среднее значение ОЭСР — голубым.
Этот визуализатор (я!) игнорирует тот факт, что изменение цвета означает изменение вида. На первый взгляд, то же самое относится и к этой диаграмме: кажется, что все железно-синие цвета принадлежат к разным группам темно-синего. Но это не то, что я пытаюсь донести, единственное, что у них общего, это то, что они помечены.
В переработанной версии цвета всех стран не изменились. Я изменил прозрачность неотмеченных стран, чтобы выделить отмеченные. Затем я подправил шрифты, используя полужирный шрифт, чтобы подчеркнуть наше внимание к Бразилии, и курсив для ОЭСР.
размытая диаграмма
Этот последний тип ошибки не особенно очевиден. Подобные диаграммы не вводят в заблуждение и не сбивают с толку. Они просто плохо справляются с оправданием своего существования — обычно это вызвано неправильным представлением или желанием упаковать много информации в маленькое пространство.
Ошибка: содержит слишком много деталей
Как красочно! Мы опубликовали это в нашей колонке о профиците бюджета Германии.Диаграмма. Он показывает сальдо бюджета и сальдо денежных счетов для 10 стран еврозоны. В иконке используется много цветов, а само маленькое значение очень затрудняет различение большого объема данных, через такую диаграмму невозможно передать информацию. Это почти все о том, чтобы нащупать свой путь сквозь туман. И, что более важно, причина, по которой мы не отображаем данные по всем странам еврозоны, заключается в том, что такое суммирование данных не имеет никакого смысла.
Мы вернемся к этому случаю, чтобы увидеть, есть ли другие способы упростить таблицу. В столбцах диаграммы упоминаются Германия, Греция, Нидерланды, Испания и несколько оставшихся стран. В переработанной версии мы решили выделить только их. Чтобы решить проблему суммирования только нескольких стран, я добавил дополнительную категорию («Другие»), которая включает все остальные страны еврозоны.(Остаток кассового счета на переработанном графике ниже, чем на исходном графике, поскольку мы использовали пересмотренные данные Евростата.)
Ошибка: много данных, мало места
Из-за нехватки места мы часто помещаем данные в небольшую тонкую полоску. Хоть и экономит место, но тоже будет что-то вроде этогоГрафик (с марта 2017 г.)То же следствие. Этот случай показывает, что в научной журналистике доминируют мужчины. Все данные имеют одинаковое значение и относятся к предмету. Но так много данных (включая четыре области исследований и изобретателей) трудно показать здесь.
После долгих размышлений я решил не переделывать эту схему. Если бы я сохранил все данные, диаграмма была бы слишком раздутой, чтобы сжато передать тему. В этом случае лучше всего отрезать часть данных. Например, мы могли бы показать меру среднего значения или вместо этого использовать среднее значение женских публикаций во всех областях.(Если вы можете сделать лучше в этом маленьком пространстве! Тогда дайте мне знать, я хотел бы знать, что вы думаете.)
Лучшие реализации визуализации данных быстро развиваются: то, что работает сегодня, может не работать завтра. Все время появляются новые технологии. Совершали ли вы ошибки, которые легко исправить? Приходите и расскажите нам!
Сара Лео, репортер по визуализации данных The Economist.
Если вы обнаружите ошибки в переводе или в других областях, требующих доработки, добро пожаловать наПрограмма перевода самородковВы также можете получить соответствующие бонусные баллы за доработку перевода и PR. начало статьиПостоянная ссылка на эту статьюЭто ссылка MarkDown этой статьи на GitHub.
Программа перевода самородковэто сообщество, которое переводит высококачественные технические статьи из Интернета сНаггетсДелитесь статьями на английском языке на . Охват контентаAndroid,iOS,внешний интерфейс,задняя часть,блокчейн,продукт,дизайн,искусственный интеллектЕсли вы хотите видеть более качественные переводы, пожалуйста, продолжайте обращать вниманиеПрограмма перевода самородков,официальный Вейбо,Знай колонку.