Какие и сколько данных иллюстрировать

Марджи Хенри

Давайте заложим основу для успешной презентации данных. Если вы отнесетесь к этому серьезно, то здорово поможете себе определить, какие аспекты данных стоит визуализировать и как именно. Начнем с небольшого мозгового штурма. Вы можете сделать это самостоятельно, подумав несколько минут, или работая в команде. Здесь у вас две задачи: определить, что вы хотите сказать, и обозначить целевую аудиторию. Вы можете изменить эту последовательность по своему усмотрению, но мы начнем с определения вашего сообщения.

Что вы хотите сказать?

Прежде чем взяться за выбор данных для презентации, потратьте несколько минут на размышления, что же вы хотите сказать. Закройте странички с социальными сетями, отойдите от компьютера и подумайте, что именно вы хотите сказать. Спросите себя: “Что я знаю? Что это значит? И почему я верю, что это важно?”.

Представьте себе базу данных, содержащую данные о различных видах кофеиносодержащих напитков и эффектах от их употребления. Не останавливайтесь на мысли «кофеин влияет на организм». Вряд ли вы хотите презентовать информацию, вызывающую ответ «Хм.. Ну и?». Копайте глубже. Будьте конкретнее. Что говорят ваши данные о том, как кофеин влияет на организм? Эффект кофеина исключительно положительный, или отрицательный? Или, может быть, и одно и другое? Меняется ли эффект в зависимости от возраста и/или пола человека? Может, какие-то отдельные напитки более полезные или вредные для здоровья? Ваш ответ должен быть лаконичным: кратким, понятным и по существу. Утверждение вроде “При умеренном потреблении кофе обладает способностью снижать риск определенных расстройств и заболеваний, поскольку содержит основные антиоксиданты” – существенно лучше по сравнению с изначальным примером. Больше того, оно устанавливает четкий фокус для визуальных элементов и общий язык для общения с нашей аудиторией.

Прямо сейчас вы можете мысленно вернуться к урокам языка и литературы, потому что определить ключевое послание − это то же самое, что сформулировать цель и тему диплома. Если вы не можете выразить основную мысль в нескольких лаконичных предложениях, тогда вам, скорее всего, нужно лучше разобраться в теме. Сурово? Возможно, но уж получше, чем презентовать информацию толпе зевающих равнодушных сверстников. Преодолейте свое желание пропустить этот шаг! Если вы – любитель карандаша и блокнота, сядьте и напишите свое основное сообщение! Оно будет для вас опорой в течение всего процесса визуализации данных.

Проще говоря, ваши шансы создать убедительный, хорошо организованный визуальный аргумент будут неизмеримо выше, если вы начнете с четкого и сфокусированного послания.

Поймите свою аудиторию

Итак, вы определились, что же хотите сказать. Теперь давайте подумаем о важности понимания своей аудитории. Это знание также поможет вам определить, какие данные и в каком количестве иллюстрировать.

Потратьте еще пару минут и спросите себя: «Какая информация наиболее ценна для моей аудитории?», «Какую роль будут играть визуальные элементы в этом диалоге?» и «Какие действия я хочу вызвать?». Хотите ли вы учить алгебре группу инженеров? (Правильный ответ − нет). Зачем? Чем лучше вы знаете свою аудиторию, тем выше ваши шансы создать удачную визуальную презентацию.

Представим себе презентацию данных на тему “Охрана окружающей среды в новом тысячелетии” в следующих вариантах: (1) в маленьком блоге, посещаемом, в основном, экологами-любителями; (2) в аудитории для учеников старших классов; и (3) на мероприятии по фандрейзингу для природоохранной организации. Станете ли вы создавать и объяснять свои данные одинаково во всех случаях? Надеемся, что нет. Вы должны быть способны предположить, что будет наиболее подходящим для презентации, даже если вы никогда не встречали ни одного представителя своей аудитории.

В нашей первой ситуации мы можем допустить, что посетители уже заинтересованы в охране окружающей среды. Может, они уже длительное время изучали эту тему. Часть из них − постоянные посетители, которые доверяют вашему мнению, и, может, даже видят в вас эксперта в этой области. Вероятно, ваш сайт – не единственный блог, которому они доверяют, но в будущем он может стать таковым целенаправленно, а не из-за капризов функции автозаполнения. В этом случае, ключевые моменты − ширина и глубина. Вы можете уделить больше времени исследованию, анализу и реорганизации данных. Если задача вашего сайта − дать толчок к дальнейшим исследованиям, вы можете представить визуализации, которые поднимают вопросы или же заставляют посетителей ставить под сомнения их собственные убеждения.

Наша вторая ситуация с учениками немного отличается. Можно предположить, что ваша аудитория весьма поверхностно знакома с темой. (Хотя, как обычно, некоторые участники будут знать больше остальных). Посещение может быть обязательным, а не добровольным, поэтому самое важное − удержать их интерес. Нужно представить зрелищные, высококачественные, привлекающие внимание визуализации, касающиеся актуальных животрепещущих вопросов. Будьте осторожны с лексикой: объясняйте профессиональную терминологию и включите больше визуальных индикаторов хорошего/плохого, положительного/отрицательного. Ваши иллюстрации должны четко донести важность защиты окружающей среды, не оставляя места сомнениям.

Ну и наконец, наше мероприятие по фандрейзингу. Этой аудитории необходимо почувствовать, что защита окружающей среды − весомая причина для их денежных вложений. Скорее всего, это будет смешанная аудитория: заинтересованные доноры, их незаинтересованные партнеры (пришедшие только ради бесплатной еды и напитков), эксперты, персонал и стажеры. Вы можете предположить, что они будут ожидать некоего баланса между сентиментальностью, убеждениями в необходимости безотлагательных действий и неопровержимыми фактами. Мы предположили, что люди будут разные, поэтому стоит использовать общедоступный и легкий язык, не опускаясь в то же время до снисходительности. Эта аудитория ожидает подтверждения их интереса к важности защиты окружающей среды, и ваши визуализации должны этому соответствовать. Как и с группой учеников, не оставляйте вопросов без ответов.

Представить вызывающий эмоции контент − это не значит отбросить ключевые факты, если они не вписываются в вашу идеальную фабулу. Будьте предельно внимательны, когда делитесь такой информацией, и сделайте все, чтобы ваши ценности не стали помехой для достоверной презентации данных!

Теперь, когда мы обсудили важность основного сообщения и понимания своей аудитории, углубимся в изучение вопроса, как выбрать данные для иллюстрирования.

Выбираем данные для иллюстрирования

Вы можете начать этот процесс, расширив ваше ключевое сообщение до масштабов повествования или рассказа. Наша цель − представить последовательность или набор фактов, которые шаг за шагом приведут вашу аудиторию к основному сообщению. Данные, которые вы выбираете для иллюстрирования, должны задавать контекст, показывать основные интересные моменты, и объяснять, как они взаимосвязаны. Будьте целеустремленными в своей презентации, но не цензурируйте свои данные, чтобы они подтверждали ваши аргументы. Ваша визуальная история должна основываться на том, что говорят ваши данные, а не только на том, что вы хотите сказать.

Возьмем, для примера, следующую таблицу, представляющую уровень IQ детей, которые были взяты в приемные семьи в раннем возрасте, и социально-экономический статус (СЭС) их приемных и биологических родителей (основанный на их доходе и роде занятий). Эти данные взяты из исследования Кэпрон и Дьюм (C. Capron, M. Duyme), проведенного в 1989 году, под названием “IQ детей и социально-экономический статус их биологических и приемных родителей в сбалансированном перекрестном исследовании”, опубликованного в «Европейском бюллетене когнитивной психологии».

IQСЭС приемных родителейСЭС биологических родителей
136ВысокийВысокий
99ВысокийВысокий
121ВысокийВысокий
133ВысокийВысокий
125ВысокийВысокий
131ВысокийВысокий
103ВысокийВысокий
115ВысокийВысокий
116ВысокийВысокий
117ВысокийВысокий
94ВысокийНизкий
103ВысокийНизкий
99ВысокийНизкий
125ВысокийНизкий
111ВысокийНизкий
93ВысокийНизкий
101ВысокийНизкий
94ВысокийНизкий
98НизкийВысокий
99НизкийВысокий
91НизкийВысокий
124НизкийВысокий
100НизкийВысокий
116НизкийВысокий
113НизкийВысокий
119НизкийВысокий
92НизкийНизкий
91НизкийНизкий
98НизкийНизкий
83НизкийНизкий
99НизкийНизкий
68НизкийНизкий
76НизкийНизкий
115НизкийНизкий
86НизкийНизкий
116НизкийНизкий

Давайте обсудим две возможные истории, которые вы можете создать, исходя из этого набора данных: “Социально-экономический статус приемных родителей ограничивает интеллект усыновленных детей” и “Влияние социально-экономического статуса биологических и приемных родителей на интеллект приемных детей ”.

СОЦИАЛЬНО-ЭКОНОМИЧЕСКИЙ СТАТУС ПРИЕМНЫХ РОДИТЕЛЕЙ ОГРАНИЧИВАЕТ ИНТЕЛЛЕКТ УСЫНОВЛЕННЫХ ДЕТЕЙ

Мы можем создать историю, подтверждающую первое утверждение, для этого достаточно только посмотреть на СЭС приемных родителей: у детей из семей с высоким СЭС средний IQ около 112, в то время как у детей из семей с низким СЭС − 99. Однако, такое утверждение включало бы лишь половину релевантной информации: оно полностью отбрасывает СЭС биологических родителей. Понятно, что СЭС биологических родителей играет настолько же важную роль, поскольку социально-экономический статус влияет на уровень и качество перинатального ухода и, в свою очередь, внутриутробного развития ребенка.

childiq

ВЛИЯНИЕ СОЦИАЛЬНО-ЭКОНОМИЧЕСКОГО СТАТУСА БИОЛОГИЧЕСКИХ И ПРИЕМНЫХ РОДИТЕЛЕЙ НА ИНТЕЛЛЕКТ ПРИЕМНЫХ ДЕТЕЙ

Название чуть более занудное, но зато куда более точное. Когда мы включаем СЭС и приемных, и биологических родителей, мы лучше видим, как это влияет на IQ ребенка. В частности, мы видим следующее:

adoptive-table

Итак, правильнее будет сказать, что IQ ребенка зависит от СЭС и биологических, и приемных родителей. Если обе пары родителей обладали высоким СЭС, то IQ ребенка, скорее всего, будет самым высоким. Если у одних родителей СЭС высокий, а у других низкий (не важно, у кого именно), то у ребенка будет, как правило, средний IQ. И наконец, если СЭС обеих пар родителей низкий, то уровень IQ ребенка обычно будет ниже среднего.

Наш первый пример − прекрасная иллюстрация того, что происходит, когда вы создаете историю, основываясь на том, что хотите сказать вы, а не на том, что говорят данные. К сожалению, подобное обращение с данными − не редкость. Мы видим подобное и в новостях, и в будничных разговорах. Опускание ключевых фактов и соответствующих переменных создает визуализацию, полную дезинформации, недостоверную и явно предвзятую. Второй пример гораздо меньше предвзят, он представляет собой правдоподобную историю, основанную на всех доступных данных, показывает контекст, включает все переменные и объясняет, как они связаны друг с другом. Хотя, как правило, в результате название будет менее сенсационным, однако полное представление всех релевантных данных − это единственный способ обеспечить достоверную и надежную аргументацию.

Сколько данных иллюстрировать

В предыдущих разделах мы рассмотрели, как определить ключевое сообщение, важность понимания аудитории и процесс отбора фактов для иллюстрации. Теперь посмотрим, как определить, сколько же данных нужно визуализировать.

Поскольку мы подразумеваем, что иллюстрирование данных сделает их более удобоваримыми, то следует постараться не представлять больше, чем ожидает аудитория, или больше, чем ей необходимо, чтобы понять ваше сообщение. Когда вы решаете, сколько данных вам иллюстрировать, помните, что больше означает лучше, только если это содержательно и подтверждает ваше основное сообщение. В большинстве случаев, ваши визуализации будут восприниматься как часть повествования, часть хранилища данных или и то, и другое.

Как уже говорилось ранее, повествование (нарратив) − это рассказ, представляющий последовательность фактов, которые постепенно подводят вашу аудиторию к основному сообщению. Если вы хотите понять, что такое нарратив, вспомните письменные отчеты, презентации PowerPoint и статьи в газетах, журналах или онлайн. Вы должны проиллюстрировать такое количество данных, чтобы ваша аудитория легко поняла ваши выводы, но при этом не устала. У каждой иллюстрации должна быть конкретная цель. Избегайте использования визуальных объектов только потому, что они производят впечатление. В качестве теста, попробуйте убрать одну или несколько иллюстраций или изменить порядок презентации. Не лишился ли ваш нарратив смысла? Каждая иллюстрация должна быть независимой, без чрезмерных устных или письменных пояснений, но если она никак не способствует пониманию вопроса аудиторией, вероятно, она не нужна вовсе.

Для той части вашей аудитории, которая захочет больше информации, вы всегда можете предоставить ссылки на дополнительные интерпретации ваших данных и подробные комментарии, дающие контекст и объясняющие информацию более детально и глубоко. Если вы хотите впечатлить технически подкованную аудиторию, то можете даже расшарить графическое приложение как репозиторий на GitHub или галереи фрагментов кода на bl.ocks.org.

Хранилище, с другой стороны, можно рассматривать как  склад информации. Обычно оно состоит из многочисленных нарративов и автономных контентов и может быть примером того, когда больше значит лучше. В отличие от любителей повествования, посетителей хранилищ не утомляют данные. Они хорошо воспринимают большие объемы данных, потому что рассчитывают потратить какое-то время на то, чтобы разобраться или улучшить свои знания в теме. Хранилище не нужно фокусировать на одном сообщении. Его аудитория ищет новые толкования данных, разнообразие перспектив, и различные углы рассмотрения темы или области контента. В варианте с хранилищем, основным критерием при принятии решения об объеме иллюстрируемых данных, будет фактор избыточности информации. Если ваши иллюстрации не могут добавить ничего нового к теме или расширить ее, скорее всего, их можно исключить.

В качестве иллюстрации давайте представим киномана и управляющего магазином. Оба просматривают блог с датами выхода новых фильмов, обзорами и критикой режиссеров. Киноман проводит часы на этом сайте, впитывая каждую картинку и зачитываясь содержанием. Менеджер просто хочет знать, какие популярные фильмы ему заказать на следующие праздники. Менеджер, скорее всего, не захочет потратить много времени в поисках нужного ему ответа. Для нашего киномана чем больше информации, тем лучше; для менеджера − наоборот.

Редактирование и исправление

Приведу распространенный и раздражающий пример: вы совершили мозговой штурм, сделали кучу визуализаций, и выбрали самые лучшие, для своего проекта. Вы старались не перегрузить аудиторию и убедились, что ваши иллюстрации охватили самые важные моменты, не дублируя друг друга.

Как же потом бесят вопросы во время презентации или комментарии в блоге, требующие именно те визуализации, которые вы отбросили! Вы начинаете испытывать сомнения в своих же выводах, боретесь с желанием спорить с человеком, задавшим этот вопрос, скрежещете зубами и ворчите.

Все нормально. Если вы сделали хорошую работу и заинтересовали аудиторию, она естественно проявит любопытство и захочет больше информации. Людям может быть интересно увидеть те же данные, представленные по-другому, глубже или масштабнее. Если вопросы аудитории отражают решения, которые вы принимали в процессе выбора, это отлично! Это обозначает, что вы на одной волне со своей аудиторией, и что публика вовлечена и заинтересована историей, которую рассказывают ваши данные.

Есть несколько способов сохранить (не подчеркивая при этом) те визуализации, которые не прошли отбор в вашу основную коллекцию. Распространенная практика для слайд-шоу – подготовить несколько дополнительных слайдов после “спасибо” или завершающего слайда так, чтобы эти слайды содержали интересную информацию, которая не вписалась во временные рамки. “Да, у меня есть разбивка по отраслям промышленности/ годам/ странам/ полам”, говорите вы уверенно, переключаясь на подготовленный слайд. Вуаля!

Еще один способ − опубликовать интерактивные версии ваших визуализаций, позволяющие пользователям самостоятельно изучать информацию. Еще лучше, если вы можете поделиться исходными наборами данных. В таком случае, все желающие смогут самостоятельно анализировать данные и рассматривать их под новым углом. Мы еще поговорим подробнее о статической и интерактивной графике в главе «Печать и онлайн».

Если вы ищете обратную связь на начальном этапе и не уверены, к кому обратиться, взгляните на HelpMeViz, это сайт-сообщество, где вы можете опубликовать свои неоконченные работы и получить дружеские советы, как их можно улучшить. Получать обратную связь от вашей аудитории и редактировать свои визуализации, чтобы они лучше соответствовали потребностям аудитории − это все части процесса!