4 заметки с тегом

книги

Книга — Visualization Analysis & Design

Прочитал книгу, хочу поделиться впечатлениями.

Автор книги — Тамара Манзнер, профессор Университета Британской Колумбии в Канаде. Интересно, что автор занимается визуализацией очень по научному. Оказывается, что как и всё в этом мире, тема визуализации данных достаточно серьёзно разрыта учеными. Ученные мужи занимаются проблемой давно, стараются найти зависимости и построить математический модели. С одной стороны — это очень круто, с другой иногда кажется излишне формализованным. И вся книга такая — с одной стороны всё очень круто структурировано, с другой слишком сухо. В книге очень классные визуальные выводы-саммари перед каждой главой, которые часто понятнее текста самой главы. Как бывший научный сотрудник, могу авторитетно заявить, что чем больше копаешься в какой-то теме, тем сложнее она становится, но, к сожалению, это не всегда улучшает результат.

Книга состоит из пяти смысловых частей:

  • обобщенный алгоритм визуализации данных
  • графические и смысловые «элементарные частицы» для визуализации данных
  • виды и примеры использования различных «идиом» (типов визуализации) для трёх типов данных (таблицы, пространственные данные, связи)
  • как использовать цвет
  • инерактив и организации визуализации

Крутая часть про обобщенный алгоритм. Идея простая, но полезная.

Алгоритм состоит из четырёх крупных шагов:

1. Понять, что за данные мы имеем

К какому они относятся типу, изменяются ли они во времени

2. Понять какую задачу должна решать визуализация

«Потреблять» или «генерить» данные, какие параметры данных должен обнаружить пользователь (тренды, выбросы, значениях атрибутов), необходимо ли ему сравнивать данные между собой и т. п.

3. Решить как отображать данные и запрограммировать решение

Только на этом шаге появляется визуальная составляющая. В самом простом случае надо выбрать из «каталога» подходящую «идиому» и понять какое у неё будет управление.

4. Проверить как реализованная визуализация решает задачу на практике

Необходимо убедиться экспериментально, что разработанное решение решает поставленные задачи. При этом важно, чтобы такая валидация была сделана для каждого предыдущего шага.

Для меня самой интересной идеей из всего алгоритма показалось следующее — в общем виде, задач которые нужно решать при помощи визуализации данных не так уж много. Поэтому всегда решая задачу хорошо выходить на более высокий уровень абстракции, а не решать задачу в рамках терминов и определений предметной области. Например, задача — определить оптимальность инвестиций в ценные бумаги, за счет построения спреда исторических кривых. На более высоком уровне абстракции может звучать так — сравнение зависимостей x(y) по третьему атрибуту z с определенным шагом по z. Абсолютно такая же абстрактная задача скрывается из-за научной задачей — анализ вольт-амперных характеристик вакуумной дуги в зависимости от собственной индуктивности разрядного контура.

Вряд ли бы мы подумали применить один и тот же тип визуализации, для столь по разному звучащих задач. Но приводя их к общему виду, это можно легко увидеть. Возможно идея покажется слишком простой, но на мой взгляд именно простые идеи правят миром и их сложнее всего применять на практике.

Из этой же идеи можно сделать вывод о том, что не важно насколько вы разбираетесь в предметной области, гораздо важнее уметь нужным образом описать задачу (для этого придется потрудится при общении с клиентом) и знать наибольшее кол-во хороших решений для абстрактных задач. Конечно же не получится просто использовать шаблонные решения для абстрактных задач, особенно для сложных данных со смешанными типами атрибутов, но это точно повышает вероятность успешного решения задачи.

Подводя итоги 

Кига понравилась, но написано очень сухо и научно. Вся книга про дэшборды и интерактивные вещи, никакой инфографики, эстетики и журналистики данных. Большинство примеров достаточно старые и визуально не привлекательные, но это не мешает понимать о чем суть. Можно использовать как справочник по типам визуализации, использованию цвета и возможных каналов передачи данных.

В качестве бонуса — видео лекция автора.

2015   книги

Список книг по визуализации данных (от Игоря Яновского)

На курсе Coursera Игорь Яновский (вот его сайт) поделился списком своих любимых книг по тематике. Я пока что не успел ещё его просмотреть, но решил перепостить. Странно, что в списке нет Тафти.

  1. Жак Бертин “Semiology of Graphics” — классика теории информационного дизайна;
  2. если чтение “Information Visualization: Perception for Design”Колина Вэра покажется жестковатым, рекомендую обратить внимание на его же “Visual Thinking: for Design” или на книгу Конни Маламид “Visual Language for Designers” — они воспринимаются полегче;
  3. в книгах Стивена Фью — “Now You See It”, “Show Me the Numbers”, “Information Dashboard Design” — описаны методы графического представления данных (в основном количественных), рассматриваются их особенности и приемы визуального анализа; кстати, недавно в продажу поступила его книга “Signal: Understanding What Matters in a World of Noise”;
  4. о методах визуализации качественных данных (графы, сетевые диаграммы) можно почитать в “Visual Complexity” Мануэля Лимы;
  5. книги Нэйтана Яу — “Visualize This” (кстати, есть на русском языке — «Искусство визуализации в бизнесе»), “Data Points” — могут найти практическое применение сразу же, т. к. он рассматривает различные методы визуализации на конкретных примерах и предлагает читателю сделать самому все то же самое, приводя алгоритмы действий и листинги программ (в первой книге) и описывает процесс работы над визуализацией, начиная с анализа данных и понимания целей самой визуализации, о чем часто забывают, если вообще задумываются (об этом во второй книге, соответственно);
  6. “Beautiful Visualization” и “Beautiful Data” — это сборники статей, написанных экспертами по работе с данными; просто интересно почитать, узнать о чьем-то конкретном опыте, привычках работы над проектом, особенностях мышления, каких-то хитростях, вдохновиться этим занятием.

Апдейт: Игорь собрал ещё более внушительный список у себя на сайте. За что ему отдельное спасибо!

2015   книги

Книга «Говори на языке диаграмм»

Хочу написать про вторую книгу по применению визуализации данных, которую можно найти на русском языке. Книга вызывает странное и двоякое впечатление. С одной стороны в ней есть классные базовые идеи:

  • сначала определи, что ты хочешь сказать, запиши это словами → затем выбери тип диаграммы
  • определи какой тип сравнения ты хочешь использовать — во времени, по значению, по позиции, по частоте или хочешь показать корреляцию
  • выбери диаграмму по таблице:

С другой стороны автор предлагает странные местами странные идеи — использовать в заголовке, вместо названия, вывод из графика. Такой газетный заголовок, точно подойдёт не всегда. Да и как-то кажется слишком «продажным», возможно это и имеет место, но только не всегда и не везде. Автор любит 3D штучки и фоны для диаграмм — Тафти он точно не читал. =)

Также в книге стрёмный дизайн из прошлого века (я читал от издательства ИКСИ, а не МИФ). Да и сами примеры пришли из той эпохи когда для показа презентации использовались реальные слайды.

Плюс книги — в ней есть кучу практических задачек, которые можно порешать от руки, а уж пользоваться советами автора или нет, это ваше дело. ;)

2015   книги

Книга «Искусство визуализации в бизнесе»

Хочу написать про недавно прочтенную книгу Нейтана Яау (автор сайта flowingdata.com). В России книга издана издательством МИФ с достаточно радикальным переводом — как из «Visualize This» получилось «Искусство визуализации в бизнесе» я даже не знаю. Книга является чуть ли не единственным стоящим произведением по тематике визуализации данных на русском — в ней много хороших примеров и её интересно читать, с другой она является набором туториолов с краткой теорией и реально полезной будет только тем, кто хочет работать с R или Phyton. Книга 2011 года выпуска, поэтому некоторые технологии используемые для реализации визуализаций устарели (flash и нет использования ggplot2 для R). В любом случаи, на скудном поприще русскоязычной литературы по тематике книга абсолютный маст хэв.

Главные мысли которые вынес для себя из книги:

  • подзаголовок для графика — это круто, можно именно там показывать основные выводы из графика
  • цветовую шкалу можно совмещать с гистограммой
  • надо учиться парсить сайты
  • сначала данные и история («сюжет»), потом визуализация — если будешь долго и тщательно готовить данные, то понимание как их визуализировать придет в процессе

Самые интересные примеры из книги (для увеличения правый клик → открыть изображение):

2015   книги