о визуализации данных и развитии BI-систем
канал в телеграмме | подборки | видео

Книга — Visualization Analysis & Design

Прочитал книгу, хочу поделиться впечатлениями.

Автор книги — Тамара Манзнер, профессор Университета Британской Колумбии в Канаде. Интересно, что автор занимается визуализацией очень по научному. Оказывается, что как и всё в этом мире, тема визуализации данных достаточно серьёзно разрыта учеными. Ученные мужи занимаются проблемой давно, стараются найти зависимости и построить математический модели. С одной стороны — это очень круто, с другой иногда кажется излишне формализованным. И вся книга такая — с одной стороны всё очень круто структурировано, с другой слишком сухо. В книге очень классные визуальные выводы-саммари перед каждой главой, которые часто понятнее текста самой главы. Как бывший научный сотрудник, могу авторитетно заявить, что чем больше копаешься в какой-то теме, тем сложнее она становится, но, к сожалению, это не всегда улучшает результат.

Книга состоит из пяти смысловых частей:

  • обобщенный алгоритм визуализации данных
  • графические и смысловые «элементарные частицы» для визуализации данных
  • виды и примеры использования различных «идиом» (типов визуализации) для трёх типов данных (таблицы, пространственные данные, связи)
  • как использовать цвет
  • инерактив и организации визуализации

Крутая часть про обобщенный алгоритм. Идея простая, но полезная.

Алгоритм состоит из четырёх крупных шагов:

1. Понять, что за данные мы имеем

К какому они относятся типу, изменяются ли они во времени

2. Понять какую задачу должна решать визуализация

«Потреблять» или «генерить» данные, какие параметры данных должен обнаружить пользователь (тренды, выбросы, значениях атрибутов), необходимо ли ему сравнивать данные между собой и т. п.

3. Решить как отображать данные и запрограммировать решение

Только на этом шаге появляется визуальная составляющая. В самом простом случае надо выбрать из «каталога» подходящую «идиому» и понять какое у неё будет управление.

4. Проверить как реализованная визуализация решает задачу на практике

Необходимо убедиться экспериментально, что разработанное решение решает поставленные задачи. При этом важно, чтобы такая валидация была сделана для каждого предыдущего шага.

Для меня самой интересной идеей из всего алгоритма показалось следующее — в общем виде, задач которые нужно решать при помощи визуализации данных не так уж много. Поэтому всегда решая задачу хорошо выходить на более высокий уровень абстракции, а не решать задачу в рамках терминов и определений предметной области. Например, задача — определить оптимальность инвестиций в ценные бумаги, за счет построения спреда исторических кривых. На более высоком уровне абстракции может звучать так — сравнение зависимостей x(y) по третьему атрибуту z с определенным шагом по z. Абсолютно такая же абстрактная задача скрывается из-за научной задачей — анализ вольт-амперных характеристик вакуумной дуги в зависимости от собственной индуктивности разрядного контура.

Вряд ли бы мы подумали применить один и тот же тип визуализации, для столь по разному звучащих задач. Но приводя их к общему виду, это можно легко увидеть. Возможно идея покажется слишком простой, но на мой взгляд именно простые идеи правят миром и их сложнее всего применять на практике.

Из этой же идеи можно сделать вывод о том, что не важно насколько вы разбираетесь в предметной области, гораздо важнее уметь нужным образом описать задачу (для этого придется потрудится при общении с клиентом) и знать наибольшее кол-во хороших решений для абстрактных задач. Конечно же не получится просто использовать шаблонные решения для абстрактных задач, особенно для сложных данных со смешанными типами атрибутов, но это точно повышает вероятность успешного решения задачи.

Подводя итоги 

Кига понравилась, но написано очень сухо и научно. Вся книга про дэшборды и интерактивные вещи, никакой инфографики, эстетики и журналистики данных. Большинство примеров достаточно старые и визуально не привлекательные, но это не мешает понимать о чем суть. Можно использовать как справочник по типам визуализации, использованию цвета и возможных каналов передачи данных.

В качестве бонуса — видео лекция автора.

Подписаться на блог
Отправить
Поделиться
Запинить
 938   2015   книги
Популярное