Блог Ромы Бунина

о визуализации данных, дизайне BI систем и работе с Tableau

канал в телеграмме | подборки примеров | подкасты и видео 

Видеоподкаст с Александром Богачевым

Записал подкаст с Александром Богачевым. Саша — автор канала Чартомойка и книги «Графики, которые убеждают всех».

В этот раз получился большой рассказ про карьерный путь Саши и его работы, на фоне которого мы обсудили как измеряется эффективность медиа-проектов, как соблюсти баланс между сложностью и понятностью и почему в медицине не хватает визуализации данных. Рука не поднялась что-то вырезать, сорри за большой хронометраж.

Подборка проектов из подкаста — https://revealthedata.com/examples/digest/all/primery-rabot-aleksandra-bogacheva/

1:55 — Как попал в визуализацию данных
6:02 — Медицинская инфографика — про визуализацию в медицине
23:57 — РИА Новости — про метрики медийных проектов, выбор тем для проектов и упрощение визуализаций для медиа
1:00:51 — Спец проекты — про подходы к работе с проектом
1:15:05 — Чем занимается сейчас — чем вдохновляется
1:22:31 — Блиц

Пять классных работ в Табло

Готовлюсь к проведению Лабораторного курса — обновляю список классных примеров в Табло, которые буду показывать слушателям. Добавил в него ещё 5 работ.
 

Распределение земли по назначению в США
На этой визуализации показан «каждый» акр земли в штатах и зачем он используется. При этом супер уместно используется анимация, которая показывает разные срезы этого распределения: географически, в абсолютном или относительном сравнении по типам. Это работа Александра Варламова — дата-виз энтузиаста из Казани. Как он такое делает, можно послушать на его выступлении на дне открытых данных.

  

Радиус взрыва атомной бомбы
Это довольно распространённый визуальный образ радиуса поражения на карте и даже есть сервисы, где можно выбрать большое кол-во разных видов бомб и самому «понаводиться» на цель. Эта работа — ремейк печатного плаката, видимо поэтому меня в ней зацепило аккуратное оформление и реализация.

 

Поездки Такси в Нью-Йорке

На этой визуализации 3 дня поездок такси в Нью-Йорке, показана каждая точка поездки и её длительность. Ещё есть два POI — куда люди уезжают от Эмпайр Стейт Билдинг и из аэропорта Кеннеди. У этой визуализации только одна проблема — переиспользование цветов легенды для разных метрик на разных графиках. Это путает и является грубой ошибкой, но всё равно не смог не включить эту работу в список.

 

Уровень преступности в разных штатах США
Удачная реализация Camel plot (сам придумал, так как не смог найти как это называется) — графиков в которых ограничена ось Y, и если значение больше него, то оно наслаивается сверху.

Такой вид графиков хорошо подходит, что бы делать small multiples для срезов с большим разбросом значений. Если бы оси для каждого штата были независимы, то значения на графиках нельзя было бы сравнивать между собой. Если бы оси были зафиксированы, то штаты с небольшим кол-вом преступлений превращались бы в прямую. Плюс, если отдалится взглядом, такие графики образуют хитмап, что тоже круто.

В работе автор решает проблему сложности считываемости графика тем, что при наведении появляются обычные тайм-серии. На них ещё круто добавлено сравнение со средним по стране.

 

Я бы это задачу решал ещё более наглядно и добавлял бы что-то на подобии такой легенды:

 

Графики в стиле Тафти
Последняя работа — моя собственная. Наверное, это самая законченная работа из всех, что у меня есть на Табло Паблик и я получил большое удовольствие от её реализации. Во-первых мне хотелось понять, можно ли что-то сделать в такой эстетике в Табло (да! можно!), во-вторых попробовать графики Тафти на реальных данных (да! работают!).

Классные работы в Табло можно искать в галерее работ Viz of the Day. Ещё можно поискать работы, которые подают на Make Over Monday (сами работы можно искать в твиттере). И там, и там, к сожалению, приходится копаться с пинцетом.

Видеоподкаст с Наташей Степановой

Провели видеоподкаст с Наташей Степановой — программисткой и автором канала Визуализируй это!

Поговорили про её карьерный путь, программирование визуализаций в вебе и отличие svg и canvas.

1:02 — Карьерный путь
5:39 — Примеры проектов
24:38 — Про визуализацию в вебе
29:20 — SVG vs Canvas
35:30 — Стек для проектов
42:08 — За чем следит и с чего начать изучать визуализацию в вебе
46:47 — Блиц

Новая подборка крутых примеров

Продолжаю эксперимент с дайджестом классных примеров. Собрал ещё три работы, которые меня вдохновили на этой неделе. Дисклеймер, в этой рубрике не только новые работы, но и те, которые я просто увидел впервые. Поэтому тут будут и старые работы, но я не видел их в основных чатах по визуализации. =)
 

Звук толпы на стадионе во время футбольного матча
Эта работа очень запала в душу. Это анализ пяти футбольных матчей на стадионе Альянц Арена — показан уровень «социальной» активности во время матча: громкость звука трибун и кол-во сообщений в твиттере. Самый сок — это запись звука болельщиков с реальных матчей, историю про твиттер я что-то не понял.

На таймсериях справа видно громкость болельщиков, можно выбрать самые яркие моменты и слева послушать, что происходило.

 

Самый кайф создатели проекта почему поместили в подвал сайта. Там можно выбрать конкретный матч и посмотреть модель стадиона и полные графики в разных разрезах. Это просто огонь, тот редкий случай когда 3D в самый раз, так как отображает реальность данных:

Очень крутая работа, которая показывает природу событий через данные, можно прям залипнуть. Смотрите проект со звуком.

 

Топ футболистов по забитым голам

Ещё одна работа про футбол. Продолжает тематику прошлого выпуска — это простой и лаконичный график, но его очень интересно рассматривать. На графике все самые известные футболисты и кол-во забитых голов. Самое классное в визуализации — возможность найти интересного игрока, выделить его, и после этого переключить ось x. Видно как класно перемещаются игроки и что картина становится совсем другой. Очень классное применение интерактивности и анимации, прям захотелось попробовать что-то подобное сделать в Табло.

 

Неравенство зарплат мужчин и женщин в Англии
Гардиан визуализировали результаты отчетов компаний о неравенстве зарплат (да-да, такие отчеты обязаны сдавать крупные компании в Англии). Работа состоит из двух классных графиков: распределения и джой плота.

На распределении показана каждая компания и есть подписи для самых интересных из них. Я не очень понял, почему компании с равенством (серые) вынесены в отдельный круг, так его не сравнишь с остальными компаниями. Но сама идея выбросить на график все точки — классная.

 

Ниже в статье joy-plot — график, названный в честь обложки альбома Unknown Pleasure группы Joy Division. Вот как бывает — графики получают имена! Мне этот график очень нравится, он даже у меня на стартовой странице сайта стоит )) Он классно подходит для этих данных, наглядно сравниваются распределения по разным индустриям и удобно сравнивать пики распределения. Обратите внимание, как точки с прошлого графика на этом графике стали областями — это классный приём: сохранили каркас (читатель с ним уже знаком), но при этом выбрали более подходящее визуальное представление (точки тут бы шумели и отвлекали от основной сущности визуализации — индустрии):

Конкурс дашбордов Клуба анонимных аналитиков

Участвовал в конкурсе Алексея Колоколова про дашборд для продаж. Занял первое место. )

Задача была интересная — были приближенные к реальным данные отдела продаж небольшой компании, которые было нужно превратить в дашборд. Разрезов было не очень много, но от этого было ещё интереснее. Ещё понравился двухступенчатый формат: было одно ревью работ судьями → время на доработки → финальная оценка. Это уменьшало разночтения в ожиданиях и давало идея для разработки.

Вот сам дашборд — https://revealthedata.com/examples/sales-dashboard/

Вот видео, где судьи разбирают работы. Мне конечно было очень приятно, что большего всего мой даш зашёл Эдуарду Шмидту, специалисту по продажам. Так как он был голосом пользователя в этом конкурсе.

Когда делал дашборд, экспериментировал и сделал два интересных решения.

Часть дашборда с основными метриками сделана по принципу mobile first: она будет хорошо смотреться на мобильном, даже без специальной версии дашборда. И именно это часть нужна, чтобы быстро «в дороге» взглянуть на общее состояние дел, остальное можно проанализировать уже дойдя до ноута.

Сделал What-If калькулятор для воронки, с помощью него можно подобрать нужные уровни конверсии или кол-во лидов для выполнения плана.

Позже планирую записать небольшое видео и показать как дашборд устроен внутри, и рассказать какие решения принимал во время дизайна.

3 примера лаконичных графиков

Многие друзья говорят мне, что будет классно собирать крутые примеры визуализации каждый месяц/неделю. Я пока не знаю, насколько это нужно и будет ли интересно — чаще всего самые классные примеры и так сами пролезают во все чаты и люди уже подписаны на редитты и подобное. Но так как запрос вроде бы есть, решил попробовать. Просто дублировать то, что уже все видели не хочется. Но решил попробовать. Собрал не самые громкие последние визуализации, а три небольших примера, которые зацепили меня лаконичностью и дизайном. Я вообще обожаю когда визуализация — это простые один-два графика, но их дико интересно изучать.

Сравнение игроков разных видов спорта
Супер классно оформленный скетерплот. Для эти данных он подходит идеально: видно кластеры разных видов спорта, видно общее кол-во игроков и выбросы, есть подписи самых интересных случаев. Даже при том, что график статичный подписи игроков заменяют часть интерактивности.

Карта Москвы с раскраской улиц по типу
Леша Тихонов сделал простую и при этом мега интересную и крутую визуализацию. Это улицы Москвы по типу: улица, переулок, тупик и т. п. Это супер интересно рассматривать и близко каждому, кто живет в столице.

Андрей Кармацкий и его команда тоже поделились подобной работой:

Индекс счастья

Классное оформление, показывает, что в Табло тоже можно делать красиво. За счет джиттеринга точки равномерно распределены по столбцам, это создает приятную визуальную картинку. Ещё здесь супер ОК то, что нед точных подписей на оси Y, так как сам индекс как раз важен просто в разрезе много/мало, а не точных значений.

Россия на фоне других стран

 

Итоги
Даже простые графики могут быть супер интересными. Мне кажется, что это и есть самые интересные типы визуализаций и здесь супер важным становится графическое оформление, сама идея и тип подобранного графика. Ещё на этих графиках много данных — это не суммарный условный бар-чарт, а каждая частица данных на плоскости. Это круто повышает интерес и контекст для читателя.

Видеоподкаст с Андреем Дорожным

Я запустил новый проект — видеоподкаст с участниками дата-виз сообщества: журналистами данных, BI аналитиками и визуализаторами. Хочется поближе всех нас познакомить и узнать как у кого устроены процессы и проекты. Мы сняли пилотный выпуск с Андреем Дорожным (спасибо ему большое за участие). Поговорили с ним про профессию, карьерный путь и примеры проектов.

Звук и видео не супер айс, буду с этим работать.

1:42 — Карьерный путь, что нравится и не нравится в профессии
12:08 — Примеры первых работ для газеты
14:16 — Какие сейчас проекты в работе
19:33 — Про инстаграм со смешными графиками
23:03 — Как построен процесс работы над проектами
31:11 — Про инструменты
36:57 — Про любимые проекты и работы
43:17 — Блиц
45:58 — Классный пример визуализации по COVID-19

Канал Андрея в телеграмме — https://t.me/data_publication
Видеоблог — https://www.youtube.com/channel/UCQ3cyKr_SnAb5Jsfwa3VCjw
Инстаграм со смешными графиками — https://www.instagram.com/dorozhnijchart/

Видеоинфографика

Астрологи объявили месяц видео (запредельное кол-во ссылок на ютуб в этом посте)

Недавно ютуб подсунул мне ролик от моего любимого канала Cut. Это была живая инфографика, где люди отвечали на вопрос, вставая в одну из областей, нарисованную на полу.

Это классный пример очеловеченного датавиза. Здесь каждый человек — визуальный атом, который транслирует свою частицу данных  — ответ на какой-то вопрос. Вспомнилось несколько похожих примеров. Первый это фото людей, образующих нормальное распределение по росту:

В белом девушки, в черном парни

Ещё была очень-очень классная визуализация: Sexpierence — одна из самых увлекательных визуализаций, что попадала ко мне в руки. Вообще такой формат очень подходит для результатов опросов. К сожалению, её уже нет в интернете (да! такое, к сожалению, бывает) и нельзя посмотреть даже в веб архиве, так как она была сделана на флеше. Нашёл только такое видео, где показывают её небольшую часть:

Также такая визуализация классно работает для отображения изменения состояний. Например Найтан Яу сделал классную визуализацию о том, чем заняты Американцы в разное время дня:

Подобную визуализацию, кстати, в Табло делать сложно (но можно, смотрите работы Саши Варламова). Но есть, например, встроенный формат во Флоуриш, которые позволяет делать такие истории с перемещением точек:

Вообще формат видео-инфографики с одной стороны сложный и мало, кто её делает. С другой самый распространённый на ТВ (и поэтому довольно старый) и в последние годы набирает популярность. Те же самые Race Bar Chart’s набирают миллионы просмотров на ютубе. Если вы ещё не смотрели, то вот залипайте. Флориш, кстати тоже такие умеет.

Появляются и новые форматы, например, такие топы:

Самая крутая видео-инфографика, которую я видел, это конечно же fallen.io о второй мировой войне. Если вы почему-то её ещё не видели, то обязательно посмотрите:

UPD Нашёл еще похожий формат про живые визуализации

Навыки для визуализации данных

Немного вводных мыслей. Если не интересно, листайте сразу к разделу с навыками.

Классный дизайн обычно свойственен B2C продуктам — часто именно удобство и эстетичность продукта это Unique Selling Point, который продвигает продажи товара или услуги. А вот B2B продукты с этим отстают. Да, B2B продукты сейчас тоже стараются делать классными или даже делают это основой и стратегией всего продукта, как, например BOX. Посмотрите видео их основателя в Y-Combiantor, который рассказывает как они смогли за счет дизайна отъесть долю рынка у гигантов бизнеса. Но всё равно, это скорее исключение из правил.

Ещё в более плачевной ситуации оказываются внутренние инструменты, которые делают для себя сами компании внутри для целей анализа или управления бизнесом. К таким инструментам относятся и системы аналитики (оно же BI — business intelligence) и визуализации данных. Да, сами системы могут быть крутыми и классными, но вот контент в них часто делают ужасный. И это не вина инструмента (хотя Тафти, например, прям ругает Power Point), это проблема отсутствия у сотрудников необходимых навыков.

Кто делает контент в BI системах
Контент (отчеты и дашборды) в этих системах создают или сами бизнес-пользователи, или аналитики данных. Если это делают бизнес-пользователи, то им часто не хватает технических скилов и понимания как в целом работать с данными (как правильно интерпретировать результаты анализа).

Если же отчеты делают аналитики, то эти отчеты зачастую излишне сложны, в них есть куча фильтров и обычно много-много таймсерий. Ещё, не хочу обобщать, но в целом у аналитиков часто есть проблемы с дизайном, ведь они никогда этому не учились или не обращали на это внимание.

Вот как выглядят типичные дашборды, который сделали бизнес-пользователи (таблицы с хайлайтами) или аналитики (много разбивок и комплексные показатели):

Почему так происходит
На мой взгляд основная проблема в том, что визуализация данных требует большого кол-ва навыков из довольно противоположных областей. Получается так, что ребята, которые учатся на дизайнеров редко изучают статистику и основы бизнес-анализа, а аналитики наоборот ничего не слышали про теорию близости или композицию. Поэтому найти классных специалистов очень сложно. Когда подбирал людей в команду я решил составить матрицу компетенций по визуализации данных — это реально помогает понять что спросить на собеседовании.

Навыки для визуализации данных

Сделаю оговорку, что я говорю больше про визуализацию для бизнес аналитики, а не журналистику, дата-арт или что-то такое. Я выделяю такие основные навыки (порядок без приоритета, по мне все одинаково важны).

Больше «дизайнерские»

Визуализация данных
«Тафти скилз» — минимизация чернил, принципы визуального кодирования данных, принципы оформления графиков.
Читать: Тафти, Манзнер, Блог Тани

Графический дизайн
Правила верстки, композиция, модульные сетки, цвета и типографика, адаптивный дизайн, работа с динамичным контентом (изменение данных в графиках).
Читать: Советы на сайте Бюро и книги, которые там рекомендуют.

Дизайн интерфейсов и UX
Выбор подходящих элементов управления, паттерны использования UI элементов, сценарии работы.
Читать: Раскин, Норман

Сторителлинг
Нарратив анализа данных в дашборде, выделение идей и их презентация, аннотации, принципы журналистики данных и построение пирамиды Минто.
Читать: Минто, Роэм, Нафлик

Больше «технические»

Инструмент
Технические знания инструмента и сode style: лучшие практики совместной работы с кодом, источниками данных. нейминга и поддержания порядка. Тут для каждого инструмента своё, по Табло рекомендую смотреть их официальные обучалки. Читать про организацию кода: Фаулер

Основы статистики
Распределения, медианы, доверительные интервалы и стат значимость, понимание расчетов метрик и их иерархий, понимание аддитивных и неаддитивных показателей. Читать: Уилан.

Бизнес-навыки
Управления продуктом, знание предметной области и здравый смысл: сбор требований и постановка задачи, управление ожиданиями и т. п. Читать: Советы Бюро и рекомендуемые там книги.
  
Каждый из этих навыков тянет на отдельную профессию, и я, например, ещё не успел прокачать все из них до прям хорошего уровня, но так как, чаще всего у аналитиков развиты больше «технические» навыки, то даже обладая средними «дизайнерскими» навыками я чувствую, что это позволяет делать продукты на голову выше, чем у многих ребят. Поэтому, если вы аналитик или технарь, то прокачайте дизайнерскую часть хоть немного и будете сильно круче и конкурентнее на рынке. А вот если вы дизайнер, то знайте, что в технических областях вас может ждать прям мега успех. Мне почему-то кажется, то технические навыки прокачать проще, но у меня байас, я сам вышел из инженеров и мне дизайн дается сложнее.

Используя этот поход мы для своей команды составляем уровень текущих навыков и верстаем матрицу компетенций, а далее план развития для каждого. Вот пример матрицы компетенций, в кадждом столбце член команды:

Матрица компетенций

Давайте знакомиться + Канал в телеграмме

Я понял, что хочу рассказать немного больше про себя читателям этого блога, откуда появился блог и почему его может быть стоит читать. И ещё анонсировать канал в телеграмме, куда в основном буду просто дублировать ссылки на блог. Кажется, что просто блог уже не круто и не удобно. =) На самом деле канал мне видеться просто удобным способ подписаться на блог.

Откуда блог
Я начал веси этот блог аж в 2015, вот первая статься с дисклеймером. Моя идея была — научится визуализировать данные и просто писать про это, больше «для себя»: я собирал ссылки, делал обзоры книги и т. п. Потом я много экспериментировал с созданием разных мини-проектов и просто постил их в блог. Сейчас я хочу больше делиться систематизацией тех знаний, что получил за это время и какими-то реальными примерами из жизни. Ещё есть всякие идеи про подкасты, обзоры вакансий и какие-то групповые активности, но появятся ли они в реальной жизни не знаю.

Что есть/будет в блоге и канале
Редкий авторский контент про визуализацию данных, дизайн дашбордов и работу с Табло. В канал буду иногда постить ссылки на что-то полезное, что ещё не засветилось в остальных каналах, не хочу просто пересылать новости между чатами. В основном статьи будут про дизайн дашбордов, разработку BI систем, как продукта, обзоры книг, и меньше про техническую часть.

Вот примеры того, что можете увидеть:
— Теория: Навыки для визуализации данных, Шаблоны верстки дашбородв
— Мини-проекты: Тафти в Табло, Обзор вакансий в области BI
— Обзоры книг: Книга «Visualization Analysis & Design», Книга «Графики, которые убеждают всех»

Про меня
Я живу в Мск, люблю визуализацию как работу и хобби, прям получаю кайф от классных визуализацией и инструментов. У меня странный карьерный путь и я набрался всего разного из очень разных сфер бизнеса, это часто помогает мне в работе и жизни: могу смотреть на задачи с очень разных сторон. Ещё играю на бас гитаре и у меня есть пёс))

Сейчас я руковожу командой визуализации данных в Я.Такси: управляю системой отчетности, как продуктом; делаю дизайн гайды и дашборды; обучаю коллег Табло и визуализации. Раньше руководил разработкой BI SaSS продукта в Фармакей и проектами в Лаборатории Данных. В прошлой жизни работал бизнес-консультантом и научным сотрудником. Пока защищался и стал кандидатом наук, как раз и полюбил датавиз — большая часть тезисов в диссере были построены на базе визуального анализа данных.

Ещё веду вместе с Таней Бибиковой Лабораторный курс и предмет про Данные и визуализацию в школе дизайнеров Бюро Горбунова.

Дисклеймер
Я пишу редко и не очень грамотно. Если вам нужен регулярный контент или бесят очепятки, то сорри)

Ссылка телеграмм канал — https://t.me/revealthedata

Если вы вдруг это всё прочитали, присоединяйтесь и пишите в комментариях откуда вы знаете про этот блог и чем занимаетесь.

Книга «Графики, которые убеждают всех» и курс «Интерактивные графики для вашего сайта»

Так получилось, что последние две недели у меня проходят под эгидой Саши Богачева — я проходил его курс и читал его новую книгу. Хочу поделиться впечатлениями.

Кратко — всё круто, я рад, что Саша делает такой классный контент на тему визуализации. В России по пальцам можно пересчитать людей, которые это делают в принципе, ещё меньше, кто делает это хорошо. Всем рекомендую купить книгу и сходить на курс.

Подробнее с набором аргументов и мыслями, что стоит ожидать и какие есть плюсы и минусы.

Про книгу
У книги классная обложка =)) Но пока можно купить только электронный вариант книги. Покупайте электронную версию и тогда повысится шанс, что она выйдет и в бумаге.

В целом книга позиционируется для всех, кто делает графики. В основном для презентаций и журналистики. В ней совсем нет про графики для анализа данных, рассказывается именно как подать результаты проделанной аналитической работы и как донести эту мысль до аудитории.

Вот из каких глав состоит книга:
Глава 1. Пример было/стало. Общее понимание процесса
Глава 2. Понимать свою задачу и аудиторию
Глава 3. Формулируем сообщение
Глава 4. Когда визуализация данных не нужна
Глава 5. Как устроена визуализация данных, виды графиков
Глава 6. Основные виды взаимоотношений между данными, как их визуализировать и чем заменять в сложных случаях
Глава 7. Ошибки в визуализации данных
Глава 8. Как сделать график, наглядно доносящий ваше сообщение

Что понравилось:
— Книга интересная, прочитал за три вечера, читать не скучно.
— Книга нормально и удобно читается даже в электронном варианте на телефоне. Кажется, что Саша это продумал и все графики изначально заточены хорошо выглядеть на всех устройствах.
— Личная история Саши и примеры из совсем необычной отрасли — медицины. Кажется, что можно было даже пускать эту тему красной нитью через все главы.
— Примеры Было-Стало. ИМХО самое полезное в книге.
— Много мелких приемов и правил. Можно сделать чек-лист на проверку графика по этим пунктам.
— В целом консистентное изложение и со многими мыслями в книге я полностью согласен. Много классных отступлений формата «но бывает и так можно/нужно сделать». Показывает, что Саша широко и внимательно думает над правилами и приемами, которые предлагает и главное не запирает в них читателя: «Чаще всего делайте „так“ и „так“, но что-то может пойти и по-другому.»
— Классный раздел с частыми ошибками в визуализации.

Чего не хватило:
— БОЛЬШЕ, БОЛЬШЕ ПРИМЕРОВ! Примеры очень классные и было бы правда круто увидеть их ещё больше в книге. Особенно не хватило их в некоторых «лайфхаках» типа раздела про теорию близости или цвета.
— Часто говорится, что нужно обращать внимание на аудиторию и формат, с которого она будет воспринимать сообщение, но при этом нет примеров как именно это делать. Сейчас очень не хватает, например, правил и примеров, как делать графики для тех же самых мобилок.
— Я не до конца понял структуру книги. Кажется, что было бы здорово в конце повторить ещё раз основной алгоритм с ссылками на предыдущие главы для каждого шага алгоритма.
— Книга довольно короткая, некоторые разделы в конце книги на 1-2 абзаца и прям иногда не хватает примеров. Кажется, что в изначальных планах было желание рассказать о большем, судя по содержанию у Саши в блоге.

Понравившиеся и запомнившиеся мысли:
«Чем больше у проекта ограничений, тем проще вам работать» — идея про то, что лучше сначала хорошо понять целевую аудиторию, задачу, форматы и технические ограничения, с которыми вы будете работать. If you fail to prepare, you prepare to fail и вот это всё.

«Чаще всего с помощью визуализации мы пытаемся понять, какие из значений больше или меньше других и в какой степени» — метко и просто.

«Я не видел ни одного человека, которому помогли бы чарт-чузеры, или чтобы кто-то реально ими пользовался. Они интересны для ознакомления, но пользоваться ими не рекомендую» — я тоже не видел и рекомендую пользоваться скорее как библиотекой или для вдохновения. Иногда можно придумать и свой формат графика. =)

В целом, к прочтению книгу крайне рекомендую.

Примеры До-После

Про курс
Я не знаю сам Саша придумал такой формат, или где-то подсмотрел, но это просто огонь. Это был челлендж — 9 уроков с домашкой каждый день. Не прислал домашку → выбыл из курса. Прям огонь, прям хочу так же. Хороший стимул, чтобы делать домашку для слушателей, темп интенсива и много обратной связи от преподавателя. Очень понравилось.

Курс практический, про два инструмента — Datawrapper и Flourish. Это простые инструменты куда ты заливаешь данные и получаешь на выходе графики выбранного тобой типа. Я такие инструменты не очень люблю, они сильно ограниченны форматами и в них мало настроек. Флориш не понравился совсем, странный и на выходе не очень опрятный продукт. А вот Datawrapper очень даже зашёл. Больше всего тем, что это прям готовое решение для публикации графиков в статьи. Очень круто оформлены графически и типографически, учтено куча мелких приятных вещей и на выходе получаются очень приятные графики. Ниже будут примеры работ.

Что понравилось:
— Формат челленджа
— Индивидуальная и групповая обратная связь от преподавателя на каждую домашку
— Приятная атмосфера в рабочем чате

Что улучшить:
— Не хватало немного теории про то как оформлять графики
— Не самая удачная платформа для курса, сложная навигация и не очень приятный интерфейс
— Очень много было про коронавирус, мне приелась тема

На курс советую сходить даже тем, кто не планирует особо использовать эти инструменты в работе. Он отлично сочетает в себе цена/качество, темп и объем материала.

Итого
Курс + книга = идеальное комбо. В книге теория, на курсе практика. Мне повезло, что я одновременно попал на курс и в это время вышла книга.

 
Вот несколько работ, которые у меня получились на курсе. 
Datawrapper
 

 

 
  

 

   

 

 
 
 
Flourish
 
   

 

 
 
   

 

Шаблоны верстки дашбордов

Сейчас много приходится работать с различными дашбордами для бизнеса: делать самому или помогать придумывать коллегам макеты. Выработались некоторые стандартные шаблоны под разные задачи, хочу ими поделиться.

Условно я делю дашборды по решаемой ими задаче:
— Узнать что-то про определенную сущность (заранее знаю что хочу увидеть).
— Получить какой-то инсайт, не зная что именно ищу. Или сделать выводы, имея в голове определенный алгоритм поиска.
— Отслеживать операционные данные на «ежедневной» основе.

Шаблон «Страница сущности»
Задача: Узнать что-то про определенную сущность (заранее знаю что хочу увидеть)

Эта задача может быть в двух вариантах. Первый — когда сущность, которой вы интересуетесь можно определить в один клик (например, конкретный город из списка), или это какая-то сложносоставная сущность, для которой потребуется выделить несколько срезов (оборот продаж в определённом городе, определенного товара в определенный месяц, то есть потребуется применить несколько фильтров). Примером из обычной жизни будет поездка в другой город. Если вы турист и едете туда впервые, вы хотите узнать сводную информацию по этому городу и смотрите путеводитель — «страницу», где описана вся основная информация про этот город. Чтобы попасть на такую страницу вам было бы достаточно выбрать город из списка. Второй вариант задачи — вы уже были на каком-то курорте, но хотите посмотреть температуру воды за конкретные даты. Здесь вам понадобится выбрать и город, и даты, и саму метрику — температуру воды.

В первом случае можно использовать шаблон типа «лонгрид» или «сайт с закладками». При этом выбор ключевой сущности происходит в самом начале или ещё до начала работы с дашбордом (ссылка с фильтром). Это аналогично страницы на фейсбуке: вы нашли человека и видите все его метрики: когда родился, где учился, где работает, что сейчас постит. То же самое в бизнесе — вы региональный менеджер и отвечаете за город, попадаете на страницу города, а там продажи в разных разрезах, кол-во поставщиков, карта с магазинами и т. п. При этом в качестве сущности может быть не только что-то физичное, но и какая-то метрика. Например, вы следите за доходностью в разных разрезах: по городам, по продуктам и т. п.

Рецепт: «лонгрид» или «сайт с закладками», в которых есть всё про выбранную вами сущность в разных разрезах. Первый этаж или вкладка с овервью, остальные с детальной информацией по каким-то разрезам. Основных фильтров мало и они живут в шапке дашборда, есть доп. фильтры на каждом этаже/вкладке для тонкой настройки. Интерактивность такого отчета лучше сделать средней и в основном с помощью фильтров. Если система позволяет делать асинхронную загрузку и якорные ссылки на отдельные этажи «лонгнрида», то я бы выбрал «лонгрид». Если система так не умеет (например, Табло), то лучше делать «сайт с вкладками», желательно умещая каждую вкладку на один экран (но и лонгрид можно делать, нужно смотреть конкретные кейсы). Классно иметь такие страницы на разные бизнес сущности и делать кросс-линки между собой.

«Лонгрид»
«Сайт с закладками»

Когда мы хотим изучить какой-то узкий срез и выбрать его в один клик не получается, то лучше использовать другой подход. Часто пример такого среза — сочетание метрика-«место»-время: хочу посмотреть прирост продаж год к году в городе Б за месяц X. В таком случае хорошо работает шаблон: «утром деньги, вечером стулья», когда мы просим пользователя сначала выбрать какие-то параметры и после этого показываем ему данные. Фильтры располагаем слева, справа результат (согласно направлению чтения). Пока пользователь ничего не выбрал, можно показывать общие данные по тоталу или другую полезную информацию, например топ-10 чего-то с наибольшим изменением к предыдущему периоду и т. п. Примером из обычного мира будет сайт с билетами в кино: вы выбираете фильм → время → место в зале.

Рецепт: Слева фильтры → справа результат. Какие-то глобальные фильтры, которые применяются редко и могут быть сохранены заранее для группы пользователей, можно расположить в шапке. Такой дашборд лучше умещать на один экран.

«Утро деньги, вечером стулья»

 
 
Шаблон «Аналитический инструмент»
Задача: Получить какой-то инсайт, не зная что именно ищу. Или сделать выводы, имея в голове определенный алгоритм

Такая задача возникает, когда вы хотите исследовать какую-то область бизнеса, найти какие-то взаимосвязи и принять решение. Или понять как принятые ранее или планируемые действия повлияли или повлияют на бизнес.
В этом случае важно видеть общую картину и иметь возможность провалиться ниже для детального анализа. Такие инструменты подходят для задач, для которых дорого делать ML и подобные алгоритмы, но при этом «слепые» решения на интуиции будут неэффективны. Дизайн для таких инструментов, пожалуй, одна из самых трудных задач среди всех описанных в статье шаблонов и всегда очень сильно затачивается под задачу.

Примером задачи может быть такой кейс. Предположим, что вы отвечаете за поставки в магазины какого-то города. На прошлой неделе произошел сбой в одном из распределительных центров. Вы хотите понять отразилось ли это как-то на работе магазинов. При этом вы не знаете точно за какой именно метрикой будете следить, вам нужно проанализировать разные метрики и сделать вывод. Примером из обычного мира будет сайт с афишей или карта дешевых авиабилетов, когда вы еще не решили куда лететь, но хотите посмотреть какие бывают варианты. В UX такое называется discovery сценарием.

Ещё очень похожей задачей будет, если у вас в голове уже есть алгоритм, которым можно воспользоваться для того, чтобы сделать вывод. Тогда нужен или просто удобный инструмент, чтобы это сделать быстро и наглядно, или всевозможные инструменты what-if анализа. Их тоже очень класно показывать через визуализацию данных, особенно если вы следите сразу за несколькими сложными сценариями с несколькими переменными.

Рецепт (краткая версия): Разбираемся в бизнес-задаче и какими метриками описывается эта задача. Здесь важно идти от того, что происходит в реальности, к тому как это превращается в метрики и срезы. Если можем, то выбираем главные и вспомогательные метрики. Хорошо, если можем следить за изменением какой-то одной метрики, чтобы понять общий ход событий, а на остальные смотреть, если нужно прокопать причинно-следственные связи. Делаем несколько визуализацией в разных срезах. Чем мельче детализация, тем лучше (вместо средних продаж, показываем значения продаж каждого магазина и т. п.). Слева основные визуализации, справа доп. информация и различные срезы по основной метрике (если есть). Много интерактива — графики фильтруют друг друга, возможно проваливаемся в другие дашборды или показываем доп. графики и срезы при наведении. Сам «шаблон», по сути, не шаблон, а подстраивается под каждую задачу.

Рецепт (полная версия) — задачи такого класса ИМХО хорошо описаны в алгоритме Лаборатории данных Тани Бибиковой. Подробнее в статье на Хабре или на учебном курсе .

«Аналитический инструмент»

 

 
Шаблон «Приборная панель»
Задача: Отслеживать операционные данные на «ежедневной» основе

Это как раз те самые дашборды, про которые говорят упоминая «дашборд». Это системы мониторинга, основная их задача — как можно быстрее дать понимание текущей ситуации. Это тот случай, когда, приходя на работу с утра, нужно взглянуть на дашборд и понять, что происходит в вашем королевстве. Недавно для своей команды мы тоже сделали такой дашборд и повесили на стенку телевизор. Я понял, что недооценивал этот инструмент и он работает очень классно. Работа команды как на ладони при таком подходе. В обычной жизни такие вещи встречаются нам в виде спидометров автомобилей, виджетов с остатками на счету мобильного и личными кабинетами банков.

Рецепт: Разрабатывая дашборд для операционного мониторинга точно придется разбираться с иерархией метрик и выбрать что-то, за чем хотим следить в первую очередь. Важно давать контекст, а не только текущие значения (спарклайны с динамикой, значки приростов, средние и референсные значения). Хорошо работают регулярные структуры и small multiples, если пользователь отвечает за группу метрик. Такие отчеты должны быть наименее интерактивны, но могут вести на более детальные отчеты в виде «страниц сущностей» и т. п.

«Приборная панель»

Вместо вывода

Я постарался рассказать свои идеи, но конечно же они не покрывают все задачи и не могут являться стандартом. Можно смешивать их, они отлично работают в комбинации, а можно делать как-то совсем по-другому. Основная идея из серии «капитана очевидность»  — определяйте задачу вашего пользователя, стройте дашборды вокруг них и старайтесь при этом выделять повторяющиеся паттерны.

Каналы про визуализацию данных и Табло

Понял, что сейчас получаю 90% контента из каких-либо каналов и чатов в телеграмме и других лентах. Хочу поделится тем, что читаю.

Чаты
Дата-виз чат — чат про визуализацию данных, много общения с коллегами. Часто мелькают интересные обсуждения и ссылки.

Чат Tableau — чат пользователей Табло в России, огромное кол-во пользователей и активности. Коллеги часто помогают друг другу, задают вопросы и делятся работами. Так же есть более тухлый, но международный чат.

Чат про открытые данные — можно спросить где и как найти данные открытые данные о России

Чат про журналистику данных — можно узнать про новые проекты или стипендии и гранты

Слак международного сообщества — разные чаты для обсуждения всего про визуализацию. Чтобы попасть в каналы, нужно зарегаться на сайте сообщества.

Каналы
Канал «Дашбордец» — про проектирование дашбордов и смежные темы

Канал «Инжинирг данных» — про облачные хранилища данных, BI и около этого.

Канал Алексея Новичкова — про инфографику и инструменты

Канал Андрея Кормацкого — про городские данные и урбанистику

Реддит про визуализацию — примеры визуализаций со всего мира, часто шлак, но иногда попадаются классные проекты которые больше нигде не найдешь

Канал Александра Богачева — про журналистику данных

Канал Андрея Дорожного — про журналистику данных

Канал «Настенька и графики» — редко, но очень метко про визуализацию данных и проекты

Твитер Натальи Киселевой — чудесные комиксы про датавиз

Дата.csv — ссылки на новые проекты по журналистике данных
«Журналистика данных» — ссылки на новые проекты по журналистике данных

Интерактивные визуализации от New York Times — без комментариев )

Канал «Рациональные числа» — статистика и данные из разных областей

Конкурсы Malofiej и Information is Beautiful

Каналы про Табло от вендоров — https://t.me/tableau_ru, https://t.me/TableauRussia, https://t.me/Tableauinrussia

Блоги
Зарубежных коллег я больше читаю в блогах, так как их нет телеграмме. Если вам больше нравиться формат блогов, то писал о них в этой статье или можно сразу подписаться на все на feedly.

Тафти в Табло

На Новый год сделал себе подарок — купил все книги Эдварда Тафти в бумаге. Сейчас перечитываю их. Книги вдохновили меня сделать в Табло визуализации в стиле графиков из книг.

Вообще всем советую прочитать эти книги. Больше всего я люблю, что в них описаны как довольно философские, так и практические принципы. А особенно круто, когда философские принципы обернуты в четкие формулы. Например, принцип data-ink ratio — соотношение чернил, которые передают суть данных и всех остальных чернил, которые есть на графике.

Для визуализации на экране заменяем «ink» на «pixel» и можно замечательно считать этот KPI.

Я сделал графики на основе данных с графика Ганса Розлинга и показал такие идеи из книги:
— Облегченные версии ящичных диаграмм, где нет «ящиков», а остаются только «усы» и центральная отметка среднего;
— Дополнение вспомогательных элементов графика (например, осей) дополнительными данными: проекциями точек и описательной статистикой в виде ящичных диаграмм;
— Графики с высокой плотностью данных (slopе chart и «подложка» из линий на тайм-сериях);
— Диаграмма стебель-листья, где точками являются сами данные (значащие цифры после запятой). Такой график я уже делал когда в первый раз читал Тафти. Получился отдельный мини-инструмент. Внизу на его страницы детальное описание как он устроен;
— Облегченные версии сеток и бар-чартов;
— Компактные спарклайны для отображения проигрышей/выигрышей или приростов/падений.

Вот какие графики у меня получились:

Интерактивная версия по клику на картинку и ссылке https://public.tableau.com/views/TributetoEdvardTufte/TributetoEdvardTufte

Трекинг жизни

Я давно собираю данные о своей жизни. Иногда в них находятся классные инсайты, которые помогают её улучшить. Мой любимый пример — это то, как я купил себе беспроводные наушники для созвонов по работе и сразу стал ходит на 40% больше по кол-ву шагов. Оказалось, что мне во время разговора отлично «гуляется» по комнате и можно за два совещания пройти 4-5 тысяч шагов. Ещё я смотрю на свои привычки по сну, чем в основном занят в рабочее время и т. п. Проблема со всеми этими метриками для меня была в двух вещах:
— разные данные живут в разных приложеньках и устройствах, смотрю на эти данные по-отдельности;
— все данные собираются автоматически, вроде бы здорово, но это приводит к тому, что они лежат мертвым грузом и руки у меня до них доходят в лучшем случаи раз в год на новогодних праздниках.

Вот, что я придумал, чтобы это исправить. Я сделал гугл-форму, куда последние полтора месяца заношу данные из всех приложений, которыми пользуюсь. Плюс дописываю комментарии и другие не структурированные данные. Теперь я каждый день «перевариваю» свои данные так как их надо внести в форму. По сути, это та самая «осознанность», но на уровне контроля данных. Я успеваю вспомнить всё, что было вчера, обдумать это и переварить. Плюс у меня теперь есть источник в виде гугл-таблицы, куда я подтянул всю историю и могу подключить это к Табло → получать живой отчет, который сам обновляется каждый день. Получился вот такой дашборд. Верстал изначально под мобильный, так как смотрю его там.

Как и что я трекаю. Вдруг кому-то полезно.

Шаги, вес, сон — Mi Fit + Mi Band + Mi Scale. По-моему идеальное сочетание цена/качество, особенно браслет меня очень радует. Само приложение странное, но не так давно появилась классная скрытая опция, для экспорта всей истории данных.

Время за компом в разбивке по проектам — Timecamp. Чудесный бесплатный таймтрекер. Особенность в том, что каждому приложению, сайту/поддомену или названию папки можно задать свой проект. В итоге получается не разбивка по типам приложений или названию приложения, а именно проекты или области, над которыми работаешь. А в каждый проект можно добавить более детальные задачи. Для каждой задачи задается «ключевое слово», которое трекер ищет в названии программы или сайта и так определяет, что ты занимаешься именно этой задачей.

Есть встроенные репорты в разных разбивках и можно строить кастомные таблицы, по типу сводных таблиц в Экселе. Единственный минус — не трекает время в мобильном. Энивей, очень крутой сервис.

Время за телефоном — измеряю с помощью Rescue time. Неплохой трекер, данные бьются с таймкемпом, но есть разбивка только по приложениям/сайтам (без проектов) и бесплатно дают данные только за последние пол-года. Для мобилки альтернативы нормальной не нашёл. Если знаете хорошее — порекомендуйте.

Калорийность и питание — приложение MyFitnessPal. Удобное и понятное приложение, есть сканер штрих-кода продуктов, что супер удобно. Часто есть всякие редкие продукты, которые не ожидаешь там увидеть.

Не структурированные данные — гугл-формы. Очень удобно, что сохраняют данные в таблицы, к которым можно подключиться в Табло.

Если кому-то нужен шаблончик дашборда в Табло — пишите, скину книгу.

Ранее Ctrl + ↓