Rose debug info
---------------

Reveal the Data

Блог Ромы Бунина о визуализации, Tableau и развитии BI-систем
канал в телеграмме | подборки примеров | подкасты и видео

Шпаргалка по Quick Table Calculations

Статья подготовлена Русланом и немного подредактирована мной. Материал создан рамках менторства и прокачивания навыков Руслана как BI-разработчика. На нашем перовом созвоне я увидел, что у Руслана нет легкости в обращении с быстрыми табличными вычислениями, поэтому одно из заданий было разобраться с каждым видом расчета, чтобы прокачать этот навык. Он подготовил шпаргалку, которая будет полезна всем, кто только начал изучать Табло.

Задание

Придумать по одному бизнес кейсу для каждого Quick Table Calcs, которые есть в Табло. Описать какую задачу решает этот кальк, описать особенности этого калька (если есть).

Решение

Книга на Табло Паблик с примерами

Общая особенность формул: Для всех table calcs можно уточнять размер партиции (Таблица, панель, ячейка) и направление расчета, если партиция по структуре не ряд, а таблица. Направления — down, across и т. д.

Running total (Включает в себя быстрые YTD total, YTD growth)

Краткое описание

  • Агрегация нарастающим итогом.
  • YTD total. Суммы нарастающим итогом, разбитые по годам
  • YTD growth. Приросты к прошлому году нарастающим итогом, разбитые по годам

Формула
RUNNING_SUM(SUM([Sales]))

Особенности

  • Для агрегации можно использовать sum, avg, min, max
  • Расчет может быть основан на другой расчетной метрике (Secondary calculation). Т. е. можно сделать например нарастающий итог процента от общего.
  • Для того чтобы работали функции YTD и YTD Growth в виде обязательно должны быть год и месяц
  • Нет расчета RUNNING_COUNTD что очень не удобно для подсчета когорт уникальных пользователей

Кейсы

  • Все сценарии когда нам нужно смотреть на наши цифры нарастающим итогом. Например сравнивать факт и план, если план дается нарастающим итогом, а не разбит по периодам
  • Можем строить график парето. Понимать соотношение кол-ва элементов и их вклада (X% товарных позиций приносят Y% выручки)
  • Риал тайм цифра. Например количество открытых тикетов, которое складывается из всех открытых и закрытых тикетов за все время или количество проданных билетов за все дни

Difference from

Краткое описание
Разница текущего значения и выбранного (чаще всего предыдущего) в абсолютном выражении. Насколько приросли к выбранному периоду в абсолюте.

Формула
ZN(SUM([Sales])) — LOOKUP(ZN(SUM([Sales])), -1)

Особенности
Работает опция «Relative to» — выбранным значением может быть Previous, Next, First или Last

Кейсы

  • Можем использовать, чтобы сравнивать результаты текущего периода и прошлого
  • Рассчитывать разницу «отставания» между двумя категориями. Полезно для постройки waterfall чартов или гантельных диаграмм

Percent difference from и Year over Year growth rate

Краткое описание
Аналогично предыдущему, только в процентном выражении. При этом предыдущее значение берётся по абсолюту, для учета случаем отрицательных значений.

Формула
(ZN(SUM([Sales])) — LOOKUP(ZN(SUM([Sales])), -1)) / ABS(LOOKUP(ZN(SUM([Sales])), -1))
 
Особенности

  • Работает опция «Relative to» — выбранным значением может быть Previous, Next, First или Last
  • Расчет YoY доступен только если в виде есть год и месяц.

Кейсы

  • Year over Year growth rate. Сравнение результатов текущего периода и аналогичного периода год назад
  • График доходности актива. Если хотим смотреть % изменения относительно первого значения.

Percent from

Краткое описание.
Сравнение текущего значения и выбранного в процентном выражении. Какой % составляет текущее значение от выбранного.

Формула
ZN(SUM([Sales])) / LOOKUP(ZN(SUM([Sales])), -1)

Особенности
Выбранным значением может быть Previous, Next, First, Last
 
Кейсы

  • Расчет выполнения факта от плана в длинной структуре данных
  • Сравнение нескольких категорий в процентном соотношении

Percent of total

Краткое описание
Доля от общего.
 
Кейсы

  • Можем использовать чтобы понимать вклад отдельной категории продуктов в общие продажи
  • Строить нормированные бар-чарты и ареа-чарты

Rank

Краткое описание.
Порядковый для среза посчитанный по убыванию или возрастанию агрегата какой-то метрики

Формула
RANK(SUM([Sales]))

Особенности
Можно выбирать формулу выбора номера при совпадающих значения (Competition, dense, unique, modified competition)

Кейсы

  • Рейтинг с изменением по времени (бамп чарт)
  • Сортировать и фильтровать данные когда нельзя фильтр по TopN

Percentile

Краткое описание
Процентиль — определяет в какой процент от общего попадает значение для упорядоченного по метрике массива.

Формула
RANK_PERCENTILE(SUM([Sales]))

Кейс
Отобрать все записи, входящие в топ N% значений

Moving calculation

Краткое описание
Скользящая аггрегация. Вместо одного значения берет для расчета несколько, выбирая их относительно текущего

Формула
WINDOW_AVG(SUM([Sales]), -2, 0)

Особенности

  • Для агрегации можно использовать sum, avg, min, max
  • Выборка задается окном «от и после» текущего значения
  • Текущее значение и случаи когда не нет полных данных для окна можно исключать.

Кейсы
Если данные показывают большую вариабельность или имеют сезонность, то часто общая динамика непонятна. В этом случае используется скользящее среднее.

Дополнительные материалы

Видео от Энди Крибела
Материалы Табло Марафона
Официальная документация

Последовательный выбор двух параметров одним экшеном

Редко пишу такие технические статьи про Табло, но недавно придумал довольно интересное решение, захотелось им поделиться.

Идея: при кликах в один и тот же график менять последовательно два параметра — первый клик меняем один параметр, второй клик — меняем второй параметр. Например, можно использовать для выбора метрик для двух осей скеттер плота или придумать какие-то другие более необычные кейсы.

Давайте рассмотрим как это сделать. Эта инструкция подойдёт только для данных в широком формате, при подключении статичных файлов перевернуть таблицу можно при помощи встроенной функции Pivot.

1) Делаем счётчик кликов в график. Для этого создаём INT параметр Counter и поле Counter + 1, которое будет прибавлять количество кликов

2) Создаем два одинаковых параметра для выбора метрика. Это текстовые параметры, которые берут значения из поля Pivot Fields Names при открытии книги.

3) Создаём поля, которые проверяют какой сейчас номер клика в визуализацию и возвращают либо то же самое значение, что уже было выбрано, либо выбирают новое.

Selected Metric 1 Check // Название поля
IIF([Counter]%2=0,[Pivot Field Names],[Select Metric 1]) //Делает проверку остатка от деления на 2, если равно нулю, то клик «четный» и надо поменять значение, если «нечетный» то возвращаем текущее значение параметра

Для выбора второй метрики будет зеркальная формула:

Selected Metric 2 Check 
IIF([Counter]%2!=0,[Pivot Field Names],[Select Metric 2])

С помощью остатка от деления можно считать и третий, и четвертый клик и т. п.

4) Делаем расчетные поля, которые подставляют нужную метрику в зависимости от параметра. Эти поля мы и будем выводить на график.

Selected Metric 1 
IIF([Select Metric 1]=[Pivot Field Names],[Pivot Field Values],NULL)

Selected Metric 2
IIF([Select Metric 2]=[Pivot Field Names],[Pivot Field Values],NULL)

5) Создаём график с которого будет происходит управление. Я сделал для этого фактоиды. Важно положить все расчетные поля в details, чтобы мы могли использовать их в Parameters Actions.

6) Создаём график в котором будут выбираться метрики

7) Делаем дашборд и настраиваем три параметр экшена. Первый про изменение счётчика при клике.

Два вторых про изменение выбранной метрики

8) Наводим марафет и добавляем всякий приятности типа подсказки, деселекта хайлата и т. п. Получаем рабочую версию. Можете покликать и посмотреть как будет меняться значение Counter и выбранных метрик для осей. На Паблике можно скачать книгу и покопаться как устроено.

___

Итоги
Рассмотренный кейс довольно специфичный и, наверное, не является лучшей практикой UX паттернов, но с помощью него хотел показать, что возможности Табло по сложным интерфейсам — очень большие. Используя параметр экшены и счётчики можно сделать почти всё что угодно. Например, выводить какую-то надпись, если кликнули больше 100 раз. =)

Использовал приём с двумя параметрами для вот этой работы, получилось довольно удобно, но работает не супер быстро, много точек на графиках.

Шаблон дашборда для Эгеи

Как-то раз мне написал Саша Михайлов и мы договорились сделать с ним совместный мини-проектик — шаблон для Табло в который смогли бы тянуть автоматом данные из движка для блогов Эгея (он же используется и для этого блога). Тянуть в лайве не получается, так как Табло Паблик не работает с базами данных (из платной версии можно без проблем подключиться), поэтому Саша сделал очень крутой ноутбук, который вытягивает данные из базы данных и перекладывает их в гугл-таблицы. А туда уже можно подключать Табло. Вот краткое описание работы с этим ноутбуком.

Я же сделал шаблон в Табло, его можно скачать с Табло Паблик и подставить туда свои данные. Для этого:

1. Скачайте шаблон с Паблика

2. Зайдите на вкладку Data Source и подмените в источнике гугл-таблицу на свою

3. В идеальной ситуации — это всё! Можно возвращаться на вкладку с дашбордом и сохранить работу, например, к себе на Табло Паблик. Если что-то пойдет не так — пишите, постараюсь помочь чем смогу.

В конечном результате получиться такой дашборд:

Визуализация процессов

Yet another post «Why dataviz matter». Пост из этой же серии про моего пса и змею.

Недавно разбирал фотки и наткнулся на прикольный кейс со старой работы. В прошлой жизни я был бизнес-конслуьтантом по улучшению процессов и занимался оптимизацией на промышленных предприятиях с помощью бережливого производства. Один из принципов этой методологии — визуализация процессов с помощью карт потока Value Stream Mapping.

История

Проект на газодобывающем предприятии — необходимо понять, что мешает работе и почему часто есть проблемы и простои оборудования на месторождении. Проводим первичный анализ и понимаем, что часто не хватает нужных запчастей. Разбираемся почему так происходит — оказывается процесс закупки (только договор + оплата, без доставки) может достигать до 70 рабочих дней! Топы предприятия не верят, что ситуацию можно как-то исправить и считают, что процесс закупки построен нормально.

Рисуем карту потока с рабочей группой

Анализируем процесс — запираемся с рабочей группой в переговорке и строим карту потока с помощью стикеров. Получаем процесс состоящий из 60 шагов, задействующий 19 сотрудников и занимающий кучу времени. Даже на одну доску не уместился весь процесс. Оказывается, что больше всего теряется на согласования договора и других документов!

Печатаем карту

Переносим карту потока в электронный вид, чтобы аккуратно посчитать потери в деньгах, распечатываем на плоттере, склеиваем (так как карта умещаются только на десятке листов A2), идём на встречу к директорам и эффектно разворачиваем на гигантском столе в переговорке.

Это было одно из самых прикольных совещаний за мою карьеру — надо было видеть как удивились и сразу поняли все присутствующие неоптимальность процесса. Сразу увидели кучу блоков согласований, выстраивающихся в колонки на карте и потряслись самим масштабом процесса. У меня было полное ощущение, что случился «Aha-moment» и «Now you see it».

Улучшаем процесс

Очень быстро принялись верные решения — удалось удалить лишние этапы согласования, убрать лишние проверки и сделать новые стандартные формы документов. В итоге процесс стал занимать не 67 рабочих дней, а 33 и сэкономили компании очень серьёзные деньги.

Подводя итог — визуализация и отображение реального масштаба очень важны. Победой в этом кейсе — было именно решение распечатать эту карту потока, чтобы показать масштабы проблемы. Визуализация важна, даже если вы визуализируете не данные, а процессы и схемы.

Обзор стандарта IBCS

Давно хотел написать про этот стандарт, а тут выдался отличный повод — Антон Жиянов сделал отличную, читаемую версию этого стандарта. Антон, большое спасибо! Ещё у Антона куча крутых статей про проектирование интерфейса.

Я решил сделать обзор этого стандарта и рассказать своих мысли про него. Как и при рецензии на любую книгу, здесь рекомендую ознакомиться с оригиналом, а не только моим «кратким» содержанием, сам стандарт классный и заслуживает внимания. У меня скорее выдержка того, что запомнило именно мне. Вы, наверняка, увидите что-то своё.

Что такое IBCS (International Business Communication Standards)

Этот стандарт разработан Рольфом Хикертом, бывшим консультантом McKinsey и CTO нишевой немецкой BI-системы MIS. Основная идея стандарта — практические советы и семантические стандарты по дизайну отчетов и графиков. Стандарт распространяется бесплатно и доступен на сайте www.ibcs.com, но сделан там в очень неудобном формате. Почему так — думаю, что для того, чтобы заработать на продаже нормальной pdf версии, которая есть на сайте =) В целом это нормально и такие организации зарабатывают как раз на материалах, сертификациях и тренингах. Но выглядит это конечно немного смешно.

Стандарт состоит из семи разделов, посвященным разным аспектам дизайна дашбордов, дальше пройдемся по каждому из разделов и покажу, что мне понравилось, а что нет.

1. Convey a message

Этот раздел посвящен фундаментальным идеям и правилам. В нём перечислены полезные, но теоретические пункты: знай свою аудиторию, понимай цель визуализации, раскрывай и доказывай идею данными, подсвечивай сообщение на графике и текстом, делай сноски, комментарии и делай summary в конце презентации.
Всё это правильные идеи, но в большинстве случаев применимы только к презентациям, так как часто в операционных дашбордах невозможно заранее «сделать вывод», иначе и дашборд бы был не нужен.

2. Organize content

Эта часть стандарта посвящена последовательности изложения и структуре. Если говорить грубо, то весь раздел про применение принципа MECE, про повествование методами дедукции или индукции и визуальное отображение иерархичных структур. По мне получился ещё более «теоретизированный» раздел, чем первый. Самое полезное для дашбордов, как мне кажется, что не стоит забывать показывать полные данные по всем разрезам для полноты картины.

3. Choose proper visualization

Это раздел является классическим «чарт-чузером» для выбора подходящего типа диаграмм. Очень понравилось, что автор сводит задачи по-сути всего к двум типам — изменение во времени и сравнение категорий. В целом это реально 90% бизнесовых задач, которые можно решить и правда небольшим количеством графиков. Правда совсем не хватает точечного графика, фактоидов (KPI’s) и спарклайнов. И ещё сама стилистика графиков прям кричит на тебя тем, что рассчитана на печать и супер строгий минимализм. Я сам люблю минимализм, но тут он выглядит сильно outdated именно стилистически.

Понравились детальные описания каждого графика и его оформления, и практические советы как использовать правило близости в чартах.

Ещё более круто описано как делать таблицы, очень классно показано, как отделять столбцы разного вида, как подчеркивать группировки и т. п. Просто отличное руководство по верстке таблиц и идеи как их оформлять. В Табло такое сделать будет почти нереально, а вот если буду делать таблички в Экселе, то обязательно воспользуюсь этими идеями.

Мы только сошлись во мнении с коллегами, что можно спокойно убрать горизонтальные линии в каждой ячейке, и что на больших таблицах, такое оформление уже кажется довольно громоздким (третий пример в листалкк ниже).

Не понравился вот этот вид графиков, очень странные сгруппированные бар-чарты, кажется, что это очень неудобно читать и в варианте с треугольничком, и при наложении баров друг под другом.

А ещё стандарт не толерантный и прям запрещает делать некоторые виды графиков. ;—)

4. Avoid clutter

Следующий раздел полностью посвящен удалению non-data-ink. Тут не знаю, что особо сказать. Хорошие примеры, но довольно очевидные — убирайте лишнее и редактируйте текст.

5. Increase information density

Следующий раздел обратный — про повышение количества data-ink на графиках.

Здесь понравились те вещи, про которые я сам часто говорю, но мало где слышу. Что стоит увеличивать кол-во срезов, метрик и дат, не бояться уменьшать размеры графиков и делать таблички с встроенными графиками.

Не понравилось, что предлагают делать двойные оси и не очень понятные виды графиков.

6. Ensure visual integrity

Этот раздел посвящён тому как не обмануть зрителя при помощи масштаба и осей, что не стоит использовать логарифмические оси и делать бар-чарты не от нуля и т. п. Мне больше всего понравился вот этот пример. Про то, как совместить графики с одним масштабом, но когда есть какой-то срез сильно преобладающий над другими (обычно это Москва в бизнесовых данных).

Но очень сильно смутило предложение делать что-то подобное:

7. Apply semantic notation

Пожалуй самый интересный раздел, который как раз больше всего похож на стандарт. В этом разделе предлагаются идеи как соблюдать одинаковое положение элементов, маркировать одинаковые виды данных, и т. п.

Первая часть довольно скучная, хотя и супер полезная — пишите одинаково заголовки, делайте одинаковые шрифты и т. п.

А вот дальше начинаются очень интересные идеи, которые мне хочется как-то попробовать применить в работе, но пока не придумал как именно.

Идея № 1. Использовать для базовых метрик (данных) и расчетных метрик разные толщины линий и бар-чартов. Затея выглядит интересной, но пока не могу понять стоит ли того. И это точно сложно реализовывать и поддерживать. Но сама идея такого деления, по-моему, очень необычная.

Идея № 2. Использовать для обозначения факта, плана. прошлого периода и прогноза всегда одинаковые визуальные оформления. Факт — темная сплошная заливка, План — «пустотелая» заливка, Прошлый период — серая сплошная заливка, Прогноз — штриховка. Кажется, что это тоже очень прикольная идея. Такие «сценарии» существуют во всех бизнесах и это правда очень удобно. Но смущает реализация со  штриховкой и «пустыми» маркерами для линий плана.

Мы у себя такую унификацию тоже частично внедрили в внутреннем стайлгайде. Но хочу это ещё прокачивать.

Идея № 3. Использовать для разных скейлов, разные ширины баров. По-моему довольно элегантно. Хотя реализация снова будет довольно сложной.

Идея № 4. Использовать для абсолютных отклонений бар-чарты, для процентных пин-чарты (аля лолипопы). Всегда показывать оба сравнения для всех пар план-факт, факт-прогноз и т. п. Мне здесь больше всего нравится именно разделение абс. отклонений и процентных. Кажется, что довольно элегантное решение. Только сами пин-чарты мне не нравятся, делал бы вместо них, например, стандартные лолипоп-чарты.

Идея № 5. Для стандартных бизнесовых периодов типа YTD, MAT и т. п. завести отображение символами, чтобы быстро их показывать на графиках и таблицах. Мне этая идея очень нравится, как идея. Но всё-таки в реальном использовании я бы всегда писал начало и конец периода Jan’18 … Jan’19 и т. п. Мы у себя в стандарте делаем именно так.

Выводы и общие впечатления

Стандарт мне нравится. Это отличная сводка правил и интересных находок. Очень простая и понятная подача из свода правил и карточек формата «Don’ts and Dos». Он точно не подходит в формате «как есть» для дашбордов, есть спорные моменты и рекомендации и устаревший визуальный стиль. Используется через чур мало цветом, хотя очень круто, что основной — черный (мы у себя сделали так же). В целом много интересных идей, рекомендую к прочтению.

По-мимо самого стандарта на сайте есть ещё и гайдлайны. Можно прям брать и делать внутренние рекомендации по аналогии.

Есть неполные, но довольно близкие, реализации стандарта в Табло.

И ещё есть расширения для Excel и Power BI, которые позволяют работать по этому стандарту. Вот на этой страничке можно потыкать живые дашборды. Не всё идеально, но таблицы выглядят просто отлично.

Из забавного. В том году я делал длинный лонгрид про графики план-факта. Итоговый вариант получился довольно похож на вот эти графики ниже, хотя я тогда ещё не видел такую реализацию этих графиков в виде этого стандарта, нашёл только сейчас в плагине для Power BI.

Переверстка в Power BI

Ко мне в личку пришёл Владимир Шилов из Ростелекома и попросил взять в рубрику «переверстка» дашборд (точнее темплейт) в Power BI. Сначала я хотел отказаться, но потом решил «WTF, hold my beer!». Впервые переделал дашборд в этой BI-системе. Получился очень интересный лично для меня опыт. Решил собрать в этой заметке, что заметил на счет конкретно этого дашборда и Power BI в целом.

Этот дашборд является темплейтом и примером как можно оформлять дашборды. Владимир занимается развитием BI в компании и хочет улучшить внешний вид отчетов. Он сделал этот темплейт как пример, на которые могли бы ориентироваться сотрудники используя селф-сервис. Основная идея со слов Владимира — дать правильное оформление заголовка, фильтров и примеры визуализаций, которые могут быть использованы в дашбордах. Но само положение и размеры визуализаций в целом случайны.

Вот три исходных дашборда. Все данные фейковые и случайные, картинки публикуются с разрешения Владимира.

Дальше я подробно пройдусь по правилам, которые были нарушены и с помощью которых можно улучшить дашборд.

Выравнивание по центру

Такое выравнивание текста применяется в заголовках когда мы хотим привлечь внимание зрителя. Оно смотрится уместным на афише, вывеске или обложке книги. Использовать же выравнивание по центру для всех заголовков и элементов на дашборде — плохая идея. Получается много рваных краёв, а эффект привлечения внимания теряется и получается визуальный шум. Поэтому первое, что я сделал — поменял выравнивание всех заголовков, подзаголовков и фактоидов налево.

Подробнее про выключку по центру (это так называется выравнивание в типографике):
Заметка Игоря Штанга
Совет Михаила Нозика про смену выравнивания и ещё один, про выравнивание по ширине
Памятка верстальщика

Правило контраста и иерархии

Вся типографика на дашборде должна подчиняться правилам иерархии. Самым большим элементом должен быть заголовок дашборда, затем заголовки блоков и т. п.

В темплейте же получилось, что самым значимыми элементами являются фактоиды. Ещё много разных начертаний, хотя достаточно было бы двух-трёх.

Самыми контрастными по размеру и цвету получились тримеп, фактоиды и пай-чарт. Для диаграмм с большой площадью заливки лучше использовать пастельные вариант палитры, чтобы они не давили на зрителя своей «массой»

Видео про контраст от Михала Нозика
 

Правило близости, правило внутреннего и внешнего

Расстояния от края блока до элементов внутри него получились очень маленькими. Из-за этого элементы смотрятся слипшимися. Чтобы исправить это — нужно дать больше пространства между блоками.

Подробнее:
Разъяснение этого правила от Артёма Горбунова
Как теория близости работает в интерфейсе?

Фильтры без аналитики

Очень частый пример того, что фильтры в дашбордах используются не на полную мощность. Если вы даете пользователю просто фильтры или кнопки, вы не помогаете ему выбрать значение фильтра — он должен заранее знать, что он хочет посмотреть. Или начать перещёлкивать фильтры, пытаясь запомнить значения графиков, чтобы сравнить их между собой. Вместо этого я обожаю применять мини бар-чарты, которые можно кликать и они будут работать как фильтры, но при этом они будут давать возможность сравнивать значение метрики между срезами ещё даже ничего не выбрав. Можно показывать, например, значение за последний период или усреднение по всем периодам.

Применив принципы, которые описал выше, у меня получился вот такой результат:

Что я изменил:
— Выровнял всё по левому краю
— Сделал меньше контрасты между заголовком и фактоидами, унифицировал заголовки
— Сделал весь полу-черный текст черным
— Добавил больше пространства между блоками и убрал серую сетку (так как её сложно сделать при верстке в PBI)
— Фильтры выделил отдельной плашкой и кнопки заменил на мини бар-чарты
— Сделал пастельные цвета для тримапа
— Лого переместил на право, так как оно текстовое и плохо стыковалось с заголовком
— Сделал пропорции графиков более подходящими под их тип (да, графики были только примерами, но надо чтобы разработчики запоминали такие вещи из примеров)
— Убрал странные индикаторы в виде восклицательного знака в фактоидах

Power BI vs Tableau

Я занимался только версткой и оформлением, поэтому сравню именно эти аспекты.

Сам подход к верстке — отличается координально. С одной стороны, в Power BI, он гораздо более прост и привычен — полное ощущение, что работаешь с Power Point. А с другой, сразу ставит крест на нормальной адаптивности под разные экраны ноутбуков. Табло в этом плане круче.

Настройки оформления в Power BI сейчас довольно обширные (последний раз я трогал его года три назад), позволяют закрыть большинство кейсов. Мне только не хватило возможности настраивать внутренние паддинги для блоков. И вынесло мозг, что нельзя поменять цвет только части текста в строке.

Ещё выписал для себя список фич, которым прям позавидовал:
— Офигенные фильтры, которые при снятии всех галочек догадываются, что нужно показывать всё. Это очень удобно
— Крутая визуализация для факторного анализа (дерево метрик). Я такую в Табло два месяца делал, а тут бац и в два клика =(
— Копи-паст форматирования работает шикарно, а не как в Табло
— Группировки блоков на дашборде с помощью одной кнопки. Какой же кайф!
— Очень неплохие бар-чарт таблицы с правильным выравниванием цифр
— Можно вставить нормально ссылку в текст
— Умные подписи внутри тримапа при иерархии

Выводы

Power BI не удалось меня в себя влюбить, всё равно продукт прям так и предлагает тебе сделать плохо. Попробуйте сделать стиль таблицы «Броские строки», просто вырвиглаз 🤦‍♂️
Но в целом у меня от него сложились гораздо более приятные впечатления, чем три года назад. И оказывается, в нём можно делать очень даже неплохие по оформлению дашборды без миллиарда цветом и с аккуратным выравниванием. ;-)

Все населённые пункты РФ

Сделал визуализацию про все населённые пункты РФ, получилось красиво, напоминает карту рельефа.

68% людей проживают в городах. Больше всего в России деревень — 76 тысяч. На севере больше деревень и сёл, а на юге станицы и хутора, не знал о такой особенности. А ещё, я был уверен, что в России куча деревень с названием Бухалово. Оказалось, что это не так, их всего пять, зато целых 286 Александровок.

Давно хотел сделать что-то подобное, но не попадалось хороших данных. А тут ко мне пришли ребята из проекта «Инфраструктура научно-исследовательских данных» и попросили про них рассказать. Это портал, где они собирают и обогащают открытые данные, и дальше их бесплатно раздают. Я решил посмотреть, какие есть датасеты, наткнулся на этот и визуализировал его.

Качество датасетов на портале издалека выглядит лучше, чем на портале открытых данных РФ. Пока там немного наборов, но есть большие и интересные. Надеюсь проект правда направлен на благие дела, будут только полезные датасеты и он не сведётся к деятельности ради закрытия планов.

Видеоподкаст c Анастасией Кузнецовой

Записал подкаст с Анастасией Кузнецовой, автором канала Настенька и графики (если ещё не подписаны, то очень рекомендую).

Поговорили про то, как дизайн помогает аналитикам в работе, посмотрели работы Насти и обсудили работы с Табло Паблика в новой рубрике «дашборд-рулетка».

Аудиоверсия
Текстовая версия — под видео (спасибо Наташе Shirosayuri!)

0:43 Карьерный путь
Началось всё с того, что мне предложили вести паблик, он был про анализ данных и визуализацию и поскольку посты нужно было делать каждый день, я стала очень много читать и изучать в этой сфере, перезнакомилась со множеством людей. Параллельно с этим я занималась количественными исследованиями для научной деятельности. Потом поняла, что это всё сильно пересекается и что датавиз это тема. Сейчас уже веду только свой паблик.

Я скорее называю себя свободным аналитиком, не привязываюсь к какому-то определению. Или, например, говорю, что я автор телеграмм-канала. Дата-визуализатором я себя не называю, всё же скорее ближе к аналитике.

По образованию я социолог. Когда я поступала, то ничего не знала про это. На профтестах мне сказали, что я люблю вставлять данные в таблички и я поняла, что это правда моё. Я пошла в Вышку на социологию, эта программа сейчас называется «Социология и социальная информатика». Там больше уклон на computational social of science, на все, что связано и с анализом данных, и в том числе с визуализацией. Там мы учили программирование на R, на третьем курсе немного Tableau, хотя очень поверхностно. В дальнейшем я увидела, насколько больше там глубины на самом деле. Ну и когда занималась научными исследованиями, часто данные просто визуализировала и был такой больше описательный анализ.

Если кратко, то социология это про исследование людей. Но если психология, например, больше про то, что человек чувствует или как переживает, то социологи смотрят на людей в контексте других людей. В социологии есть разделение на качественную, количественную и есть смешанные методы. Мне больше нравится, когда мы совмещаем какие-то интервью с количественным анализом, конечно. Я занималась исследованиями университетов — делала библиометрический анализ (как они сотрудничают в научном поле) и как упоминаются в СМИ. Видно, как по-разному выстраивают университеты свои стратегии в сотрудничестве. Про контекст любопытно, что, если какие-то топовые вузы упоминаются в темах рейтингов, экспертных оценках, то вузы послабее — в статьях вида «ректора посадили» или «отпустили под домашний арест».

7:12 Про работу аналитика клиентских данных
Основными моими обязанностями сейчас является построение дашбордов, к сожалению, пока что в data studio. И обычная, в общем, аналитика, подсчёты каких-либо моделей, показателей, проведение тестов. То есть анализирую все данные, которые есть, а их много: и crm, и логи, и опросные данные.Также я преподаю в Вышке и Европейском университете визуализацию данных и веду свой канал.

8:34 Зачем аналитику нужно знать основы дизайна
Я пропагандирую идею, что визуализация данных это больше про коммуникацию. У меня есть пост в блоге про датасатанистов, которые говорят на каких-то своих языках, и другим людям в компании не понятно, что происходит. Поэтому я выступаю за то, чтобы сделать всё максимально понятным и удобным. Базовые навыки предоставления информации должны присутствовать. От того, что ты покажешь результаты своего регрессионного анализа табличкой, никому понятнее не станет. Все результаты лучше визуализировать. Хотя я не могу сказать, что всегда соблюдаю свои же принципы, потому что многие вещи приходится делать в спешке. Правда, потом я к ним возвращаюсь, чтобы что-то сделать лучше.

Когда я изначально пришла на свою позицию, от меня больше ожидали таблиц. В дальнейшем, когда у меня сменился руководитель, попросили рисовать графики, поэтому думаю, что бизнес замечает старания визуализаторов.

13:14 Наука в северной Корее

Это первая работа в моей визуализаторской карьере про науку в Северной Корее. Так как я занималась до этого библиометрией, я решила посмотреть на неё. Данные я брала из web of science, это база научных журналов высокого уровня. Тут есть интересные вещи, например, про финансирующие агентства, где есть какие-то китайские организации, а ещё сети соавторства и карты терминов. Это сделано при помощи VOSViewer. Как оказалось, темы северокорейских учёных очень технические. А в сетях соавторства оказалось, что 39 из 265 авторов зовут «Ким». Ещё было про языки публикации, например, 3 на русском, до распада СССР. У исследователей из Северной Кореи есть некоторая свобода: им предоставляется интернет, а это уже достаточно много. Очень интересно, про что они пишут и как осуществляется их общение. Можно увидеть, как меняется развитие тематик, по цвету сети: сразу больше писали про физику, а позже стали популярнее молекулярные исследования и генетика.

В плане бизнеса применение сетей — это скорее HR-аналитика. С помощью сетей можно находить такие изолированные группы или людей, которые называются мостами, и объединяют их.

20:25 Граф для связей в ВК

Это сеть друзей, она задумывалась как подарок. Здесь я, мой друг и как наши друзья связаны между собой. На сетях много делается исследований по пересечениям. Я как-то анализировала группы МСГ и там есть две группы: официальная и не очень. И в официальной, если построить сеть друзей, то большего всего связей получается у разных председателей молодёжных советов, а у неофициальной это будут просто такие популярные ребята. В этой сети с другом можно увидеть разные кластеры, самый большой кластер — это университет, и там часть наш факультет, а часть другие программы. Зелёный кластер — это мои мурманские друзья. Сетки по друзьям в принципе все так раскладываются: есть школа, клубы по интересам, универ, может быть работа.

23:50 Музыка в ВК

Люблю с данными ВК работать. Для блога SkillFactory писала статью про музыку, хотя я в ВК уже давно не слушаю. Эта статья очень понравилась людям и получила много отклика.

Здесь получается интересная вещь со скаттерплотом по продолжительности и частоте прослушиваний. Мне скидывали другие люди, как у них эти графики получились, и там были выбросы: либо какие-то длинные подкасты, либо много коротких песен.

Барчарты закрашены по продолжительности песен и кажется, что это не так сложно для восприятия зрителями как, например, двойные оси.

Облако слов в плане аналитики даёт примерно ничего, но все любят на них смотреть, и я в том числе, оно скорее для красоты.

У ВК есть возможность запросить архив, чтобы узнать, какие у них есть данные про вас. Там сохраняются все сообщения, лайки, комментарии. Можно либо посмотреть на свои сообщения 10 года и ужаснуться, либо вот, собрать из них такие красивые визуализации.

35:05 Сравнение пенсий

Мне однажды скинули статью про сравнение пенсий по странам, в которой данные были представлены просто текстом. Поэтому я решила их визуализировать. Здесь барчарты и картинки про средний возраст жизни и размер пенсии. Это данные на 2018 год, уже могло что-то поменяться. Так же я посмотрела, сколько бигмаков можно купить на эту пенсию. Мне очень нравится индекс бигмаков для сравнения таких вещей. Получается, что в Дании самая большая пенсия, можно купить целых 689 штук, а в России всего лишь 100, то есть 3 с лишним в день.

33:00​ Дашборд рулетка
35:05​ — Социальное неравенство в США
43:44​ — Вкус рождества
54:50​ — Торнадо

1:05:22 За чем следит и что почитать
Из того, зачем я слежу, это Flowing Data и Visual Cinnamon. Ещё очень много пабликов в телеграмме, я за ними за всеми слежу, это и Чартомойка, и Reveal the Data, и Дашбордец. Ещё в твиттере очень много интересного публикуют.

Мне очень нравится книга Дональда Нормана «Дизайн привычных вещей», классическая в дизайне. Он описывает такую идею: если вы не понимаете, как работает какой-то прибор, то это проблема дизайна, а не ваша. И это применимо так же к дашбордам: если вы не понимаете, как работает какой-то дашборд, то это проблема тех, кто их разрабатывает, то есть наша.

1:07:20 Блиц
Москва или Питер? — Питер.
Google Studio или Tableau? — Когда как. Tableau для души, Google Studio для скорости.
Tableau или R или ggplot? — Если Tableau или ggplot, то Tableau, если Tableau или R, то R.
Тафти или Босток? — Тафти.
BI или дата арт? — Дата арт, потому что для души.

Ссылки, которые рекомендовала Настя:
https://flowingdata.com
https://www.visualcinnamon.com
https://medium.com/@kennelliott/39-studies-about-human-perception-in-30-minutes-4728f9e31a73

Книги:
— Дизайн привычных вещей: https://www.mann-ivanov-ferber.ru/books/dizajn-privyichnyix-veshhej/
— Storytelling With Data: A Data Visualization Guide for Business Professionals: https://www.amazon.com/Storytelling-Data-Visualization-Business-Professionals/dp/1119002257
— Better Data Visualizations: A Guide for Scholars, Researchers, and Wonks: https://policyviz.com/pv_books/better-data-visualizations-a-guide-for-scholars-researchers-and-wonks/

Список лайфхаков Табло

Решил собирать в одном месте все лайфхаки по Табло, чтобы можно было легче искать нужный.

Плейлист со всеми выпусками:

Выпуск №1
0:00 — Как сделать удобный фактоид с приростами период к периоду
9:26 — Как показать разрыв в данных с помощью Missing Values
11:58 — Как ускорить работу в Табло за счет фишек интерфейса

Выпуск №2
0:00 — Сортировка по значению за последний месяц с помощью Nested Table Calcs
4:04 — Оформление спарклайнов при помощи Reference Lines
7:12 — Highlighted таблица с подсветкой по одной метрике из Measure Values

Выпуск №3
0:00 — UTF символы для создания цветовой легенды
3:29 — Динамический фильтр дат с окном и ренджем
7:08 — Подпись событий о запусках или маркетинговых активностях во времени на таймсерии

Выпуск №4
0:00 — Как сделать удобную адаптивную легенду
3:00 — Как подписать точки на графике по условию
7:12 — Как избежать проблем при работе с Табло на Windows

Выпуск №5
0:00 — Составные таблицы из нескольких листов
4:19 — Функция Random()
8:16 — Переименование Worksheets и Dashboards на сервере

Выпуск №6
0:00 — Тоталы в барах
4:19 — Таблица с спарклайнами
8:16 — Предыдущий период на графике

Итогов года пост 2020

Собрал все итоги года в одном посте.

Telegram

Начну с Телеграма. Данные собрал из API tgstat.ru, выгрузки из самого Телеграма и некоторую разметку сделал руками. Получился такой дашборд:

Основные хайлайты
— Канал вырос с 0 до 2.2К подписчиков.
— Всё время поддерживается Engagement Rate (ERR) ≈ 100% (Ср. охват поста/Кол-во подписчиков). Эта метрика для меня важнее кол-ва подписчиков, так как показывает, насколько интересен контент читателям и насколько им делятся.
— Больше всего в канале постов в тегом #ссылка — 81 шт., наибольший охват и ERR получили посты с тегами #статья — 2К охват, 241% ERR
— Чаще всего я публикую посты по пятницам, но охват у таких постов не самый большой. По времени чаще всего с 14 до 15, здесь показатели тоже небольшие, видимо обеденное время. Нужно будет с этим поэкспериментировать =)
— Был написал 241 пост. Самым просматриваемым постом стал пост про черные точки, его репостнули в канале Адовый UX. Самым виральным стал пост про статью «Таблица или график? Как убедить заказчика».
— 80% просмотров на пост приходятся за первые 3-4 часа после публикации.

Впечатления
Я, если честно, приятно удивлён количеством подписчиков и вовлеченностью. Я веду блог пять лет, и мне всегда казалось, что тематика супер узкая и интересная малому количеству людей. Когда заводил канал, думал, что максимальный потолок для канала ~1К подписчиков (посчитал как половина от суммы участников чата по визуализации и чата по Табло). Рад, что контент интересен и полезен, для меня это классная возможность поделиться тем, что я считаю важным, и развить личный бренд.

Спасибо всем, кто делится постами, особенно @rockyourdata, @dashboardets, @chartomojka, @data_publication, @leftjoin, @internetanalytics, @analyst_club, @nastengraph, @dataviznews, @novichkovnet или просто в личных сообщениях. Кстати, список каналов, за которыми я сам слежу лежит здесь.

YouTube

Данные взял из Data API YouTube Data API, скачав их с помощью скрипта на js напрямую в гугл-таблицы — очень удобно! https://public.tableau.com/views/YoutubeAnalysis_16090922510490/YouTubeAnalysis Собрал дашборд, по аналогии с тем, что разбирали на вебинаре по адаптивной верстке.

Основные хайлайты
— За год я выпустил 26 видео, на канал подписалось 429 человек, всего 16К просмотров.
— Большего всего сморят видео с типом #выступление и #подкаст. В среднем одно видео собирает ~400 просмотров (медиана 370).
— Самое просматриваемое видео «Алгоритм разработки дашборда» на Date Learn. Меньше всего у перевёрстки «Product Superstore».
— Самый короткий подкаст был пилотным, с Андреем Дорожным, но зато у него больше всего просмотров среди подкастов. Дольше всего проговорили с Никитой Рокотяном.

Впечатления
Ютуб требует довольно много усилий на продакшен, при этом качество мне всё равно пока не нравится, видно, что сделано на коленке. Зато он очерчивает core аудиторию которая готова тратить время на просмотры, а не только на посты в телеграмме. Самое большое разочарование для меня, что не взлетела рубрика #переверстка, мне казалось, что это самый полезный контент на канале, но почему-то заходит он плохо, если есть идеи как его прокачать — пишите в личку.

Блог и сайт

Данные для этого анализа мне помог собрать Саша Михайлов, автора канала data-будни про инжиниринг данных, рекомендую. Данные тянутся из базы блога с помощью питона записанного в гугл-коллабе и после этого складируются в гугл-таблицы. Скоро сделаем с Сашей инструкцию, как собрать такой же дашборд если у вас блог на Эгее. Плюс ещё кое-что посмотрел в Я.Метрике. И конечно же собрал дашборд. =)

Основные хайлайты
— За год написал в блог 32 заметки, из них 14 «настоящих» статей, остальное дубли подборок из телеграмма и видео с Ютуба. Это больше, чем в прошлом и позапрошлом году, но меньше чем в 2017-ом.
— Самой просматриваемой стала заметка «Интерфейсы в BI системах».
— Завёл отдельный тред для подборки работ по визуализации, собрал 93 классных примера.
— Самой популярной заметкой по запросам из поисковиков является уже который год статья про логарифмическую шкалу. В этом году она особенно популярна ))) Смотрите как забавно отличается рост просмотров от остальных заметок.

Впечатления
В этом году мне прям нравятся лонгриды, которые написал. Доволен, что из них получается стройная теория по проектированию дашбордов.

Дисклеймер по данным
Сбор просмотров начался только с марта, после обновления платформы блога. Поэтому хотя там можно отмотать фильтр по дате публикации, но это будут просмотры только за текущий год.

Подборка самых важных и полезных авторских материалов за год по моему мнению

Статья «Навыки для визуализации данных»
Статья «Интерфейсы в BI-системах»
Вебинар «Алгоритм проектирования дашборда»
Статья «Шаблоны верстки дашбордов» (скоро буду обновлять, докрутил идеи)
Вебинар про Адаптивную верстку в Табло
Статья «Таблица или график? Как убедить заказчика» и вебинар на базе этой статьи
Статья «График план-факт во времени»
Выступление про стайлгад и темплпейт Я.Такси
Трибьют «Тафти в Табло»
Дашборд про рынок вакансий аналитиков

Tableau Public

Собрал подборку работ с Табло Паблик, которые понравились мне больше всего за 2020 год. Сложнее всего на Паблике найти хорошие дашборды, одни лонгриды и инфографика )))

Личная статистика

Последняя часть с итогами. В ней собрал все данные, которые можно получить о себе почти без усилий. Графики в этот раз попытался сделать в стиле «инстаграм». Осваиваю новые форматы, сразу чувствуется нехватка практики.

В этом году очень много времени провел, работая за компом. Планирую в следующем году ограничить время на работу. Это всё плохо сказывается на продуктивности и здоровье. Надо больше отдыхать и относиться к этому, как к части работы. В основном трачу время на Табло (34%) и мессенджеры (28% и 82К отправленных сообщений, 187 часов в zoom).

В конце сентября заболел ковидом и на это же время наложилось несколько важных проектов, из-за этого потерял все старания по контролю веса с начала года. Благо сам вирус перенёс супер просто, но ещё 2 месяца после этого был как ватный. Интересно, что в данных это проявилось как повышенный сердечный ритм в октябре и ноябре. Неприятная болезнь, какие-то пост эффекты дурацкие. Из-за этого же явно меньше ходил, особенно в конце года совсем не соблюдал планку в 8500 шагов в день.

Из забавных эффектов карантина, стал довольно много и регулярно спать по сравнению с прошлым годом.

Данные: MI Band 3, Mi Scale, Timecamp.com

Табло

Добавил 2020-ый год в свою любимую [«визуализацию про время, которое я трачу на визуализацию». Табло всё больше в моей жизни. В этом году много работал руками и обучал, отсюда набежало больше тысячи часов.

Данные: Timecamp.com

Траты

Чаще всего в этом году тратил на супермаркеты, транспорт и кафешки. Больше всего потратил на переводы и нал, они превратились в три самые крупные покупки: машину, подводку газа в дом и обустройство участка.

Данные: Выгрузка из банка
 

Перемещения

В этом году никаких зарубежных поездок не было, как и у большинства. Зато я снова перешёл с iPhone на Android, и там есть замечательная функция выгрузки местоположений и вообще любой статистики по Гугл аккаунту. Получилась классная карта. В карантин много раз порадовался, что последние 3 года живу за городом. Прикольно видно как я переехал с юго-востока на северо-запад, а потом на север.

Данные: takeout.google.com

Сайт и айдентика

Ещё в этом году обновил сай и его английскую версию. За это огромное спасибо Кириллу Беляеву, он взялся нарисовать дизайн, а я заверстал сайт.

Если вам будет нужен дизайн, очень рекомендую обратиться к Кириллу — его портфолио и канал.

Впечатления
Год был ярким как на хорошие события, так и на плохие. Для меня в итоге он имеет скорее положительную окраску, но осталось куча всего, что хочется докрутить в следующем году. Самыми яркими впечатлением стали, пожалуй, выступление на конференции Матемаркетинг, концерт с группой (хобби — играю на басу в кавер-группе) и запуск телеграмм-канала.

🎄Всех с наступившим, приятных заказчиков и классных дашбордов вам в этом году!

Адаптивная верстка в Табло

Выступил на проекте DataLearn с рассказом про адаптивную верстку.

Материалы со вчерашнего вебинара про адаптивную верстку в Табло:

  1. Запись вебинара
  2. Книга на Паблике (можно скачать и посмотреть, что внутри)
  3. Статьи The Economist:
    про ошибки в мобильных графиках
    про адаптацию графиков для инстаграма
  4. Дашборд про зарплаты (пример с CSS, можно посмотреть в инспекторе кода)
  5. Навыки и литература по визуализации

Сам дашборд, на котором разбирали теорию, — это статистика канала Data Learn на YouTube. Данные собрал через API YouTube и скрипт в гугл-таблицах. Получился прикольный дашборд, который можно будет переиспользовать.

Видеоподкаст с Никитой Рокотяном

Записал подкаст с Никтой Рокотяном — Data Visualization Engineer, основателем студии Interacta и автором канала Виз Ньюз. Никита — отличный пример «renaissance man», человека совмещающего большое количество разных компетенций и интересов: кодинг, дизайн, аналитику и арт.

Поговорили с Никитой о сложной визуализации для аналитических инструментов, посмотрели примеры интересных проектов и обсудили как обстоят дела с визуализацией в Кремниевой долине. В конце был отдельный блок про дата-арт и криэйтив кодинг. Не совсем по теме визуализации, но невероятно вдохновляет. В живую проекты можно посмотреть на странице компании и личном сайте Никиты.

Аудиоверсия
Текстовая версия — под видео (спасибо Наташе Shirosayuri!)

1:03 Карьерный путь
Термин «визуализация данных» настолько широкий, что те, кто знают, что это такое, до конца не понимают, чем конкретно ты занимаешься. А те, кто не знают, путают это с другими областями. Например, с 3d-визуализацией или визуализацией мыслей.

Когда я нахожусь в профессиональной среде, я говорю, что занимаюсь инструментами для визуальной аналитики. Это включает в себя не только визуализацию, но и алгоритмы, и ux-дизайн. В течении карьеры я занимался не только этим, мы также делали компоненты, которые куда-либо встраивались, и дата-арт.
Я делаю всё, но стараюсь концентрироваться на создании визуализаций и компонент инженерной части, и немного ещё data science и дизайн. Прелесть области состоит в том, чтобы делать всё и сразу.

По образованию я физик. Занимался научной работой около 5-6 лет, был сотрудником лаборатории климата и окружающей среды. Мы исследовали по солнечному излучению состав атмосферы. Кратко: солнечное излучение проходит через атмосферу и может быть измерено в наземных лабораториях. Потом оно отражается от поверхности Земли и может быть замерено спутником. Таким образом, наземные лаборатории являются валидацией данных от спутников. Потому что спутники могут давать данные по всей поверхности Земли, а лаборатории — нет. Молекулы в атмосфере поглощают излучение и по его спектру мы можем достаточно точно восстановить состав атмосферы.

Со временем это переросло в визуализацию, потому что я хотел совмещать свой научный интерес с творческим.
До этого я занимался дизайном, работал в типографии, мне нравился дизайн как область, и математика, алгоритмы. Область, в которой это всё соединяется и востребовано — визуализация данных.

8:58 Офф-топ: есть ли глобальное потепление?
Потепление есть, несомненно. Если какое-то время тому назад часть учёных ещё считала, что только на 95% потепление обусловлено антропогенными причинами, то сейчас почти все ученые сошлись во мнении. И риски очень велики. Огромный ущерб экосистемам, которые мы не видим, а дальше всё идёт по цепочке. Такое быстрое изменение для экосистем очень губительно. Оно не уничтожит планету, но нам станет всем не очень хорошо и наше существование будет под угрозой.

Сам процесс изменения климата медленный и инерционный: то, что мы запустили сейчас будет продолжаться ещё на протяжении ста лет. Ты не сразу можешь видеть результат своих действий.

11:23 Визуализация в Кремниевой долине и переезд
Сейчас здесь почти все работают из дома. Все очень серьёзно отнеслись к коронавирусу. Ещё летом крупные компании перевели на удалёнку всех до следующего года. Поэтому нет того эффекта кампусов, как будто в научном городке, где кипит жизнь. Это не город, это такая деревня, конгломерация крупных компаний, где для сотрудников созданы тепличные условия, чтобы они могли продуктивно работать весь день. Сейчас это остановилось и многие работают из дома. Нет социального эффекта, который был здесь всегда.

Очень интересно развитие долины после пандемии. Я не думаю, что она вымрет, возможно, она расцветёт ещё больше. До этого здесь было слишком много людей, из-за чего цены слишком выросли, было видно слишком большое расслоение общества и огромное количество проблем.

К истории о том, как я переехал. Я долгое время работал с клиентами отовсюду. Как-то так случилось со временем, что большая их часть была из долины. Один из них оказался амбициозным стартапом. У нас завязалось сотрудничество, и на протяжении 2-3х лет всё шло к тому, что для дальнейшего развития мне было бы полезно находиться здесь. Если и учиться где-то создавать крупные масштабные проекты, то именно здесь, потому что это столица современных технологий. Кроме того, по моему опыту американцы из долины и из Нью-Йорка умеют очень продуктивно работать, не растрачивая время на бесполезные детали.

Что касается визуализации, субъективно кажется, что потребность в специалистах всё ещё велика. Именно разработчиком визуализаций — их достаточно мало, чтобы насытить имеющийся рынок. А рынок растёт, потому что значительное число компаний начинают понимать, что можно стать лучше, используя визуализацию.
Наиболее интересная область для меня находится на стыке визуализации данных, data science и ux-дизайна. Если ты можешь создать компонент, который работает с динамическими данными, при этом он красивый и информативный, то это успех и огромное количество продуктов может сделать шаг вперёд благодаря подобным инструментам. Таких специалистов очень мало. Я вижу компании, которые ищут дизайнеров, которые умеют кодить. Они и раньше были, но сейчас для таких специалистов появился рынок.

21:20 Примеры проектов
Show Real на нашем сайте я собирал достаточно долго из разных кусочков. Здесь не только инструменты, но и самые разные проекты. В принципе он отражает то, что нам нравится делать. В связи с тем, что всё моё время уходит на работу со стартапом, студия существует сама по себе без моего активного участия. В проектах, которые там идут, я иногда выступаю в роли ментора. К сожалению, очень много проектов находятся под NDA и ими нельзя поделиться, хотя зачастую они все очень интересные, удобные и красивые.

23:50 Data-Driven Country Map

Это конкурсный проект, который мы делали для World Data Visualization Price Мы сделали инструмент, который может перерасти во что-то больше как концепция, возможно с другим набором данных.

Идея состоит в том, что у нас есть набор данных о разных странах и каждая конкретная страна может быть охарактеризована набором определённых свойств. Например, число жителей, ВВП, различные индексы, уровень коррупции, эффективность судебной системы. Огромное количество метрик и сложно составить картину того, какие это страны. Как они соотносятся друг с другом по своим свойствам, а не по географии? Мы взяли алгоритм t-sne. Он берёт на вход массив данных, где каждая точка описывается большим набором характеристик, и умеет находить между ними схожести и группировать точки по ним. Здесь точки — это страны, и мы видим в них какие-то паттерны. То есть алгоритм считает, что эти страны между собой похожи по какой-то причине. Ты как исследователь сперва не знаешь эту причину, и дальше начинаешь изучать. Первое, что мы сделали, это нанесли эти точки, страны, и покрасили их по континентам. Сама карта открыта для интерпретаций, и чтобы понять, почему те или иные точки оказались рядом, нужно иметь интерактивный интерфейс, который может дать тебе возможность в реальном времени что-то включать и смотреть, как алгоритм реагирует. Это позволяет тебе понять, какие свойства находятся в основании попадания стран в кластеры. Кроме того, можно выбрать какую-то определенную страну и подвигать параметры для неё. Подобная игра позволяет думать комплексно о том, что можно изменить, чтобы страна попала в тот или иной кластер.

35:20 The Seamless Web

Это экспериментальный визуальный поисковый движок по судебной системе США. Как-то к нам обратился юрист, который хотел попробовать визуализировать сеть связанных дел. Боль, которую тут можно решить с помощью визуализации, состоит в том, что ты, будучи юристом хочешь найти случаи, которые подходят под твой. Ты открываешь какую-то поисковую систему и находишь список других дел в виде списка. Дальше тебе нужно их все открывать и читать. Поэтому появилась идея: визуализировать результаты поиска в виде графа. Тут ты можешь увидеть центральные кейсы, на которые ссылаются другие, смежные и кейсы на периферии, можешь выделять какие-то группы и делать текстовый анализ по ним.

Открывая проект в первый раз, ты видишь поисковую строку. Тут же автоматический саджест из базы по документам, которые искали люди или которые могут быть тебе интересны. Ты формулируешь свой запрос, он отправляется на сервер и формирует тебе из него граф: по ключевым запросам ищет дела и потом в них ищет ссылки друг на друга. Здесь каждая точка представляет собой одно дело. Дальше включается алгоритм поиска комьюнити в сети, и по результатам алгоритма точки раскрашиваются. Уже на этом этапе мы видим какие-то определённые кластеры, но пока не знаем, почему они схожи. Тут подключается data science, скрипты, которые вычленяют из кейсов несколько моментов: наиболее важные термины и словосочетания, наиболее релевантный текст. Дальше делается сложный анализ: мы вычленяем из текста кейса фрагменты, которые являются наиболее цитируемыми.

В итоге получается база, по которой юрист может провести поиск и получить граф для того, чтобы продвинуться дальше в деле, которое ведёт. Например, в графе можно увидеть наиболее важные дела и нажать на них, чтобы увидеть их тексты. В текстах подсвечиваются наиболее интересные фрагменты.

47:13 Про графы связей
Использование графов сильно зависит от задачи. Сам по себе он не столько несёт в себе информацию, сколько является навигацией по визуализации. Потом ты уже можешь выбирать ноду, углубляться в неё. Таким образом, граф является первым экраном для инструментов глубокого анализа.

50:27 Красота vs Бизнес-польза
Всё зависит от бизнеса. Кому-то может быть всё равно, красивое оно или нет, а кому-то это наоборот важно. Я думаю, что это не вредит, и когда делаю что-то, задаюсь вопросом: можно ли сделать так же, но ещё и красиво. Не всегда есть возможность так сделать. Часто можно сделать такие нестандартные визуализации, которые решают ту же задачу, что и классические, и делают это не менее эффективно, но более привлекательно выглядят. Анимация, например, очень сильно оживляет картинку, хотя многие её пренебрегают.

50:27 Стек технологий
Чаще всего используем d3 и какой-нибудь фронтенд react/svelte. Последний сейчас стал очень популярным, потому что он маленький и простой, в react’e разобраться сложнее. Svelte позволяет быстро разобраться и создавать в нём простой ui, а сама визуализация d3. Если нужно нарисовать что-то большое, то используются инструменты на webgl, three.js, reguls.

С точки зрения визуализации, мы обычно используем то, что нужно в проекте прямо сейчас. Если нужно не очень много точек, то не нужен какой-то сложный стек, и наоборот.

57:10 Как визуализация спасет жизни пациентов

В этом проекте t-sne был использован для анализа медицинских анализов. Лаборатория, которая занимается исследованиями болезней сердца, делают огромное количество анализов. По их набору хочется найти взаимосвязь и закономерности.

Им нужен был инструмент, с помощью которого можно было работать с их данными. Например, есть файл excel, где в столбцах это виды анализов, а в рядах пациенты. Можно нарисовать точками типы анализа или пациентов, из-за чего у нас появляется две карты. Первая может быть использована для того, чтобы смотреть на пациентов, которые сходятся в каких-то параметрах и определить для них течение болезни и возможные риски. Во втором случае проводились исследования, где брали различные группы пациентов, например, очень больных, которые в итоге умирают. Или наоборот, которые в итоге выздоравливают. И сравнивали, как соотносятся анализы, которые есть у разных групп пациентов. Таким образом, увидели, что чем больше количество кластеров, в которых анализы схожи между собой, тем более велик риск смерти пациента. Так же можно брать анализы у пациентов каждый день и исследовать их с помощью данного инструмента. Чем больше связей между точками появляется со временем, тем сильнее ухудшается состояние пациента. Если пациент идёт на поправку, то эта сеть становится более хаотичной.

1:03:40 Источники вдохновения, Виз Ньюз
Хорошие примеры визуализации я беру из твиттера. Там огромное количество новостей. Можно подписаться на ряд экспертов из этой области, со временем твиттер предлагает ещё людей из этой области, таким образом можно составить себе профессиональную новостную ленту. Как в дизайне важна насмотренность, так она важна и в визуализации. Поэтому важно всё время смотреть на то, какие визуализации придумали другие.

1:06:55 Технологический арт, как не бояться нового

С арта начался интерес к визуализации и области. Изначально меня вдохновляли алгоритмы, которые рисуют графику. Я думал, что круто было так делать, но это так сложно, что никогда не научусь. Со временем страх уходил, а интерес рос. Это как раз совпало с расцветом индустрии интерактивных инсталляций. Я делал генеративные инсталляции, со временем интерес этот вывел меня на работу с визуализацией и совпал с моим научным интересом. На сайте есть раздел с артом, где выложены мои старые проекты. Там есть совершенно удивительные проекты. Например, исследовательский проект в minecraft’e. Совпало два биеннале: выставка Уральского современного искусства и выставка Zero one? Мы строили в игре прототипы инсталляций, которые в итоге может воплотить в жизни.

Так же был интересный игровой проект «18», который так и остался прототипом. Он похож на plants vs. zombies, но в нём ты делаешь музыку. И цель не победить всех, а создать трек. У каждого юнита своя музыкальная тема, добавляя их на поле можно было создать мелодию.

Поскольку я занимался вопросами изменения климата, мне захотелось визуализировать как CO2 на планете меняется. Это вызвало огромный интерес, хотя сама по себе визуализация очень простая. Сам посыл о том, что что-то меняется достаточно агрессивно, так хорошо считывается, что люди действительно начинают задумываться об этой проблеме.

Кроме того, мы делали скульптуры из фарфора: выдавали опросники коллегам и друзьям, чтобы определить, насколько они рискованны в той или иной области. И в итоге получатся такой фарфоровый портрет их риска.

Была ещё одна совершенно невообразимая история о том, как одно рекламное агентство собирает команду для своей творческой резиденции, чтобы создавать новые вещи. Жить три месяца в незнакомой стране было что-то пугающим. Мы жили командой в одном доме и делали экспериментальные проекты. Удивительно, насколько многому можно научиться в подобных резиденциях. Самое важно, что я вынес: я лучше понял, что я могу. Когда работаешь фрилансером, зачастую не знаешь, что ты умеешь относительно других. Если есть возможность поучаствовать в таких проектах, то я бы посоветовал это делать.

Сам проект представлял собой инсталляцию, которая создавалась для фестиваля STEAM Carnival. Там часто делаются инсталляции, которые основаны на законах физики и математики. Наша инсталляция должна была вдохновить детей на интерес к науке. Мы придумали создать несколько станций с граммофонами, внутри которых был микрофон. По нашей задумке ребёнок должен был кричать в граммофон, и дальше крик модифицировался во что-то ещё. Была LED-станция, в которой зажигался свет, ещё с мыльными пузырями, дующая ветром, с шариками и с ленточками, развевавшимися на ветру.

Дети находят самые необычные применения тому, что ты сделал. Например, набрать на одной станции мыльных пузырей, чтобы на станции, которая дует, их развеять по ветру. Очень радует, что это в конечном счёте вдохновило детей на то, чтобы исследовать, как это работает.

Главный урок, который я вынес: я думал, что еду в крупное агентство, уж, наверное, они знают, как делать вещи. И оказалось, что нет, на самом деле никто не знает. Чуда не случится. На самом деле сделать что-то хорошее действительно очень сложно.

1:32:03 Блиц

Топ-3 книги
Я не очень много читаю, мне всегда было сложно учиться по учебникам. Всегда потом приходилось садиться и делать то же самое руками, иначе я не запоминал. Так что я не назову каких-то конкретных названий, но выберите какую-нибудь художественную, техническую и научную книгу и это даст вам разные взгляды на жизнь. Если вы сможете их все переварить и получить удовольствие, то всё, успех вам обеспечен.

Генеративные коддинг или визуализация данных?
Эти вещи даже нельзя сравнить. Но если отвечать на вопрос, то визуализация. Во-первых, она использует генеративный коддинг, во-вторых, в ней есть прикладной аспект.

SVG или Canvas
SVG

Vuj или react
React

React или Svelt
React, если вы делаете что должно масштабироваться. Если что-то маленькое делаете, то Svelt

Россия или Штаты
Россия. У штатов есть огромное количество вещей, где можно было бы поучиться, а у нас — огромное количество областей, которые ещё не заняты и где эти знания можно применить

Процессинг или D3
D3. С досадой отвечаю, потому что процессинг — это моё профессиональное детство. Но всё равно d3, потому что с одной стороны он сложнее, а с другой стороны он больше возможности даёт и в итоге получается проще.

Масштаб текста в Windows и Tableau

Очень важная заметка для тех кто работает с Табло на Винде. Из-за этой ошибки вечно криво и косо верстаются дашборды.

Если у вас в настройках экрана стоит шрифт 125%,150% и т. п. то при работе с Табло Десктоп вы можете получить неправильную отрисовку размеров шрифтов и некоторых элементов. Настроив дашборд после публикации вы получаете ошибки — элементы смещены или не умещаются. Нормально работает только с шрифтами 100%.

Вот как это выглядит — вы сделали дашборд и на десктопе всё выглядит ОК:

А после заливки на сервер это превращается в кашу:

Если сталкиваетесь с такой проблемой, то вот как это исправить:
— Видео-инструкция
— Официальная инструкция от Табло
— Инструкция скриншотами:

Единственная проблема, что такое решение «блюрит» вам дашборд в десктопе. Такое будет только на машине, а на сервере отчет будет выглядеть четким. Если это не подходит, то нужно менять размер шрифта в системе на 100% или 200% процентов. =(

Кем работать, если нравится визуализация данных

Читатель блога спросил кем работать, если нравится визуализация данных. Собрал небольшой гайд по профессиям, где одним из основных навыков является визуализация данных. Всё ниже сказанное — моё субъективное мнение и опыт. Зарплаты Московские, net по результатам анализа рынка аналитики и инструмента быстрого анализа зп по запросу. Примеры вакансий не самые актуальные, а самые подходящие по навыкам и т. п. Если есть чем дополнить статью и я что-то пропустил — пишите.

Я буду разбирать разные позиции по одним и тем же критериям: что делать, какие нужны скилы, насколько много визуализации, сколько можно заработать и т. п.

Разработчик дашбордов

Тэги: BI разработчик, Data Visualization Engineer, Разработчик отчётности, Разработчик + название BI системы, Консультант по + название BI системы.

Что делать: Разрабатывать и поддерживать дашборды и внутреннюю отчетность в компании.

Основные навыки: техническое знание BI системы (Tableau, Power BI, Qlik), графический и UX дизайн, сбор требований, SQL и подготовка данных.

Насколько много визуализации: 60% — визуализация, 20% — сбор требований, 20% — подготовка данных.

Зарплаты: junior — 50-80, middle — 100-140, senior — 160-200.

Востребованность: Пожалуй самый востребованный и денежный способ заниматься визуализаций данных. Таких позиций меньше, чем аналитиков данных, но они есть на рынке и многие компании выделяют создание дашбордов в отдельные направления. Чаще всего таких людей ищет крупный бизнес, где есть разделение по ролям внутри отдела аналитики. Ещё можно вполне успешно фрилансить на зарубежном и российском рынке.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/38814023
https://hh.ru/vacancy/38402536
https://hh.ru/vacancy/38763777
https://www.upwork.com/search/jobs/?q=tableau
https://www.standav.com/careers_v4/index.html?job_id=z5G7h3

Аналитик данных

Тэги: Data analyst, Бизнес-аналитик, Аналитик, Аналитик баз данных, Маркетинговый аналитик, Продуктовый аналитик.

Что делать: Полный цикл анализа данных: подготовка и обработка данных, анализ, представление результата в виде дашборда (чаще всего)

Основные навыки: Python, практическая мат. статистика, SQL и подготовка данных, технические знание BI системы, сбор требований и управление проектами.

Насколько много визуализации: 35% — подготовка данных, 35% — анализ данных, 15% — визуализация данных, 15% — сбор требований.

Зарплаты: junior — 30-80, middle — 100-180, senior — 180-260.

Востребованность: Таких вакансий ещё больше, но визуализация это скорее доп. навык, который используется при представлении результатов анализа. Кажется, что рынок довольно перегрет и вакансий сейчас много, в основном это средний и крупный бизнес от 100 человек. Ещё у таких аналитиков часто есть специализация: маркетинг, продукт, ритейл и т. п., когда человек работает и знает какую-то область, специфичный набор метрик и как их правильно считать.

Примеры вакансий и фриланса:
https://yandex.ru/jobs/vacancies/analytics/analyst_eda_test/1w=
https://hh.ru/vacancy/39416083
https://hh.ru/vacancy/39657872
https://www.upwork.com/search/jobs/?q=analyst

Дизайнер интерфейсов аналитических платформ

Тэги: UX дизайнер, Аналитические системы, Корпоративные системы.

Что делать: Разрабатывать интерфейсы для сложных продуктов с большим количеством графиков и визуализаций.

Основные навыки: Информационный дизайн, верстка и типографика, UX/UI дизайн, Figma.

Насколько много визуализации: 50% — сбор требований, 30% — проектирование и отрисовка визуализаций и интерфейсов, 20% — проектирование сценариев.

Зарплаты: junior — 30-80, middle — 100-140, senior — 140-220.

Востребованность: Найти работу дизайнера аналитических систем сложно, так как приходится искать скорее проект, чем фирму. То есть тут можно искать именно интересные проекты и продукты, и уже туда стучаться как дизайнер, но искать, конечно, сложно. При этом и специалистов таких на рынке тоже очень мало, поэтому с таким опытом можно находить действительно хорошие предложения, но всё-таки, в этом случае, спрос прям единичный.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/38732193
https://hh.ru/vacancy/40129963
https://www.upwork.com/job/detail-orientated-designer-for-data-analysis-app

Фронт-энд разработчик

Тэги: d3.js и любые другие библиотеки визуализации.

Что делать: Разрабатывать аналитические web-приложения или сложные кабинеты с большим количеством визуализаций.

Основные навыки: JS, фреймворки, CSS, информационный дизайн.

Насколько много визуализации: 70% — написание и тестирование кода, 15% — сбор требований, 15% — дизайн визуализаций.

Зарплаты: junior — 30-90, middle — 130-160, senior — 180-280.

Востребованность: Фронт-энд разработчики сейчас в цене. История про визуализацию примерно такая же как с дизайнером сложных интерфейсов: нужно искать скорее продукт, чем компанию, в котором используется много визуализации — биржи, аналитические инструменты, BI инструменты и т. п. Кажется, что таких предложений, в целом, больше, чем дизайнеров аналитических платформ.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/39967086
https://hh.ru/vacancy/39924837
https://hh.ru/vacancy/39687471
https://www.upwork.com/search/jobs/?q=d3.js

Дизайнер инфографики

Тэги: Дизайнер инфографики, Дизайнер презентаций.

Что делать: Делать инфографику и важные печатные корпоративные отчеты.

Основные навыки: Информационный дизайн, верстка и типографика, Illustrator, Power Point.

Насколько много визуализации: 70% — проектирование и отрисовка инфографики, 30% — сбор требований.

Зарплаты: junior — 30-40, middle — 80-120, senior — 120-160.

Востребованность: В целом довольно востребованное направление, можно найти как и отдельные вакансии, так и пойти в одно из агентств, которые на этом специализируются: https://infografika.agency/ru/ https://infografika.in/ и т. п.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/39930792
https://hh.ru/vacancy/39653396
https://hh.ru/vacancy/39941199
https://hh.ru/vacancy/40143575
https://www.upwork.com/search/jobs/?q=infographics

Журналист данных

Тэги: Data журналист.

Что делать: Собирать и исследовать данные, формировать из них медиа-истории и статьи.

Основные навыки: Сбор и обработка данных, парсинг, редактура, сторителлинг, информационный дизайн, верстка и типографика.

Насколько много визуализации: 50% — сбор данных, 25% — создание истории, 25% — визуализация.

Зарплаты: junior — 30-40, middle — 60-80, senior — 120-150.

Востребованность: Редкая профессия в чистом виде, часто такие люди живут внутри студий инфографики в крупных медиа. Кажется, что работу найти довольно сложно, но не супер спец в этом.

Примеры вакансий:
https://journal.tinkoff.ru/team/infographics-designer/
https://hh.ru/vacancy/38148283

Вместо заключения
Если любите визуализацию данных, то с помощью неё сегодня можно зарабатывать совершенно в разных направлениях. Наиболее часто востребованы BI разработчики и аналитики, сложнее всего найти работу журналистам данных и дизайнерам сложных аналитических систем.

Помимо стандартных hh и т. п., работу можно поискать тут:
https://www.datavisualizationsociety.com/find-a-job
https://t.me/analysts_hunter
https://t.me/biheadhunter
https://revealthedata.com/examples/hh/
https://revealthedata.com/examples/vacancies/

График План-Факт во времени

У меня есть задача — сделать стандартный формат для графиков типа «План-Факт». Основная загвоздка произошла для графиков, когда нужно показать как значения плана и факта менялись во времени. Я придумал показывать факт линией, а план заливкой (ареа чартом), но это вызвало разночтение у моих коллег. Тогда я решил провести опрос в канале, и выяснилось, как думают читатели.

Опрос в канале

Оказалось, что при той постановке вопроса, как я задал, выигрывает вариант факт — заливкой, план — линией. А ещё много людей написали мне разные идеи, как можно было бы ещё попробовать. В общем это голосование привело меня к тому, что надо сесть и разобраться детально с этой задачей. Я разработал разные варианты и собрал для каждого из них плюсы и минусы.

Понимание задачи

В компании часто выставляются плановые значения метрик. Их нужно сравнивать с фактическими или прогнозными значениями.

У нас чаще всего следят за значением на определённый момент времени, а не накопительно. То есть важнее всего значение на последнюю дату, а не за сумму всех дат. Однако важно понимать выполнялись ли планы за предыдущие периоды, так как план по-сути являлся прогнозом, который мы сделали раньше и важно понимать насколько точно мы его делаем. Поэтому нужно смотреть и планы, и факт в динамике и отчетливо видеть их динамику. Если будет подсветка в какие даты не выполняется план — хорошо, но не критично. Чаще всего план — это положительное число, факт может быть как положительным, так и отрицательным.

График будет использоваться в разных дашбордах, поэтому чем универсальнее получится решение, тем лучше. Либо нужно сделать набор правил под разные задачи. Нужно разработать набор графиков: большой график во времени план/факт, график отклонения план/факт, спарклайны план/факт во времени, сравнение план/факт по разным разрезам, фактоид план/факт. Нужно, чтобы эти графики были «срифмованы» между собой и с остальными графиками темплейта. Обычные графики фактов, если нет установленного плана — это линии.

Данные для графиков хранятся в формате «дата | значение факта | значение плана». Чем проще и надежнее будет реализация в Табло, тем лучше.

Возможные решения

Не найдя best practice по этому вопросу и не получив каких-то научных обоснований от коллег по цеху, решил подойти к задаче методом перебора решений.

Часть графиков придумал сам, часть посоветовали коллеги и читатели блога. Варианты:
— Линия факт — Ареа план
— Линия факт — Бары план
— Линия факт — Засечки план
— Бары факт — Засечки план
— Ареа факт — Линия план
— Линия факт — Линия план
— Линия факт — Линия план + заливка между линиями
— Линия факт — Ареа план + заливка между линиями

Дисклеймер
В основном делал упор именно на разработку таймсерий. На остальные графики уделял меньше внимания, фактоиды совсем не делал. Цветовое кодирование тоже пока условное и не финальное. Ещё не докручивал подписи для самих графиков — так как важна последняя дата, то на неё ещё можно будет сделать акцент на самих графиках. Эти вещи докручу отдельно.

Линия факт — Ареа план

Мой исходный вариант. Больше всего в нём мне нравится, что линия остается фактом, как и обычные графики, где нет плана.

Плюсы:
— Срифмован с остальными графиками, для которых нет плана. Они просто линии, а тут мы добавляем «фон в виде» плана.
— Физично отображает выражение «факт идёт выше плана». План как гора на фоне, которую мы хотим достичь, факт выше «горы» или «ниже».
— Легко считывается динамика плана и факта по отдельности.
— Легко можно продолжить рисовать прогноз линией другого цвета.
— Легко реализуется и масштабируется в Табло.
— Можно заменять план на другие форматы «фона» — прошлый год, среднее по рынку и т. п.

Минусы:
— Набрало мало отклика у пользователей.
— Много акцента на план, так как занимает большую площадь заливки.
— Нет подсветки проблемных и хороших дат.
— Не «срифмовано» с буллет-чартом, где бар (заливка) тянется к линии.

Линия факт — Бары план

Очень похож на предыдущие график, по-сути просто делаем дискретным ареа. Поэтому все те же самые плюсы-минусы, но есть и дополнительные:

Плюсы:
— Можно подсвечивать конкретные даты по выполнению плана.

Минусы:
— «Рябит» малёк, когда много дат.
— Техническая заморочка с шириной баров при изменении скейла (Табло оно иногда такое Таблё).

Линия факт — Засечки план

Плюсы:
— Классно «зарифмован» основной график и график отклонений.
— Может работать с отрицательным планом.

Минусы:
— «Рябит», когда много дат.
— Настройка ширины тиков только ручная и будет плыть для разной ширины экрана.
— Хуже считывается сама линия плана.

Бары факт — Засечки план

Пожалуй, самый привычный формат. По сути, буллет-чарт, поставленный на бок, будет привычен многим пользователям.

Плюсы:
— Классно «зарифмован» с буллет-чартами и выглядит «физично» (похоже на заполнение прогресс-бара).
— Довольно классический и понятный формат.
— Можно делать акцент на «плохих» и «хороших» барах.

Минусы:
— «Рябит» малёк, когда много дат или спарклайны.
— Настройка ширины тиков только ручная и будет плыть для разной ширины экрана.

Ареа факт — Линия план

Это тот вариант, который мне мало нравится. Хотя он оказался более привычен, судя по количеству голосов. Самая моя большая к нему претензия, что по сравнению с теми графиками, где есть только факт (линия), почему-то меняется отображение факта на ареа-чарт.

Плюсы:
— «Зарифмован» с буллет-чартами, так как тоже заполняется как прогресс-бар.
— Довольно классический и понятный формат.

Минусы:
— Меня прям передергивает, что в обычных графиках (без плана), факт — линия, а тут бац — и стал ареа. Тогда надо менять и в остальных графиках на ареа, но это совсем не правильно.
— Ареа можно воспринять как что-то накопительное (площадь под интегралом).

Линия факт — Линия план

На мой вкус самый беззубый вариант из всех. Вроде просто, но контраст между планом и фактом маленький и никаких особо преимуществ нет.

Плюсы:
— Просто.
— Хорошо считывать отдельно динамику плана и факта.

Минусы:
— Сложно отслеживать положение линий относительно друг-друга.

Такой вариант, кстати, предлагает стандарт IBCS, но с отметками в виде заполненных и не заполненных точек. Что-то как-то не айс. Для спарклайнов точно не подойдет.

Линия факт — Линия план + заливка между линиями

Этот вариант предложил один из читателей канала и показал вот такую ссылку на Натана Яу. Вообще вариант прикольный, но мне лично, очень сложно тут считывать само значение плана.

Плюсы:
— Аккуратный, мало чернил. Классно смотрится спраклайном.
— Акцент на «хорошие» и «плохие» даты.

Минусы:
— Сложно отследить линию плана из-за «перекручивания».
— Чтобы сделать «линию» плана, которая очерчивает область заливки, используется неприятный лайфхак в Табло.

Линия факт — Ареа план + заливка между линиями

Аналог предыдущего графика, но с заполнением ниже нижней границы. Кажется, что это помогает считывать отдельно линию плана.

Плюсы:
— Довольно хорошо считывается.
— Акцент на «хорошие» и «плохие» даты.
— «Зарифмован» с графиком отклонений.
— «Зарифмован» с обычными графиками фактов.
— «Зарифмован» с буллет-чартами.

Минусы:
— Нормально считывается динамика линии плана, но не идеально.

Анализ

Я сделал все эти скрины и пошёл советоваться к эксперту по графикам — Саше Богачеву. Он согласился со мной, что важно будет сохранить факт линией, чтобы это сочеталось с остальными графиками, где нет планов. Самым «классическим» ему показался вариант факт — барами, план — засечками, но! чтобы при этом не было графиков факта линиями на соседних графиках.

Составил табличку сравнений вариантов и проставил плюсики.

Итого, решил взять последний вариант «Линия факт — Ареа план + заливка между линиями». Кажется, что это самый сбалансированный вариант из всех. Хотя не могу сказать, что он идеальный. У каждого из вариантов есть куча плюсов и минусов и этот показался мне наиболее робастным: он сохраняет факт линией, а подсветка сразу даёт понимание, что есть план, а что факт. При этом, легко увидеть, в какие периоды было отставание от плана, и такой вариант удобно реализовать в Табло.

П. С. Спасибо большое Саше Богачеву за обсуждения. И ещё многие написали в личку с идеями, тоже большое спасибо: Роман Зубарев, Егор Ларин и Павел.

 4 комментария    4226   8 мес   теория
Ранее Ctrl + ↓