Rose debug info
---------------

Reveal the Data

Блог Ромы Бунина о визуализации, Tableau и развитии BI-систем
канал в телеграмме | подборки примеров | подкасты и видео

Визуализация процессов

Yet another post «Why dataviz matter». Пост из этой же серии про моего пса и змею.

Недавно разбирал фотки и наткнулся на прикольный кейс со старой работы. В прошлой жизни я был бизнес-конслуьтантом по улучшению процессов и занимался оптимизацией на промышленных предприятиях с помощью бережливого производства. Один из принципов этой методологии — визуализация процессов с помощью карт потока Value Stream Mapping.

История

Проект на газодобывающем предприятии — необходимо понять, что мешает работе и почему часто есть проблемы и простои оборудования на месторождении. Проводим первичный анализ и понимаем, что часто не хватает нужных запчастей. Разбираемся почему так происходит — оказывается процесс закупки (только договор + оплата, без доставки) может достигать до 70 рабочих дней! Топы предприятия не верят, что ситуацию можно как-то исправить и считают, что процесс закупки построен нормально.

Рисуем карту потока с рабочей группой

Анализируем процесс — запираемся с рабочей группой в переговорке и строим карту потока с помощью стикеров. Получаем процесс состоящий из 60 шагов, задействующий 19 сотрудников и занимающий кучу времени. Даже на одну доску не уместился весь процесс. Оказывается, что больше всего теряется на согласования договора и других документов!

Печатаем карту

Переносим карту потока в электронный вид, чтобы аккуратно посчитать потери в деньгах, распечатываем на плоттере, склеиваем (так как карта умещаются только на десятке листов A2), идём на встречу к директорам и эффектно разворачиваем на гигантском столе в переговорке.

Это было одно из самых прикольных совещаний за мою карьеру — надо было видеть как удивились и сразу поняли все присутствующие неоптимальность процесса. Сразу увидели кучу блоков согласований, выстраивающихся в колонки на карте и потряслись самим масштабом процесса. У меня было полное ощущение, что случился «Aha-moment» и «Now you see it».

Улучшаем процесс

Очень быстро принялись верные решения — удалось удалить лишние этапы согласования, убрать лишние проверки и сделать новые стандартные формы документов. В итоге процесс стал занимать не 67 рабочих дней, а 33 и сэкономили компании очень серьёзные деньги.

Подводя итог — визуализация и отображение реального масштаба очень важны. Победой в этом кейсе — было именно решение распечатать эту карту потока, чтобы показать масштабы проблемы. Визуализация важна, даже если вы визуализируете не данные, а процессы и схемы.

Обзор стандарта IBCS

Давно хотел написать про этот стандарт, а тут выдался отличный повод — Антон Жиянов сделал отличную, читаемую версию этого стандарта. Антон, большое спасибо! Ещё у Антона куча крутых статей про проектирование интерфейса.

Я решил сделать обзор этого стандарта и рассказать немного своих мыслей про этот стандарт. Как и при рецензии на любую книгу, здесь рекомендую всегда ознакомиться с оригиналом, а не только моим «кратким» содержанием, сам стандарт классный и заслуживает внимания. У меня скорее выдержка того, что запомнило именно мне. Вы, наверняка, увидите что-то своё.

Что такое IBCS (International Business Communication Standards)

Этот стандарт разработан Рольфом Хикертом, бывшим консультантом McKinsey и CTO нишевой немецкой BI-системы MIS. Основная идея стандарта — практические советы и семантические стандарты по дизайну отчетов и графиков. Стандарт распространяется бесплатно и доступен на сайте www.ibcs.com, но сделан там в очень неудобном формате. Почему так — думаю, что для того, чтобы заработать на продаже нормальной pdf версии, которая есть на сайте =) В целом это нормально и такие организации зарабатывают как раз на материалах, сертификациях и тренингах. Но выглядит это конечно немного смешно.

Стандарт состоит из семи разделов, посвященным разным аспектам дизайна дашбордов, дальше пройдемся по каждому из разделов и покажу, что мне понравилось, а что нет.

1. Convey a message

Этот раздел посвящен фундаментальным идеям и правилам. В нём перечислены полезные, но теоретические пункты: знай свою аудиторию, понимай цель визуализации, раскрывай и доказывай идею данными, подсвечивай сообщение на графике и текстом, делай сноски, комментарии и делай summary в конце презентации.
Всё это правильные идеи, но в большинстве случаев применимы только к презентациям, так как часто в операционных дашбордах невозможно заранее «сделать вывод», иначе и дашборд бы был не нужен.

2. Organize content

Эта часть стандарта посвящена последовательности изложения и структуре. Если говорить грубо, то весь раздел про применение принципа MECE, про повествование методами дедукции или индукции и визуальное отображение иерархичных структур. По мне получился ещё более «теоретизированный» раздел, чем первый. Самое полезное для дашбордов, как мне кажется, что не стоит забывать показывать полные данные по всем разрезам для полноты картины.

3. Choose proper visualization

Это раздел является классическим «чарт-чузером» для выбора подходящего типа диаграмм. Очень понравилось, что автор сводит задачи по-сути всего к двум типам — изменение во времени и сравнение категорий. В целом это реально 90% бизнесовых задач, которые можно решить и правда небольшим количеством графиков. Правда совсем не хватает точечного графика, фактоидов (KPI’s) и спарклайнов. И ещё сама стилистика графиков прям кричит на тебя тем, что рассчитана на печать и супер строгий минимализм. Я сам люблю минимализм, но тут он выглядит сильно outdated именно стилистически.

Понравились детальные описания каждого графика и его оформления, и практические советы как использовать правило близости в чартах.

Ещё более круто описано как делать таблицы, очень классно показано, как отделять столбцы разного вида, как подчеркивать группировки и т. п. Просто отличное руководство по верстке таблиц и идеи как их оформлять. В Табло такое сделать будет почти нереально, а вот если буду делать таблички в Экселе, то обязательно воспользуюсь этими идеями.

Мы вот только обсудили с коллегами, что можно убрать спокойно горизонтальные линии в каждой ячейке, и что на больших таблицах, такое оформление уже кажется довольно громоздким.

Не понравился вот этот вид графиков, очень странные сгруппированные бар-чарты, кажется, что это очень неудобно читать и в варианте с треугольничком, и при наложении баров друг под другом.

А ещё стандарт не толерантный и прям запрещает делать некоторые виды графиков. ;—)

4. Avoid clutter

Следующий раздел полностью посвящен удалению non-data-ink. Тут не знаю, что особо сказать. Хорошие примеры, но довольно очевидные — убирайте лишнее и редактируйте текст.

5. Increase information density

Следующий раздел обратный — про повышение количества data-ink на графиках.

Здесь понравились те вещи, про которые я сам часто говорю, но мало где слышу. Что стоит увеличивать кол-во срезов, метрик и дат, не бояться уменьшать размеры графиков и делать таблички с встроенными графиками.

Не понравилось, что предлагают делать двойные оси и не очень понятные виды графиков.

6. Ensure visual integrity

Этот раздел посвящён тому как не обмануть зрителя при помощи масштаба и осей, что не стоит использовать логарифмические оси и делать бар-чарты не от нуля и т. п. Мне больше всего понравился вот этот пример. Про то, как совместить графики с одним масштабом, но когда есть какой-то срез сильно преобладающий над другими (обычно это Москва в бизнесовых данных).

Но очень сильно смутило предложение делать что-то подобное:

7. Apply semantic notation

Пожалуй самый интересный раздел, который как раз больше всего похож на стандарт. В этом разделе предлагаются идеи как соблюдать одинаковое положение элементов, маркировать одинаковые виды данных, и т. п.

Первая часть довольно скучная, хотя и супер полезная — пишите одинаково заголовки, делайте одинаковые шрифты и т. п.

А вот дальше начинаются очень интересные идеи, которые мне хочется как-то попробовать применить в работе, но пока не придумал как именно.

Идея № 1. Использовать для базовых метрик (данных) и расчетных метрик разные толщины линий и бар-чартов. Затея выглядит интересной, но пока не могу понять стоит ли того. И это точно сложно реализовывать и поддерживать. Но сама идея такого деления, по-моему, очень необычная.

Идея № 2. Использовать для обозначения факта, плана. прошлого периода и прогноза всегда одинаковые визуальные оформления. Факт — темная сплошная заливка, План — «пустотелая» заливка, Прошлый период — серая сплошная заливка, Прогноз — штриховка. Кажется, что это тоже очень прикольная идея. Такие «сценарии» существуют во всех бизнесах и это правда очень удобно. Но смущает реализация со  штриховкой и «пустыми» маркерами для линий плана.

Мы у себя такую унификацию тоже частично внедрили в внутреннем стайлгайде. Но хочу это ещё прокачивать.

Идея № 3. Использовать для разных скейлов, разные ширины баров. По-моему довольно элегантно. Хотя реализация снова будет довольно сложной.

Идея № 4. Использовать для абсолютных отклонений бар-чарты, для процентных пин-чарты (аля лолипопы). Всегда показывать оба сравнения для всех пар план-факт, факт-прогноз и т. п. Мне здесь больше всего нравится именно разделение абс. отклонений и процентных. Кажется, что довольно элегантное решение. Только сами пин-чарты мне не нравятся, делал бы вместо них, например, стандартные лолипоп-чарты.

Идея № 5. Для стандартных бизнесовых периодов типа YTD, MAT и т. п. завести отображение символами, чтобы быстро их показывать на графиках и таблицах. Мне этая идея очень нравится, как идея. Но всё-таки в реальном использовании я бы всегда писал начало и конец периода Jan’18 … Jan’19 и т. п. Мы у себя в стандарте делаем именно так.

Выводы и общие впечатления

Стандарт мне нравится. Это отличная сводка правил и интересных находок. Очень простая и понятная подача из свода правил и карточек формата «Don’ts and Dos». Он точно не подходит в формате «как есть» для дашбордов, есть спорные моменты и рекомендации и устаревший визуальный стиль. Используется через чур мало цветом, хотя очень круто, что основной — черный (мы у себя сделали так же). В целом много интересных идей, рекомендую к прочтению.

По-мимо самого стандарта на сайте есть ещё и гайдлайны. Можно прям брать и делать внутренние рекомендации по аналогии.

Есть неполные, но довольно близкие, реализации стандарта в Табло.

И ещё есть расширения для Excel и Power BI, которые позволяют работать по этому стандарту. Вот на этой страничке можно потыкать живые дашборды. Не всё идеально, но таблицы выглядят просто отлично.

Из забавного. В том году я делал длинный лонгрид про графики план-факта. Итоговый вариант получился довольно похож на вот эти графики ниже, хотя я тогда ещё не видел такую реализацию этих графиков в виде этого стандарта, нашёл только сейчас в плагине для Power BI.

Переверстка в Power BI

Ко мне в личку пришёл Владимир Шилов из Ростелекома и попросил взять в рубрику «переверстка» дашборд (точнее темплейт) в Power BI. Сначала я хотел отказаться, но потом решил «WTF, hold my beer!». Впервые переделал дашборд в этой BI-системе. Получился очень интересный лично для меня опыт. Решил собрать в этой заметке, что заметил на счет конкретно этого дашборда и Power BI в целом.

Этот дашборд является темплейтом и примером как можно оформлять дашборды. Владимир занимается развитием BI в компании и хочет улучшить внешний вид отчетов. Он сделал этот темплейт как пример, на которые могли бы ориентироваться сотрудники используя селф-сервис. Основная идея со слов Владимира — дать правильное оформление заголовка, фильтров и примеры визуализаций, которые могут быть использованы в дашбордах. Но само положение и размеры визуализаций в целом случайны.

Вот три исходных дашборда. Все данные фейковые и случайные, картинки публикуются с разрешения Владимира.

Дальше я подробно пройдусь по правилам, которые были нарушены и с помощью которых можно улучшить дашборд.

Выравнивание по центру

Такое выравнивание текста применяется в заголовках когда мы хотим привлечь внимание зрителя. Оно смотрится уместным на афише, вывеске или обложке книги. Использовать же выравнивание по центру для всех заголовков и элементов на дашборде — плохая идея. Получается много рваных краёв, а эффект привлечения внимания теряется и получается визуальный шум. Поэтому первое, что я сделал — поменял выравнивание всех заголовков, подзаголовков и фактоидов налево.

Подробнее про выключку по центру (это так называется выравнивание в типографике):
Заметка Игоря Штанга
Совет Михаила Нозика про смену выравнивания и ещё один, про выравнивание по ширине
Памятка верстальщика

Правило контраста и иерархии

Вся типографика на дашборде должна подчиняться правилам иерархии. Самым большим элементом должен быть заголовок дашборда, затем заголовки блоков и т. п.

В темплейте же получилось, что самым значимыми элементами являются фактоиды. Ещё много разных начертаний, хотя достаточно было бы двух-трёх.

Самыми контрастными по размеру и цвету получились тримеп, фактоиды и пай-чарт. Для диаграмм с большой площадью заливки лучше использовать пастельные вариант палитры, чтобы они не давили на зрителя своей «массой»

Видео про контраст от Михала Нозика
 

Правило близости, правило внутреннего и внешнего

Расстояния от края блока до элементов внутри него получились очень маленькими. Из-за этого элементы смотрятся слипшимися. Чтобы исправить это — нужно дать больше пространства между блоками.

Подробнее:
Разъяснение этого правила от Артёма Горбунова
Как теория близости работает в интерфейсе?

Фильтры без аналитики

Очень частый пример того, что фильтры в дашбордах используются не на полную мощность. Если вы даете пользователю просто фильтры или кнопки, вы не помогаете ему выбрать значение фильтра — он должен заранее знать, что он хочет посмотреть. Или начать перещёлкивать фильтры, пытаясь запомнить значения графиков, чтобы сравнить их между собой. Вместо этого я обожаю применять мини бар-чарты, которые можно кликать и они будут работать как фильтры, но при этом они будут давать возможность сравнивать значение метрики между срезами ещё даже ничего не выбрав. Можно показывать, например, значение за последний период или усреднение по всем периодам.

Применив принципы, которые описал выше, у меня получился вот такой результат:

Что я изменил:
— Выровнял всё по левому краю
— Сделал меньше контрасты между заголовком и фактоидами, унифицировал заголовки
— Сделал весь полу-черный текст черным
— Добавил больше пространства между блоками и убрал серую сетку (так как её сложно сделать при верстке в PBI)
— Фильтры выделил отдельной плашкой и кнопки заменил на мини бар-чарты
— Сделал пастельные цвета для тримапа
— Лого переместил на право, так как оно текстовое и плохо стыковалось с заголовком
— Сделал пропорции графиков более подходящими под их тип (да, графики были только примерами, но надо чтобы разработчики запоминали такие вещи из примеров)
— Убрал странные индикаторы в виде восклицательного знака в фактоидах

Power BI vs Tableau

Я занимался только версткой и оформлением, поэтому сравню именно эти аспекты.

Сам подход к верстке — отличается координально. С одной стороны, в Power BI, он гораздо более прост и привычен — полное ощущение, что работаешь с Power Point. А с другой, сразу ставит крест на нормальной адаптивности под разные экраны ноутбуков. Табло в этом плане круче.

Настройки оформления в Power BI сейчас довольно обширные (последний раз я трогал его года три назад), позволяют закрыть большинство кейсов. Мне только не хватило возможности настраивать внутренние паддинги для блоков. И вынесло мозг, что нельзя поменять цвет только части текста в строке.

Ещё выписал для себя список фич, которым прям позавидовал:
— Офигенные фильтры, которые при снятии всех галочек догадываются, что нужно показывать всё. Это очень удобно
— Крутая визуализация для факторного анализа (дерево метрик). Я такую в Табло два месяца делал, а тут бац и в два клика =(
— Копи-паст форматирования работает шикарно, а не как в Табло
— Группировки блоков на дашборде с помощью одной кнопки. Какой же кайф!
— Очень неплохие бар-чарт таблицы с правильным выравниванием цифр
— Можно вставить нормально ссылку в текст
— Умные подписи внутри тримапа при иерархии

Выводы

Power BI не удалось меня в себя влюбить, всё равно продукт прям так и предлагает тебе сделать плохо. Попробуйте сделать стиль таблицы «Броские строки», просто вырвиглаз 🤦‍♂️
Но в целом у меня от него сложились гораздо более приятные впечатления, чем три года назад. И оказывается, в нём можно делать очень даже неплохие по оформлению дашборды без миллиарда цветом и с аккуратным выравниванием. ;-)

Все населённые пункты РФ

Сделал визуализацию про все населённые пункты РФ, получилось красиво, напоминает карту рельефа.

68% людей проживают в городах. Больше всего в России деревень — 76 тысяч. На севере больше деревень и сёл, а на юге станицы и хутора, не знал о такой особенности. А ещё, я был уверен, что в России куча деревень с названием Бухалово. Оказалось, что это не так, их всего пять, зато целых 286 Александровок.

Давно хотел сделать что-то подобное, но не попадалось хороших данных. А тут ко мне пришли ребята из проекта «Инфраструктура научно-исследовательских данных» и попросили про них рассказать. Это портал, где они собирают и обогащают открытые данные, и дальше их бесплатно раздают. Я решил посмотреть, какие есть датасеты, наткнулся на этот и визуализировал его.

Качество датасетов на портале издалека выглядит лучше, чем на портале открытых данных РФ. Пока там немного наборов, но есть большие и интересные. Надеюсь проект правда направлен на благие дела, будут только полезные датасеты и он не сведётся к деятельности ради закрытия планов.

Видеоподкаст c Анастасией Кузнецовой

Записал подкаст с Анастасией Кузнецовой, автором канала Настенька и графики (если ещё не подписаны, то очень рекомендую).

Поговорили про то, как дизайн помогает аналитикам в работе, посмотрели работы Насти и обсудили работы с Табло Паблика в новой рубрике «дашборд-рулетка».

Аудиоверсия
Текстовая версия — под видео (спасибо Наташе Shirosayuri!)

0:43 Карьерный путь
Началось всё с того, что мне предложили вести паблик, он был про анализ данных и визуализацию и поскольку посты нужно было делать каждый день, я стала очень много читать и изучать в этой сфере, перезнакомилась со множеством людей. Параллельно с этим я занималась количественными исследованиями для научной деятельности. Потом поняла, что это всё сильно пересекается и что датавиз это тема. Сейчас уже веду только свой паблик.

Я скорее называю себя свободным аналитиком, не привязываюсь к какому-то определению. Или, например, говорю, что я автор телеграмм-канала. Дата-визуализатором я себя не называю, всё же скорее ближе к аналитике.

По образованию я социолог. Когда я поступала, то ничего не знала про это. На профтестах мне сказали, что я люблю вставлять данные в таблички и я поняла, что это правда моё. Я пошла в Вышку на социологию, эта программа сейчас называется «Социология и социальная информатика». Там больше уклон на computational social of science, на все, что связано и с анализом данных, и в том числе с визуализацией. Там мы учили программирование на R, на третьем курсе немного Tableau, хотя очень поверхностно. В дальнейшем я увидела, насколько больше там глубины на самом деле. Ну и когда занималась научными исследованиями, часто данные просто визуализировала и был такой больше описательный анализ.

Если кратко, то социология это про исследование людей. Но если психология, например, больше про то, что человек чувствует или как переживает, то социологи смотрят на людей в контексте других людей. В социологии есть разделение на качественную, количественную и есть смешанные методы. Мне больше нравится, когда мы совмещаем какие-то интервью с количественным анализом, конечно. Я занималась исследованиями университетов — делала библиометрический анализ (как они сотрудничают в научном поле) и как упоминаются в СМИ. Видно, как по-разному выстраивают университеты свои стратегии в сотрудничестве. Про контекст любопытно, что, если какие-то топовые вузы упоминаются в темах рейтингов, экспертных оценках, то вузы послабее — в статьях вида «ректора посадили» или «отпустили под домашний арест».

7:12 Про работу аналитика клиентских данных
Основными моими обязанностями сейчас является построение дашбордов, к сожалению, пока что в data studio. И обычная, в общем, аналитика, подсчёты каких-либо моделей, показателей, проведение тестов. То есть анализирую все данные, которые есть, а их много: и crm, и логи, и опросные данные.Также я преподаю в Вышке и Европейском университете визуализацию данных и веду свой канал.

8:34 Зачем аналитику нужно знать основы дизайна
Я пропагандирую идею, что визуализация данных это больше про коммуникацию. У меня есть пост в блоге про датасатанистов, которые говорят на каких-то своих языках, и другим людям в компании не понятно, что происходит. Поэтому я выступаю за то, чтобы сделать всё максимально понятным и удобным. Базовые навыки предоставления информации должны присутствовать. От того, что ты покажешь результаты своего регрессионного анализа табличкой, никому понятнее не станет. Все результаты лучше визуализировать. Хотя я не могу сказать, что всегда соблюдаю свои же принципы, потому что многие вещи приходится делать в спешке. Правда, потом я к ним возвращаюсь, чтобы что-то сделать лучше.

Когда я изначально пришла на свою позицию, от меня больше ожидали таблиц. В дальнейшем, когда у меня сменился руководитель, попросили рисовать графики, поэтому думаю, что бизнес замечает старания визуализаторов.

13:14 Наука в северной Корее

Это первая работа в моей визуализаторской карьере про науку в Северной Корее. Так как я занималась до этого библиометрией, я решила посмотреть на неё. Данные я брала из web of science, это база научных журналов высокого уровня. Тут есть интересные вещи, например, про финансирующие агентства, где есть какие-то китайские организации, а ещё сети соавторства и карты терминов. Это сделано при помощи VOSViewer. Как оказалось, темы северокорейских учёных очень технические. А в сетях соавторства оказалось, что 39 из 265 авторов зовут «Ким». Ещё было про языки публикации, например, 3 на русском, до распада СССР. У исследователей из Северной Кореи есть некоторая свобода: им предоставляется интернет, а это уже достаточно много. Очень интересно, про что они пишут и как осуществляется их общение. Можно увидеть, как меняется развитие тематик, по цвету сети: сразу больше писали про физику, а позже стали популярнее молекулярные исследования и генетика.

В плане бизнеса применение сетей — это скорее HR-аналитика. С помощью сетей можно находить такие изолированные группы или людей, которые называются мостами, и объединяют их.

20:25 Граф для связей в ВК

Это сеть друзей, она задумывалась как подарок. Здесь я, мой друг и как наши друзья связаны между собой. На сетях много делается исследований по пересечениям. Я как-то анализировала группы МСГ и там есть две группы: официальная и не очень. И в официальной, если построить сеть друзей, то большего всего связей получается у разных председателей молодёжных советов, а у неофициальной это будут просто такие популярные ребята. В этой сети с другом можно увидеть разные кластеры, самый большой кластер — это университет, и там часть наш факультет, а часть другие программы. Зелёный кластер — это мои мурманские друзья. Сетки по друзьям в принципе все так раскладываются: есть школа, клубы по интересам, универ, может быть работа.

23:50 Музыка в ВК

Люблю с данными ВК работать. Для блога SkillFactory писала статью про музыку, хотя я в ВК уже давно не слушаю. Эта статья очень понравилась людям и получила много отклика.

Здесь получается интересная вещь со скаттерплотом по продолжительности и частоте прослушиваний. Мне скидывали другие люди, как у них эти графики получились, и там были выбросы: либо какие-то длинные подкасты, либо много коротких песен.

Барчарты закрашены по продолжительности песен и кажется, что это не так сложно для восприятия зрителями как, например, двойные оси.

Облако слов в плане аналитики даёт примерно ничего, но все любят на них смотреть, и я в том числе, оно скорее для красоты.

У ВК есть возможность запросить архив, чтобы узнать, какие у них есть данные про вас. Там сохраняются все сообщения, лайки, комментарии. Можно либо посмотреть на свои сообщения 10 года и ужаснуться, либо вот, собрать из них такие красивые визуализации.

35:05 Сравнение пенсий

Мне однажды скинули статью про сравнение пенсий по странам, в которой данные были представлены просто текстом. Поэтому я решила их визуализировать. Здесь барчарты и картинки про средний возраст жизни и размер пенсии. Это данные на 2018 год, уже могло что-то поменяться. Так же я посмотрела, сколько бигмаков можно купить на эту пенсию. Мне очень нравится индекс бигмаков для сравнения таких вещей. Получается, что в Дании самая большая пенсия, можно купить целых 689 штук, а в России всего лишь 100, то есть 3 с лишним в день.

33:00​ Дашборд рулетка
35:05​ — Социальное неравенство в США
43:44​ — Вкус рождества
54:50​ — Торнадо

1:05:22 За чем следит и что почитать
Из того, зачем я слежу, это Flowing Data и Visual Cinnamon. Ещё очень много пабликов в телеграмме, я за ними за всеми слежу, это и Чартомойка, и Reveal the Data, и Дашбордец. Ещё в твиттере очень много интересного публикуют.

Мне очень нравится книга Дональда Нормана «Дизайн привычных вещей», классическая в дизайне. Он описывает такую идею: если вы не понимаете, как работает какой-то прибор, то это проблема дизайна, а не ваша. И это применимо так же к дашбордам: если вы не понимаете, как работает какой-то дашборд, то это проблема тех, кто их разрабатывает, то есть наша.

1:07:20 Блиц
Москва или Питер? — Питер.
Google Studio или Tableau? — Когда как. Tableau для души, Google Studio для скорости.
Tableau или R или ggplot? — Если Tableau или ggplot, то Tableau, если Tableau или R, то R.
Тафти или Босток? — Тафти.
BI или дата арт? — Дата арт, потому что для души.

Ссылки, которые рекомендовала Настя:
https://flowingdata.com
https://www.visualcinnamon.com
https://medium.com/@kennelliott/39-studies-about-human-perception-in-30-minutes-4728f9e31a73

Книги:
— Дизайн привычных вещей: https://www.mann-ivanov-ferber.ru/books/dizajn-privyichnyix-veshhej/
— Storytelling With Data: A Data Visualization Guide for Business Professionals: https://www.amazon.com/Storytelling-Data-Visualization-Business-Professionals/dp/1119002257
— Better Data Visualizations: A Guide for Scholars, Researchers, and Wonks: https://policyviz.com/pv_books/better-data-visualizations-a-guide-for-scholars-researchers-and-wonks/

Список лайфхаков Табло

Решил собирать в одном месте все лайфхаки по Табло, чтобы можно было легче искать нужный.

Плейлист со всеми выпусками:

Выпуск №1
0:00 — Как сделать удобный фактоид с приростами период к периоду
9:26 — Как показать разрыв в данных с помощью Missing Values
11:58 — Как ускорить работу в Табло за счет фишек интерфейса

Выпуск №2
0:00 — Сортировка по значению за последний месяц с помощью Nested Table Calcs
4:04 — Оформление спарклайнов при помощи Reference Lines
7:12 — Highlighted таблица с подсветкой по одной метрике из Measure Values

Выпуск №3
0:00 — UTF символы для создания цветовой легенды
3:29 — Динамический фильтр дат с окном и ренджем
7:08 — Подпись событий о запусках или маркетинговых активностях во времени на таймсерии

Выпуск №4
0:00 — Как сделать удобную адаптивную легенду
3:00 — Как подписать точки на графике по условию
7:12 — Как избежать проблем при работе с Табло на Windows

Выпуск №5
0:00 — Составные таблицы из нескольких листов
4:19 — Функция Random()
8:16 — Переименование Worksheets и Dashboards на сервере

Итогов года пост 2020

Собрал все итоги года в одном посте.

Telegram

Начну с Телеграма. Данные собрал из API tgstat.ru, выгрузки из самого Телеграма и некоторую разметку сделал руками. Получился такой дашборд:

Основные хайлайты
— Канал вырос с 0 до 2.2К подписчиков.
— Всё время поддерживается Engagement Rate (ERR) ≈ 100% (Ср. охват поста/Кол-во подписчиков). Эта метрика для меня важнее кол-ва подписчиков, так как показывает, насколько интересен контент читателям и насколько им делятся.
— Больше всего в канале постов в тегом #ссылка — 81 шт., наибольший охват и ERR получили посты с тегами #статья — 2К охват, 241% ERR
— Чаще всего я публикую посты по пятницам, но охват у таких постов не самый большой. По времени чаще всего с 14 до 15, здесь показатели тоже небольшие, видимо обеденное время. Нужно будет с этим поэкспериментировать =)
— Был написал 241 пост. Самым просматриваемым постом стал пост про черные точки, его репостнули в канале Адовый UX. Самым виральным стал пост про статью «Таблица или график? Как убедить заказчика».
— 80% просмотров на пост приходятся за первые 3-4 часа после публикации.

Впечатления
Я, если честно, приятно удивлён количеством подписчиков и вовлеченностью. Я веду блог пять лет, и мне всегда казалось, что тематика супер узкая и интересная малому количеству людей. Когда заводил канал, думал, что максимальный потолок для канала ~1К подписчиков (посчитал как половина от суммы участников чата по визуализации и чата по Табло). Рад, что контент интересен и полезен, для меня это классная возможность поделиться тем, что я считаю важным, и развить личный бренд.

Спасибо всем, кто делится постами, особенно @rockyourdata, @dashboardets, @chartomojka, @data_publication, @leftjoin, @internetanalytics, @analyst_club, @nastengraph, @dataviznews, @novichkovnet или просто в личных сообщениях. Кстати, список каналов, за которыми я сам слежу лежит здесь.

YouTube

Данные взял из Data API YouTube Data API, скачав их с помощью скрипта на js напрямую в гугл-таблицы — очень удобно! https://public.tableau.com/views/YoutubeAnalysis_16090922510490/YouTubeAnalysis Собрал дашборд, по аналогии с тем, что разбирали на вебинаре по адаптивной верстке.

Основные хайлайты
— За год я выпустил 26 видео, на канал подписалось 429 человек, всего 16К просмотров.
— Большего всего сморят видео с типом #выступление и #подкаст. В среднем одно видео собирает ~400 просмотров (медиана 370).
— Самое просматриваемое видео «Алгоритм разработки дашборда» на Date Learn. Меньше всего у перевёрстки «Product Superstore».
— Самый короткий подкаст был пилотным, с Андреем Дорожным, но зато у него больше всего просмотров среди подкастов. Дольше всего проговорили с Никитой Рокотяном.

Впечатления
Ютуб требует довольно много усилий на продакшен, при этом качество мне всё равно пока не нравится, видно, что сделано на коленке. Зато он очерчивает core аудиторию которая готова тратить время на просмотры, а не только на посты в телеграмме. Самое большое разочарование для меня, что не взлетела рубрика #переверстка, мне казалось, что это самый полезный контент на канале, но почему-то заходит он плохо, если есть идеи как его прокачать — пишите в личку.

Блог и сайт

Данные для этого анализа мне помог собрать Саша Михайлов, автора канала data-будни про инжиниринг данных, рекомендую. Данные тянутся из базы блога с помощью питона записанного в гугл-коллабе и после этого складируются в гугл-таблицы. Скоро сделаем с Сашей инструкцию, как собрать такой же дашборд если у вас блог на Эгее. Плюс ещё кое-что посмотрел в Я.Метрике. И конечно же собрал дашборд. =)

Основные хайлайты
— За год написал в блог 32 заметки, из них 14 «настоящих» статей, остальное дубли подборок из телеграмма и видео с Ютуба. Это больше, чем в прошлом и позапрошлом году, но меньше чем в 2017-ом.
— Самой просматриваемой стала заметка «Интерфейсы в BI системах».
— Завёл отдельный тред для подборки работ по визуализации, собрал 93 классных примера.
— Самой популярной заметкой по запросам из поисковиков является уже который год статья про логарифмическую шкалу. В этом году она особенно популярна ))) Смотрите как забавно отличается рост просмотров от остальных заметок.

Впечатления
В этом году мне прям нравятся лонгриды, которые написал. Доволен, что из них получается стройная теория по проектированию дашбордов.

Дисклеймер по данным
Сбор просмотров начался только с марта, после обновления платформы блога. Поэтому хотя там можно отмотать фильтр по дате публикации, но это будут просмотры только за текущий год.

Подборка самых важных и полезных авторских материалов за год по моему мнению

Статья «Навыки для визуализации данных»
Статья «Интерфейсы в BI-системах»
Вебинар «Алгоритм проектирования дашборда»
Статья «Шаблоны верстки дашбордов» (скоро буду обновлять, докрутил идеи)
Вебинар про Адаптивную верстку в Табло
Статья «Таблица или график? Как убедить заказчика» и вебинар на базе этой статьи
Статья «График план-факт во времени»
Выступление про стайлгад и темплпейт Я.Такси
Трибьют «Тафти в Табло»
Дашборд про рынок вакансий аналитиков

Tableau Public

Собрал подборку работ с Табло Паблик, которые понравились мне больше всего за 2020 год. Сложнее всего на Паблике найти хорошие дашборды, одни лонгриды и инфографика )))

Личная статистика

Последняя часть с итогами. В ней собрал все данные, которые можно получить о себе почти без усилий. Графики в этот раз попытался сделать в стиле «инстаграм». Осваиваю новые форматы, сразу чувствуется нехватка практики.

В этом году очень много времени провел, работая за компом. Планирую в следующем году ограничить время на работу. Это всё плохо сказывается на продуктивности и здоровье. Надо больше отдыхать и относиться к этому, как к части работы. В основном трачу время на Табло (34%) и мессенджеры (28% и 82К отправленных сообщений, 187 часов в zoom).

В конце сентября заболел ковидом и на это же время наложилось несколько важных проектов, из-за этого потерял все старания по контролю веса с начала года. Благо сам вирус перенёс супер просто, но ещё 2 месяца после этого был как ватный. Интересно, что в данных это проявилось как повышенный сердечный ритм в октябре и ноябре. Неприятная болезнь, какие-то пост эффекты дурацкие. Из-за этого же явно меньше ходил, особенно в конце года совсем не соблюдал планку в 8500 шагов в день.

Из забавных эффектов карантина, стал довольно много и регулярно спать по сравнению с прошлым годом.

Данные: MI Band 3, Mi Scale, Timecamp.com

Табло

Добавил 2020-ый год в свою любимую [«визуализацию про время, которое я трачу на визуализацию». Табло всё больше в моей жизни. В этом году много работал руками и обучал, отсюда набежало больше тысячи часов.

Данные: Timecamp.com

Траты

Чаще всего в этом году тратил на супермаркеты, транспорт и кафешки. Больше всего потратил на переводы и нал, они превратились в три самые крупные покупки: машину, подводку газа в дом и обустройство участка.

Данные: Выгрузка из банка
 

Перемещения

В этом году никаких зарубежных поездок не было, как и у большинства. Зато я снова перешёл с iPhone на Android, и там есть замечательная функция выгрузки местоположений и вообще любой статистики по Гугл аккаунту. Получилась классная карта. В карантин много раз порадовался, что последние 3 года живу за городом. Прикольно видно как я переехал с юго-востока на северо-запад, а потом на север.

Данные: takeout.google.com

Сайт и айдентика

Ещё в этом году обновил сай и его английскую версию. За это огромное спасибо Кириллу Беляеву, он взялся нарисовать дизайн, а я заверстал сайт.

Если вам будет нужен дизайн, очень рекомендую обратиться к Кириллу — его портфолио и канал.

Впечатления
Год был ярким как на хорошие события, так и на плохие. Для меня в итоге он имеет скорее положительную окраску, но осталось куча всего, что хочется докрутить в следующем году. Самыми яркими впечатлением стали, пожалуй, выступление на конференции Матемаркетинг, концерт с группой (хобби — играю на басу в кавер-группе) и запуск телеграмм-канала.

🎄Всех с наступившим, приятных заказчиков и классных дашбордов вам в этом году!

Адаптивная верстка в Табло

Выступил на проекте DataLearn с рассказом про адаптивную верстку.

Материалы со вчерашнего вебинара про адаптивную верстку в Табло:

  1. Запись вебинара
  2. Книга на Паблике (можно скачать и посмотреть, что внутри)
  3. Статьи The Economist:
    про ошибки в мобильных графиках
    про адаптацию графиков для инстаграма
  4. Дашборд про зарплаты (пример с CSS, можно посмотреть в инспекторе кода)
  5. Навыки и литература по визуализации

Сам дашборд, на котором разбирали теорию, — это статистика канала Data Learn на YouTube. Данные собрал через API YouTube и скрипт в гугл-таблицах. Получился прикольный дашборд, который можно будет переиспользовать.

Видеоподкаст с Никитой Рокотяном

Записал подкаст с Никтой Рокотяном — Data Visualization Engineer, основателем студии Interacta и автором канала Виз Ньюз. Никита — отличный пример «renaissance man», человека совмещающего большое количество разных компетенций и интересов: кодинг, дизайн, аналитику и арт.

Поговорили с Никитой о сложной визуализации для аналитических инструментов, посмотрели примеры интересных проектов и обсудили как обстоят дела с визуализацией в Кремниевой долине. В конце был отдельный блок про дата-арт и криэйтив кодинг. Не совсем по теме визуализации, но невероятно вдохновляет. В живую проекты можно посмотреть на странице компании и личном сайте Никиты.

Аудиоверсия
Текстовая версия — под видео (спасибо Наташе Shirosayuri!)

1:03 Карьерный путь
Термин «визуализация данных» настолько широкий, что те, кто знают, что это такое, до конца не понимают, чем конкретно ты занимаешься. А те, кто не знают, путают это с другими областями. Например, с 3d-визуализацией или визуализацией мыслей.

Когда я нахожусь в профессиональной среде, я говорю, что занимаюсь инструментами для визуальной аналитики. Это включает в себя не только визуализацию, но и алгоритмы, и ux-дизайн. В течении карьеры я занимался не только этим, мы также делали компоненты, которые куда-либо встраивались, и дата-арт.
Я делаю всё, но стараюсь концентрироваться на создании визуализаций и компонент инженерной части, и немного ещё data science и дизайн. Прелесть области состоит в том, чтобы делать всё и сразу.

По образованию я физик. Занимался научной работой около 5-6 лет, был сотрудником лаборатории климата и окружающей среды. Мы исследовали по солнечному излучению состав атмосферы. Кратко: солнечное излучение проходит через атмосферу и может быть измерено в наземных лабораториях. Потом оно отражается от поверхности Земли и может быть замерено спутником. Таким образом, наземные лаборатории являются валидацией данных от спутников. Потому что спутники могут давать данные по всей поверхности Земли, а лаборатории — нет. Молекулы в атмосфере поглощают излучение и по его спектру мы можем достаточно точно восстановить состав атмосферы.

Со временем это переросло в визуализацию, потому что я хотел совмещать свой научный интерес с творческим.
До этого я занимался дизайном, работал в типографии, мне нравился дизайн как область, и математика, алгоритмы. Область, в которой это всё соединяется и востребовано — визуализация данных.

8:58 Офф-топ: есть ли глобальное потепление?
Потепление есть, несомненно. Если какое-то время тому назад часть учёных ещё считала, что только на 95% потепление обусловлено антропогенными причинами, то сейчас почти все ученые сошлись во мнении. И риски очень велики. Огромный ущерб экосистемам, которые мы не видим, а дальше всё идёт по цепочке. Такое быстрое изменение для экосистем очень губительно. Оно не уничтожит планету, но нам станет всем не очень хорошо и наше существование будет под угрозой.

Сам процесс изменения климата медленный и инерционный: то, что мы запустили сейчас будет продолжаться ещё на протяжении ста лет. Ты не сразу можешь видеть результат своих действий.

11:23 Визуализация в Кремниевой долине и переезд
Сейчас здесь почти все работают из дома. Все очень серьёзно отнеслись к коронавирусу. Ещё летом крупные компании перевели на удалёнку всех до следующего года. Поэтому нет того эффекта кампусов, как будто в научном городке, где кипит жизнь. Это не город, это такая деревня, конгломерация крупных компаний, где для сотрудников созданы тепличные условия, чтобы они могли продуктивно работать весь день. Сейчас это остановилось и многие работают из дома. Нет социального эффекта, который был здесь всегда.

Очень интересно развитие долины после пандемии. Я не думаю, что она вымрет, возможно, она расцветёт ещё больше. До этого здесь было слишком много людей, из-за чего цены слишком выросли, было видно слишком большое расслоение общества и огромное количество проблем.

К истории о том, как я переехал. Я долгое время работал с клиентами отовсюду. Как-то так случилось со временем, что большая их часть была из долины. Один из них оказался амбициозным стартапом. У нас завязалось сотрудничество, и на протяжении 2-3х лет всё шло к тому, что для дальнейшего развития мне было бы полезно находиться здесь. Если и учиться где-то создавать крупные масштабные проекты, то именно здесь, потому что это столица современных технологий. Кроме того, по моему опыту американцы из долины и из Нью-Йорка умеют очень продуктивно работать, не растрачивая время на бесполезные детали.

Что касается визуализации, субъективно кажется, что потребность в специалистах всё ещё велика. Именно разработчиком визуализаций — их достаточно мало, чтобы насытить имеющийся рынок. А рынок растёт, потому что значительное число компаний начинают понимать, что можно стать лучше, используя визуализацию.
Наиболее интересная область для меня находится на стыке визуализации данных, data science и ux-дизайна. Если ты можешь создать компонент, который работает с динамическими данными, при этом он красивый и информативный, то это успех и огромное количество продуктов может сделать шаг вперёд благодаря подобным инструментам. Таких специалистов очень мало. Я вижу компании, которые ищут дизайнеров, которые умеют кодить. Они и раньше были, но сейчас для таких специалистов появился рынок.

21:20 Примеры проектов
Show Real на нашем сайте я собирал достаточно долго из разных кусочков. Здесь не только инструменты, но и самые разные проекты. В принципе он отражает то, что нам нравится делать. В связи с тем, что всё моё время уходит на работу со стартапом, студия существует сама по себе без моего активного участия. В проектах, которые там идут, я иногда выступаю в роли ментора. К сожалению, очень много проектов находятся под NDA и ими нельзя поделиться, хотя зачастую они все очень интересные, удобные и красивые.

23:50 Data-Driven Country Map

Это конкурсный проект, который мы делали для World Data Visualization Price Мы сделали инструмент, который может перерасти во что-то больше как концепция, возможно с другим набором данных.

Идея состоит в том, что у нас есть набор данных о разных странах и каждая конкретная страна может быть охарактеризована набором определённых свойств. Например, число жителей, ВВП, различные индексы, уровень коррупции, эффективность судебной системы. Огромное количество метрик и сложно составить картину того, какие это страны. Как они соотносятся друг с другом по своим свойствам, а не по географии? Мы взяли алгоритм t-sne. Он берёт на вход массив данных, где каждая точка описывается большим набором характеристик, и умеет находить между ними схожести и группировать точки по ним. Здесь точки — это страны, и мы видим в них какие-то паттерны. То есть алгоритм считает, что эти страны между собой похожи по какой-то причине. Ты как исследователь сперва не знаешь эту причину, и дальше начинаешь изучать. Первое, что мы сделали, это нанесли эти точки, страны, и покрасили их по континентам. Сама карта открыта для интерпретаций, и чтобы понять, почему те или иные точки оказались рядом, нужно иметь интерактивный интерфейс, который может дать тебе возможность в реальном времени что-то включать и смотреть, как алгоритм реагирует. Это позволяет тебе понять, какие свойства находятся в основании попадания стран в кластеры. Кроме того, можно выбрать какую-то определенную страну и подвигать параметры для неё. Подобная игра позволяет думать комплексно о том, что можно изменить, чтобы страна попала в тот или иной кластер.

35:20 The Seamless Web

Это экспериментальный визуальный поисковый движок по судебной системе США. Как-то к нам обратился юрист, который хотел попробовать визуализировать сеть связанных дел. Боль, которую тут можно решить с помощью визуализации, состоит в том, что ты, будучи юристом хочешь найти случаи, которые подходят под твой. Ты открываешь какую-то поисковую систему и находишь список других дел в виде списка. Дальше тебе нужно их все открывать и читать. Поэтому появилась идея: визуализировать результаты поиска в виде графа. Тут ты можешь увидеть центральные кейсы, на которые ссылаются другие, смежные и кейсы на периферии, можешь выделять какие-то группы и делать текстовый анализ по ним.

Открывая проект в первый раз, ты видишь поисковую строку. Тут же автоматический саджест из базы по документам, которые искали люди или которые могут быть тебе интересны. Ты формулируешь свой запрос, он отправляется на сервер и формирует тебе из него граф: по ключевым запросам ищет дела и потом в них ищет ссылки друг на друга. Здесь каждая точка представляет собой одно дело. Дальше включается алгоритм поиска комьюнити в сети, и по результатам алгоритма точки раскрашиваются. Уже на этом этапе мы видим какие-то определённые кластеры, но пока не знаем, почему они схожи. Тут подключается data science, скрипты, которые вычленяют из кейсов несколько моментов: наиболее важные термины и словосочетания, наиболее релевантный текст. Дальше делается сложный анализ: мы вычленяем из текста кейса фрагменты, которые являются наиболее цитируемыми.

В итоге получается база, по которой юрист может провести поиск и получить граф для того, чтобы продвинуться дальше в деле, которое ведёт. Например, в графе можно увидеть наиболее важные дела и нажать на них, чтобы увидеть их тексты. В текстах подсвечиваются наиболее интересные фрагменты.

47:13 Про графы связей
Использование графов сильно зависит от задачи. Сам по себе он не столько несёт в себе информацию, сколько является навигацией по визуализации. Потом ты уже можешь выбирать ноду, углубляться в неё. Таким образом, граф является первым экраном для инструментов глубокого анализа.

50:27 Красота vs Бизнес-польза
Всё зависит от бизнеса. Кому-то может быть всё равно, красивое оно или нет, а кому-то это наоборот важно. Я думаю, что это не вредит, и когда делаю что-то, задаюсь вопросом: можно ли сделать так же, но ещё и красиво. Не всегда есть возможность так сделать. Часто можно сделать такие нестандартные визуализации, которые решают ту же задачу, что и классические, и делают это не менее эффективно, но более привлекательно выглядят. Анимация, например, очень сильно оживляет картинку, хотя многие её пренебрегают.

50:27 Стек технологий
Чаще всего используем d3 и какой-нибудь фронтенд react/svelte. Последний сейчас стал очень популярным, потому что он маленький и простой, в react’e разобраться сложнее. Svelte позволяет быстро разобраться и создавать в нём простой ui, а сама визуализация d3. Если нужно нарисовать что-то большое, то используются инструменты на webgl, three.js, reguls.

С точки зрения визуализации, мы обычно используем то, что нужно в проекте прямо сейчас. Если нужно не очень много точек, то не нужен какой-то сложный стек, и наоборот.

57:10 Как визуализация спасет жизни пациентов

В этом проекте t-sne был использован для анализа медицинских анализов. Лаборатория, которая занимается исследованиями болезней сердца, делают огромное количество анализов. По их набору хочется найти взаимосвязь и закономерности.

Им нужен был инструмент, с помощью которого можно было работать с их данными. Например, есть файл excel, где в столбцах это виды анализов, а в рядах пациенты. Можно нарисовать точками типы анализа или пациентов, из-за чего у нас появляется две карты. Первая может быть использована для того, чтобы смотреть на пациентов, которые сходятся в каких-то параметрах и определить для них течение болезни и возможные риски. Во втором случае проводились исследования, где брали различные группы пациентов, например, очень больных, которые в итоге умирают. Или наоборот, которые в итоге выздоравливают. И сравнивали, как соотносятся анализы, которые есть у разных групп пациентов. Таким образом, увидели, что чем больше количество кластеров, в которых анализы схожи между собой, тем более велик риск смерти пациента. Так же можно брать анализы у пациентов каждый день и исследовать их с помощью данного инструмента. Чем больше связей между точками появляется со временем, тем сильнее ухудшается состояние пациента. Если пациент идёт на поправку, то эта сеть становится более хаотичной.

1:03:40 Источники вдохновения, Виз Ньюз
Хорошие примеры визуализации я беру из твиттера. Там огромное количество новостей. Можно подписаться на ряд экспертов из этой области, со временем твиттер предлагает ещё людей из этой области, таким образом можно составить себе профессиональную новостную ленту. Как в дизайне важна насмотренность, так она важна и в визуализации. Поэтому важно всё время смотреть на то, какие визуализации придумали другие.

1:06:55 Технологический арт, как не бояться нового

С арта начался интерес к визуализации и области. Изначально меня вдохновляли алгоритмы, которые рисуют графику. Я думал, что круто было так делать, но это так сложно, что никогда не научусь. Со временем страх уходил, а интерес рос. Это как раз совпало с расцветом индустрии интерактивных инсталляций. Я делал генеративные инсталляции, со временем интерес этот вывел меня на работу с визуализацией и совпал с моим научным интересом. На сайте есть раздел с артом, где выложены мои старые проекты. Там есть совершенно удивительные проекты. Например, исследовательский проект в minecraft’e. Совпало два биеннале: выставка Уральского современного искусства и выставка Zero one? Мы строили в игре прототипы инсталляций, которые в итоге может воплотить в жизни.

Так же был интересный игровой проект «18», который так и остался прототипом. Он похож на plants vs. zombies, но в нём ты делаешь музыку. И цель не победить всех, а создать трек. У каждого юнита своя музыкальная тема, добавляя их на поле можно было создать мелодию.

Поскольку я занимался вопросами изменения климата, мне захотелось визуализировать как CO2 на планете меняется. Это вызвало огромный интерес, хотя сама по себе визуализация очень простая. Сам посыл о том, что что-то меняется достаточно агрессивно, так хорошо считывается, что люди действительно начинают задумываться об этой проблеме.

Кроме того, мы делали скульптуры из фарфора: выдавали опросники коллегам и друзьям, чтобы определить, насколько они рискованны в той или иной области. И в итоге получатся такой фарфоровый портрет их риска.

Была ещё одна совершенно невообразимая история о том, как одно рекламное агентство собирает команду для своей творческой резиденции, чтобы создавать новые вещи. Жить три месяца в незнакомой стране было что-то пугающим. Мы жили командой в одном доме и делали экспериментальные проекты. Удивительно, насколько многому можно научиться в подобных резиденциях. Самое важно, что я вынес: я лучше понял, что я могу. Когда работаешь фрилансером, зачастую не знаешь, что ты умеешь относительно других. Если есть возможность поучаствовать в таких проектах, то я бы посоветовал это делать.

Сам проект представлял собой инсталляцию, которая создавалась для фестиваля STEAM Carnival. Там часто делаются инсталляции, которые основаны на законах физики и математики. Наша инсталляция должна была вдохновить детей на интерес к науке. Мы придумали создать несколько станций с граммофонами, внутри которых был микрофон. По нашей задумке ребёнок должен был кричать в граммофон, и дальше крик модифицировался во что-то ещё. Была LED-станция, в которой зажигался свет, ещё с мыльными пузырями, дующая ветром, с шариками и с ленточками, развевавшимися на ветру.

Дети находят самые необычные применения тому, что ты сделал. Например, набрать на одной станции мыльных пузырей, чтобы на станции, которая дует, их развеять по ветру. Очень радует, что это в конечном счёте вдохновило детей на то, чтобы исследовать, как это работает.

Главный урок, который я вынес: я думал, что еду в крупное агентство, уж, наверное, они знают, как делать вещи. И оказалось, что нет, на самом деле никто не знает. Чуда не случится. На самом деле сделать что-то хорошее действительно очень сложно.

1:32:03 Блиц

Топ-3 книги
Я не очень много читаю, мне всегда было сложно учиться по учебникам. Всегда потом приходилось садиться и делать то же самое руками, иначе я не запоминал. Так что я не назову каких-то конкретных названий, но выберите какую-нибудь художественную, техническую и научную книгу и это даст вам разные взгляды на жизнь. Если вы сможете их все переварить и получить удовольствие, то всё, успех вам обеспечен.

Генеративные коддинг или визуализация данных?
Эти вещи даже нельзя сравнить. Но если отвечать на вопрос, то визуализация. Во-первых, она использует генеративный коддинг, во-вторых, в ней есть прикладной аспект.

SVG или Canvas
SVG

Vuj или react
React

React или Svelt
React, если вы делаете что должно масштабироваться. Если что-то маленькое делаете, то Svelt

Россия или Штаты
Россия. У штатов есть огромное количество вещей, где можно было бы поучиться, а у нас — огромное количество областей, которые ещё не заняты и где эти знания можно применить

Процессинг или D3
D3. С досадой отвечаю, потому что процессинг — это моё профессиональное детство. Но всё равно d3, потому что с одной стороны он сложнее, а с другой стороны он больше возможности даёт и в итоге получается проще.

Масштаб текста в Windows и Tableau

Очень важная заметка для тех кто работает с Табло на Винде. Из-за этой ошибки вечно криво и косо верстаются дашборды.

Если у вас в настройках экрана стоит шрифт 125%,150% и т. п. то при работе с Табло Десктоп вы можете получить неправильную отрисовку размеров шрифтов и некоторых элементов. Настроив дашборд после публикации вы получаете ошибки — элементы смещены или не умещаются. Нормально работает только с шрифтами 100%.

Вот как это выглядит — вы сделали дашборд и на десктопе всё выглядит ОК:

А после заливки на сервер это превращается в кашу:

Если сталкиваетесь с такой проблемой, то вот как это исправить:
— Видео-инструкция
— Официальная инструкция от Табло
— Инструкция скриншотами:

Единственная проблема, что такое решение «блюрит» вам дашборд в десктопе. Такое будет только на машине, а на сервере отчет будет выглядеть четким. Если это не подходит, то нужно менять размер шрифта в системе на 100% или 200% процентов. =(

Кем работать, если нравится визуализация данных

Читатель блога спросил кем работать, если нравится визуализация данных. Собрал небольшой гайд по профессиям, где одним из основных навыков является визуализация данных. Всё ниже сказанное — моё субъективное мнение и опыт. Зарплаты Московские, net по результатам анализа рынка аналитики и инструмента быстрого анализа зп по запросу. Примеры вакансий не самые актуальные, а самые подходящие по навыкам и т. п. Если есть чем дополнить статью и я что-то пропустил — пишите.

Я буду разбирать разные позиции по одним и тем же критериям: что делать, какие нужны скилы, насколько много визуализации, сколько можно заработать и т. п.

Разработчик дашбордов

Тэги: BI разработчик, Data Visualization Engineer, Разработчик отчётности, Разработчик + название BI системы, Консультант по + название BI системы.

Что делать: Разрабатывать и поддерживать дашборды и внутреннюю отчетность в компании.

Основные навыки: техническое знание BI системы (Tableau, Power BI, Qlik), графический и UX дизайн, сбор требований, SQL и подготовка данных.

Насколько много визуализации: 60% — визуализация, 20% — сбор требований, 20% — подготовка данных.

Зарплаты: junior — 50-80, middle — 100-140, senior — 160-200.

Востребованность: Пожалуй самый востребованный и денежный способ заниматься визуализаций данных. Таких позиций меньше, чем аналитиков данных, но они есть на рынке и многие компании выделяют создание дашбордов в отдельные направления. Чаще всего таких людей ищет крупный бизнес, где есть разделение по ролям внутри отдела аналитики. Ещё можно вполне успешно фрилансить на зарубежном и российском рынке.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/38814023
https://hh.ru/vacancy/38402536
https://hh.ru/vacancy/38763777
https://www.upwork.com/search/jobs/?q=tableau
https://www.standav.com/careers_v4/index.html?job_id=z5G7h3

Аналитик данных

Тэги: Data analyst, Бизнес-аналитик, Аналитик, Аналитик баз данных, Маркетинговый аналитик, Продуктовый аналитик.

Что делать: Полный цикл анализа данных: подготовка и обработка данных, анализ, представление результата в виде дашборда (чаще всего)

Основные навыки: Python, практическая мат. статистика, SQL и подготовка данных, технические знание BI системы, сбор требований и управление проектами.

Насколько много визуализации: 35% — подготовка данных, 35% — анализ данных, 15% — визуализация данных, 15% — сбор требований.

Зарплаты: junior — 30-80, middle — 100-180, senior — 180-260.

Востребованность: Таких вакансий ещё больше, но визуализация это скорее доп. навык, который используется при представлении результатов анализа. Кажется, что рынок довольно перегрет и вакансий сейчас много, в основном это средний и крупный бизнес от 100 человек. Ещё у таких аналитиков часто есть специализация: маркетинг, продукт, ритейл и т. п., когда человек работает и знает какую-то область, специфичный набор метрик и как их правильно считать.

Примеры вакансий и фриланса:
https://yandex.ru/jobs/vacancies/analytics/analyst_eda_test/1w=
https://hh.ru/vacancy/39416083
https://hh.ru/vacancy/39657872
https://www.upwork.com/search/jobs/?q=analyst

Дизайнер интерфейсов аналитических платформ

Тэги: UX дизайнер, Аналитические системы, Корпоративные системы.

Что делать: Разрабатывать интерфейсы для сложных продуктов с большим количеством графиков и визуализаций.

Основные навыки: Информационный дизайн, верстка и типографика, UX/UI дизайн, Figma.

Насколько много визуализации: 50% — сбор требований, 30% — проектирование и отрисовка визуализаций и интерфейсов, 20% — проектирование сценариев.

Зарплаты: junior — 30-80, middle — 100-140, senior — 140-220.

Востребованность: Найти работу дизайнера аналитических систем сложно, так как приходится искать скорее проект, чем фирму. То есть тут можно искать именно интересные проекты и продукты, и уже туда стучаться как дизайнер, но искать, конечно, сложно. При этом и специалистов таких на рынке тоже очень мало, поэтому с таким опытом можно находить действительно хорошие предложения, но всё-таки, в этом случае, спрос прям единичный.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/38732193
https://hh.ru/vacancy/40129963
https://www.upwork.com/job/detail-orientated-designer-for-data-analysis-app

Фронт-энд разработчик

Тэги: d3.js и любые другие библиотеки визуализации.

Что делать: Разрабатывать аналитические web-приложения или сложные кабинеты с большим количеством визуализаций.

Основные навыки: JS, фреймворки, CSS, информационный дизайн.

Насколько много визуализации: 70% — написание и тестирование кода, 15% — сбор требований, 15% — дизайн визуализаций.

Зарплаты: junior — 30-90, middle — 130-160, senior — 180-280.

Востребованность: Фронт-энд разработчики сейчас в цене. История про визуализацию примерно такая же как с дизайнером сложных интерфейсов: нужно искать скорее продукт, чем компанию, в котором используется много визуализации — биржи, аналитические инструменты, BI инструменты и т. п. Кажется, что таких предложений, в целом, больше, чем дизайнеров аналитических платформ.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/39967086
https://hh.ru/vacancy/39924837
https://hh.ru/vacancy/39687471
https://www.upwork.com/search/jobs/?q=d3.js

Дизайнер инфографики

Тэги: Дизайнер инфографики, Дизайнер презентаций.

Что делать: Делать инфографику и важные печатные корпоративные отчеты.

Основные навыки: Информационный дизайн, верстка и типографика, Illustrator, Power Point.

Насколько много визуализации: 70% — проектирование и отрисовка инфографики, 30% — сбор требований.

Зарплаты: junior — 30-40, middle — 80-120, senior — 120-160.

Востребованность: В целом довольно востребованное направление, можно найти как и отдельные вакансии, так и пойти в одно из агентств, которые на этом специализируются: https://infografika.agency/ru/ https://infografika.in/ и т. п.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/39930792
https://hh.ru/vacancy/39653396
https://hh.ru/vacancy/39941199
https://hh.ru/vacancy/40143575
https://www.upwork.com/search/jobs/?q=infographics

Журналист данных

Тэги: Data журналист.

Что делать: Собирать и исследовать данные, формировать из них медиа-истории и статьи.

Основные навыки: Сбор и обработка данных, парсинг, редактура, сторителлинг, информационный дизайн, верстка и типографика.

Насколько много визуализации: 50% — сбор данных, 25% — создание истории, 25% — визуализация.

Зарплаты: junior — 30-40, middle — 60-80, senior — 120-150.

Востребованность: Редкая профессия в чистом виде, часто такие люди живут внутри студий инфографики в крупных медиа. Кажется, что работу найти довольно сложно, но не супер спец в этом.

Примеры вакансий:
https://journal.tinkoff.ru/team/infographics-designer/
https://hh.ru/vacancy/38148283

Вместо заключения
Если любите визуализацию данных, то с помощью неё сегодня можно зарабатывать совершенно в разных направлениях. Наиболее часто востребованы BI разработчики и аналитики, сложнее всего найти работу журналистам данных и дизайнерам сложных аналитических систем.

Помимо стандартных hh и т. п., работу можно поискать тут:
https://www.datavisualizationsociety.com/find-a-job
https://t.me/analysts_hunter
https://t.me/biheadhunter
https://revealthedata.com/examples/hh/
https://revealthedata.com/examples/vacancies/

График План-Факт во времени

У меня есть задача — сделать стандартный формат для графиков типа «План-Факт». Основная загвоздка произошла для графиков, когда нужно показать как значения плана и факта менялись во времени. Я придумал показывать факт линией, а план заливкой (ареа чартом), но это вызвало разночтение у моих коллег. Тогда я решил провести опрос в канале, и выяснилось, как думают читатели.

Опрос в канале

Оказалось, что при той постановке вопроса, как я задал, выигрывает вариант факт — заливкой, план — линией. А ещё много людей написали мне разные идеи, как можно было бы ещё попробовать. В общем это голосование привело меня к тому, что надо сесть и разобраться детально с этой задачей. Я разработал разные варианты и собрал для каждого из них плюсы и минусы.

Понимание задачи

В компании часто выставляются плановые значения метрик. Их нужно сравнивать с фактическими или прогнозными значениями.

У нас чаще всего следят за значением на определённый момент времени, а не накопительно. То есть важнее всего значение на последнюю дату, а не за сумму всех дат. Однако важно понимать выполнялись ли планы за предыдущие периоды, так как план по-сути являлся прогнозом, который мы сделали раньше и важно понимать насколько точно мы его делаем. Поэтому нужно смотреть и планы, и факт в динамике и отчетливо видеть их динамику. Если будет подсветка в какие даты не выполняется план — хорошо, но не критично. Чаще всего план — это положительное число, факт может быть как положительным, так и отрицательным.

График будет использоваться в разных дашбордах, поэтому чем универсальнее получится решение, тем лучше. Либо нужно сделать набор правил под разные задачи. Нужно разработать набор графиков: большой график во времени план/факт, график отклонения план/факт, спарклайны план/факт во времени, сравнение план/факт по разным разрезам, фактоид план/факт. Нужно, чтобы эти графики были «срифмованы» между собой и с остальными графиками темплейта. Обычные графики фактов, если нет установленного плана — это линии.

Данные для графиков хранятся в формате «дата | значение факта | значение плана». Чем проще и надежнее будет реализация в Табло, тем лучше.

Возможные решения

Не найдя best practice по этому вопросу и не получив каких-то научных обоснований от коллег по цеху, решил подойти к задаче методом перебора решений.

Часть графиков придумал сам, часть посоветовали коллеги и читатели блога. Варианты:
— Линия факт — Ареа план
— Линия факт — Бары план
— Линия факт — Засечки план
— Бары факт — Засечки план
— Ареа факт — Линия план
— Линия факт — Линия план
— Линия факт — Линия план + заливка между линиями
— Линия факт — Ареа план + заливка между линиями

Дисклеймер
В основном делал упор именно на разработку таймсерий. На остальные графики уделял меньше внимания, фактоиды совсем не делал. Цветовое кодирование тоже пока условное и не финальное. Ещё не докручивал подписи для самих графиков — так как важна последняя дата, то на неё ещё можно будет сделать акцент на самих графиках. Эти вещи докручу отдельно.

Линия факт — Ареа план

Мой исходный вариант. Больше всего в нём мне нравится, что линия остается фактом, как и обычные графики, где нет плана.

Плюсы:
— Срифмован с остальными графиками, для которых нет плана. Они просто линии, а тут мы добавляем «фон в виде» плана.
— Физично отображает выражение «факт идёт выше плана». План как гора на фоне, которую мы хотим достичь, факт выше «горы» или «ниже».
— Легко считывается динамика плана и факта по отдельности.
— Легко можно продолжить рисовать прогноз линией другого цвета.
— Легко реализуется и масштабируется в Табло.
— Можно заменять план на другие форматы «фона» — прошлый год, среднее по рынку и т. п.

Минусы:
— Набрало мало отклика у пользователей.
— Много акцента на план, так как занимает большую площадь заливки.
— Нет подсветки проблемных и хороших дат.
— Не «срифмовано» с буллет-чартом, где бар (заливка) тянется к линии.

Линия факт — Бары план

Очень похож на предыдущие график, по-сути просто делаем дискретным ареа. Поэтому все те же самые плюсы-минусы, но есть и дополнительные:

Плюсы:
— Можно подсвечивать конкретные даты по выполнению плана.

Минусы:
— «Рябит» малёк, когда много дат.
— Техническая заморочка с шириной баров при изменении скейла (Табло оно иногда такое Таблё).

Линия факт — Засечки план

Плюсы:
— Классно «зарифмован» основной график и график отклонений.
— Может работать с отрицательным планом.

Минусы:
— «Рябит», когда много дат.
— Настройка ширины тиков только ручная и будет плыть для разной ширины экрана.
— Хуже считывается сама линия плана.

Бары факт — Засечки план

Пожалуй, самый привычный формат. По сути, буллет-чарт, поставленный на бок, будет привычен многим пользователям.

Плюсы:
— Классно «зарифмован» с буллет-чартами и выглядит «физично» (похоже на заполнение прогресс-бара).
— Довольно классический и понятный формат.
— Можно делать акцент на «плохих» и «хороших» барах.

Минусы:
— «Рябит» малёк, когда много дат или спарклайны.
— Настройка ширины тиков только ручная и будет плыть для разной ширины экрана.

Ареа факт — Линия план

Это тот вариант, который мне мало нравится. Хотя он оказался более привычен, судя по количеству голосов. Самая моя большая к нему претензия, что по сравнению с теми графиками, где есть только факт (линия), почему-то меняется отображение факта на ареа-чарт.

Плюсы:
— «Зарифмован» с буллет-чартами, так как тоже заполняется как прогресс-бар.
— Довольно классический и понятный формат.

Минусы:
— Меня прям передергивает, что в обычных графиках (без плана), факт — линия, а тут бац — и стал ареа. Тогда надо менять и в остальных графиках на ареа, но это совсем не правильно.
— Ареа можно воспринять как что-то накопительное (площадь под интегралом).

Линия факт — Линия план

На мой вкус самый беззубый вариант из всех. Вроде просто, но контраст между планом и фактом маленький и никаких особо преимуществ нет.

Плюсы:
— Просто.
— Хорошо считывать отдельно динамику плана и факта.

Минусы:
— Сложно отслеживать положение линий относительно друг-друга.

Такой вариант, кстати, предлагает стандарт IBCS, но с отметками в виде заполненных и не заполненных точек. Что-то как-то не айс. Для спарклайнов точно не подойдет.

Линия факт — Линия план + заливка между линиями

Этот вариант предложил один из читателей канала и показал вот такую ссылку на Натана Яу. Вообще вариант прикольный, но мне лично, очень сложно тут считывать само значение плана.

Плюсы:
— Аккуратный, мало чернил. Классно смотрится спраклайном.
— Акцент на «хорошие» и «плохие» даты.

Минусы:
— Сложно отследить линию плана из-за «перекручивания».
— Чтобы сделать «линию» плана, которая очерчивает область заливки, используется неприятный лайфхак в Табло.

Линия факт — Ареа план + заливка между линиями

Аналог предыдущего графика, но с заполнением ниже нижней границы. Кажется, что это помогает считывать отдельно линию плана.

Плюсы:
— Довольно хорошо считывается.
— Акцент на «хорошие» и «плохие» даты.
— «Зарифмован» с графиком отклонений.
— «Зарифмован» с обычными графиками фактов.
— «Зарифмован» с буллет-чартами.

Минусы:
— Нормально считывается динамика линии плана, но не идеально.

Анализ

Я сделал все эти скрины и пошёл советоваться к эксперту по графикам — Саше Богачеву. Он согласился со мной, что важно будет сохранить факт линией, чтобы это сочеталось с остальными графиками, где нет планов. Самым «классическим» ему показался вариант факт — барами, план — засечками, но! чтобы при этом не было графиков факта линиями на соседних графиках.

Составил табличку сравнений вариантов и проставил плюсики.

Итого, решил взять последний вариант «Линия факт — Ареа план + заливка между линиями». Кажется, что это самый сбалансированный вариант из всех. Хотя не могу сказать, что он идеальный. У каждого из вариантов есть куча плюсов и минусов и этот показался мне наиболее робастным: он сохраняет факт линией, а подсветка сразу даёт понимание, что есть план, а что факт. При этом, легко увидеть, в какие периоды было отставание от плана, и такой вариант удобно реализовать в Табло.

П. С. Спасибо большое Саше Богачеву за обсуждения. И ещё многие написали в личку с идеями, тоже большое спасибо: Роман Зубарев, Егор Ларин и Павел.

 2 комментария    3735   6 мес   теория

Видеоподкаст c Ольгой Колчевой

Записал подкаст с Ольгой Колчевой. Большинство из вас знакомы с ней как с Solution Engineer в компании Tableau. Но в этот раз Оля представляла не компанию, а просто согласилась поболтать про развитие BI и о том как работается за рубежом.

Обсудили чем отличается найм в Европе, как попала в Tableau, как развивать Data Literacy в компании и почему Self-Service это хорошо.

Аудиоверсия
Текстовая версия — под видео (спасибо Наташе Shirosayuri!)

0:44 Карьерный путь
Карьерный путь был очень тернистым. После школы решила, что единственное, что я люблю — это математика и пошла на мехмат. Это место оказалось сильно не по мне, потому что школьная математика представлялась тем, что проводит параллели с реальным миром. Фундаментальная математика очень теоретическая, а я очень практический человек: всегда нужно знать, зачем это нужно. После окончания решила никогда не иметь ничего общего с математикой. Лучшее, что я там получила: меня научили учиться.

Самые большие проблемы были с программированием. Код, который я писала на папином компьютере, не компилировался на университетских. Мои программы вечно не работали, я не знала достаточно в программировании, чтобы понимать почему. В глубину компилятора было не интересно вдаваться, важнее было получить результат.

После университета пошла в магистратуру ВШЭ и стала искать работу на part-time, чтобы можно было совмещать. Так я попала в группу, которая занималась отчётом о прибылях и убытках департамента системного интегратора. Там был классный отдел, который занимался автоматизациями. Можно было договориться о задачах очень быстро, без бюрократии. Так я и автоматизировала половину своей работы. Поняла, что совсем далеко от математики, автоматизации и технологий мне не интересно. Очень понравилось, что я смогла часы ручного ввода автоматизировать до часа. Поработала там три года: решила, что хочу двигаться дальше.

Подруге предложили собеседование в телеком-операторе, а это был не её профиль. Она предложила отправить моё резюме. Оказалось, что там надо быть аналитиком, так что я рассказала про свой опыт, знание математики. Про SQL я знала только по опыту работы с Microsoft Access: sql, которые там генерируются. На собеседовании мне задачи дали на дом. Моих знаний sql явно не хватало, чтобы их решить, так что я сделала таблички в Access’e и посмотрела, какие получатся запросы. В итоге приняли, и пока согласовывали, я выучила sql. Я была единственным человеком с доступом к базе данных в нашем отделе, и она ещё строилась. Все задачи были мои, я могла быстро развиваться. Но в какой-то момент я упёрлась в потолок, потому что зависела от IT, который развивал эту БД. К тому же за год можно выучить все sql запросы, так что я вновь решила куда-то дальше идти.
Так я попала в команду, которая повлияла на меня больше всего — Lamoda. Я думала, что это интернет магазин из подвала. Там оказался красивый офис на несколько этажей и огромная команда. Я встретила своего будущего руководителя: уютная, замечательная девушка, в толстовке, которая села в стул вместе с ногами прямо при hr’е. Я решила: раз здесь такая атмосфера — я хочу здесь работать. Когда расспрашивали про знания, я поняла, что ещё и интересная. Проработала четыре года, и, кажется, никогда бы оттуда не ушла, если бы не переезд в Германию. Там я у разработчиков научилась очень многому. Для аналитика это было не очень важно, но если ты был готов впитывать, они всем делились. Благодаря всему этому я оказалась в Tableau. Они искали специалистов, так что я позвонила, прошла собеседование, и вот я здесь.

10:00 Как переехала и искала работу
У меня несколько лет была мысль попробовать за границу, но всё время было ощущение, что я не на том уровне.
Моя ситуация осложнялась тем, что я не знаю немецкого. Пул был изначально очень узкий. На разосланные 20 резюме мне ответили из четырёх мест, в двух я в итоге получила оффер, в третью компанию я уже не пошла на финальную стадию собеседования, чтобы не тратить ни своё, ни чужое время. Достаточно быстро это прошло: я переехала в феврале, а уже в июле вышла на работу. Поэтому если кто-то хочет поискать работу за рубежом, я бы рекомендовала попробовать и предложила бы обратить внимание на интервью.

12:55 Отличия при найме на работу
В отличие от России, на интервью совершенно другие вопросы и ты к нему по-другому готовишься. В России мне не пришло бы в голову досконально изучить сайт компании. Здесь по крайней мере на собеседованиях ожидали, что я буду знать о компании, кто её основатель, к чему они идут. Боле осознанный выбор работодателя не с точки зрения работы, а с точки зрения идеологии.

Немного другой подход с испытательным сроком. Не в том смысле, что нанимают всех, а потом увольняют. Но это действительно серьезный этап: если ты не будешь дотягивать по техническим скиллам… На предыдущих работах испытательный срок был больше формальностью. Здесь же очень многим не предлагают оффер после него и это не экстраординарная ситуация. Но и soft-скиллы очень важны. Ещё в Москве тебя проверяют на многофункциональность, важно чтобы ты был человек-швейцарский нож. Здесь ты приходишь на конкретную вакансию, если ты знаешь что-то вокруг — это очень здорово, и ты молодец, но тебя по этому спрашивать не будут.

15:49 Чем занимается Solution Engineer в Tableau?
Я работаю с рынком России и у нас меньше специализаций. Многие компании в России не могут или не хотят говорить по-английски. Поэтому моя роль немного отличается от того, чем занимаются мои коллеги. Я немного и саппорт, и customer success manager, и учитель.

Если в идеале: когда компания решает, что она хочет купить Tableau, то должна понять, соответствует ли это её критериям. Я должна прийти и помочь им задать правильные вопросы, направить в нужном русле. Я не буду делать дашборды за наших заказчиков, но буду помогать находить ресурсы, информацию, сделать dashboard polishing. Иногда это специфическая информация, которую я знаю по опыту. Больше как техническая поддержка во время пре-сейла.

18:30 Какая культура в Tableau?
Мне нравится дух компании, потому что очень мало бюрократии, много открытости. Когда я пришла сюда, я увидела людей, которыми хочу стать, когда вырасту. Мы реально любим наш продукт. Например, каждый наш sales manager действительно сам делает дашборды. Вся наша компания пользуется Tableau.

Есть два подхода к отчётности. Один — когда тебе нужно ось сверху, подпись снизу, шрифт с завиточками и так далее. Аналитика для меня немного про другое: для получения понятного, удобного результата. Тут Tableau самый лучший инструмент, который может быть. Понимаю, что могут быть боли с форматированием. Иногда для реализации нужны hacks&tricks. Из тех дашбордов, что я делаю для своих дейликов, ни один не занял более четырёх часов. Я их дорабатываю время от времени, но они позволяют мне отслеживать то, что я делаю, поддерживать связь с клиентами.

22:53 Как управляют Tableau как продуктом?
Есть несколько потоков информации, которые отслеживают наши product managers.

Community forum, где голосуют за идеи. Есть такие, за которые проголосовало очень много людей, но они до сих пор не реализованы. Здесь скорее есть какие-то причины, например, технические. Идеи community форума проверяются, тестируются, прототпируются и включаются или не включаются в продукт. Если посмотреть на Tableau, как он развивался, то можно заметить, что он исторически делал всё не так, как стандартный BI. Всем это понравилось, но всё равно захотели туда включить стандартный BI.

Есть также стратегические моменты: большие интеграции с крупными вендорами, стратегические направления, которые решаются на высоком уровне. Важно понимать, сколько людей хотят эту фичу. Можно делать классные вещи, которые нужны 2% пользователей, но лучше это сбалансировать. Недавно услышала в подкасте термин: quality of life feature и это очень важно. Возможно мы, как профессионалы, научились уже обходить какие-то сложные моменты, но для массового потребителя они могут быть супер важны.

29:35 — Лайфхаки для развития Data Literacy
Я очень редко думаю о будущем, потому что очень многим нужно освоить те инструменты, которые уже есть сейчас. Понятно, что там будет машинное обучение, интеграции с AI более удобные и незаметные, возможно с голосовым интерфейсом. Я не знаю, идём мы в эту сторону или нет. Но считаю, что мы всё время хотим чего-то нового, в то время, как очень большое количество компаний живут в прошлом. Для меня важнее вместо новой фичи для 1% пользователей, чтобы поднималась грамотность работы с данными. Новые технологии — это хорошо. Но чтобы они не оставались сферическим котом в вакууме, нам нужно подготовить аудиторию. Повышать уровень образования, чтобы вне зависимости от того, что ты заканчиваешь, ты имел базовые знания по работе с данными.

Blueprint очень классный, но должна быть команда, которая может этим заниматься на full time. Это называется center of excellence. Я проработала с Tableau несколько лет до того, как стала сотрудником здесь, но я не знала очень многих вещей. Когда ты решаешь какую-то задачу, ты гуглишь, как её решить, но не смотришь на весь продукт в целом. Когда у тебя кроме этого есть другие задачи, таким самообразованием достаточно сложно заниматься. Поэтому в компании должны быть люди, главная обязанность которых — знать, как работают те инструменты, за которые компания платит. У этих людей должно быть меньше снобизма по отношению к пользователям, когда ты даже не пытаешься объяснить какие-то моменты. Потому что потом возникают какие-то заплатки, дашборды, которые потом перестают обновляться, если нет тех, кто за этим следит.

Когда я готовлю какой-то контент и предполагаю, что этим ещё кто-то будет пользоваться, я могу включить запись монитора и проговаривать, что я делаю. Это полезно для меня, для презентаций, позволяет научиться выражать свои мысли более чётко. Кроме того, у меня появляется видео, из которого можно сделать обучающий материал. Если ты делаешь что-то хорошо, тебе кажется, что всё понятно. В то же время, аудитория очень заинтересовывается тем, как ты что-то делаешь, твоим ходом мыслей. Зачастую мы не заморачиваемся объяснять это, и это кажется большой ошибкой. Коммуницировать очень важно, не нужно ставить тег «это же очевидно». На мехмате меня успели научить, что нет ничего очевидного, все необходимо доказывать.

35:45 — Про необычные проекты и P&L кондитера
Самый интересный проект у меня идёт прямо сейчас. У нас есть пре-релиз сайт и там можно тестировать ещё не релизнутые фичи. Есть партнёр, который как раз занимается этим, даёт фидбек. Это всё связано с докеризацией Tableau-сервера и поскольку я с этим не очень знакома, интересно изучать и погружаться в эту тему.

Самое классное внедрение BI, которое я видела, произошёл в компании, в которой очень классный центр экспертизы. В ней очень большой сервер, он очень густо населён, там много пользователей генерируют контент, при этом там нет беспорядка. Для меня это идеальное сочетание обучения пользователей и качественного governance.

Для меня сейчас неожиданно, если где-то нет BI. Недавно помогала девушке, с которой познакомилась в Instagram, она домашний кондитер. У нас возникло обсуждение о том, как считать свой отчёт о прибыли и убытках. В итоге мы сделали для неё google doc + tableau public для того, чтобы анализировать свою эффективность. Ей достаточно вводить свои данные, и это масштабируется до бесконечности.
Данные нужно аккумулировать и ты должен понимать, что делаешь это правильно. Ты начинаешь видеть недостатки логирования, когда ты пытаешься найти ответы в своих данных.

41:41 — За чем следит
Количество потоков информации огромно. Есть несколько людей внутри и снаружи компании, за которыми я слежу, например Betany Liens??. Слежу за Сашей Варламовым и кучей ребят в комьюнити. С Егором Лариным постоянно обсуждаем какие-то другие вопросы, например, хотим сделать дашборд про Destiny 2.

У нас команда из 10 человек, они делятся чем-то в рабочих чатах, а я делаю для себя закладки. Я не всех людей знаю, на кого я подписана, но если кто-то из коллег поделился, значит это важно. Если вижу несколько полезных постов от одного и того же человека, то подписываюсь и слежу за его обновлениями.

Часто просят что-то локализовать, очень много материалов на английском, поэтому я планирую выкладывать на свою страничку то, что нахожу.

45:40 — Блиц с Tableau Day: Self-service, AI, NLP
Self-service или reporting?
Однозначно self-service. Reporting должен быть, но когда он не имеет отношение к аналитике. Для этого ничего не нужно, все уже знают как делать его качественно. Аналитика должно быть self-service, потому что иначе это испорченный телефон. Даже бизнес-пользователи, возможно, не должны готовить данные сами, но должны понимать те, которые подготовлены для них.
Что мешает внедрять self-service?
Певрое: люди не хотят этого делать. Это как образование в стране: большая сложная задача. Если её никто не решает, то она не решается. Когда уже есть желание, тогда нужно внедрять правильные тулы и мотивировать студентов делать всё правильно. Иногда люди боятся, что всё будет автоматизировано и их заменят. Поэтому им нужно дать другой мотивирующий фактор. Я также видела, как желание высшего руководства ломается о сильное нежелание большинства.

Как будет влиять на BI NLP и AI?
Очень многие вещи, которые люди делают, нужно автоматизировать. Чтобы они занимались более важными, сложными задачами, где надо думать. Я люблю разные тулы, которые связаны с процессингом голоса. Считаю, что все эти классные достижения должны быть везде. Они не решат все вопросы, потому что человеческая экспертиза и интуиция незаменимы. Ещё есть фактор доверия к тому, что сделал AI. Например, мы сейчас включаем эти функции, пользователь может что-то замоделировать, но это не та математика, которую ты можешь проследить от первого до последнего шага и как-то проверить. Понятно, что я могу доверять data scientist’у, который написал эту функцию. Все ошибаются, это абсолютно нормально, но я хочу знать, как именно они ошибаются. Поэтому сложно доверять AI, который предоставляет тебе данные, и ты не можешь их проверить. Мы по-прежнему больше доверяем людям, чем машинам.

Что посоветуешь тем, кто хочет внедрять self-service?
Здесь у меня совет есть к тому, кто будет хоть что-то внедрять. Редко я вижу, что в компаниях есть конкретный список требований, чего именно хотят добиться внедрением нового инструмента. Ты хочешь, чтобы что-то стало лучше. Почему, как, какие у тебя задачи? Хотите что-то внедрить, определитесь, зачем это вам. Иначе вы тратите ресурсы, время, деньги фактически зря. Если вы не знаете, какой результат хотите получить, как вы поймете, что получили его? Важно определиться с целями, определить шаги к ним, подготовить пользователей, не навязывать ему это. С пользователем нужно говорить, объяснять, потому что self-service потребует их максимального вовлечения в процесс.

59:16 — Мини-блиц №2

  • Level of detail или table calculation?
  • Сама я больше использую первое, поэтому настойчиво пытаюсь себя пересадить на второе.
  • Extract или live?
  • Live.
  • Tableau Prep или Tableau Desktop?
  • Оба.

Вместо заключения
Очень рекомендую попробовать встать на роль консультанта, больше общаться. И заниматься саморазвитием. Например, я сейчас читаю литературу о том, как люди в принципе воспринимают информацию. Эти два совета не связаны между собой, но очень важны для меня.

Таблица или график? Как убедить заказчика

Читатель блога написал классный вопрос:
«В ходе работы приходится сталкиваться с заказчиком, который приемлет только таблички с множеством фильтров. На все предложения сделать покрасивее — отвечает отказом, говорит, что тогда потеряется функционал. К слову, в книге ~20 разных дэшбордов и все они должны быть в таком стиле: фильтры и таблички.

Подскажи плз, стоит ли бороться, забить или еще какой-то вариант?)»

По-моему, это одна из самых распространенных проблем у разработчика дашборда — заказчик хочет таблички. Давайте разберемся, что можно сделать в таком случае. У меня, к сожалению, нет волшебной таблетки и сам я часто не могу убедить коллег, но напишу, что думаю и что сам делаю, когда с таким сталкиваюсь.

Ниже текст, а на видео ещё более развернутая версия вебинара по этой теме с примерами как это делать в Табло.

Таблички vs графики. Теория

Сначала немного теории: рассмотрим когда хорошо работают таблицы, а когда графики. Просто сказать, что любая таблица — это зло, было бы совсем неправильно и таблицы тоже важны и нужны для своих задач.

Есть разные исследования, которые оценивают скорость и точность восприятия информации человеком в виде графиков и таблиц. Мне очень нравится вот эта статья Task-Based Effectiveness of Basic Visualizations. В ней подробно рассмотрено как базовые визуализации решают различные типы задач. Пользователей просили выполнить 10 типов задач с помощью разных визуализаций: найти аномалии, найти кластеры, найти экстремумы, узнать конкретное значение, рассчитать значения между двумя точками данных и т. п. Измерялись три метрики: точность решения задачи, скорость решения и ответ пользователя какая визуализация ему понравилась больше всего для решения этой задачи.

И ещё есть общее резюме, с которым авторы что-то перемудрили. Но, если привыкнуть, то можно считывать довольно быстро. Каждая строка — это тип задачи. Столбцы — три метрики. Внутри каждая ячейка разделена на две части. Слева  — топ визуализаций в порядке ухудшения по метрике, справа  — самый плохой график. Стрелки идут от графиков, которые работают сильно лучше, чем тот, на который направлена стрелка. То есть первую ячейку в таблице надо читать так: для поиска аномалий по точности лучше всего работает скаттерплот, хуже всего таблица и пай-чарт. При этом скаттерплот работает гораздо лучше (статистически значимо) пайчарта.

Есть и другие статьи Cognitive Fit: An Empirical Study of Information Acquisition и Effects of Tables, Bar Charts, and Graphs on Solving Function Tasks, в которых обсуждаются похожие проблемы и сравниваются таблицы и разные виды графиков.

Общие выводы такие
Таблицы хорошо работают для «количественных задач»: узнать конкретное значение, посчитать разницу или сравнить значения между двумя ячейками. Графики хорошо работают для «качественных задач»: найти общие признаки для точек, найти максимальные и минимальные значения, понять отрицательная или положительная динамика, узнать какое значение больше и т. п.

И это в целом работает для всех людей, но есть особенность того, что при работе с таблицами и графиками включаются разные отделы мозга. Таблица — по-сути текстовая информация, которую пользователь «читает» перемещаясь по строками и столбцам. Чтобы преобразовать данные используются отделы мозга, отвечающие за чтение и речь. Графики — визуальная информация, она преобразуется другими частями мозга, распознающими расстояния и образы. Если у человека более развит какой-то из отделов, он может быть более восприимчив к тому или иному способу получения информации. Это тоже нужно учитывать. Возможно ваши заказчики просто «речевики».

Таблички vs графики. Практика

На практике пользователи, которые просят таблицу, на мой взгляд, решают одну из задач:
1) Получить данные для их дальнейшей обработки (скачать в excel, досчитать сравнение с планом и вставить в power point).
2) Узнать конкретные значения для ad-hoс анализа (сколько продали в точке А в январе).
3) Увидеть много метрик сразу для одной сущности (все метрики продаж для одного города и т. п.).
4) Ранжировать и сравнивать сущности по разным показателям, проводить факторный анализ (видеть топ городов по продажам и знать какие там скидки и маркетинговые расходы).
5) Видеть сырые данные для оценки их качества (важно видеть нет ли «битых» данных, неправильно преобразованных дат, не так заполненных полей CRM и т. п.).
6) Видеть точные данные для их обработки (точные показатели технического процесса, значения плана и факта и т. п.) или бланки строгой отчетности.
7) Не хотят ломать привычку (привыкли к Экселю или им «не нравятся графики»).

Вот что я делаю в каждом из кейсов:

1. Получить данные для их дальнейшей обработки
От бизнеса такой запрос звучит чаще всего как: «Нужна таблица за 5 лет со всеми метриками по всем срезам».

Тут всё довольно прозаично, но придется выяснить потребности. Здесь нужно узнать «Что было дальше?», что пользователь делает после того, как скачал или куда-то перенёс данные. Если вариантов, что с ними происходит дальше, очень много, то научите пользователя self-service — дайте доступ к данным и покажите как с помощью вашего BI инструмента из них можно получать выводы. В Табло, например, для таких целей отлично подходит роль Explorer на сервере и сертифицированные датасорсы.

Если после скачивания данных пользователь, например, каждый раз делает графики в экселе, а потом переносит их Power Point, то просто сделайте ему такие графики, чтобы они формировались автоматически. Вы удивитесь как часто происходит именно такой кейс. =)

Классический self-service

2. Узнать конкретные значения для ad-hoс анализа
От бизнеса такой запрос звучит чаще всего как: «Нужна таблица, в ней можно выбрать любую метрику и даты, и должны быть все фильтры по нашим разрезам».

В бизнесе часто надо узнать значение какой-то метрики «здесь и сейчас». И это отличная задачка для таблиц. Здесь также можно использовать self-service, а можно сделать специальный отчет — такой «полу self-service»: форма, где можно выбрать какие-то срезы и метрики и получать одно или несколько визуальных отображений.

Если и правда происходит так, что пользователям изредка нужны конкретные метрики в определённых разрезах, то сделайте такой отчет. У нас в компании, например, это очень популярный тип отчетов — огромный справочник метрик и возможность показать его в каком-то разрезе в виде таблички или графика. Хорошо решает задачи, чтобы на совещании можно было быстро достать метрику и что-то решить. Или если аналитик проверяет свои расчеты и хочет сверить их с общими трендами или более общей метрикой.

Часто такие отчеты превращаются в операционные дашборды: пользователи сохраняют себе какой-то набор метрик и смотрят за ними каждый день. В целом, это не так страшно. Если пользователь знает свои данные вдоль и поперёк, следит за ними каждый день и понимает даже небольшие изменения на цифрах, то он может работать просто с такими отчетами. Это кейс из серии «ночью разбуди, а он ответит хорошо или плохо, что продажи в точке А составили 12 649 рублей». Но такие кейсы, конечно, лучше отслеживать и делать из них хорошие операционные дашборды.

Полу self-service — готовый отчет с выбором метрик и срезов
 

3. Увидеть много метрик сразу для одной сущности
От бизнеса такой запрос звучит чаще всего как: «Нужная широкая таблица со всеми метриками. Менеджер, который отвечает за свою часть, выбирает нужное в фильтре и смотрит как обстоят дела».

Часто бизнесу нужно получить овервью по какой-то сущности: все метрики по какому-то городу, по какой-то кампании и т. п. Это можно заметить, если в отчете пользователь выбирает что-то фильтрами, а потом пользуется только одной или несколькими строчками. В этом случае классно подходят «страницы сущности», такие one-pager’ы, в которых есть вся нужная информация только по одному городу, например. Всегда сравниваю такие странички с профилем на Фейсбуке — в одном месте вся информация: сколько лет, где работал и т. п.

В Фармакей, например, были популярны такие отчеты для отдельных аптечных сетей. Менеджер по работе с сетью открывает «страницу сети» и видит всё-всё по этому B2B клиенту: сколько тот совершил закупок товара, сколько продал конечным покупателям, сколько в этой сети открытых точек и какие основные показатели YTD. Такие страницы сущностей могут собираться в «портфели» и может получаться иерархичная структура с похожими отчетами.

Страница сущности для аптечной сети
 

4. Ранжировать и сравнивать сущности по разным показателям, факторный анализ
От бизнеса такой запрос звучит чаще всего как: «Нужная таблица, в которой можно сравнить разные срезы по такому-то набору метрик».

Иногда бизнесу нужно сравнить между собой разные срезы: чем отличается портрет пользователей, пришедших по рекламе, от органики; какой стиль работы разных менеджеров, кто из них продал большего всего товаров, у кого самая лучшая конверсия и т. п. На мой взгляд, для таких случаев идеально подходит таблица, дополненная графиками-спарклайнами, фононовыми барчартами и удобным интерфейсом для управления этой таблицей. Часто этим интерфейсом могут быть дополнительные графики, которые одновременно дают и дополнительную информацию, и позволяют быстро фильтровать основную таблицу.

Слева можно нажать на регион и увидеть для него топ продуктов. Справа можно сортировать по любой колонке, а при клике на товар увидеть хитмапы и таймсерию продаж
 

5. Видеть сырые данные для оценки их качества
От бизнеса такой запрос звучит чаще всего как: «Выведите сырые данные , что бы можно было смотреть и сразу изменять их».

Такая задача часто возникает у аналитиков, когда они готовят данные и нужно видеть, что именно посчитал код. Или, например, менеджерам, которые работают с анализом данных из CRM, нужно понять правильно ли были заполнены поля. Или если кто-то анализирует неструктурированные ответы пользователей на опросы и т. п. То есть это те кейсы, где нам действительно нужно видеть сырые данные и я делаю обычную таблица. Классно дополнять её какой-то сводной информацией по столбцу, как это сделано, например в Data Wrangler от Trifacta или Tableau Prep. И, если есть такая возможность, прокидывать ссылку из таблицы в систему с сырыми данными.

 

6. Видеть точные данные для принятия решений или бланки строгой отчетности
От бизнеса такой запрос звучит чаще всего как: «Вот форма отчетности, сделайте чтобы она обновлялась автоматически».

Это редкий кейс, когда точные данные нужно видеть в неизменном виде, поскольку это влияет на регулировку какого-то процесса. В этом случае представление информации нужно не для анализа чего-либо, а просто для обработки этой информации и принятии какого-то (часто механического) решения. Примеры: бухгалтер смотрит на выполнение плана сотрудником и выдает премию; технолог на производстве смотрит на показатели и увеличивает давление в приборе и т. п. То есть когда не нужен анализ, а нужно просто получить точную информацию.

Ещё существуют бланки строгой отчетности и принятые финансовые стандарты. Здесь таблицы нужны просто, чтобы все одинаково считывали информацию по заранее придуманному стандарту.

Если есть такие кейсы, то просто делаем таблицы, но тоже стараемся их оформлять по правилам хорошего графического дизайна.

Аккуратную таблицу можно сделать даже в Табло

7. Не хотят ломать привычку
От бизнеса такой запрос звучит чаще всего как: «Таблички, таблички, таблички!».

Если не удается выявить ни одну из потребностей, перечисленных выше, то, возможно, люди правда «просто привыкли» или «речевики». К сожалению, привычки — самое сложное, что можно менять у пользователя, а иногда это делать и не нужно. А если и делать, то аккуратно и постепенно. Что делаю в таких случаях я:
— Пытаюсь рассказать почему существуют различные типы представления данных и зачем они нужны, ссылаюсь на исследования из первой части статьи.
— Показываю примеры табличек и графиков: играем в задачки «найди самую большую категорию в таблице и на бар-чарте», «скажи какой тренд в таблице и на таймсериях», «найди минимум и максимум в таблице и на хитмапе».
— Добавляю в таблицы графические элементы: фоновые бар-чарты, спарклайны, хитмапы (highlighted table).

— Делаю и графики, и таблицу. И ставлю её под ними или рядом. Только важно не делать это двумя разными дашбордами, а то вторым могут демонстративно не пользоваться. А если на одном, то графики могут примелькаться и вдруг стать полезными.

— Если пользователь один (то есть это не задевает других) и прям уперся, то просто делаю ему таблицы. Если ему это помогает решать бизнесовую задачу и он достигает своих целей, то пусть будет так, если даже это делается не оптимальным образом. Всё-таки визуализация здесь инструмент, а не самоцель.

Надеюсь, что модное нынче течение data literacy не угаснет и скоро таблички будут просить только там, где они нужны.

Подводя итог

Таблицы — отличный инструмент, когда нужно узнать точное значение или сравнить по многим параметрам небольшой набор сущностей. Отлично использовать таблицы как часть дашборда для вывода информации самой мелкой детализации или чтобы сделать какой-то топ по разными метрикам. Я часто делаю внизу дашборда таблицу с детальными данными до строки в базе данных.

Если же на дашборде просят только одну таблицу, то стоит разобраться какая потребность из семи перечисленных выше существует у бизнеса и попробовать решение из этого блока. Если вы не смогли определить потребность, то попробуйте объяснить как работают таблицы и графики или дополняйте таблицы графиками. Если это всё не помогло, то дайте людям таблички или организуйте self-service.

Видеоподкаст c Кириллом Беляевым

Записал подкаст с Кириллом Беляевым — дизайнером из Риги и автором канала своего имени.

Хотя я знаю Кирилла давно, мне было безумно интересно с ним поговорить про графический дизайн и интерфейсы для визуализации данных. Обсудили как можно выбирать сложность интерфейса в зависимости от задач, как можно делать интересный онбординг и какие навыки нужны, чтобы делать классные графические работы. Ещё посмотрели примеры работ, где Кирилл переделывал и улучшал визуализации.

У Кирилла есть проект с логотипами-заготовками Pre-logo и ещё он делает очень крутой дизайн на заказ — примеры работ. Не реклама, искренняя рекомендация если вам вдруг будет нужен дизайн.

Аудиоверсия
Текстовая версия — под видео (спасибо Наташе Shirosayuri!)

0:50 Про самоидентификацию как дизайнера

Чаще всего называю себя дизайнером. Если уточнить, то графический, digital-дизайнер или интерфейсный дизайнер. Зависит от того, кому я это говорю, чтобы им было проще. Почти весь спектр дизайна, который не про среду и не про одежду. Всё, что касается графики в той или иной степени, чуть-чуть потрогал.

Про образование, мотивацию и становление

Когда учился в школе, было модно среди родителей пытаться куда-то направить. Это сейчас они уже понимают, что было бы лучше не мешать. Теория моих родителей была в том, чтобы я стал инженером, потому что у меня было хорошо с математикой, но я сильно споткнулся о физику. То ли из-за учителя, то ли потому что она мне просто не интересна была. Поэтому неожиданно в 9м классе я решил пойти в художку. Я как бы до этого в другие секции ходил, ну и школа была недалеко от дома. Случилось так, что в нашей группе из 7-8 человек разновозрастных была молодая преподавательница, которая как будто недавно университет закончила. Это было здорово: она не пыталась нас ничему научить, всегда пыталась сделать так, чтобы нам было интересно. Это сильно втянуло: мы занимались и линогравюрой, и карандашами, всем, чем угодно. Позже, наверное в 10 классе, нам открыли все окна и дали масляные краски (чего, кажется, в художках нельзя делать), мы там все обнюхались. Всё было просто отлично. Тогда я решил, что это здорово, потому что в этом есть какой-то драйв. Начал думать, куда поступать: не на художника же. Были 90е, художник однозначно был нищий человек, никаких вариантов. Быть нищим очень не хотелось.

Нечаянно узнал о таком явлении, как дизайн. Когда поступал, появилась возможность поступить в Питер, в университет технологии и дизайна, если бы не это название, я бы туда не пошёл. Там были: дизайн рекламы (графический); мода и среда.

На среду у меня не было опыта художественного опыта в объёмности, про моду меня отговаривали, что это сплошное нетрадиционно-ориентированное, так что остался графический дизайн, так что я пошёл туда. Ходил на подготовительные курсы, специалитет по старой программе: 5 лет учёбы и ещё полгода на диплом. Это было долго и скучно, но у нас были рисунок и живопись, которые преподавали в том числе и преподаватели из мухи? Эти два навыка, по прошествии многих лет, дают очень хороший бекграунд. Не могу иногда понять, что это работает, но благодаря этому я знаю, как цвета смешивать, например. Работает на уровне ощущений. Года два назад я начал ощущать этот вклад, до этого вообще не задумывался, не ощущал ни сама техника, технология или методика. Но потом я понял, что люди пытаются понять что-то про цветовой круг, а я знаю точно, что их как-минимум много, это не единственный способ, цвета можно по-разному сочетать. Так что я подумал: если для меня это очевидно, а они что-то пытаются понять, то всё-таки где-то я это знание получил. Так что взглянув в ретроспективу я понял, что это всё из университета.

После университета пошёл работать по специальности, в маленькую студию. Разослал резюме очень много куда, в том числе сделал наflash-e и отправил в студию Лебедева и получил ответ от Людвига Быстроновского, процитирую: «Простите меня великодушно, но я не буду ебаться с вашим flash-ом». Обидно, но что уж тут сделаешь. В следующий раз вместо непонятных форматов я отправлял огромный jpeg 5000х3000, на котором было много разных картинок: один файл точно пройдёт, что-нибудь да увидят.

Поработал два года в студии, пробовал сделать свою, после чего пошёл в бюро Горбунова учиться делать интерфейсы. Они тогда только начинались, поэтому казалось, что это более счётная, проектируемая история, в меньше степени здесь важно логотип делать красненьким и делать его больше или меньше. По крайней мере так казалось. В итоге, конечно, оказалось, что всё то же самое, просто не в логотипе дело, а в другом: контролы побольше, диапазоны поменьше. Тем не менее, из-за того, что это более инженерная история, коммуникация должна быть более структурная. Хотелось меньше договариваться и больше тратить время на производство дизайна. Следующим витком была визуализация, где, казалось, ещё больше инженерной компоненты, потому что здесь нет этого пользовательского опыта, нам надо данные визуализировать. То есть опыт есть, но по большей мере одинаковый: человеку нужно получить инсайт. Поэтому пошёл потом в лабораторию, после неё — в компанию, которая строила аэротрубы и там я занимался всем дизайном подряд: дешборды, айдентика, etc.

11:17 Это более творческая профессия или боле инженерная?

Отвечу очень странно: это исключительно инженерная профессия, но в моём представлении эта инженерная есть самая творческая. Приведу пример: недавно слушал технического директора, который сказал, что математика — это не то, чему тебя учат в школе. Математика это про то, как ребёнок решает задачу про то, как перевезти волк, козу и капусту через речку. Как только у тебя есть какая-то дорожка, по которой надо ходить, то по-хорошему ходить по ней не надо, надо автоматизировать. И здесь уже следующая, творческая задача: как автоматизировать, чем. Не повторять старое, придумывать новые решения.

Деление на гуманитариев и технарей — очень искажённая история. Кто-то когда-то придумал не совсем верный взгляд. То есть писать код и выдумывать конструкции их не пугает, а придумывать что-то другое — да. Возможно, играет отсутствие функционала: руки не разработаны, Photoshop когда первый раз открываешь он сложный. В самом процессе разницы почти нет: щёлкает в голове, придумываешь что-то, ставишь задачи, ограничения.

14:32 Что нравилось в data visualization, как в него пришёл?

Я занимался dataviz’ом с той задачей, о которой говорил [получить инсайт]. Есть, конечно, и более простая визуализация данных. Или всё, что связано с New York Times и другими изданиями, где журналистика данных и визуализация используется как часть повествования. Практики у меня в этом очень мало. Там, допускаю, не один пользовательский опыт, потому что там визуализация не продукт, а, скорее, иллюстрация: у тебя огромная статья, ты хочешь через неё что-то донести, эмоции, факты, показать, какую огромную работу ты проделал и твой вывод точно верный. Это уже другой опыт: не нужно давать пользователю инструмент, чтобы он свои инсайты искал, надо показать, что мы проедали работу. Или была визуализация, как беженцы из Африки бегут в Италию, огромные маршруты, тут нужно просто чтобы масштаб сработал, и ты ужаснулся тому, как люди в кровь ноги стирают. Про такую визуализацию я не очень много знаю.

В Лаборатории делали в основном для финансов, для науки, где почти в ста процентах случаев нужно дать инструмент. Визуализация в центре, нет какого-то повествования. Если и есть, то это какая-то маленькая кнопка infо, спрятанная в сбоку. Это какая-то штука на весь экран. И ещё есть контролы, и здесь отличие от журналистики данных в том, что там это какие-то простые один-два ползунка, которыми точно все смогут воспользоваться. Если мы можем сделать, чтобы оно работало по скроллу — это ещё лучше. Для финтеха, например, так не получится: у нас один экран, он может даже не скроллится. Куча интерфейсного интерфейса, данных, которые ты препарируешь. Весь опыт пользовательский на уровне интерфейса, а не на уровне визуализации данных. Сложно отделить в какой-то момент, но я бы как-то так делал.

22:39 Как сочетать интерфейс и визуализацию, как сделать, чтобы пользователь понимал интерфейсные элементы в самой визуализации

Очень важна подготовка пользователя. Учёным, которые много работают с визуализацией, обычно не надо много обучения или дублирования фильтров. У них огромные названия белковых молекул или ещё чего-нибудь, они уже привыкли, что всё более-менее кликабильное. В бизнесе люди разные бывают, опыт может быть разный. Если просят продублировать, можно продублировать, другой путь — пробовать придумать, как здесь визуализировать, чтобы сразу было видно. Если говорим именно про дешборды, про некие панели, в которых много всего сразу как отчёт, он немного тяготеет к статье: это история, которую ты можешь проскроллить. Возможно убрать фильтр, а просто один график три раза показать, чтобы человек это сразу увидел. Это будет мусорнее, но наш здесь KPI это время, за которое человек получает то, за чем он пришёл. Клики — это дорого: ещё надо найти, где что переключается, добавили вообще этот фильтр сюда или нет. Тут он этого не увидит только если глаза закроет.

История про управления, кажется, больше касается графиков, которые один на экране. Дешборд это когда больше одного элемента: таблица, фактоиды, график, или два основных. А когда там один scatterplot, то можно добавлять интерфейс, потому что мы будем управлять эти точками.

Про паттерны проектирования, разница между интерфейсами в визуализации данных и вне её, лайфхаки для тех, кто делает сложные интерфейсы для бизнеса

Посоветовал бы начать с кривой обучения. Когда человек в первый раз открывает Facebook или Twitter, то с первого раза ему нужно понять, как этим пользоваться. С бизнес-инструментом хочется сказать, что это не Facebook, люди же будут с этим работать, но дешборды носят другим людям, поэтому на них я бы всё же смотрел, как на Facebook. Это вершина айсебрга бизнес-платформы, и вот она, в плане интерфейса, должна быть такой же простой. Там будет много информации, без неё он не сможет даже существовать. Хочется, чтобы взаимодействие с этой информацией было как можно проще, возможно, через скролл, минимум простых интерактивных элементов. И на этот инструмент смотрят 2-5-10 минут. Дальше есть более глубокие, за которыми человек проводит 15-20-30 минут подряд, можно делать сложнее: меньше скроллов, больше фильтров. И так вплоть до интерфейса Bloomberg’а, в котором люди сидят днями, смотрят в один экран, в котором происходит непонятно что. Всё закодировано, потому что на экран выведено всё в один клик, но функций так много, что мы не можем уже словами писать, всё сокращено до аббревиатур и иконок. И это нужно, чтобы сделать быстро какую-то свою задачу, возможно будут учиться этому несколько лет, но оно того стоит. Ну вот на одной стороне он, а на другой даже не Twitter, он кажется слишком сложным. Какой-то просто новостной портал, где ничего кликать не нужно, просто скроллишь ленту и всё. Это почти всегда на время завязано, здесь ещё важно про непрерывные итерации. Поэтому при проектировании интерфейса пытаешься его на эту шкалу приземлить, чтобы прикинуть примерно уровень сложности. Потом, конечно, живые пользователи, тестирование.

27:05 Есть ли какие-то интерфейсные хаки, как сделать онбординг максимально эффективно

Если есть и вершинка айсберга, которую надо быстро посмотреть, и те, которые займут тебя на полчаса, то нужно их соединить, чтобы с вершины можно было проваливаться в эти 30-минутки, потому что там ты уже что-то понял, и после перехода важно, чтобы человек увидел что-то похожее. То, что он успел распознать, смог здесь увидел в таком же виде, в новой среде. И он уже понимает полэкрана и это уже неплохо, остаётся разобраться с остальным.

Что касается видео и документации, то весь мой опыт достаточно скверный. Но недавно я видел видео, которое рассказывал какую-то простую штуку, но было сделано как клип из 90х. Ты не можешь оторваться, ты его посмотрел и уже хочешь-не хочешь, но знаешь, как это работает. Не важно, насколько скучно или сложно то, что человек должен посмотреть, если там будет какая-то интересная обёртка, парень в кепке это будет рассказывать, или петух с оторванной головой, который будет спотыкаться на каждом контроле, выпадать. Это точно посмотрят. Конечно, дороговато в производстве, но есть много энтузиастов, которым нравится это делать. Здесь можно отделить содержание и форму: форма должна помочь мне здесь остаться на этом видео, а содержание оно и есть. Люди точно знают, что в мануалах много полезного и хорошо скорее всего написано. Они по большему счёту уверены, что смогут найти всё, что им нужно, но это всё равно сложно. И эмоции ещё. И если это разработчик, то он много мануалов читает: надо разбираться в языках программирования, sql-ях. Он уже зачитался мануалами, можно уже котиков полистать? А ты тут ему и делаешь мануал с котиками. Это работает для Tinkoff, журнал который для бизнеса, то для внутреннего инструмента, который никто снаружи не увидит, делать что хочешь можно.

32:21Примеры работ

Вот формат промежуточный между визуализацией, как ты её себе представляешь, и чем-то журнальным. Это карта музея недалеко от Риги. Изначально она выглядела так:

Это карта с реалистичными домиками, милая по стилистике и вся в цветных цифрах с огромной легендой. И это всё на А4.Это музей под открытым небом, он достаточно большой: здесь привезённые со всей Латвии дома поселений разных эпох. Они сгруппированы по цветам по регионам: ближе к Беларуси и России одни племена жили, ближе к морю другие, и у них были свои особенности. Снизу сами эти группы по цветам размечены. Из-за того, что это А4, музей большой и ты ходишь по нему долго, первое, что происходит: ты складываешь карту пополам и начинаешь её туда-сюда переворачивать, что неудобно. Так же неудобно сличать цифры по цветам и с легендой, в которой цвета нет. Меня это очень раздражало и я хотел понять, можно ли это сделать нормально. Я попробовал, мне кажется, у меня получилось.

Я её упростил и выбросил часть текста, который для меня, как для посетителя, не нёс никакой информации. Там были какие-то дополнительные сведения, год реконструкции ещё добавлен, например. При этом он есть всегда на самом домике. Для навигации дом реконструкции — лишний. Также попробовал привязывать то, что близко расположено, усиками. В итоге собрал на А4, распечатал на А5, и стало удобно пользоваться. Здесь используются все эти приёмы про подачу информации, цветовое кодирование, но это не совсем визуализация, конечно. Скорее предоставление информации. Информационный дизайн.

Если говорить про махровую? визуализацию, то здесь больше подойдёт этот пример.

Это график, мы его ещё вместе делали, о том, как произошла «оцифровка» профессии и изменения в зарплате и часах, для США. Она что-то показывает, но в моей голове больше похоже на data art. Выглядит здорово, но сходу понять сложно. Так что мы достали данные, пошли смотреть, как можно сделать лучше. Вспомнили про эти гантельки, много экспериментировали, в итоге получилось вот так:

И здесь уже что-то более-менее понятно. Самое важно, что здесь уже появились палочки, которые просто шли против шерсти. Стало хоть что-то видно, потому что со стрелочками считать было невозможно. Здесь, конечно, можно быстро и не считать где какой год.

Графики-прототипы хорошо работают, если человек уже имел опыт взаимодействие с чем-то подобным, здесь не столько важен увлечён читатель или нет. К сожалению, это недостаточно распространённый опыт: показать что-то на одном графике и промасштабировать на другие. Тут помогает, когда разница между образцом и последующими инстансами маленькая и ты считываешь, что это одна и та же вещь. Если разница большая или из-за специфики данных что-то сильно раздувается относительно оригинала, конечно сложно. Так что я бы не рекомендовал использование их в общем случае. Лучше делать проще, если говорим про широкую аудиторию.

Простое всегда работает лучше. У сложного есть только одно оправдание: если нам это экономит клики и у нас есть что-то, что дороже для нас, чем скорость понимания происходящего. Если такое есть — будем усложнять визуальную часть и интерфейс, если нет — не стоит.

Вот эта штука вообще примитивная. Есть такие графики и они чудовищно непонятные:

Мне не совсем понятно, зачем люди так рисуют, когда можно делать иначе.

Здесь есть мальчики и девочки, общий график и распределение: небольшие задачи, но стратегически важные, уровень счастья и частотность. На входе кажется, что чем чаще человек начинает день с маленькой «лягушки», тем он будет счастливее. Здесь это вроде подтверждается, в простом виде, но чтобы понять, что здесь происходит, надо потратить какое-то время. Мы сделали проще: во-первых, перевернули графики. Во-вторых мы транспонировали его: было два графика с тремя полосками, а мы сделали три графика, разбитые на две половинки. Стало удобнее, потому что на исходном надо было сравнивать красное с красным, жёлтое с жёлтым, что абсолютно неудобно — они близки по размерам, но начинаются не на одном уровне. Высота столбцов в нашем случае показывало объём, соответственно, точность данных.

45:11 Почему решил вернуться в классический дизайн?

Поскольку я пришёл в визуализацию из дизайна, мне кажется я её с точки зрения прошёл, как игру. Она с точки зрения графического представления имеет какое-то конечное представление. Более того, вся эта конечность вцелом в четырёх книжках Тафти описана. То есть этому можно всему научиться, пройти и дальше уже начинается история про журналистику данных: это не про дизайн, скорее про сторителлинг. Можно было туда пойти, но поскольку я этим занимался в Лаборатории, у нас там даже направления такого не было. Подумал, в новостное агентство идти? Нет, наверное, люблю удалённо работать, а они так не умеют. Так что в ту сторону нет. А если в сторону науки и создания новых типов визуализации, это ещё одно направление в моём представлении, то оно требует большего погружения в статистику, в анализ, более технические вещи. Была возможность в лаборатории туда немного погрузиться, я понял, что это интересно, но для меня конкретно трение высокое. Поэтому я решил, что за единицу времени буду больше делать того, где трение меньше. То есть не захотелось выбирать самый сложный путь. При этом сейчас, если что-то в интерфейсах нужно, я радуюсь, что у меня этот опыт есть: сразу понимаю, где нужно что-то сделать, где нет. Например, когда говорят, что надо визуализацию сделать, можно остановиться на трёх фактоидах. Ещё есть такое направление, как инфографика, где больше иллюстрирование: надо показать на карте какой-нибудь маршрут, например. Тоже визуализация, но не данных, а пути. Само по себе понятие визуализация достаточно широкое: с одной стороны есть 3D-визуализация, с другой есть визуализация данных. Мы делаем что-то видимым. Можно было пойти в какое-то такое иллюстрирование, но на тот момент проектировать те же интерфейсы мне казалось интересней. Может и вернусь, это же так: видишь что-то прикольное, делаешь. Ещё и рынок, если говорить про СНГ, он смешной.

Единственная мотивация для дизайнеров идти в BI — много денег. За ней можно идти. Но тем не менее, для дизайна это конечная область, ты там как дизайнер всё перепробуешь, найдёшь лучшие сочетания.
Если представить, что ты очень прагматичен и при этом быстро осваиваешь такие специфичные штуки как Tableau. А он достаточно странный, это и не код и не борд, непонятная вещь, сходу сложно представить, на что похож. Вот если вспомнить эти ощущения фантомные от моих первых заходов в Photoshop и 3ds Max тоже: сходу не поймёшь. При этом интересно, что и в Photoshop’e и 3ds Max’е можно скрипты запускать. Порог входа высокий. Нужно иметь быстрое усвоение странных вещей для того, чтобы разобраться, дойти до какого-то уровня и потом выйти из этой истории. Здорово, если кто-то так сделает и расскажет остальным, сколько можно на этом поднять. И ещё посчитает, сколько он входил, потому что мне кажется, что для дизайнеров вход будет дороже, чем для инженера.

53:38 Про профисточники в графическом дизайне или UX

На начальном уровне стоит брать книжки классические, например Раскин, Тафти. Старые советы бюро про интерфейсы и визуализацию. В начале следить за кем-то конкретным бегать не надо. Когда ты на уровне middle или выше, кажется, ни за кем не получается следить, потому что сегодня студия N делает классно, а завтра — нет. И сидеть, следить за ней.. Был Тафти, все следили за ним, а он начал искусством заниматься. Можно переключиться вслед за ним, но если тебе визуализация интересна, тебе эти камни не сильно помогут. Можно искать крупицы смысла в его текста, но… За всё время у меня много чего перестроилось, единственное, что осталось неизменным, это Бирман. Единственный стабильный источник информации, на который можно рассчитывать: там не будет больше определенного процента флуда, будет всё ещё что-то интересное, полезное, метко сформулированное. Бывает, что ты много чего знаешь и понимаешь, но сказать не можешь. А у него есть такое полезное свойство: он умеет формулировать. Я видел его TikTok’и, не знаю, зачем они мне, но это такой показатель адекватности: если он может оценить свои силы так, чтобы там появиться, релевантно, значит он на месте. Как только я вижу ребят, которые бегут за остальными в Youtube, возникает вопрос: а вы там ничего не забыли, в своих 99-х в интернете?

Ещё скажу, чтобы люди ходили на курсы. Прекрасно понимаю, что они дорогие, поэтому предлагаю капать на голову работодателю, спрашивать при устройстве на работу: сколько курсов в год мы проходим? Не «проходим ли», а «сколько». Потому что по моему опыту это хорошая встряска, переупаковка всего, что ты знаешь. Я очень рад, что на курсы Ли попал не когда только начинал, а уже чуть ли ни на уходе из лаборатории. То есть я уже делал сложные вещи, у меня не было в этом потребности, но ещё раз всё это пересобрать и вспомнить базу — супер. Когда ты уже достаточно хорошо всему научился и вспоминаешь азы, они более широко раскрываются. Вещи из первой самой простой книжки Тафти, когда я их прокручиваю в голове, замечаю, насколько оно многомерно раскрывается. Понимаешь: незачем на треды смотреть, надо просто раз в год вспоминать всю классику и ходить раз в год на курс бюро или лабораторию. С Тафти ещё полезно, потому что это не наш родной язык, поэтому если ты развиваешь английский, со временем прочтение Тафти делает его более насыщенным. Но интенсивы Лаборатории для junior designer я бы не рекомендовал. Они слишком интенсивные для новичков, ты мало усваиваешь, расстроишься, что потратил деньги. Лучше уж на уровне pre-middle. Либо искать курсы длиннее.

1:02:31 Блиц

Три базовых навыка графической вёрстки?

  1. Работа с пространством, то есть когда у тебя есть текст и белая область вокруг, ограниченная листом или экраном.
  2. Пройти курс про шрифты, чтобы увидеть список ужасных шрифтов и выкинуть их. Оставить себе 5-10 нормальных, это можно один раз сделать и жить с ними. На начальном этапе можно даже не понимать, почему шрифт плохой или хороший, можно узнать у кого-нибудь список, ограничить себя им и остальные забыть
  3. Google it — всё надо гуглить. Сейчас можно нагуглить любой контекст, даже не понимая языка. Найти можно вообще всё, перевести, даже если ты не знаешь, как это люди обычно используют, было это или нет, потому что умея это, можно и шрифты нагуглить нормальные, и инструкции по работе с пространством. В общем, это самый главный навык любого специалиста, у которого есть компьютер или телефон.
  4. В случае с визуализацией, хорошо пойти разобраться в цветах, палитрах, принципах триад, сочетаний, найти для себя color brewer, чтобы просто знать, что есть готовые палитры, потому что в визуализации много возлагается на цветовое кодирование, это самое сильное и часто используемое кодирование. Иногда даже говорят, что другие не надо использовать, потому что они намного сложнее. Чтобы не использовать все оттенки серого или понимать, когда данные уже вышли в следующее измерение и тебе нужно вводить цвет или работать на уровне оттенков.
    Пространство, шрифт, цвет — это база. У графического дизайнера дальше бы пошли ещё формы, но для визуализации они нужны в последнюю очередь.

Figma или Photoshop?
Если говорить о визуализации, то Figma. Если про графический дизайн в целом, то оба. Сейчас важнее что-то сделать и получить approve от реального мира, и Figma позволяет получить это быстрее. Чтобы быстрее понять глубину кроличьей норы, то лучше Photoshop. Чем раньше ты её поймёшь, тем быстрее развеются иллюзии и станет интереснее. Иногда кажется, что дизайн скучно — просто посмотри, что люди в фотошопе делают и реши, насколько это скучно.

Когда можно и стоит выравнивать шрифт по центру, а когда нет?
У текста при выравнивании появляется ось. У флага, соответственно, края, у центра центральная. Если она нужна для того, чтобы что-то пояснить, например, по ней же данные идут, то в целом это ок. Если элементы плотно стоят друг к другу, три точечки, то у крайних можно по флагу сделать выравнивания, а у центрального по центру, чтобы они максимально привязались к своим объектам. Можно в заголовках, но это скорее будет каким-то художественным приёмом, и он тоже не просто потому, что заголовок, давайте поставим по центру, должна быть хотя бы какая-то интенция передать что-то. Как только мы не знаем, зачем оно нужно, оно не нужно. У него должна быть какая-то нагрузка функциональная: смысл, эмоция.

Шрифты с засечками или без?
Для визуализации без. Мой опыт больше о бизнесе и науке, где много данных, много всего, там часто кегль нельзя сделать большим, поэтому с экраном проще считывается без засечек. Во всём остальном как угодно, можно и Twitter сделать с засечками круто. Очень интересно, что всегда об этом спрашивают, но никто не говорит: шрифт без засечек или а-ля Comic Sans? Хотя, по-моему, это тоже две большие величины. Или категория шрифтов, которая scripts называется. Это просто шрифт, как узкий или широкий. Для интерфейса широкий сложно: будет плохо вмещать. Засечки примерно из той же категории.

Три любимых шрифта?
Есть шрифт Suisse Int’l который разработали швейцарцы, его люди, ничего не знающие про дизайн, назовут Arial’ом или Helvetica, но он немного другой. Им я могу сделать много всего, он похож на мой дефолтный. И, наверное, всё. Много в памяти шрифтов, названий, но выделить сложно. Они же все по времени меняются. Хороших много. Назову один, хотя подозреваю, он тоже скоро из категории любимых уйдёт, потому что надоедает.

Шпроты или шаверма?
Имеешь ввиду Рига или Питер? Конечно, Рига, если бы был Питер я бы уже вернулся. А так, наверное, ни шпроты, ни шаверма, хотя она по-вкуснее будет.

Ранее Ctrl + ↓