о визуализации данных и развитии BI-систем
канал в телеграмме | подборки | видео

Позднее Ctrl + ↑

Список лайфхаков Табло

Решил собирать в одном месте все лайфхаки по Табло, чтобы можно было легче искать нужный.

Выпуск №1
0:00 — Как сделать удобный фактоид с приростами период к периоду
9:26 — Как показать разрыв в данных с помощью Missing Values
11:58 — Как ускорить работу в Табло за счет фишек интерфейса

Выпуск №2
0:00 — Сортировка по значению за последний месяц с помощью Nested Table Calcs
4:04 — Оформление спарклайнов при помощи Reference Lines
7:12 — Highlighted таблица с подсветкой по одной метрике из Measure Values

Выпуск №3
0:00 — UTF символы для создания цветовой легенды
3:29 — Динамический фильтр дат с окном и ренджем
7:08 — Подпись событий о запусках или маркетинговых активностях во времени на таймсерии

Выпуск №4
0:00 — Как сделать удобную адаптивную легенду
3:00 — Как подписать точки на графике по условию
7:12 — Как избежать проблем при работе с Табло на Windows

Выпуск №5
0:00 — Составные таблицы из нескольких листов
4:19 — Функция Random()
8:16 — Переименование Worksheets и Dashboards на сервере

Выпуск №6
0:00 — Тоталы в барах
4:19 — Таблица с спарклайнами
8:16 — Предыдущий период на графике

Выпуск №7
0:00 — Пагинация в таблице
4:45 — Сравнение метрики по разрезам
11:23 — Подсветка строк в таблице

Выпуск №8
0:00 — Бины и группировка максимума
5:38 — Выравнивание в бар-чарт таблице
13:05 — Подсветка выходных

Выпуск №9
0:00 — Дубль графиков
6:01 — Топ N в каждой категории
9:22 — Размер точек на карте

Выпуск №10
0:00 — Run Rate
12:30 — Двойная цветовая легенда
15:04 — Apply to Totals

Плейлист со всеми выпусками:

Итогов года пост 2020

Собрал все итоги года в одном посте.

Telegram

Начну с Телеграма. Данные собрал из API tgstat.ru, выгрузки из самого Телеграма и некоторую разметку сделал руками. Получился такой дашборд:

Основные хайлайты
— Канал вырос с 0 до 2.2К подписчиков.
— Всё время поддерживается Engagement Rate (ERR) ≈ 100% (Ср. охват поста/Кол-во подписчиков). Эта метрика для меня важнее кол-ва подписчиков, так как показывает, насколько интересен контент читателям и насколько им делятся.
— Больше всего в канале постов в тегом #ссылка — 81 шт., наибольший охват и ERR получили посты с тегами #статья — 2К охват, 241% ERR
— Чаще всего я публикую посты по пятницам, но охват у таких постов не самый большой. По времени чаще всего с 14 до 15, здесь показатели тоже небольшие, видимо обеденное время. Нужно будет с этим поэкспериментировать =)
— Был написал 241 пост. Самым просматриваемым постом стал пост про черные точки, его репостнули в канале Адовый UX. Самым виральным стал пост про статью «Таблица или график? Как убедить заказчика».
— 80% просмотров на пост приходятся за первые 3-4 часа после публикации.

Впечатления
Я, если честно, приятно удивлён количеством подписчиков и вовлеченностью. Я веду блог пять лет, и мне всегда казалось, что тематика супер узкая и интересная малому количеству людей. Когда заводил канал, думал, что максимальный потолок для канала ~1К подписчиков (посчитал как половина от суммы участников чата по визуализации и чата по Табло). Рад, что контент интересен и полезен, для меня это классная возможность поделиться тем, что я считаю важным, и развить личный бренд.

Спасибо всем, кто делится постами, особенно @rockyourdata, @dashboardets, @chartomojka, @data_publication, @leftjoin, @internetanalytics, @analyst_club, @nastengraph, @dataviznews, @novichkovnet или просто в личных сообщениях. Кстати, список каналов, за которыми я сам слежу лежит здесь.

YouTube

Данные взял из Data API YouTube Data API, скачав их с помощью скрипта на js напрямую в гугл-таблицы — очень удобно! https://public.tableau.com/views/YoutubeAnalysis_16090922510490/YouTubeAnalysis Собрал дашборд, по аналогии с тем, что разбирали на вебинаре по адаптивной верстке.

Основные хайлайты
— За год я выпустил 26 видео, на канал подписалось 429 человек, всего 16К просмотров.
— Большего всего сморят видео с типом #выступление и #подкаст. В среднем одно видео собирает ~400 просмотров (медиана 370).
— Самое просматриваемое видео «Алгоритм разработки дашборда» на Date Learn. Меньше всего у перевёрстки «Product Superstore».
— Самый короткий подкаст был пилотным, с Андреем Дорожным, но зато у него больше всего просмотров среди подкастов. Дольше всего проговорили с Никитой Рокотяном.

Впечатления
Ютуб требует довольно много усилий на продакшен, при этом качество мне всё равно пока не нравится, видно, что сделано на коленке. Зато он очерчивает core аудиторию которая готова тратить время на просмотры, а не только на посты в телеграмме. Самое большое разочарование для меня, что не взлетела рубрика #переверстка, мне казалось, что это самый полезный контент на канале, но почему-то заходит он плохо, если есть идеи как его прокачать — пишите в личку.

Блог и сайт

Данные для этого анализа мне помог собрать Саша Михайлов, автора канала data-будни про инжиниринг данных, рекомендую. Данные тянутся из базы блога с помощью питона записанного в гугл-коллабе и после этого складируются в гугл-таблицы. Скоро сделаем с Сашей инструкцию, как собрать такой же дашборд если у вас блог на Эгее. Плюс ещё кое-что посмотрел в Я.Метрике. И конечно же собрал дашборд. =)

Основные хайлайты
— За год написал в блог 32 заметки, из них 14 «настоящих» статей, остальное дубли подборок из телеграмма и видео с Ютуба. Это больше, чем в прошлом и позапрошлом году, но меньше чем в 2017-ом.
— Самой просматриваемой стала заметка «Интерфейсы в BI системах».
— Завёл отдельный тред для подборки работ по визуализации, собрал 93 классных примера.
— Самой популярной заметкой по запросам из поисковиков является уже который год статья про логарифмическую шкалу. В этом году она особенно популярна ))) Смотрите как забавно отличается рост просмотров от остальных заметок.

Впечатления
В этом году мне прям нравятся лонгриды, которые написал. Доволен, что из них получается стройная теория по проектированию дашбордов.

Дисклеймер по данным
Сбор просмотров начался только с марта, после обновления платформы блога. Поэтому хотя там можно отмотать фильтр по дате публикации, но это будут просмотры только за текущий год.

Подборка самых важных и полезных авторских материалов за год по моему мнению

Статья «Навыки для визуализации данных»
Статья «Интерфейсы в BI-системах»
Вебинар «Алгоритм проектирования дашборда»
Статья «Шаблоны верстки дашбордов» (скоро буду обновлять, докрутил идеи)
Вебинар про Адаптивную верстку в Табло
Статья «Таблица или график? Как убедить заказчика» и вебинар на базе этой статьи
Статья «График план-факт во времени»
Выступление про стайлгад и темплпейт Я.Такси
Трибьют «Тафти в Табло»
Дашборд про рынок вакансий аналитиков

Tableau Public

Собрал подборку работ с Табло Паблик, которые понравились мне больше всего за 2020 год. Сложнее всего на Паблике найти хорошие дашборды, одни лонгриды и инфографика )))

Личная статистика

Последняя часть с итогами. В ней собрал все данные, которые можно получить о себе почти без усилий. Графики в этот раз попытался сделать в стиле «инстаграм». Осваиваю новые форматы, сразу чувствуется нехватка практики.

В этом году очень много времени провел, работая за компом. Планирую в следующем году ограничить время на работу. Это всё плохо сказывается на продуктивности и здоровье. Надо больше отдыхать и относиться к этому, как к части работы. В основном трачу время на Табло (34%) и мессенджеры (28% и 82К отправленных сообщений, 187 часов в zoom).

В конце сентября заболел ковидом и на это же время наложилось несколько важных проектов, из-за этого потерял все старания по контролю веса с начала года. Благо сам вирус перенёс супер просто, но ещё 2 месяца после этого был как ватный. Интересно, что в данных это проявилось как повышенный сердечный ритм в октябре и ноябре. Неприятная болезнь, какие-то пост эффекты дурацкие. Из-за этого же явно меньше ходил, особенно в конце года совсем не соблюдал планку в 8500 шагов в день.

Из забавных эффектов карантина, стал довольно много и регулярно спать по сравнению с прошлым годом.

Данные: MI Band 3, Mi Scale, Timecamp.com

Табло

Добавил 2020-ый год в свою любимую [«визуализацию про время, которое я трачу на визуализацию». Табло всё больше в моей жизни. В этом году много работал руками и обучал, отсюда набежало больше тысячи часов.

Данные: Timecamp.com

Траты

Чаще всего в этом году тратил на супермаркеты, транспорт и кафешки. Больше всего потратил на переводы и нал, они превратились в три самые крупные покупки: машину, подводку газа в дом и обустройство участка.

Данные: Выгрузка из банка
 

Перемещения

В этом году никаких зарубежных поездок не было, как и у большинства. Зато я снова перешёл с iPhone на Android, и там есть замечательная функция выгрузки местоположений и вообще любой статистики по Гугл аккаунту. Получилась классная карта. В карантин много раз порадовался, что последние 3 года живу за городом. Прикольно видно как я переехал с юго-востока на северо-запад, а потом на север.

Данные: takeout.google.com

Сайт и айдентика

Ещё в этом году обновил сай и его английскую версию. За это огромное спасибо Кириллу Беляеву, он взялся нарисовать дизайн, а я заверстал сайт.

Если вам будет нужен дизайн, очень рекомендую обратиться к Кириллу — его портфолио и канал.

Впечатления
Год был ярким как на хорошие события, так и на плохие. Для меня в итоге он имеет скорее положительную окраску, но осталось куча всего, что хочется докрутить в следующем году. Самыми яркими впечатлением стали, пожалуй, выступление на конференции Матемаркетинг, концерт с группой (хобби — играю на басу в кавер-группе) и запуск телеграмм-канала.

🎄Всех с наступившим, приятных заказчиков и классных дашбордов вам в этом году!

Адаптивная верстка в Табло

Выступил на проекте DataLearn с рассказом про адаптивную верстку.

Материалы со вчерашнего вебинара про адаптивную верстку в Табло:

  1. Запись вебинара
  2. Книга на Паблике (можно скачать и посмотреть, что внутри)
  3. Статьи The Economist:
    про ошибки в мобильных графиках
    про адаптацию графиков для инстаграма
  4. Дашборд про зарплаты (пример с CSS, можно посмотреть в инспекторе кода)
  5. Навыки и литература по визуализации

Сам дашборд, на котором разбирали теорию, — это статистика канала Data Learn на YouTube. Данные собрал через API YouTube и скрипт в гугл-таблицах. Получился прикольный дашборд, который можно будет переиспользовать.

Видеоподкаст с Никитой Рокотяном

Записал подкаст с Никтой Рокотяном — Data Visualization Engineer, основателем студии Interacta и автором канала Виз Ньюз. Никита — отличный пример «renaissance man», человека совмещающего большое количество разных компетенций и интересов: кодинг, дизайн, аналитику и арт.

Поговорили с Никитой о сложной визуализации для аналитических инструментов, посмотрели примеры интересных проектов и обсудили как обстоят дела с визуализацией в Кремниевой долине. В конце был отдельный блок про дата-арт и криэйтив кодинг. Не совсем по теме визуализации, но невероятно вдохновляет. В живую проекты можно посмотреть на странице компании и личном сайте Никиты.

Аудиоверсия
Текстовая версия — под видео (спасибо Наташе Shirosayuri!)

1:03 Карьерный путь
Термин «визуализация данных» настолько широкий, что те, кто знают, что это такое, до конца не понимают, чем конкретно ты занимаешься. А те, кто не знают, путают это с другими областями. Например, с 3d-визуализацией или визуализацией мыслей.

Когда я нахожусь в профессиональной среде, я говорю, что занимаюсь инструментами для визуальной аналитики. Это включает в себя не только визуализацию, но и алгоритмы, и ux-дизайн. В течении карьеры я занимался не только этим, мы также делали компоненты, которые куда-либо встраивались, и дата-арт.
Я делаю всё, но стараюсь концентрироваться на создании визуализаций и компонент инженерной части, и немного ещё data science и дизайн. Прелесть области состоит в том, чтобы делать всё и сразу.

По образованию я физик. Занимался научной работой около 5-6 лет, был сотрудником лаборатории климата и окружающей среды. Мы исследовали по солнечному излучению состав атмосферы. Кратко: солнечное излучение проходит через атмосферу и может быть измерено в наземных лабораториях. Потом оно отражается от поверхности Земли и может быть замерено спутником. Таким образом, наземные лаборатории являются валидацией данных от спутников. Потому что спутники могут давать данные по всей поверхности Земли, а лаборатории — нет. Молекулы в атмосфере поглощают излучение и по его спектру мы можем достаточно точно восстановить состав атмосферы.

Со временем это переросло в визуализацию, потому что я хотел совмещать свой научный интерес с творческим.
До этого я занимался дизайном, работал в типографии, мне нравился дизайн как область, и математика, алгоритмы. Область, в которой это всё соединяется и востребовано — визуализация данных.

8:58 Офф-топ: есть ли глобальное потепление?
Потепление есть, несомненно. Если какое-то время тому назад часть учёных ещё считала, что только на 95% потепление обусловлено антропогенными причинами, то сейчас почти все ученые сошлись во мнении. И риски очень велики. Огромный ущерб экосистемам, которые мы не видим, а дальше всё идёт по цепочке. Такое быстрое изменение для экосистем очень губительно. Оно не уничтожит планету, но нам станет всем не очень хорошо и наше существование будет под угрозой.

Сам процесс изменения климата медленный и инерционный: то, что мы запустили сейчас будет продолжаться ещё на протяжении ста лет. Ты не сразу можешь видеть результат своих действий.

11:23 Визуализация в Кремниевой долине и переезд
Сейчас здесь почти все работают из дома. Все очень серьёзно отнеслись к коронавирусу. Ещё летом крупные компании перевели на удалёнку всех до следующего года. Поэтому нет того эффекта кампусов, как будто в научном городке, где кипит жизнь. Это не город, это такая деревня, конгломерация крупных компаний, где для сотрудников созданы тепличные условия, чтобы они могли продуктивно работать весь день. Сейчас это остановилось и многие работают из дома. Нет социального эффекта, который был здесь всегда.

Очень интересно развитие долины после пандемии. Я не думаю, что она вымрет, возможно, она расцветёт ещё больше. До этого здесь было слишком много людей, из-за чего цены слишком выросли, было видно слишком большое расслоение общества и огромное количество проблем.

К истории о том, как я переехал. Я долгое время работал с клиентами отовсюду. Как-то так случилось со временем, что большая их часть была из долины. Один из них оказался амбициозным стартапом. У нас завязалось сотрудничество, и на протяжении 2-3х лет всё шло к тому, что для дальнейшего развития мне было бы полезно находиться здесь. Если и учиться где-то создавать крупные масштабные проекты, то именно здесь, потому что это столица современных технологий. Кроме того, по моему опыту американцы из долины и из Нью-Йорка умеют очень продуктивно работать, не растрачивая время на бесполезные детали.

Что касается визуализации, субъективно кажется, что потребность в специалистах всё ещё велика. Именно разработчиком визуализаций — их достаточно мало, чтобы насытить имеющийся рынок. А рынок растёт, потому что значительное число компаний начинают понимать, что можно стать лучше, используя визуализацию.
Наиболее интересная область для меня находится на стыке визуализации данных, data science и ux-дизайна. Если ты можешь создать компонент, который работает с динамическими данными, при этом он красивый и информативный, то это успех и огромное количество продуктов может сделать шаг вперёд благодаря подобным инструментам. Таких специалистов очень мало. Я вижу компании, которые ищут дизайнеров, которые умеют кодить. Они и раньше были, но сейчас для таких специалистов появился рынок.

21:20 Примеры проектов
Show Real на нашем сайте я собирал достаточно долго из разных кусочков. Здесь не только инструменты, но и самые разные проекты. В принципе он отражает то, что нам нравится делать. В связи с тем, что всё моё время уходит на работу со стартапом, студия существует сама по себе без моего активного участия. В проектах, которые там идут, я иногда выступаю в роли ментора. К сожалению, очень много проектов находятся под NDA и ими нельзя поделиться, хотя зачастую они все очень интересные, удобные и красивые.

23:50 Data-Driven Country Map

Это конкурсный проект, который мы делали для World Data Visualization Price Мы сделали инструмент, который может перерасти во что-то больше как концепция, возможно с другим набором данных.

Идея состоит в том, что у нас есть набор данных о разных странах и каждая конкретная страна может быть охарактеризована набором определённых свойств. Например, число жителей, ВВП, различные индексы, уровень коррупции, эффективность судебной системы. Огромное количество метрик и сложно составить картину того, какие это страны. Как они соотносятся друг с другом по своим свойствам, а не по географии? Мы взяли алгоритм t-sne. Он берёт на вход массив данных, где каждая точка описывается большим набором характеристик, и умеет находить между ними схожести и группировать точки по ним. Здесь точки — это страны, и мы видим в них какие-то паттерны. То есть алгоритм считает, что эти страны между собой похожи по какой-то причине. Ты как исследователь сперва не знаешь эту причину, и дальше начинаешь изучать. Первое, что мы сделали, это нанесли эти точки, страны, и покрасили их по континентам. Сама карта открыта для интерпретаций, и чтобы понять, почему те или иные точки оказались рядом, нужно иметь интерактивный интерфейс, который может дать тебе возможность в реальном времени что-то включать и смотреть, как алгоритм реагирует. Это позволяет тебе понять, какие свойства находятся в основании попадания стран в кластеры. Кроме того, можно выбрать какую-то определенную страну и подвигать параметры для неё. Подобная игра позволяет думать комплексно о том, что можно изменить, чтобы страна попала в тот или иной кластер.

35:20 The Seamless Web

Это экспериментальный визуальный поисковый движок по судебной системе США. Как-то к нам обратился юрист, который хотел попробовать визуализировать сеть связанных дел. Боль, которую тут можно решить с помощью визуализации, состоит в том, что ты, будучи юристом хочешь найти случаи, которые подходят под твой. Ты открываешь какую-то поисковую систему и находишь список других дел в виде списка. Дальше тебе нужно их все открывать и читать. Поэтому появилась идея: визуализировать результаты поиска в виде графа. Тут ты можешь увидеть центральные кейсы, на которые ссылаются другие, смежные и кейсы на периферии, можешь выделять какие-то группы и делать текстовый анализ по ним.

Открывая проект в первый раз, ты видишь поисковую строку. Тут же автоматический саджест из базы по документам, которые искали люди или которые могут быть тебе интересны. Ты формулируешь свой запрос, он отправляется на сервер и формирует тебе из него граф: по ключевым запросам ищет дела и потом в них ищет ссылки друг на друга. Здесь каждая точка представляет собой одно дело. Дальше включается алгоритм поиска комьюнити в сети, и по результатам алгоритма точки раскрашиваются. Уже на этом этапе мы видим какие-то определённые кластеры, но пока не знаем, почему они схожи. Тут подключается data science, скрипты, которые вычленяют из кейсов несколько моментов: наиболее важные термины и словосочетания, наиболее релевантный текст. Дальше делается сложный анализ: мы вычленяем из текста кейса фрагменты, которые являются наиболее цитируемыми.

В итоге получается база, по которой юрист может провести поиск и получить граф для того, чтобы продвинуться дальше в деле, которое ведёт. Например, в графе можно увидеть наиболее важные дела и нажать на них, чтобы увидеть их тексты. В текстах подсвечиваются наиболее интересные фрагменты.

47:13 Про графы связей
Использование графов сильно зависит от задачи. Сам по себе он не столько несёт в себе информацию, сколько является навигацией по визуализации. Потом ты уже можешь выбирать ноду, углубляться в неё. Таким образом, граф является первым экраном для инструментов глубокого анализа.

50:27 Красота vs Бизнес-польза
Всё зависит от бизнеса. Кому-то может быть всё равно, красивое оно или нет, а кому-то это наоборот важно. Я думаю, что это не вредит, и когда делаю что-то, задаюсь вопросом: можно ли сделать так же, но ещё и красиво. Не всегда есть возможность так сделать. Часто можно сделать такие нестандартные визуализации, которые решают ту же задачу, что и классические, и делают это не менее эффективно, но более привлекательно выглядят. Анимация, например, очень сильно оживляет картинку, хотя многие её пренебрегают.

50:27 Стек технологий
Чаще всего используем d3 и какой-нибудь фронтенд react/svelte. Последний сейчас стал очень популярным, потому что он маленький и простой, в react’e разобраться сложнее. Svelte позволяет быстро разобраться и создавать в нём простой ui, а сама визуализация d3. Если нужно нарисовать что-то большое, то используются инструменты на webgl, three.js, reguls.

С точки зрения визуализации, мы обычно используем то, что нужно в проекте прямо сейчас. Если нужно не очень много точек, то не нужен какой-то сложный стек, и наоборот.

57:10 Как визуализация спасет жизни пациентов

В этом проекте t-sne был использован для анализа медицинских анализов. Лаборатория, которая занимается исследованиями болезней сердца, делают огромное количество анализов. По их набору хочется найти взаимосвязь и закономерности.

Им нужен был инструмент, с помощью которого можно было работать с их данными. Например, есть файл excel, где в столбцах это виды анализов, а в рядах пациенты. Можно нарисовать точками типы анализа или пациентов, из-за чего у нас появляется две карты. Первая может быть использована для того, чтобы смотреть на пациентов, которые сходятся в каких-то параметрах и определить для них течение болезни и возможные риски. Во втором случае проводились исследования, где брали различные группы пациентов, например, очень больных, которые в итоге умирают. Или наоборот, которые в итоге выздоравливают. И сравнивали, как соотносятся анализы, которые есть у разных групп пациентов. Таким образом, увидели, что чем больше количество кластеров, в которых анализы схожи между собой, тем более велик риск смерти пациента. Так же можно брать анализы у пациентов каждый день и исследовать их с помощью данного инструмента. Чем больше связей между точками появляется со временем, тем сильнее ухудшается состояние пациента. Если пациент идёт на поправку, то эта сеть становится более хаотичной.

1:03:40 Источники вдохновения, Виз Ньюз
Хорошие примеры визуализации я беру из твиттера. Там огромное количество новостей. Можно подписаться на ряд экспертов из этой области, со временем твиттер предлагает ещё людей из этой области, таким образом можно составить себе профессиональную новостную ленту. Как в дизайне важна насмотренность, так она важна и в визуализации. Поэтому важно всё время смотреть на то, какие визуализации придумали другие.

1:06:55 Технологический арт, как не бояться нового

С арта начался интерес к визуализации и области. Изначально меня вдохновляли алгоритмы, которые рисуют графику. Я думал, что круто было так делать, но это так сложно, что никогда не научусь. Со временем страх уходил, а интерес рос. Это как раз совпало с расцветом индустрии интерактивных инсталляций. Я делал генеративные инсталляции, со временем интерес этот вывел меня на работу с визуализацией и совпал с моим научным интересом. На сайте есть раздел с артом, где выложены мои старые проекты. Там есть совершенно удивительные проекты. Например, исследовательский проект в minecraft’e. Совпало два биеннале: выставка Уральского современного искусства и выставка Zero one? Мы строили в игре прототипы инсталляций, которые в итоге может воплотить в жизни.

Так же был интересный игровой проект «18», который так и остался прототипом. Он похож на plants vs. zombies, но в нём ты делаешь музыку. И цель не победить всех, а создать трек. У каждого юнита своя музыкальная тема, добавляя их на поле можно было создать мелодию.

Поскольку я занимался вопросами изменения климата, мне захотелось визуализировать как CO2 на планете меняется. Это вызвало огромный интерес, хотя сама по себе визуализация очень простая. Сам посыл о том, что что-то меняется достаточно агрессивно, так хорошо считывается, что люди действительно начинают задумываться об этой проблеме.

Кроме того, мы делали скульптуры из фарфора: выдавали опросники коллегам и друзьям, чтобы определить, насколько они рискованны в той или иной области. И в итоге получатся такой фарфоровый портрет их риска.

Была ещё одна совершенно невообразимая история о том, как одно рекламное агентство собирает команду для своей творческой резиденции, чтобы создавать новые вещи. Жить три месяца в незнакомой стране было что-то пугающим. Мы жили командой в одном доме и делали экспериментальные проекты. Удивительно, насколько многому можно научиться в подобных резиденциях. Самое важно, что я вынес: я лучше понял, что я могу. Когда работаешь фрилансером, зачастую не знаешь, что ты умеешь относительно других. Если есть возможность поучаствовать в таких проектах, то я бы посоветовал это делать.

Сам проект представлял собой инсталляцию, которая создавалась для фестиваля STEAM Carnival. Там часто делаются инсталляции, которые основаны на законах физики и математики. Наша инсталляция должна была вдохновить детей на интерес к науке. Мы придумали создать несколько станций с граммофонами, внутри которых был микрофон. По нашей задумке ребёнок должен был кричать в граммофон, и дальше крик модифицировался во что-то ещё. Была LED-станция, в которой зажигался свет, ещё с мыльными пузырями, дующая ветром, с шариками и с ленточками, развевавшимися на ветру.

Дети находят самые необычные применения тому, что ты сделал. Например, набрать на одной станции мыльных пузырей, чтобы на станции, которая дует, их развеять по ветру. Очень радует, что это в конечном счёте вдохновило детей на то, чтобы исследовать, как это работает.

Главный урок, который я вынес: я думал, что еду в крупное агентство, уж, наверное, они знают, как делать вещи. И оказалось, что нет, на самом деле никто не знает. Чуда не случится. На самом деле сделать что-то хорошее действительно очень сложно.

1:32:03 Блиц

Топ-3 книги
Я не очень много читаю, мне всегда было сложно учиться по учебникам. Всегда потом приходилось садиться и делать то же самое руками, иначе я не запоминал. Так что я не назову каких-то конкретных названий, но выберите какую-нибудь художественную, техническую и научную книгу и это даст вам разные взгляды на жизнь. Если вы сможете их все переварить и получить удовольствие, то всё, успех вам обеспечен.

Генеративные коддинг или визуализация данных?
Эти вещи даже нельзя сравнить. Но если отвечать на вопрос, то визуализация. Во-первых, она использует генеративный коддинг, во-вторых, в ней есть прикладной аспект.

SVG или Canvas
SVG

Vuj или react
React

React или Svelt
React, если вы делаете что должно масштабироваться. Если что-то маленькое делаете, то Svelt

Россия или Штаты
Россия. У штатов есть огромное количество вещей, где можно было бы поучиться, а у нас — огромное количество областей, которые ещё не заняты и где эти знания можно применить

Процессинг или D3
D3. С досадой отвечаю, потому что процессинг — это моё профессиональное детство. Но всё равно d3, потому что с одной стороны он сложнее, а с другой стороны он больше возможности даёт и в итоге получается проще.

Масштаб текста в Windows и Tableau

Очень важная заметка для тех кто работает с Табло на Винде. Из-за этой ошибки вечно криво и косо верстаются дашборды.

Если у вас в настройках экрана стоит шрифт 125%,150% и т. п. то при работе с Табло Десктоп вы можете получить неправильную отрисовку размеров шрифтов и некоторых элементов. Настроив дашборд после публикации вы получаете ошибки — элементы смещены или не умещаются. Нормально работает только с шрифтами 100%.

Вот как это выглядит — вы сделали дашборд и на десктопе всё выглядит ОК:

А после заливки на сервер это превращается в кашу:

Если сталкиваетесь с такой проблемой, то вот как это исправить:
— Видео-инструкция
— Официальная инструкция от Табло
— Инструкция скриншотами:

Единственная проблема, что такое решение «блюрит» вам дашборд в десктопе. Такое будет только на машине, а на сервере отчет будет выглядеть четким. Если это не подходит, то нужно менять размер шрифта в системе на 100% или 200% процентов. =(

Кем работать, если нравится визуализация данных

Читатель блога спросил кем работать, если нравится визуализация данных. Собрал небольшой гайд по профессиям, где одним из основных навыков является визуализация данных. Всё ниже сказанное — моё субъективное мнение и опыт. Зарплаты Московские, net по результатам анализа рынка аналитики и инструмента быстрого анализа зп по запросу. Примеры вакансий не самые актуальные, а самые подходящие по навыкам и т. п. Если есть чем дополнить статью и я что-то пропустил — пишите.

Я буду разбирать разные позиции по одним и тем же критериям: что делать, какие нужны скилы, насколько много визуализации, сколько можно заработать и т. п.

Разработчик дашбордов

Тэги: BI-аналитик, BI разработчик, Data Visualization Engineer, Разработчик отчётности, Разработчик + название BI системы, Консультант по + название BI системы.

Что делать: Разрабатывать и поддерживать дашборды и внутреннюю отчетность в компании.

Основные навыки: техническое знание BI системы (Tableau, Power BI, Qlik), графический и UX дизайн, сбор требований, SQL и подготовка данных.

Насколько много визуализации: 60% — визуализация, 20% — сбор требований, 20% — подготовка данных.

Зарплаты: junior — 50-80, middle — 100-140, senior — 160-200.

Востребованность: Пожалуй самый востребованный и денежный способ заниматься визуализаций данных. Таких позиций меньше, чем аналитиков данных, но они есть на рынке и многие компании выделяют создание дашбордов в отдельные направления. Чаще всего таких людей ищет крупный бизнес, где есть разделение по ролям внутри отдела аналитики. Ещё можно вполне успешно фрилансить на зарубежном и российском рынке.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/38814023
https://hh.ru/vacancy/38402536
https://hh.ru/vacancy/38763777
https://www.upwork.com/search/jobs/?q=tableau
https://www.standav.com/careers_v4/index.html?job_id=z5G7h3

Аналитик данных

Тэги: Data analyst, Бизнес-аналитик, Аналитик, Аналитик баз данных, Маркетинговый аналитик, Продуктовый аналитик.

Что делать: Полный цикл анализа данных: подготовка и обработка данных, анализ, представление результата в виде дашборда (чаще всего)

Основные навыки: Python, практическая мат. статистика, SQL и подготовка данных, технические знание BI системы, сбор требований и управление проектами.

Насколько много визуализации: 35% — подготовка данных, 35% — анализ данных, 15% — визуализация данных, 15% — сбор требований.

Зарплаты: junior — 30-80, middle — 100-180, senior — 180-260.

Востребованность: Таких вакансий ещё больше, но визуализация это скорее доп. навык, который используется при представлении результатов анализа. Кажется, что рынок довольно перегрет и вакансий сейчас много, в основном это средний и крупный бизнес от 100 человек. Ещё у таких аналитиков часто есть специализация: маркетинг, продукт, ритейл и т. п., когда человек работает и знает какую-то область, специфичный набор метрик и как их правильно считать.

Примеры вакансий и фриланса:
https://yandex.ru/jobs/vacancies/analytics/analyst_eda_test/1w=
https://hh.ru/vacancy/39416083
https://hh.ru/vacancy/39657872
https://www.upwork.com/search/jobs/?q=analyst

Дизайнер интерфейсов аналитических платформ

Тэги: UX дизайнер, Аналитические системы, Корпоративные системы.

Что делать: Разрабатывать интерфейсы для сложных продуктов с большим количеством графиков и визуализаций.

Основные навыки: Информационный дизайн, верстка и типографика, UX/UI дизайн, Figma.

Насколько много визуализации: 50% — сбор требований, 30% — проектирование и отрисовка визуализаций и интерфейсов, 20% — проектирование сценариев.

Зарплаты: junior — 30-80, middle — 100-140, senior — 140-220.

Востребованность: Найти работу дизайнера аналитических систем сложно, так как приходится искать скорее проект, чем фирму. То есть тут можно искать именно интересные проекты и продукты, и уже туда стучаться как дизайнер, но искать, конечно, сложно. При этом и специалистов таких на рынке тоже очень мало, поэтому с таким опытом можно находить действительно хорошие предложения, но всё-таки, в этом случае, спрос прям единичный.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/38732193
https://hh.ru/vacancy/40129963
https://www.upwork.com/job/detail-orientated-designer-for-data-analysis-app

Фронт-энд разработчик

Тэги: d3.js и любые другие библиотеки визуализации.

Что делать: Разрабатывать аналитические web-приложения или сложные кабинеты с большим количеством визуализаций.

Основные навыки: JS, фреймворки, CSS, информационный дизайн.

Насколько много визуализации: 70% — написание и тестирование кода, 15% — сбор требований, 15% — дизайн визуализаций.

Зарплаты: junior — 30-90, middle — 130-160, senior — 180-280.

Востребованность: Фронт-энд разработчики сейчас в цене. История про визуализацию примерно такая же как с дизайнером сложных интерфейсов: нужно искать скорее продукт, чем компанию, в котором используется много визуализации — биржи, аналитические инструменты, BI инструменты и т. п. Кажется, что таких предложений, в целом, больше, чем дизайнеров аналитических платформ.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/39967086
https://hh.ru/vacancy/39924837
https://hh.ru/vacancy/39687471
https://www.upwork.com/search/jobs/?q=d3.js

Дизайнер инфографики

Тэги: Дизайнер инфографики, Дизайнер презентаций.

Что делать: Делать инфографику и важные печатные корпоративные отчеты.

Основные навыки: Информационный дизайн, верстка и типографика, Illustrator, Power Point.

Насколько много визуализации: 70% — проектирование и отрисовка инфографики, 30% — сбор требований.

Зарплаты: junior — 30-40, middle — 80-120, senior — 120-160.

Востребованность: В целом довольно востребованное направление, можно найти как и отдельные вакансии, так и пойти в одно из агентств, которые на этом специализируются: https://infografika.agency/ru/ https://infografika.in/ и т. п.

Примеры вакансий и фриланса:
https://hh.ru/vacancy/39930792
https://hh.ru/vacancy/39653396
https://hh.ru/vacancy/39941199
https://hh.ru/vacancy/40143575
https://www.upwork.com/search/jobs/?q=infographics

Журналист данных

Тэги: Data журналист.

Что делать: Собирать и исследовать данные, формировать из них медиа-истории и статьи.

Основные навыки: Сбор и обработка данных, парсинг, редактура, сторителлинг, информационный дизайн, верстка и типографика.

Насколько много визуализации: 50% — сбор данных, 25% — создание истории, 25% — визуализация.

Зарплаты: junior — 30-40, middle — 60-80, senior — 120-150.

Востребованность: Редкая профессия в чистом виде, часто такие люди живут внутри студий инфографики в крупных медиа. Кажется, что работу найти довольно сложно, но не супер спец в этом.

Примеры вакансий:
https://journal.tinkoff.ru/team/infographics-designer/
https://hh.ru/vacancy/38148283

Вместо заключения
Если любите визуализацию данных, то с помощью неё сегодня можно зарабатывать совершенно в разных направлениях. Наиболее часто востребованы BI разработчики и аналитики, сложнее всего найти работу журналистам данных и дизайнерам сложных аналитических систем.

Помимо стандартных hh и т. п., работу можно поискать тут:
https://www.datavisualizationsociety.com/find-a-job
https://t.me/analysts_hunter
https://t.me/biheadhunter
https://revealthedata.com/examples/hh/
https://revealthedata.com/examples/vacancies/

Ранее Ctrl + ↓