Блог о журналистике данных и дата-сторителлинге ====== Канал ведут: @BlackPineapple — аналитик в службе дата-журналистики Яндекса, @marohovskaya — редакторка дата-отдела «Важных историй»
«Если быть точным» не так давно обновили датасет с супер-детализированными статистическими данными — в разрезе муниципальных образований. Такие данные достать очень непросто: Росстат почти всегда даёт статистику в разрезе региона и на уровни ниже в легкодоступных датасетах не спускается. Кроме того, коллеги уже сами свели таблички за разные годы в один датасет и почистили ошибки.
Остаётся приятная, но в то же время необъятная работа — исследовать это всё! Своих героев ждут 582 социально-экономических показателя.
Если у вас есть знакомые аналитики — покажите это им. Особенно ценен будет интерес со стороны тех, у кого есть отраслевая или региональная экспертиза, — с ней будет проще найти интересные сюжеты и интерпретировать результаты.
Го делать классные истории?
https://tochno.st/datasets/bdmo
P.S. картинка случайная из интернета, просто чтобы вы понимали уровень детализации
Сделали с коллегами из Яндекса тур по гастрономическим предпочтениям жителей разных городов России, изучив заказы из доставки.
Для меня одним из главных вызовов в этом проекте стала разметка категорий блюд по названиям и категориям. Оказалось, что в Яндекс Еде бургерные гиганты типа «Вкусно и точка» или «Бургер кинг» мало того, что не называют свои бургеры бургерами (а придумали всякие вопперы и биг хиты...), у них ещё и категорий таких в каталоге нет. В общем, приходилось изучать всю сетку их названий, чтобы корректно ловить такое регулярками 🥵
Долго стоически держался Калининград — когда в какой-то версии разметки бургеры лидировали почти во всех городах, там первыми были супы. В итоге бургеры всё же победили — с небольшим отрывом.
А что ещё помимо бургеров заказывают в доставке, читайте в нашем интерактивном проекте:
https://yandex.ru/company/researches/2024/food-in-cities
Новая порция дата-шарад от @datacitron! В этом году отгадываем музыкальные группы. Кого узнали? Пишите в комменты! Лично мне очень сложно 🙈
Год назад были книги и фильмы:
/channel/data_csv/1024
Знаете ли вы, что такое докс или вонёнизм?
Коллеги исследовали, какие новые слова интересовали пользователей Яндекса последние 10 лет. На лендинге можно посмотреть сами слова, их расшифровку, а также пройти тест на знание современного сленга:
https://yandex.ru/company/researches/2024/new-words
Т-Банк изучил, кто в России какими телефонами пользуются, и как отличаются траты этих людей
В среднем по России пользователей Android больше, чем пользователей iPhone. Айфоны в основном у людей помоложе и у девушек.
Айфоны преобладают в Москве и почему-то в республиках Северного Кавказа (кто-то понимает причину этого феномена?)
Самый популярный айфон в стране — это iPhone 11, прошлогодний флагман вошёл в топ-5.
По тратам предсказуемое — яблочники тратят больше, чаще ходят по барам и ездят на такси. Хотя судя по тексту исследования, мы наблюдаем тут не «эффект айфона», а скорее различие между городами-миллионерами и остальной Россией. Думаю, я бы при подсчётах учитывал бы разницу в среднем по городам.
https://www.tbank.ru/about/news/09122024-t-pay-research-how-do-iphone-and-android-smartphone-owners-differ-from-each-other-in-russia/
При работе над сложными визуализациями часто нужно вдохновение.
Data Viz Project запустили для этого классный инструмент — Data Viz Inspiration.
1500 интересных визуализаций, кнопочка Random, и вот вы залипли на пару часов.
https://datavizproject.com/inspiration/
Александр Варламов собрал данные сервиса Getmatch об актуальных российских зарплатах в IT
Если верить этим данным, миддлам-аналитикам при выходе на работу в среднем предлагают 210 тысяч. Самую «жирную» зарплату — обещают некому разработчику C++ — 1,6 млн рублей в месяц, есть в подборке и ещё несколько вакансий с потолком выше мульта.
В топе компаний по зарплатам почти всё — неизвестные имена. Из понятного мне внезапно вылез Островок, Звук (стриминг Сбера). Увидел ещё Яндекс, завуалированный как Плюс Фантех.
В общем, изучайте сами. Посмотреть можно на дашборде:
https://public.tableau.com/app/profile/alexandervar/viz/ITVacancies/ITVacancies
Bloomberg пишут, что Америка отстаёт от заявленных планов по климатическим целям — снижению выбросов и переход на возобновляемые источники энергии.
Для иллюстрации тезиса выбран очень нестандартный тип графика, который
1) отделяет реальные данные от прогнозных
2) позволяет сконцентировать внимание на увеличивающемся разрыве
https://www.bloomberg.com/graphics/2024-cop29-climate-change-targets
Запись вчерашних разборов!
Спасибо всем, кто пришёл вчера на стрим! Получилось очень интересно и разнообразно 🙌
Было много просьб выложить запись — делюсь ей с вами. Тут только разборы, запись моего пения пока останется эксклюзивом для тех, кто пришёл послушать вживую 😅
На эфире я также анонсировал основной поток записи на 3-й поток моего курса по визуализации данных «Эстетика в графиках».
На нем вы научитесь делать залипательные, понятные и эстетичные графики, которые будут быстро доносить мысли и помогать в принятии правильных решений. Такой навык точно поможет вам блеснуть на работе и пополнит портфолио.
🔷 Старт — 2 декабря
🔷 Продолжительность — 3 месяца
В результате курса вы:
🟣 Разберётесь как сделать график привлекательным, а также удобным и понятным для читателя;
🟣 Овладеете инструментами визуализации данных (Tableau, Flourish, Figma и другими);
🟣 Узнаете, какой график лучше подходит для вашей задачи, и почему именно он;
🟣 Научитесь дата-сторителингу: поймете, как выстроить графики, чтобы они рассказывали историю;
Разберу ваши графики
Давно не проводили такой формат, а я его очень люблю.
Условия простые, с вас — графики, с меня — предложения, как их улучшить. Или, возможно, я просто похвалю вас, и скажу, что всё круто :)
А ещё можно присылать не свои работы, а просто что-то, что вы видели в сети.
Разбор проведём в среду 20 ноября в 20:00 по Москве прямо тут.
Работы присылайте в эту форму:
https://forms.yandex.ru/u/673b275d49363912ace9eafc/
Антон Мизинов выложил в сеть свой сервис для сбора плиточной карты России
Достаточно приложить свой файл с данными (пример), выбрать цвета, настроить отступы — и можно получить готовое изображение в PNG или SVG.
Раскладка карты из ТАСС — она достаточно сильно отличается от карты, которые используют РИА, Т—Ж, РБК, Медиазона, Datawrapper и прочие медиа. Пока свою настроить нельзя, и для кого-то это может быть минусом.
https://mizinov.pro/tilemapper/
#работы_студентов
Даже серьёзную аналитику можно оформить ярко и привлекательно. Вот так получилось разобраться с экологической повесткой у моей студентки из Люксембурга.
В рамках хобби и волонтерства я интересуюсь вопросами экологии и устойчивого развития. Меня интересует, какие меры страны предпринимают для экологии и адаптации к изменению климата. Решила проанализировать, что делает Люксембург для обеспечения долгосрочного устойчивого развития, используя открытые данные.
Самым трудоёмким этапом была работа с табличными данными: от выбора подходящих датасетов сквозь кривой перевод с французского до подгона их под требования RAWgraphs и Flourish. С выбором вида графиков сложностей почти не возникло: получилось использовать и простенький донат, и Bumpchart. После обучения стало легче понимать, какие виды графиков сразу можно исключить для определенных данных. Как графический редактор использовала фигму.
Мега-инсайдов [от анализа] я не ожидала, и результаты получились достаточно предсказуемые. Решила разбавить эту предсказуемость неоновыми цветами как ассоциацию с энергетикой и инновациями, что достаточно непривычная гамма после корпоративных презенташек. Также пришлось отказаться от специфических терминов, чтобы материал был доступен более широкой аудитории, хотя обычно в таких темах хочется добавить больше профессиональных фактов.
В целом получилось выразить свои знания и интерес к сфере в новой плоскости. Ну и освоить работу с данными через эффективный визуал.
Было огненно 🔥
Поставил сегодня галочку — выступить на главной сцене Матемаркетинга
Спасибо всем, кто выбрал мой доклад! Болтали сегодня с девушкой, которая организовывала конференцию в прошлые годы: она сказала, что было много людей, и далеко не на каждое выступление столько приходит.
Приятно знать, что тема визуализации и красивые истории, построенные на данных, привлекают так много внимания. Буду стараться радовать вас ими и тут!
Как складывался путь Роберта Де Ниро в кинематографе?
Сегодня мы завершили второй поток курса «Эстетика в графиках» и сделали уже традиционную выставку дипломов. В этот раз нагенерили какое-то безумное количество крутого контента — хоть открывай свой Visual Capitalist. Безумно горжусь, что такие классные студенты учились у меня на курсе 🥰
Среди работ у меня есть и свои любимчики, и среди них — работа Дамиры Рейхерд. Ей слово:
Я давно хотела взяться за исследование творческого пути актёров, потому что просмотр и обсуждение кино с друзьями — это одно из моих главных удовольствий!
Готовых данных у меня не было, и я решила собирать их самостоятельно: нашла несколько датасетов на Kaggle, написала пару парсеров, использовала библиотеки под python для получения данных с IMDb и пр. Открытием для меня стало то, что полностью доверять полученным цифрам нельзя: я периодически натыкалась на нестыковки или неполноту. В результате ручная проверка и сопоставление данных из разных источников заняли неожиданно много времени.
Кажется, у меня нетипичный случай: изначально я сама не знала, какую историю хочу рассказать. Даже выбор актёра был практически случайным: несколько вариантов мне предложили товарищи по киноклубу. Но для меня именно в этом ценность моего исследования: в пути от поверхностного знакомства с объектом до полного погружения в его историю. Чем дальше я разбиралась в данных и строила графики, тем больше у меня появлялось идей и тем сильнее я восхищалась своим героем :) В результате успела реализовать только половину всего, поэтому — продолжение следует!
Я использовала практически все инструменты, которые освоила на курсе, — в этом одновременно была и лёгкость («Ух ты! Сколько возможностей!»), и сложность («Что выбрать? Куда податься?»). Очень вдохновила консультация, когда мы показывали свои наброски, и поддержка однокурсников.
Моя работа — это такое радостное желание поделиться своими открытиями. «А вы знали?», «Представляете!», «Я тут такое обнаружила!» Надеюсь, это радость передастся и читателям, а кто-то даже побежит смотреть фильмы с Робертом Де Ниро :)
если вы следили за моим курсом по визуализации данных, вот вам весточка
ближайшую неделю можно записаться на новый поток по самой выгодной цене 👇
Вот такие тренды 2024 года: курьер — одна из самых востребованных и хорошо оплачиваемых профессий
Ещё оказалось, что из-за нехватка рабочей силы работодатели начали снижать требования к сотрудникам, и всё больше становится вакансий, куда готовы брать вообще без опыта.
https://journal.tinkoff.ru/roles-count-2024/
Моей коллеге и подруге Кристине Уласович нужна помощь
Вы уже могли видеть этот пост в других датавиз-пабликах, но это тот случай, когда максимально широкая огласка может спасти жизнь
Кристина ищет контакты в системе здравоохранения, чтобы спасти маму.
Если вы знаете, как помочь — напишите ей: @ave_kirsten
Дорогие все.Читать полностью…
Так случилось, что в моей семье ужасное горе - мама заболела раком, IV стадия.
Не передать словами, насколько ужасный был месяц: 3 недели в реанимации, опасная для жизни операция, ТЭЛА.
Она сейчас в состоянии средней тяжести после всего пережитого — у нее пневмония, нарушены двигательные функции, кислородотерапия. Но есть положительная динамика по восстановлению.
В таком состоянии, как у нее сейчас, химию делать нельзя. А ей она нужна, потому что есть метастазы. Единственный наш шанс — это чтобы мама долечилась и прошла реабилитацию. Однако наша больница долечивать ее не очень хочет и настаивает на паллиативе, но остановиться на полпути, сдать ее в хоспис и опустить руки сердце мне не позволяет.
Я обычно стараюсь все вытянуть сама, но тут мне просто не хватает собственной мощи. Если вы знаете кого-то, кто мог бы помочь в этой ситуации - может быть, маму удастся перевести лечиться в другую больницу, в реабилитационный центр, где ей можно будет дать шанс восстановиться - или знаете, что можно ещё сделать, то напишите мне или просто поделитесь моей историей.
Скоро Новый год, и моей семье очень нужно чудо. Я уже потеряла папу в 2018 году, и я должна попытаться сделать все, чтобы не потерять еще и маму.
P. S. Если вы или ваши родители знакомы с моей мамой, то пока что ей не пишите, пожалуйста. Она не знает всю полноту диагноза, сейчас ей это не нужно — иначе страх застопорит прогресс.
Рисовали сегодня с магистрантами МГУ
Особенно мне запомнилась работа «что слушает мой дядя, когда выпивает с друзьями» 😁
На карточке нарисован топ треков по числу прослушиваний с разбивкой по жанру (цвет). Каёмка у названия обозначает десятилетие, длина горлышка — оценка, ширина бутылки — общее время прослушивания
В топ попали Chop Suey, Выхода нет и Numb
Страшно красивый проект ТАСС про магнитные бури
Недавно видел, как российский биолог и популяризатор науки Александр Панчин разоблачал феномен магнитных бурь — именно из его уст я впервые услышал, что они, вопреки распространённому стереотипу, на самом деле не влияют на самочувствие.
Ожидал увидеть и здесь подобную аналитику, но удивился, что в проекте ТАСС мнение не такое однозначное.
В целом проект в большей степени рассказывает про сам механизм возникновения магнитных бурь, и делает это со вкусом. Иллюстрации, видео, графики — секс 🩷
Полистайте обязательно!
https://spec.tass.ru/magnitnye-buri/
Вы наверняка уже видели анонс конференции «Дата-сторителлинг», которая пройдёт в эту субботу.
На ней много классных спикеров будут рассказывать о том, как использовать данные, чтобы вызывать интерес у публики. Например, год назад я рассказывал про дилемму Тафти и Холмса — один был мастером вызывающих визуальных метафор, другой пропагандировал максимальную строгость и простоту в инфографике.
В этом году я не смог выступить на конфе, но вас — зову! Регистрируйтесь, будет точно интересно 🙌
В Германии более 9 тысяч улиц с названием Lindenstraße (дословно — липовая улица). Все они — на одной визуализации
Как думаете, какая улица в России могла бы с ней потягаться?
koriander/113529613040260508">Источник
Почему все так любят песню Creep?
Выпускники предыдущего потока «Эстетики в графиках» сделали много крутейших работ, но эта — скрывать не буду — моя любимая 🥰
Ольга Хлопкова проанализировала творчество Radiohead и нашла там потрясающую историю, связанную с песней Creep. Особенно здорово получилось воплотить оформление:
В процессе работы я стала замечать, что очень негодую по поводу разрыва в количестве прослушиваний песни «Creep» и других треков. Группа выпускала такие сильные и разнообразные пластинки, а мир знает и слушает только «Creep», песню, от которой меня, лично, тошнит! И оказалось, не только меня!
Почитав интернеты, узнала, что вокруг «Creep» есть история. Песню сначала не приняли в Великобритании, но спустя год она с фурором ворвалась в американские чарты и сердца. В штатах настолько любили эту песню, что бедный коллектив заставили 4 раза подряд её сыграть, чтобы снять лучший ракурс. Люди приходили на выступления Radiohead, требовали «Creep» и уходили сразу после того, как группа ее исполняла.
Первые идеи и наброски инфографики я делала в заметках на планшете и это настолько симпатично выглядело, что было принято решение делать весь проект в стиле скетчей. Частично из-за этого, а также чтобы не перегружать аудиторию сложной инфографикой, в проекте, в основном, я использовала барчарты.
Диаграммы были созданы с использованием библиотеки roughViz, а окончательная сборка и оформление выполнены в Figma.
PS. В этой работе нет громких выводов и открытий, это фановая аналитическая история вокруг песни, которую я не люблю :)
Инфографика про скалолазание!
В качестве дипломного проекта моя студентка Мария Павлова выбрала тему спортивного скалолазания. Оказалось, по этому виду спорта можно найти много интересных инсайтов, которые хорошо ложатся в интересную, разнообразную и местами даже сложную инфографику.
Отдельный респект выражаю за первую пояснительную карточку, которую Мария сама собрала в фигме 🔥
Моя работа — серия карточек со статистикой спортивного скалолазания.
Этот вид спорта недавно стал олимпийским — с Токио-2020, что повлияло на его развитие. Например, большинство спортсменов специализируются более, чем в одном виде скалолазания. А на первых Олимпийских играх выступали только в многоборье — комбинированном зачете трёх дисциплин: то есть во всех сразу, не каждый — в своей. А ещё — с вступлением в Олимпийское движение стало больше рекордов в лазании на скорость.
Также я постаралась отразить интересные паттерны на основе данных. Например, выигрывают первые места и ставят рекорды — как вчерашние юниоры, так и возрастные спортсмены. А в мировом рейтинге «скорости» в топ-30 входят и спецы, то есть спортсмены одной дисциплины, и универсалы-многоборцы.
Захотелось проследить путь отдельных спортсменов: многие известные скалолазы не раз становились победителями и рекордсменами. Так по рекомендации Лёши появился connected scatter plot, где на временной шкале отражены повторяющиеся победы чемпионов мира. Кстати, российские спортсмены довольно успешны в скалолазании ;)
Через час встречаемся в прямом эфире на разбор графиков!
Эфир будет прямо в канале — вы увидите уведомление в верхней части экрана.
В этот раз я задумал эксперимент. Обычно, ожидая, пока люди собираются на эфир, я пробую разные тактики. Иногда мы смотрим интересные работы из мира дата-журналистики, иногда молчим и смотрим друг на друга :)
В этот раз я спою вам пару песен под гитару. Кто хочет это услышать, подключайтесь ровно в 20:00 😁
А этот пост можно использовать для комментариев к эфиру
Осталась ли любовь в песнях про любовь?
В этом пытаются разобраться The Pudding, разбирая песни из Billboard Top 10.
Не желая проспойлерить вам выводы, отмечу лишь то, что, судя по всему, представление любви в музыкальной поп-культуре трасформировалось, стало более многообразным и смелым.
Кстати, это пример классного дата-сторителлинга, когда один набор данных рассматривают с разных сторон, и показывают поэтапно с большим количеством подробностей. И виды графиков можно взять на заметку!
https://pudding.cool/2024/11/love-songs/
Как ест, закупается и спит «синяя» и «красная» Америка
Любопытный анализ опубликовали в The New York Times. Там придумали скрестить данные об организациях и результаты выборов в США. Так открывается интересный взгляд на мнение о том, что типичный «синий» и типичный «красный» избиратель живут совершенно в разных мирах.
Так, в районах, где победили демократы, на одного избирателя приходится больше коктейльных баров, Starbucks, студий йоги и буддистских храмов. В республиканских районах больше мормонских цервкей, магазинов оружия и бейсбольных полей.
Авторы справедливо указывают, что по любви к бейсболу, йоге или религии нельзя прямо говорить о политических предпочтениях человека, и что многие связи банально произрастают из характера местности, где расположены более демократические или более консервативные районы. Так, более демократическими считаются крупные города, а более консервативными — небольшие поселения. Однако публикация все равно заставляет задуматься, в каких разных условиях живут два противостоящих друг другу клана.
https://www.nytimes.com/interactive/2024/11/04/upshot/place-politics.html
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
Два объявления от редакции статистики Т—Ж
1. Отдел ищет новых авторов текстов! Нужен человек с опытом в дата-журналистике, который будет анализировать данные о России, искать там выводы и писать об этом тексты.
Оплата сдельная — платить будут по количеству написанных статей. Совмещать можно с основной работой.
https://journal.tinkoff.ru/author-stat/
2. Объявление для дизайнеров (любых)
Коллеги собирают информацию о зарплатах, чтобы обновить своё классное большое исследование
https://journal.tinkoff.ru/opros-pro-zarplaty-dizainerov/
Прошедшим обещают подарки, а результаты будут полезны всему сообществу
На Матемаркетинге DataLens сделали очень эстетичный квиз на знание правил визуализации данных
Не все ответы на карточках счёл однозначно верными, но идея и оформление — огонь 🔥
Открываю предзапись на третий поток моего курса по визуализации данных «Эстетика в графиках»
3 месяца будем учиться делать залипательные графики, которые помогут убедительно донести ваши выводы аудитории.
В результате курса вы:
🟢 Научитесь делать визуализации, которые будут сразу понятны коллегам и начальству. Вопросов «а что тут имелось ввиду» станет кратно меньше;
🟢 Поймёте, как выстраивать из графиков историю;
🟢 Получите профессиональное преимущество, ведь любой заказчик любит, когда «красивенько»;
🟢 Овладеете инструментами визуализации данных: Tableau, Flourish, Figma и другими;
А ещё вас ждет работа над вашим собственным проектом, где можно будет включить внутреннего исследователя, покопаться в данных и сделать инфографику, которая станет украшением для портфолио.
Вот несколько примеров итоговых проектов:
раз, два, три, четыре
❗️По предзаписи — самые большие скидки, тариф с обратной связью стоит 24 900 вместо35 000 руб.
Вы можете оплатить полную стоимость, а можете забронировать место и цену. Чтобы забронировать место и скидку, нужно внести предоплату — 1000₽.
Предзапись будет открыта до 11 ноября включительно. Есть рассрочка на срок до 12 месяцев, по ней ваша переплата — 0 руб.
Washington Post рассказывают об интересном когнитивном искажении, связанном с американскими выборами
Социологическая служба YouGov провела опрос, в котором спрашивала американцев об их отношении к разным предвыборным обещаниям обоих кандидатов, не раскрывая кто именно был автор этого обещания.
Оказалось, что инициативы Харрис значительно обходят по степени поддержки инициативы Трампа — такой разницы даже близко нет в опросах общественного мнения.
Изумляет и то, что избиратели вообще зачастую путают, кто из кандидатов продвигает определённые тезисы: например, одни из самых популярных инициатив Харрис в области закона и правопорядка опрашиваемые приписывали преимущественно Трампу. Всё-таки грамотный пиар очень важен!
Разобраться в теме можно тут:
https://www.washingtonpost.com/opinions/interactive/2024/trump-harris-policy-quiz/
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls