Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Большой труд Тинькофф Журнала о том, как поменялись россияне за 5-10 лет. Очень много фактов и сфер жизни, перечислю то, что показалось любопытным мне:
* За 5 лет зарплата среднего россиянина выросла с 44 до 70 тысяч рублей. А вот «зарплата мечты» почти не растет — вот уже 10 лет по опросам россияне хотят получать 150—200 тысяч рублей.
* За последние пять лет интернет смог победить телевизор. Произошло это, судя по всему, во время пандемии — именно тогда доля россиян, которые регулярно используют интернет, превысила долю россиян, которые регулярно смотрят телевизор
* ВКонтакте сдал. В 2018 году это был первый по посещаемости сайт в рунете, а в 2023 скатился на пятое место.
* В 2018 году самой популярной программой на ТВ была «Пусть говорят» с Андреем Малаховым. В 2023 Малахов ушёл на Россию-1, но его передача «Привет, Андрей» по-прежнему ТОП-1.
* За 10 лет, если верить официальной статистике, резко уменьшилось число смертей от ДТП. Ещё в 2013 году умирало около 20 тысяч человек в год, а в прошлом — 10,6.
В общем, материал интересный и очень классный, советую глянуть:
https://journal.tinkoff.ru/russian-stat-5year/
Коллеги по сфере выпустили безумно красивый проект под названием «В сетях пропаганды» — он о том, как агенство РИА «Новости» использовало в своих текстах разные штампы, чтобы влиять на общественное мнение.
Это, действительно, пример потрясающей дата-журналистской работы — и с точки зрения анализа данных, и с точки зрения визуализаций.
Кроме прочего — это редкий пример удачной визуализации данных на графе.
Из соображений безопасности я не буду давать ссылку на этот проект, но хочу выразить своё восхищение.
Хоть это и не инфографика, но не могу не отметить — идея очень милая и крутая. Респект тому, кто придумал этот ход)
https://journal.tinkoff.ru/300k-vs-100k-opinion/
«Вёрстка» пишет, что интерес к сериалу «Слово пацана» в Яндексе сейчас выше, чем даже к очень крупным политическим событиям
«Слово» и правда сейчас — везде. Но есть проблема — я подозреваю, что большая часть поискового интереса к сериалу наверняка содержит его название.
А вот новости про войну, если и ищут до сих пор, то скорее через указание подробностей — например, «Зеленский Байден», «мобилизация», «Авдеевка». Десяток таких тем в сумме легко обгонят запросы «СВО» или «Война в Украине».
В комментариях к посту издания очень верно отметили, что поисковый интерес слабо отражает настоящую заинтересованность людей в чём-либо. Скоро начнётся третий год войны — реально интересующимся уже давно не надо вбивать в поиске такие общие запросы.
В общем, на мой взгляд, картинка эта ни о чём не говорит.
Любопытный пример использования генеративных нейросетей в визуализации данных
Студия CLEVER°FRANKE решила проиллюстрировать данные о лесах на планете с помощью целой цепочки нейросетей — сначала там использовали ChatGPT-4, потом Midjourney, потом Stable Diffusion, потом снова ChatGPT, а ещё тренировали какую-то собственную модель.
В общем, от описания процесса лично у меня уже голова пошла кругом.
А как вам результат?
Подробности:
https://www.instagram.com/p/C0jfnmSImjj/
Астрологи объявили неделю выступлений на конференциях
Завтра выступаю в онлайн-студии на главной технологической конференции Яндекса. Буду просвещать там широкую аудиторию о том, какие исследования можно создавать на основе данных, и чем конкретно занимается команда Исследований Яндекса.
Как посмотреть: на сайте ищете большую кнопку «Смотреть трансляцию», оказываетесь в разделе Live. Это оно!
Мой блок планируется в 16:30. Буду рад увидеться ☺️
В продолжение нашего знакомства
Яндекс наконец-то выпустил эпизод подскаста «Войти в айти», где техноблогер Сергей Романцев и студент Вышки Арсений Бородулин спрашивают меня, чем занимаются дата-журналисты, и как я в своё время искал работу.
Рассказываю там, как вообще так получилось, что я стал заниматься дата-журналистикой и делюсь неочевидными лайфхаками, как можно выстраивать свой карьерный путь.
Вообще это проект Яндекс Образования, который ориентирован в первую очередь на школьников и студентов — поэтому обсуждаем мы разное: например, пытаемся разобрать мифы об айти или придумать свой стартап. Но надеюсь, что вам будет интересно 🙌
Лично я бы выбрал видео-версию и смотрел бы на скорости 1,25. Но сам подкаст доступен и на всех традиционных площадках.
Видео:
https://www.youtube.com/watch?v=QYeAqbDb7iQ
Аудио:
https://voyti-v-it.mave.digital/ep-9
Хороший пример, как избавиться от «лапши» на графиках.
«Лапша» — это запутанная кучка линейных графиков (слева), в которой невозможно разобраться.
Способов борьбы с этим явлением несколько, всё зависит от вашей цели. Оставлять так — точно нельзя. Единственное исключение — это интерактив, но и тогда стоит по умолчанию предусмотреть состояние, в котором график о чём-то говорит.
Если действительно важно показать динамику каждого из объектов, лучше всего делать это на отдельном графике. Как сделали РБК (справа).
Какие проблемы мешают вам красиво визуализировать данные?
В последнее время мы много общались с подписчиками (спасибо всем, кто согласился!). И пытались узнать — что именно мешает вам делать красивые графики.
Основные сложности были такие:
❌ Проблемы с данными — трудно найти, трудно привести в нужную форму. И качество исходных данных — шлак.
❌ Нет понимания, какой вид визуализации подходит для вашей задачи
❌ Нет понимания, как работать с элементами диаграммы и как упорядочить их, чтобы было «красиво»
❌ Не знаете, какой инструмент использовать, чтобы сделать график. Или знаете — но плохо им владеете.
❌ Не знаете, какие приёмы использовать, чтобы ваш график выделялся и привлекал внимание
Напишите в комментариях, есть ли еще какие-то проблемы, которые мешает вам делать ваши графики понятными и красивыми?
Давно мечтал сделать датавиз в виде нот, но тут меня опередили.
Бразильское издание пишет об итогах премии «Грэмми» и говорит, что Бразилия становилась победителем конкурса всего три раза. Ну а на графике — количество номинаций на конкурсе. Красный квадратик означает отсутствие номинаций.
Как вам?
Нравится? (🔥) или слишком странно? (🤯)
https://www1.folha.uol.com.br/ilustrada/2023/11/no-grammy-latino-brasil-so-tem-5-dos-indicados-aos-quatro-premios-principais.shtml
🔥 Live-интенсив: разбираем тестовое задание в OZON на junior-аналитика!
Реклама. ООО "Айти Резюме". ИНН 4025460134. Erid:LjN8KLY1H. Текст клиента
📣 Всем привет! Хотим пригласить вас на интенсив, где мы в прямом эфире будем разбирать настоящее тестовое задание в OZON на аналитика данных!
Нам предстоит провести аналитику продаж и доставок с помощью Pandas в Python, а также проиллюстрировать это все графиками.
📅 Дата: 22 ноября
🕘 Время: 19:00 по Мск
Что будем делать на интенсиве:
◾️ Проанализируем заказы пользователей по retention, времени доставки, сумме заказа т.д.
◾️ Научимся легко генерировать большой DataFrame с синтетическими данными
◾️ Посчитаем описательные статистики
◾️ Изучим полезные фичи Pandas: apply, map, pct_change и др.
◾️ Построим интерактивные графики с помощью Plotly
◾️ Научимся строить и читать необычные графики - например, violinplot
Интенсив подойдет всем — от новичков до тех, кто уже знаком с Python.
В прямом эфире мы также расскажем о частых ошибках новичков и поделимся лайфхаками — как достойно пройти собеседование и удивить ревьюера крутыми фишками 🤩
А вы готовы бустануть свои знания и скиллы в аналитике?
👉🏻 Зарегистрироваться на интенсив
Тут в комментариях к кейсу с корью спрашивали, что делать, если значения настолько маленькие, что их вообще не видно.
Вот один из вариантов, который мы когда-то делали в Т—Ж: можно отдельно зазумить область, которую нужно рассмотреть более детально. Но и оригинальный масштаб тоже сохранить — чтобы отчётливо была видна драматичная разница
Вот такой график опубликовало издание «Медвестник», чтобы рассказать, какая страшная в России ситуация с корью.
Вообще в нём прекрасно всё. Прямо кандидат на конкурс отвратительных графиков — только сравните числа в 2015 и 2016 году. Но дополнительно отмечу, что обрезать столбики здесь — это прямо как стрелять себе в ногу.
Произошло нечто экстраординарное, но дизайнер по какой-то причине постеснялся об этом рассказывать и решил масштабы проблемы «преуменьшить»
Если вам было интересно, как работают большие генеративные модели вроде ChatGPT, ловите красивый (и очень короткий!) эксплейнер от The Guardian.
Меня в нём удивило, что концепцию координат вектора объясняют через координаты городов. Дорогие читатели-гуманитарии, напишите, вам реально так понятнее?
Или можно было сразу говорить про координаты точек на плоскости?
https://www.theguardian.com/technology/ng-interactive/2023/nov/01/how-ai-chatbots-like-chatgpt-or-bard-work-visual-explainer
Если вы ещё не подписались на мой инстаграм, то сегодня зову вас туда почитать историю про Ханса Рослинга — шведского врача, ставшего всемирно известным лектором благодаря навыкам дата-сторителлинга.
И бонусом рассказываю в сториз, как легко сделать такой же эффектный график:
https://www.instagram.com/p/CzYuZwfih6E/
Я к вам с болью.
В этом канале я выкладываю в основном очень красивые, грамотные и вдохновляющие датавиз-работы.
Но стоит только выйти из «пузыря» и перестать смотреть только на труды моих талантливых коллег, всюду обнаруживаются плохие и очень плохие графики.
Обычно варианта бывает три:
1. Инфографику делал аналитик или менеджер, который хорошо понимает цифры. В таких случаях обычно грубых ошибок нет, но график может получиться запутанным или визуально несимпатичным. Пример — визуализация бюджета Челябинска.
2. Инфографику делал дизайнер, который ничего не понимает в цифрах и визуализации данных. От таких примеров у меня взрывается мозг 🙈
С виду такие графики могут выглядеть очень красиво, но при этом не отражать цифры, которые на них показаны.
Недавно я видел статью очень крупной известной российской компании, где был нарисован пайчарт, на котором ни одна доля не соответствовала числу, на ней изображённому. Например, по числам выходило 35%, а «закрашена» почти половина кружочка.
3. Третий вариант — это когда и неправильно, и некрасиво. Прямо как в отчёте Центрального Банка России, на котором 2271 примерно на четверть больше, чем 380. К остальным числам, на самом деле, тоже есть вопросы.
Мне очень грустно, когда люди воспринимают графики как какое-то «украшение», где можно проигнорировать значения чисел. Ведь это мощный инструмент, который помогает доносить идеи, скрытые в большом массиве данных.
Напомню, что в новом году я запускаю свой курс, на котором буду учить делать и понятно, и красиво. Завтра — последний день, когда вы можете записаться в анкету предзаписи и получить гарантию самой низкой цены:
https://forms.gle/Tp2vnXPSd9oHuA1z8 (запись ни к чему вас не обязывает)
Если вы хотите научиться визуализировать данные, то наверняка подписаны на мой второй канал Сделай это красиво. Там я даю датавиз-советы, делаю разборы ваших графиков и пишу о том, как умение визуализировать данные помогает в работе и жизни.
Вчера я рассказал подписчикам канала, что открываю набор на свой курс по визуализации данных. Он будет идти два месяца, и на нём мы разберёмся, как делать графики понятнее, как использовать десятки видов диаграмм, и как с помощью графиков рассказывать истории.
До 24 декабря можно оставить свои контакты в анкете предзаписи — мы вышлем вам презентацию со всеми подробностями, а вы получите гарантию самой низкой цены:
https://forms.gle/Tp2vnXPSd9oHuA1z8
Федерика Фрагапане умело сочетает в себе несколько качеств. С одной стороны — она одна из самых известных и востребованных в мире дизайнеров инфографики. Надо сказать, не зря — её работы часто завораживают своей красотой.
С другой — от проекта к проекту она регулярно выдаёт сомнительные решения в области датавиза.
И вот — её новая коллаборация с Google Trends: о том, какие вещи ищут со словами «почему так дорого». Посмотрите, например, на этот причудливый график со странами.
Думаете, высота волны показывает интенсивность какого-то показателя? Скажем, частоту поисковых запросов?
А нет. Высотой закодирована категория. Технологии, книги, транспорт, одежда, еда.
Это абсолютно контр-интуитивно, и на мой взгляд неуместно даже для дата-арта.
Впрочем, эта итальянская художница последовательно ломает логику датавиза, и даже учит этому на своих курсах. Её студентов мы спасти уже не сможем, но вот вас предостеречь хочется.
P.S. Во втором канале анонсировал разбор графиков — жду ваших заявок сегодня до 23:59.
Нежно расскажу, что не так с любыми картинками, которые вы пришлёте. Или, наоборот, похвалю!
Хочу узнать о ваших проблемах
Недавно я сделал ещё один канал, в котором публикую только образовательный контент — о том, как правильно и классно визуализировать данные.
Кстати, в этом канале уже на неделе пройдут разборы графиков. Если вы хотите прислать свой — не забудьте подписаться)
Так вот — на днях мы запустили там опрос, чтобы узнать, с какими проблемами при визуализации вы сталкиваетесь. Возможно, вы этот опрос не видели, а нам очень важно набрать много респондентов, чтобы результаты были репрезентативными.
Опрос должен занять 5-7 минут, почти всё там надо прокликать — развёрнутых пунктов почти нет. В подарок за ваши старания мы отправим вам полезный гайд о визуализации данных. Какой? Это мы собираемся понять как раз из опроса 😄
Чтобы пройти опрос, кликните по ссылке ниже:
🔗 https://forms.gle/P4MMPvL1L23WvYjS7
Улыбаюсь и рассказываю про своё самое любимое дата-журналистское исследование в эфире YaTalks
Запись можно посмотреть тут:
https://yatalks.yandex.ru/ru/live
Вкладка «про жизнь» / Live, на 7:02:00
Т—Ж снова «играет» с темой инфляции, на этот раз рассказывая, как изменилась ваша зарплата в айфонах.
Ещё когда я там работал, мы с коллегами придумали большой калькулятор, который измерял вашу зарплату в большом количестве товаров — от шариковых ручек до квартир. Тот калькулятор обещали обновить, ждём его 😌
А сейчас, специально для техно-редакции, коллеги сделали «лайт-версию», только с айфонами:
https://journal.tinkoff.ru/iphone-index/
В визуализации, кстати, вижу проблему.
Айфоны сделали разных размеров — опираясь, видимо, на реальные размеры устройств.
Но сравнивать числа такая визуализация не помогает совсем.
Если уж и сохранять размеры, то надо было «не достающую» часть телефона сделать прозрачной. В таком случае хотя бы будет видно долю.
Мой новый канал о том, как научиться делать залипательные графики
Опросы в канале говорят, что среди моей аудитории есть люди, которые пока не умеют делать понятные графики, которые цепляют взгляд.
И мне есть, что вам рассказать!
Но это не очень вписывается в концепцию основного канала. Поэтому я решил сделать ещё один — именно для вас.
📊 В этом канале всё будет по-старому: вдохновляющие проекты, новости дата-журналистики и мои размышления о сфере в целом 😌
📊 В новом будет больше образовательного контента. Буду писать там, как сделать ваши графики лучше; какими программами пользоваться; и как, наконец, сделать так, чтобы ваш график рассказывал историю.
Ещё в середине декабря мы проведём там разборы ваших графиков. Оказалось, на это есть большой запрос, так что следите за постами.
Если вам это интересно, и вы хотите, чтобы ваши графики выделялись, а на работе сказали «круто, а сделай нам тоже так» — жмите на ссылку ниже и подписывайтесь.
➡ /channel/+PO7tLH9FhQY0NWRi
На канале вас уже ждет небольшой подарок — три приёма, как сделать ваши графики понятнее 🎁
Я к вам с классным анонсом сегодня.
Мой замечательный коллега Андрей Дорожный в следующую субботу (9 декабря) делает конференцию по дата-сторителлингу. Состав — огонь, буду выступать сам и с большим интересом послушаю остальные доклады.
Я готовлю спич на свою любимую тему — про визуальные метафоры в датавизе. Расскажу, как дата-художники в разные годы делали графики в виде крови, цветочков и других интересных образов, и почему это не всегда так плохо, как говорил Тафти.
Это онлайн и бесплатно. Регистрируйтесь тут:
https://dorozhnij.com/conference
За последние пару месяцев мы вместе с командой провели три десятка интервью, и я обнаружил одну грустную вещь.
Многие из тех, кто любезно согласились поговорить с нами, понятия не имеют, кто ведёт этот канал 🥲
Предлагаю начать наши отношения с чистого листа и всё-таки познакомиться.
Меня зовут Лёша, и я — дата-журналист. Моя главная задача — проанализировать данные и придумать, как заинтересовать ими максимально широкую аудиторию. Я создавал развлекательные, познавательные и общественно-значимые истории для самых разных медиа в России —
РБК, Новая Газета, Т—Ж, The Village, Студия инфографики РИА (и это не полный список),
а сейчас работаю в команде Исследований Яндекса.
Ещё я преподаю дата-журналистику и визуализацию данных — сотрудничал с ВШЭ, Нетологией, веду тренинги по запросу самых разных организаций
Вот работы, которыми я горжусь больше всего:
* В погоне за Оскаром — о том, как фильмы получают награды не за «гениальность», а за то, что пытаются понравиться жюри
* Судьи держат нас за болванку (VPN) — как российские судьи копируют целые фрагменты судебных решений, заменяя в них только даты и имена, и почему это заставляет усомниться в честности правосудия
* Сколько вы зарабатываете по сравнению с коллегами противоположного пола — большая интерактивная история про gender-pay-gap, где можно вбить свою зарплату и сравнить себя с другими сотрудниками в своей сфере.
А чтобы этот пост был полезным для вас, предлагаю в комментариях спросить, что вам интересно о работе дата-журналиста 👇
Хочу узнать, какая аудитория, собралась здесь в канале, чтобы учитывать это при подготовке контента. Проголосуйте пожалуйста 🙏
Читать полностью…Я вообще довольно часто выступаю, но лекции эти чаще всего остаются в сердцах людей, а в интернет попадают не так часто.
Но сегодня я обнаружил, что Летняя Школа выложила запись моей лекции полуторогодовалой давности. Смотрю на себя и думаю, что целая жизнь с тех пор прошла.
Но лекция интересная — здесь я, например, рассказываю, как мы когда-то проверяли на честность московский сервис «электронной демократии» «Активный гражданин», объясняю из каких этапов состоит работа дата-журналиста и показываю свои любимые работы — от New York Times до Медиазоны.
Добавляйте в закладки:
https://www.youtube.com/watch?v=w8Q2grAslH4
А мою любимую картинку про корь когда-то сделала Мона Чалаби.
Это визуальная журналистка и дата-художник, которая делает инфографику от руки, она известна своими визуальными метафорами и провокационным стилем.
Для медицинского издания такая картинка вряд ли подойдёт, но зато шерить в соцсетях такое классно
Привет!
Я вместе с командой продолжаю исследовать ваш образовательный опыт и ищу больше респондентов для интервью.
Мы очень хотим поговорить с вами, если:
1. Вам интересна сфера визуализации данных
2. Вы когда-либо покупали любое обучение (не обязательно связанное с данными)
Если это вы — напишите, пожалуйста. Ваш опыт очень нам поможет ☺️
Контакт: @BlackPineapple
UPD: Пока респондентов набрали! Спасибо большое за ваш тёплый отклик. Личку разгребаю 🌿
Инструмент для визуализации данных RawGraphs анонсировал на внешнюю аудиторию новую функцию — возможность создавать и использовать «кастомные виды графиков».
Это значит, что теперь любой член комьюнити может написать шаблон для отображения нового вида визуализации, а любой другой пользователь — просто построить по этому шаблону свой график.
Ну и пару слов о RawGraphs — если вы о нём не слышали. Это сервис, который позволяет делать «основу» для вашей инфографики, которую, как правило, потом надо дорабатывать в графическом редакторе. Там нет настройки подписей, заголовков и прочих мелочей, зато есть много видов графиков, которые сложно где-то ещё построить без кода. А теперь, видимо, будет ещё больше ☺️
Одна из причин, почему я обожаю дата-материалы — они позволяют узнать много интересного о мире.
Сегодня я узнал, что районы Нью Йорка — это весьма условные территориальные единицы, рождающиеся буквально «в народе». Однажды кто-то решил, что стоит называть это место определённым образом, и если это название закрепилось — его начинают использовать другие. Такая вольность приводит к тому, что у разных людей может быть разное мнение о том, где кончается тот или иной район 🤯
Чтобы построить максимально подробную карту города, NYT опросили 37 тысяч респондентов. Оказалось, что по большей части города у жителей Нью-Йорка консесусов нет.
А карту советую глянуть — это как минимум красиво. Любопытно, что материал состоит из двух частей — отдельно статья, отдельно — интерактивная карта.
Смотреть:
Поясняющий материал, интерактивная карта
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls