data_csv | Неотсортированное

Telegram-канал data_csv - data.csv

12999

Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса

Подписаться на канал

data.csv

Большой труд Тинькофф Журнала о том, как поменялись россияне за 5-10 лет. Очень много фактов и сфер жизни, перечислю то, что показалось любопытным мне:

* За 5 лет зарплата среднего россиянина выросла с 44 до 70 тысяч рублей. А вот «зарплата мечты» почти не растет — вот уже 10 лет по опросам россияне хотят получать 150—200 тысяч рублей.
* За последние пять лет интернет смог победить телевизор. Произошло это, судя по всему, во время пандемии — именно тогда доля россиян, которые регулярно используют интернет, превысила долю россиян, которые регулярно смотрят телевизор
* ВКонтакте сдал. В 2018 году это был первый по посещаемости сайт в рунете, а в 2023 скатился на пятое место.
* В 2018 году самой популярной программой на ТВ была «Пусть говорят» с Андреем Малаховым. В 2023 Малахов ушёл на Россию-1, но его передача «Привет, Андрей» по-прежнему ТОП-1.
* За 10 лет, если верить официальной статистике, резко уменьшилось число смертей от ДТП. Ещё в 2013 году умирало около 20 тысяч человек в год, а в прошлом — 10,6.

В общем, материал интересный и очень классный, советую глянуть:
https://journal.tinkoff.ru/russian-stat-5year/

Читать полностью…

data.csv

Коллеги по сфере выпустили безумно красивый проект под названием «В сетях пропаганды» — он о том, как агенство РИА «Новости» использовало в своих текстах разные штампы, чтобы влиять на общественное мнение.

Это, действительно, пример потрясающей дата-журналистской работы — и с точки зрения анализа данных, и с точки зрения визуализаций.
Кроме прочего — это редкий пример удачной визуализации данных на графе.

Из соображений безопасности я не буду давать ссылку на этот проект, но хочу выразить своё восхищение.

Читать полностью…

data.csv

Хоть это и не инфографика, но не могу не отметить — идея очень милая и крутая. Респект тому, кто придумал этот ход)

https://journal.tinkoff.ru/300k-vs-100k-opinion/

Читать полностью…

data.csv

«Вёрстка» пишет, что интерес к сериалу «Слово пацана» в Яндексе сейчас выше, чем даже к очень крупным политическим событиям

«Слово» и правда сейчас — везде. Но есть проблема — я подозреваю, что большая часть поискового интереса к сериалу наверняка содержит его название.

А вот новости про войну, если и ищут до сих пор, то скорее через указание подробностей — например, «Зеленский Байден», «мобилизация», «Авдеевка». Десяток таких тем в сумме легко обгонят запросы «СВО» или «Война в Украине».

В комментариях к посту издания очень верно отметили, что поисковый интерес слабо отражает настоящую заинтересованность людей в чём-либо. Скоро начнётся третий год войны — реально интересующимся уже давно не надо вбивать в поиске такие общие запросы.

В общем, на мой взгляд, картинка эта ни о чём не говорит.

Читать полностью…

data.csv

Любопытный пример использования генеративных нейросетей в визуализации данных

Студия CLEVER°FRANKE решила проиллюстрировать данные о лесах на планете с помощью целой цепочки нейросетей — сначала там использовали ChatGPT-4, потом Midjourney, потом Stable Diffusion, потом снова ChatGPT, а ещё тренировали какую-то собственную модель.

В общем, от описания процесса лично у меня уже голова пошла кругом.
А как вам результат?

Подробности:
https://www.instagram.com/p/C0jfnmSImjj/

Читать полностью…

data.csv

Астрологи объявили неделю выступлений на конференциях

Завтра выступаю в онлайн-студии на главной технологической конференции Яндекса. Буду просвещать там широкую аудиторию о том, какие исследования можно создавать на основе данных, и чем конкретно занимается команда Исследований Яндекса.

Как посмотреть: на сайте ищете большую кнопку «Смотреть трансляцию», оказываетесь в разделе Live. Это оно!

Мой блок планируется в 16:30. Буду рад увидеться ☺️

Читать полностью…

data.csv

В продолжение нашего знакомства

Яндекс наконец-то выпустил эпизод подскаста «Войти в айти», где техноблогер Сергей Романцев и студент Вышки Арсений Бородулин спрашивают меня, чем занимаются дата-журналисты, и как я в своё время искал работу.

Рассказываю там, как вообще так получилось, что я стал заниматься дата-журналистикой и делюсь неочевидными лайфхаками, как можно выстраивать свой карьерный путь.

Вообще это проект Яндекс Образования, который ориентирован в первую очередь на школьников и студентов — поэтому обсуждаем мы разное: например, пытаемся разобрать мифы об айти или придумать свой стартап. Но надеюсь, что вам будет интересно 🙌

Лично я бы выбрал видео-версию и смотрел бы на скорости 1,25. Но сам подкаст доступен и на всех традиционных площадках.

Видео:
https://www.youtube.com/watch?v=QYeAqbDb7iQ

Аудио:
https://voyti-v-it.mave.digital/ep-9

Читать полностью…

data.csv

Хороший пример, как избавиться от «лапши» на графиках.

«Лапша» — это запутанная кучка линейных графиков (слева), в которой невозможно разобраться.

Способов борьбы с этим явлением несколько, всё зависит от вашей цели. Оставлять так — точно нельзя. Единственное исключение — это интерактив, но и тогда стоит по умолчанию предусмотреть состояние, в котором график о чём-то говорит.

Если действительно важно показать динамику каждого из объектов, лучше всего делать это на отдельном графике. Как сделали РБК (справа).

Читать полностью…

data.csv

Какие проблемы мешают вам красиво визуализировать данные?

В последнее время мы много общались с подписчиками (спасибо всем, кто согласился!). И пытались узнать — что именно мешает вам делать красивые графики.

Основные сложности были такие:
Проблемы с данными — трудно найти, трудно привести в нужную форму. И качество исходных данных — шлак.
Нет понимания, какой вид визуализации подходит для вашей задачи
Нет понимания, как работать с элементами диаграммы и как упорядочить их, чтобы было «красиво»
Не знаете, какой инструмент использовать, чтобы сделать график. Или знаете — но плохо им владеете.
Не знаете, какие приёмы использовать, чтобы ваш график выделялся и привлекал внимание

Напишите в комментариях, есть ли еще какие-то проблемы, которые мешает вам делать ваши графики понятными и красивыми?

Читать полностью…

data.csv

Давно мечтал сделать датавиз в виде нот, но тут меня опередили.

Бразильское издание пишет об итогах премии «Грэмми» и говорит, что Бразилия становилась победителем конкурса всего три раза. Ну а на графике — количество номинаций на конкурсе. Красный квадратик означает отсутствие номинаций.

Как вам?
Нравится? (🔥) или слишком странно? (🤯)

https://www1.folha.uol.com.br/ilustrada/2023/11/no-grammy-latino-brasil-so-tem-5-dos-indicados-aos-quatro-premios-principais.shtml

Читать полностью…

data.csv

🔥 Live-интенсив: разбираем тестовое задание в OZON на junior-аналитика!

Реклама
. ООО "Айти Резюме". ИНН 4025460134. Erid:LjN8KLY1H. Текст клиента

📣 Всем привет! Хотим пригласить вас на интенсив, где мы в прямом эфире будем разбирать настоящее тестовое задание в OZON на аналитика данных!

Нам предстоит провести аналитику продаж и доставок с помощью Pandas в Python, а также проиллюстрировать это все графиками.

📅 Дата: 22 ноября
🕘 Время: 19:00 по Мск

Что будем делать на интенсиве:

◾️ Проанализируем заказы пользователей по retention, времени доставки, сумме заказа т.д.
◾️ Научимся легко генерировать большой DataFrame с синтетическими данными
◾️ Посчитаем описательные статистики
◾️ Изучим полезные фичи Pandas: apply, map, pct_change и др.
◾️ Построим интерактивные графики с помощью Plotly
◾️ Научимся строить и читать необычные графики - например, violinplot

Интенсив подойдет всем — от новичков до тех, кто уже знаком с Python.

В прямом эфире мы также расскажем о частых ошибках новичков и поделимся лайфхаками — как достойно пройти собеседование и удивить ревьюера крутыми фишками 🤩

А вы готовы бустануть свои знания и скиллы в аналитике?

👉🏻 Зарегистрироваться на интенсив

Читать полностью…

data.csv

Тут в комментариях к кейсу с корью спрашивали, что делать, если значения настолько маленькие, что их вообще не видно.

Вот один из вариантов, который мы когда-то делали в Т—Ж: можно отдельно зазумить область, которую нужно рассмотреть более детально. Но и оригинальный масштаб тоже сохранить — чтобы отчётливо была видна драматичная разница

Читать полностью…

data.csv

Вот такой график опубликовало издание «Медвестник», чтобы рассказать, какая страшная в России ситуация с корью.

Вообще в нём прекрасно всё. Прямо кандидат на конкурс отвратительных графиков — только сравните числа в 2015 и 2016 году. Но дополнительно отмечу, что обрезать столбики здесь — это прямо как стрелять себе в ногу.

Произошло нечто экстраординарное, но дизайнер по какой-то причине постеснялся об этом рассказывать и решил масштабы проблемы «преуменьшить»

Читать полностью…

data.csv

Если вам было интересно, как работают большие генеративные модели вроде ChatGPT, ловите красивый (и очень короткий!) эксплейнер от The Guardian.

Меня в нём удивило, что концепцию координат вектора объясняют через координаты городов. Дорогие читатели-гуманитарии, напишите, вам реально так понятнее?
Или можно было сразу говорить про координаты точек на плоскости?

https://www.theguardian.com/technology/ng-interactive/2023/nov/01/how-ai-chatbots-like-chatgpt-or-bard-work-visual-explainer

Читать полностью…

data.csv

Если вы ещё не подписались на мой инстаграм, то сегодня зову вас туда почитать историю про Ханса Рослинга — шведского врача, ставшего всемирно известным лектором благодаря навыкам дата-сторителлинга.

И бонусом рассказываю в сториз, как легко сделать такой же эффектный график:
https://www.instagram.com/p/CzYuZwfih6E/

Читать полностью…

data.csv

Я к вам с болью.

В этом канале я выкладываю в основном очень красивые, грамотные и вдохновляющие датавиз-работы.

Но стоит только выйти из «пузыря» и перестать смотреть только на труды моих талантливых коллег, всюду обнаруживаются плохие и очень плохие графики.

Обычно варианта бывает три:
1. Инфографику делал аналитик или менеджер, который хорошо понимает цифры. В таких случаях обычно грубых ошибок нет, но график может получиться запутанным или визуально несимпатичным. Пример — визуализация бюджета Челябинска.
2. Инфографику делал дизайнер, который ничего не понимает в цифрах и визуализации данных. От таких примеров у меня взрывается мозг 🙈

С виду такие графики могут выглядеть очень красиво, но при этом не отражать цифры, которые на них показаны.
Недавно я видел статью очень крупной известной российской компании, где был нарисован пайчарт, на котором ни одна доля не соответствовала числу, на ней изображённому. Например, по числам выходило 35%, а «закрашена» почти половина кружочка.

3. Третий вариант — это когда и неправильно, и некрасиво. Прямо как в отчёте Центрального Банка России, на котором 2271 примерно на четверть больше, чем 380. К остальным числам, на самом деле, тоже есть вопросы.

Мне очень грустно, когда люди воспринимают графики как какое-то «украшение», где можно проигнорировать значения чисел. Ведь это мощный инструмент, который помогает доносить идеи, скрытые в большом массиве данных.

Напомню, что в новом году я запускаю свой курс, на котором буду учить делать и понятно, и красиво. Завтра — последний день, когда вы можете записаться в анкету предзаписи и получить гарантию самой низкой цены:
https://forms.gle/Tp2vnXPSd9oHuA1z8 (запись ни к чему вас не обязывает)

Читать полностью…

data.csv

Если вы хотите научиться визуализировать данные, то наверняка подписаны на мой второй канал Сделай это красиво. Там я даю датавиз-советы, делаю разборы ваших графиков и пишу о том, как умение визуализировать данные помогает в работе и жизни.

Вчера я рассказал подписчикам канала, что открываю набор на свой курс по визуализации данных. Он будет идти два месяца, и на нём мы разберёмся, как делать графики понятнее, как использовать десятки видов диаграмм, и как с помощью графиков рассказывать истории.

До 24 декабря можно оставить свои контакты в анкете предзаписи — мы вышлем вам презентацию со всеми подробностями, а вы получите гарантию самой низкой цены:

https://forms.gle/Tp2vnXPSd9oHuA1z8

Читать полностью…

data.csv

Федерика Фрагапане умело сочетает в себе несколько качеств. С одной стороны — она одна из самых известных и востребованных в мире дизайнеров инфографики. Надо сказать, не зря — её работы часто завораживают своей красотой.

С другой — от проекта к проекту она регулярно выдаёт сомнительные решения в области датавиза.

И вот — её новая коллаборация с Google Trends: о том, какие вещи ищут со словами «почему так дорого». Посмотрите, например, на этот причудливый график со странами.

Думаете, высота волны показывает интенсивность какого-то показателя? Скажем, частоту поисковых запросов?
А нет. Высотой закодирована категория. Технологии, книги, транспорт, одежда, еда.

Это абсолютно контр-интуитивно, и на мой взгляд неуместно даже для дата-арта.

Впрочем, эта итальянская художница последовательно ломает логику датавиза, и даже учит этому на своих курсах. Её студентов мы спасти уже не сможем, но вот вас предостеречь хочется.

P.S. Во втором канале анонсировал разбор графиков — жду ваших заявок сегодня до 23:59.
Нежно расскажу, что не так с любыми картинками, которые вы пришлёте
. Или, наоборот, похвалю!

Читать полностью…

data.csv

Хочу узнать о ваших проблемах

Недавно я сделал ещё один канал, в котором публикую только образовательный контент — о том, как правильно и классно визуализировать данные.
Кстати, в этом канале уже на неделе пройдут разборы графиков. Если вы хотите прислать свой — не забудьте подписаться)

Так вот — на днях мы запустили там опрос, чтобы узнать, с какими проблемами при визуализации вы сталкиваетесь. Возможно, вы этот опрос не видели, а нам очень важно набрать много респондентов, чтобы результаты были репрезентативными.

Опрос должен занять 5-7 минут, почти всё там надо прокликать — развёрнутых пунктов почти нет. В подарок за ваши старания мы отправим вам полезный гайд о визуализации данных. Какой? Это мы собираемся понять как раз из опроса 😄

Чтобы пройти опрос, кликните по ссылке ниже:
🔗 https://forms.gle/P4MMPvL1L23WvYjS7

Читать полностью…

data.csv

Улыбаюсь и рассказываю про своё самое любимое дата-журналистское исследование в эфире YaTalks

Запись можно посмотреть тут:

https://yatalks.yandex.ru/ru/live

Вкладка «про жизнь» / Live, на 7:02:00

Читать полностью…

data.csv

Т—Ж снова «играет» с темой инфляции, на этот раз рассказывая, как изменилась ваша зарплата в айфонах.

Ещё когда я там работал, мы с коллегами придумали большой калькулятор, который измерял вашу зарплату в большом количестве товаров — от шариковых ручек до квартир. Тот калькулятор обещали обновить, ждём его 😌

А сейчас, специально для техно-редакции, коллеги сделали «лайт-версию», только с айфонами:
https://journal.tinkoff.ru/iphone-index/

В визуализации, кстати, вижу проблему.
Айфоны сделали разных размеров — опираясь, видимо, на реальные размеры устройств.
Но сравнивать числа такая визуализация не помогает совсем.

Если уж и сохранять размеры, то надо было «не достающую» часть телефона сделать прозрачной. В таком случае хотя бы будет видно долю.

Читать полностью…

data.csv

Мой новый канал о том, как научиться делать залипательные графики

Опросы в канале говорят, что среди моей аудитории есть люди, которые пока не умеют делать понятные графики, которые цепляют взгляд.

И мне есть, что вам рассказать!
Но это не очень вписывается в концепцию основного канала. Поэтому я решил сделать ещё один — именно для вас.

📊 В этом канале всё будет по-старому: вдохновляющие проекты, новости дата-журналистики и мои размышления о сфере в целом 😌

📊 В новом будет больше образовательного контента. Буду писать там, как сделать ваши графики лучше; какими программами пользоваться; и как, наконец, сделать так, чтобы ваш график рассказывал историю.

Ещё в середине декабря мы проведём там разборы ваших графиков. Оказалось, на это есть большой запрос, так что следите за постами.

Если вам это интересно, и вы хотите, чтобы ваши графики выделялись, а на работе сказали «круто, а сделай нам тоже так» — жмите на ссылку ниже и подписывайтесь.

/channel/+PO7tLH9FhQY0NWRi

На канале вас уже ждет небольшой подарок — три приёма, как сделать ваши графики понятнее 🎁

Читать полностью…

data.csv

Я к вам с классным анонсом сегодня.

Мой замечательный коллега Андрей Дорожный в следующую субботу (9 декабря) делает конференцию по дата-сторителлингу. Состав — огонь, буду выступать сам и с большим интересом послушаю остальные доклады.

Я готовлю спич на свою любимую тему — про визуальные метафоры в датавизе. Расскажу, как дата-художники в разные годы делали графики в виде крови, цветочков и других интересных образов, и почему это не всегда так плохо, как говорил Тафти.

Это онлайн и бесплатно. Регистрируйтесь тут:
https://dorozhnij.com/conference

Читать полностью…

data.csv

За последние пару месяцев мы вместе с командой провели три десятка интервью, и я обнаружил одну грустную вещь.

Многие из тех, кто любезно согласились поговорить с нами, понятия не имеют, кто ведёт этот канал 🥲

Предлагаю начать наши отношения с чистого листа и всё-таки познакомиться.

Меня зовут Лёша, и я — дата-журналист. Моя главная задача — проанализировать данные и придумать, как заинтересовать ими максимально широкую аудиторию. Я создавал развлекательные, познавательные и общественно-значимые истории для самых разных медиа в России —

РБК, Новая Газета, Т—Ж, The Village, Студия инфографики РИА (и это не полный список),
а сейчас работаю в команде Исследований Яндекса.


Ещё я преподаю дата-журналистику и визуализацию данных — сотрудничал с ВШЭ, Нетологией, веду тренинги по запросу самых разных организаций

Вот работы, которыми я горжусь больше всего:
* В погоне за Оскаром — о том, как фильмы получают награды не за «гениальность», а за то, что пытаются понравиться жюри
* Судьи держат нас за болванку (VPN) — как российские судьи копируют целые фрагменты судебных решений, заменяя в них только даты и имена, и почему это заставляет усомниться в честности правосудия
* Сколько вы зарабатываете по сравнению с коллегами противоположного пола — большая интерактивная история про gender-pay-gap, где можно вбить свою зарплату и сравнить себя с другими сотрудниками в своей сфере.

А чтобы этот пост был полезным для вас, предлагаю в комментариях спросить, что вам интересно о работе дата-журналиста 👇

Читать полностью…

data.csv

Хочу узнать, какая аудитория, собралась здесь в канале, чтобы учитывать это при подготовке контента. Проголосуйте пожалуйста 🙏

Читать полностью…

data.csv

Я вообще довольно часто выступаю, но лекции эти чаще всего остаются в сердцах людей, а в интернет попадают не так часто.

Но сегодня я обнаружил, что Летняя Школа выложила запись моей лекции полуторогодовалой давности. Смотрю на себя и думаю, что целая жизнь с тех пор прошла.

Но лекция интересная — здесь я, например, рассказываю, как мы когда-то проверяли на честность московский сервис «электронной демократии» «Активный гражданин», объясняю из каких этапов состоит работа дата-журналиста и показываю свои любимые работы — от New York Times до Медиазоны.

Добавляйте в закладки:
https://www.youtube.com/watch?v=w8Q2grAslH4

Читать полностью…

data.csv

А мою любимую картинку про корь когда-то сделала Мона Чалаби.

Это визуальная журналистка и дата-художник, которая делает инфографику от руки, она известна своими визуальными метафорами и провокационным стилем.

Для медицинского издания такая картинка вряд ли подойдёт, но зато шерить в соцсетях такое классно

Читать полностью…

data.csv

Привет!
Я вместе с командой продолжаю исследовать ваш образовательный опыт и ищу больше респондентов для интервью.

Мы очень хотим поговорить с вами, если:
1. Вам интересна сфера визуализации данных
2. Вы когда-либо покупали любое обучение (не обязательно связанное с данными)

Если это вы — напишите, пожалуйста. Ваш опыт очень нам поможет ☺️
Контакт: @BlackPineapple

UPD: Пока респондентов набрали! Спасибо большое за ваш тёплый отклик
. Личку разгребаю 🌿

Читать полностью…

data.csv

Инструмент для визуализации данных RawGraphs анонсировал на внешнюю аудиторию новую функцию — возможность создавать и использовать «кастомные виды графиков».

Это значит, что теперь любой член комьюнити может написать шаблон для отображения нового вида визуализации, а любой другой пользователь — просто построить по этому шаблону свой график.

Ну и пару слов о RawGraphs — если вы о нём не слышали. Это сервис, который позволяет делать «основу» для вашей инфографики, которую, как правило, потом надо дорабатывать в графическом редакторе. Там нет настройки подписей, заголовков и прочих мелочей, зато есть много видов графиков, которые сложно где-то ещё построить без кода. А теперь, видимо, будет ещё больше ☺️

Читать полностью…

data.csv

Одна из причин, почему я обожаю дата-материалы — они позволяют узнать много интересного о мире.

Сегодня я узнал, что районы Нью Йорка — это весьма условные территориальные единицы, рождающиеся буквально «в народе». Однажды кто-то решил, что стоит называть это место определённым образом, и если это название закрепилось — его начинают использовать другие. Такая вольность приводит к тому, что у разных людей может быть разное мнение о том, где кончается тот или иной район 🤯

Чтобы построить максимально подробную карту города, NYT опросили 37 тысяч респондентов. Оказалось, что по большей части города у жителей Нью-Йорка консесусов нет.

А карту советую глянуть — это как минимум красиво. Любопытно, что материал состоит из двух частей — отдельно статья, отдельно — интерактивная карта.

Смотреть:
Поясняющий материал, интерактивная карта

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…
Подписаться на канал