Блог о журналистике данных и дата-сторителлинге ====== Канал ведут: @BlackPineapple — аналитик в службе дата-журналистики Яндекса, @marohovskaya — редакторка дата-отдела «Важных историй»
Как повышение ключевой ставки отразилось на вкладах и кредитах?
Отвечает Т—Ж в своём новом материале: «шоковое» повышение в начале 22 года повлияло в первую очередь на снижение кредитов, постепенное повышение ставки в 23 году стало работать уже на вклады.
Показательна и карта долгов и накоплений:
Напрочь закредитованный Северный Кавказ, бедная Сибирь и сберегательный Центр.
Кстати, в Ямало-Ненецком АО, судя по статистике, на одного человека приходится в среднем 640 тысяч рублей кредита 🤯
https://t-j.ru/debet-kredit-stat/
Необычная визуализация от сотрудницы Datawrapper
Она записывала, какие овощи приходят к ней по подписочному сервису в течение года, и в итоге сделала об этом график.
Поражает, что такая нестандартная визуализация собрана внутри сервиса — и по сути это кастомизированный Scatter Plot.
Картинка длинная и интерактивная, так что вдохновиться приходите сюда:
https://blog.datawrapper.de/my-vegetable-subscription/
Любопытная база данных, которая позволяет выбирать книгу по месту действия, полу, возрасту и расе персонажей, а также по ряду оценок: от весёлой до грустной, от возвышенной до приземлённой, от сексуализированной до асексуальной.
Если вы искали, что почитать, теперь вы знаете, ещё один способ подобрать книгу:
https://www.whichbook.net/character-plot/
Яндекс сделал свой генеративный язык, который позволяет рисовать валентинки.
Все параметры можно описать js-подобным кодом, но можно и «натыкать» в интерфейсе, если с кодом вы не дружите
Ну прелесть?
https://ya.ru/lovescript
Пока москвичи радуются стремительному развитию транспортной доступности, метро в других городах не может похвастаться такими успехами
Собака.ru в новом дата-материале рассказывает, как обстоят дела в Северной столице. За последние 10 лет метро в Питере строилось даже хуже, чем в 90-ые, хотя планы были хорошие...
https://www.sobaka.ru/city/transport/194548
Вот вам идея для дата-исследования:
1) взять список популярных в мире музыкальных групп (например, из чартов Billboard Hot 100) и отобрать 100 самых прослушиваемых за каждый год
2) выгрузить с Setlist.fm все их концерты (обычно там всё подробно, вот пример)
3) посмотреть, как часто популярные артисты в разных жанрах на своих крупных выступлениях практикут «выход на бис»
Гипотеза — крупные артисты больше на бис не выходят. По крайней мере, так пишет колумнист издания The Paper.
А у меня для вас исследования нет, зато будет песня, которая так и называется — «Мы не выходим на бис». Это задорный и ироничный рок в духе Sum 41, который рассказывает о ценности момента.
Выйдет она в следующий четверг, но по правилам музыкальных площадок, чтобы эту песню могло услышать много людей, она должна получить много «пресейвов». Это заочный «лайк» песне, который напомнит вам о релизе.
Для вас — одна минута и один клик, для меня — возможно — много-много радости от новых слушателей 🥺
Поставить пресейв можно тут: https://band.link/RveEX
New York Times в своём материале раскрывают проблемы двухпартийной системы США в конгрессе, которая сложилась из принципа «победитель получает всё».
Партия, победившая в избирательном округе, в итоге забирает все места в конгрессе, из-за чего недопредставленными остаются как сторонники проигравшей партии, так и люди, не нашедшие своего кандидата. Отчасти это копенсируется неожиданными союзами, из-за которых в одной партии оказываются сторонники радикально разных взглядов.
Не мне рассуждать об американской политике, но в моих силах заметить тренд на скошенные Scatter Plot'ы в визуализации данных. В этот раз такое необычное положение особнованно метафорой — все либеральные показатели сконцентрированы слева, а все консервативные — справа.
https://www.nytimes.com/interactive/2025/01/14/opinion/fix-congress-proportional-representation.html
New York Times пишут про проблему, которая может привести к потенциальной стагнации генеративных нейросетей.
Дело в том, что для улучшения моделей нужно много контента, который создатели сеток беспорядочно пылесосят из интернета. Но вот незадача — в интернете становится всё больше контента, который уже сгенерирован нейросетями. И оказывается, что сетки, обученные на сгенерированном контенте, с каждой итерацией начинают выдавать всё большую чушь.
New York Times понятно и популярно объясняют, почему качественное определение сгенерированного контента — это сейчас вопрос выживания для компаний, занимающихся разработкой подобных моделей
https://www.nytimes.com/interactive/2024/08/26/upshot/ai-synthetic-data.html
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
Очаровательный проект про одинаковые имена на выборах в Индии.
Есть там такая проблема на выборах разных уровней: в одном бюллетене могут оказаться кандидаты с крайне созвучными именами. Автор приводит пример, когда однажды выбирать предстояло из четырёх Gandhi, трое из которых к тому же были и Rahul'ами. Неприятно.
Материал притягателен разными формами подачи: тут и иллюстрации, и графы, и интерактив.
https://diagramchasing.fun/2024/votes-in-a-name
Смотрите, какая очаровательная штучка от NASA!
На лендинге можно ввести своё имя, и получить набор спутниковых снимков, на которых местность напоминает буквы из него. На каждое место можно клинкуть, посмотреть, где оно находится.
https://landsat.gsfc.nasa.gov/apps/YourNameInLandsat-main/index.html
В материале SCMP помимо прочего есть такой симпатичный дата-арт
На инфографике показана активность Солнца за последние почти 200 лет. Временной ряд идёт по спирали, а цвет и одновременно размер полосочек показывает среднее за год число пятен на Солнце.
В декабре я побывал в Гонконге, где своими глазами увидел одно из самых впечатляющих шоу в своей жизни. Прямо над бухтой Виктория в воздух взлетели дроны, создавая светящиеся изображения милых панд: они анимировались, искрились и плавно перетекали в другие формы.
Огромные панды на фоне небоскрёбов выглядели так, словно кто-то смонтировал видео со спецэффектами, но всё это происходило на самом деле.
И вот South China Morning Post выпускает инфографику, которая объясняет, как устроены такие шоу, и что может помешать их проведению.
После завершения разработки дизайна каждый дрон программируется со всеми необходимыми данными: точным местоположением, высотой и цветом подсветки в каждый момент шоу. Эти данные загружаются в контроллеры полёта дронов, что позволяет им автономно выполнять представление.
Во время шоу дроны не общаются друг с другом и не получают инструкций в режиме реального времени. Вместо этого они независимо друг от друга следуют по заранее запрограммированным траекториям, подобно танцорам, выступающим по памяти.
Планируя 2025 год, важно помнить о правиле: за каждым большим делом всегда стоят маленькие шаги
Очень мне нравится эта метафора в картиночках @newhappyco
У них вообще клёвый стиль: выглядит как визуализация данных, но в основе скорее что-то философское про жизнь
Источник:
https://www.instagram.com/newhappyco
Мой дата-год ❤🔥
Хочется зафиналить 2024, рассказав себе и вам о самых важных своих дата-активностях
1⃣ Придумал и запустил свой курс по визуализации данных. Испытываю огромное удовольствие от обсуждений со студентами и особенно работы над финальными проектами.
Прошло уже два потока, за время которых ребята сделали много крутейших работ. Посмотреть их можно тут: #работы_студентов@data_csv
2⃣ Выпустил два исследования вместе со своей прекрасной командой в Яндексе: про то, как изменился климат России за 70 лет, и о том, что заказывают в доставке в разных городах страны.
3⃣ Много выступал. Съездил на фестиваль TIME CODE в Екатеринбург, выступил на главной сцене Матемаркетинга, прочитал две лекции на Летней Школе под Дубной; ходил в гости к магистрам из Вышки, а ещё провёл тренинги для своих коллег из Яндекс Лавки и команды 1C.
А ещё — вёл вебинары для студентов своего курса и профессии «Дата-журналист» в Нетологии.
4⃣ Сделал исследование для Картетики о рынке ГИС-специлистов, которые они презентовали на своей конференции Мапакон. Некоторые выводы есть в двух материалах, которые они выпустили «по следам»: 1, 2
5⃣ Разработал небольшой курс по дата-журналистике в МГУ. Коллега в рамках этого курса предложил использовать платформу «Яндекс Контест» для проверки заданий. Студенты загружали эксельки в систему, мы писали тесты, и программа автоматически проверяла работы. Опыт был любопытный, хотя и местами стрессовый
6⃣ Написал для Т—Ж цикл авторских материалов под кодовым названием «Одураченные статистикой»: о том, какие манипуляции осознанно или неосознанно используют авторы графиков, чтобы нас запутать
Спасибо, что следите и читаете! 20 тысяч пересылок и почти полторы тысячи комментариев — это мощь 😍
Дата-сторителлинг по-шанхайски: заходишь во двор жилого дома, а там цифры висят. Эти цифры — доля вакцинированных жителей в доме.
Увидишь низкое число, значит, к этим не ходи, люди это нехорошие 😁
Потрясающей красоты датавиз / дата-арт про шутинги в американских школах.
Формы, цвета, анимация — всё тут заставляет прилипнуть к экрану.
Вдохновиться и оценить красоту (лучше с компьютера):
https://alhadaqa.github.io/wakeup/
«Собака» рассказывает как «Ленфильм», бывший некогда флагманом отечественной киноиндустрии, медленно скатывается в пропасть. Меньше картин, хуже качество, и всё меньше внимания они привлекают.
Почему так получилось:
https://www.sobaka.ru/entertainment/cinema/194995
Про цензуру на Супербоуле в США
Супербоул — это одно из самых значимых ежегодных событий в Штатах: его смотрят десятки миллионов зрителей, собираются компаниями друзей и семьями. И неминуемо это шоу смотрят дети, поэтому на него налагают множество требований.
Приличные костюмы, приличные песни, приличные жесты. Только вот популярные музыканты, которых приглашают выступать в перерыве между играми, в своих треках в выражениях обычно не стесняются.
Но чего не сделаешь ради шоу! Вот Dr. Dre и Snoop Dogg в своём выступлении заменили 22 из 392 слов. Среди них как и мат, так и просто потенциально оскорбительные выражения — в адрес чернокожих или даже полиции.
О том, как ещё преобразились песни популярных артистов, читайте в материале Washington Post
В прошлом году я делал для «Картетики» исследование и инфографику о работе и зарплатах в сфере ГИС, а теперь флаг перехватила моя студентка — Ольга Хлопкова.
Получилось отлично. Если вы работаете в этой области — обязательно следите за серией, пока вышла только первая часть исследования:
https://cartetika.ru/tpost/bfolz40031-analiz-geo-sferi-2024-chast-1-znakomstvo
А если вам нужен такой датавиз — пишите, за два потока «Эстетики в графиках» уже выпустилось немало звёздочек, попробуем найти вам классного инфографера 🙌
#работы_студентов@data_csv
Коллеги собрали красивый-красивый проект о том, когда ставят встречи пользователи Яндекс Календаря
Помимо «солнца встреч», которым можно полюбоваться в начале лендинга, есть много занятных выводов.
Например, что в начале дня чаще ставят более длинные встречи. Или что раньше всего встречи ставят сотрудники ЖКХ и производств, а позже всех — айтишники и креаторы.
https://yandex.ru/company/researches/2025/calendar
Т—Ж решил опросить своих читателей, чтобы узнать, действительно ли «троечники» более успешны, чем отличники
По субъективным ощущениям кажется, что — да. По крайней мере, троечники чаще отвечают, что довольный карьерой, и она движется быстрее, чем у окружающих.
Но метод, как мне кажется, мудрённый. Сходу не понять — среди троечников довольных примерно в два раза больше?
Я бы предпочёл смотреть на долю довольных, чем на не очень понятные коэфициенты.
Ещё прикольно, что «троечники» и «отличники» по-разному отвечали про качества, которые помогают им в работе. Первые значительно больше опираются на умение учиться на ошибках и смекалку, а вторые — на терпение и широкий кругозор.
И жаль про зарплаты ничего, хотелось бы опираться на что-то объективное, а не на самоощущения!
https://journal.tinkoff.ru/opros-pro-otsenki-rez/
Дата-сторителлинг на большой сцене
Если вы посмотрите видео, то обнаружите на нём человека, выкрикивающего разные источники данных. Это титры к спектаклю «Человек среднестатистический», премьера которого состоялась вчера в Театре Ермоловой (Москва).
Вся постановка строится на данных официальной статистики, опросах и данных частных компаний, рисуя портреты персонажей. Особенно я порадовался, когда в какой-то момент со сцены цитировали данные одного из исследований Яндекса 😄
Спектакль очень сильно отличается от всего, что я раньше видел в театре. Это непривычно и может зайти не каждому. Но мне понравилось: получилось необычно, мило и моментами смешно.
Повторные показы планируют 5 и 27 февраля, так что берите билеты, если вдруг вас заинтересовало:
https://www.ermolova.ru/afisha/view/218/
Любопытно. Чтобы серьёзно это воспринимать, критически не хватает чисел и ограничений данных — например, какие страны вошли в выборку и за какой год (UPD: источник намекает, что это может быть только Великобритания)
Но двухсекундный фактчек показал, что это должно быть близко к правде:
В 2021 году 933 тысячи россиян умерли от болезней сердца и сосудов, 283 тысячи — от злокачественных новообразований.
В январе - ноябре 2024 года зарегистрировано 6,4 тыс. убийств (с покушениями), что ниже на 7,1% уровня сопоставимого периода 2023 года
Изучал материалы предыдущего года и нашёл такую залипательную анимацию о том, как в мире менялось число ядерных боеголовок
Вообще весь материал NYT про ядерное оружие — это просто какой-то впечатляющий боевик, просто полюбуйтесь:
https://www.nytimes.com/interactive/2024/03/07/opinion/nuclear-war-prevention.html
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
Как начать работать с SQL?
Пройдите бесплатный мини-курс “SQL для новичков” от Changellenge >> Education и освойте SQL всего за 5 часов и получите практические знания, необходимые для работы с базами данных.
🔥 Преимущества курса:
- Выделите всего 5 часов на обучение,
- Изучите ключевые функции и операторы SQL,
- Получите видео-разборы от эксперта,
- Выполните более 30 практических заданий.
🎁 За прохождение мини-курса вы получите скидку 10 000 рублей на обучение на программе "Аналитик данных" от Changellenge >> Education.
📅 Скорее регистрируйтесь, осталось всего 15 свободных мест: https://u.to/TKREIQ
Реклама. ООО «Высшая школа аналитики и стратегии». ИНН 7716917009. erid:2VtzqxAmdq5
Вот несколько моих видео с того самого шоу в Гонконге, на которое я попал
Читать полностью…Андрон Алексанян собрал список интересных и актуальных авторских каналов, посвящённых аналитике. data.csv уже несколько лет входит в подборки Андрона, что очень приятно 😌
В статье есть ссылки, описания каналов и примеры любопытных постов:
https://habr.com/ru/articles/869116/
Анализ новогодних обращений президента от студентов магистратуры ВШЭ
Настроение, популярные темы и пожелания — в карточках
Авторы: Валерия Немна, Филипп Попов, Владимир Малючков
Моё уважение коллегам из «Новой газеты Европа», которые сделали очень подробный калькулятор инфляции с 2019 года, называется «Новогодняя корзина»
Можно буквально собрать корзину из привычных для вас товаров, и посмотреть, как поменялась цена каждого; можно посмотреть на готовые наборы.
Новая-Европа — нежелательная организация в России, за распространение ссылок на их материалы граждане РФ могут получить наказание, поэтому ссылки здесь не будет.
Во время моей поездки в Японию я выкладывал много инфографики, которую находил в городе
Кажется, многим это понравилось, мне недавно даже коллега выразила за это отдельный респект. Поэтому продолжим рубрику!
Сейчас я в Шанхае, в музее шоколада. Как вам кажется, что показывает график снизу? Правильный ответ выложу под спойлер в комментарии :)