data_csv | Неотсортированное

Telegram-канал data_csv - data.csv

12726

Блог о журналистике данных и дата-сторителлинге ====== Канал ведут: @BlackPineapple — аналитик в службе дата-журналистики Яндекса, @marohovskaya — редакторка дата-отдела «Важных историй»

Подписаться на канал

data.csv

Как повышение ключевой ставки отразилось на вкладах и кредитах?

Отвечает Т—Ж в своём новом материале: «шоковое» повышение в начале 22 года повлияло в первую очередь на снижение кредитов, постепенное повышение ставки в 23 году стало работать уже на вклады.

Показательна и карта долгов и накоплений:
Напрочь закредитованный Северный Кавказ, бедная Сибирь и сберегательный Центр.

Кстати, в Ямало-Ненецком АО, судя по статистике, на одного человека приходится в среднем 640 тысяч рублей кредита 🤯

https://t-j.ru/debet-kredit-stat/

Читать полностью…

data.csv

Необычная визуализация от сотрудницы Datawrapper

Она записывала, какие овощи приходят к ней по подписочному сервису в течение года, и в итоге сделала об этом график.

Поражает, что такая нестандартная визуализация собрана внутри сервиса — и по сути это кастомизированный Scatter Plot.

Картинка длинная и интерактивная, так что вдохновиться приходите сюда:
https://blog.datawrapper.de/my-vegetable-subscription/

Читать полностью…

data.csv

Любопытная база данных, которая позволяет выбирать книгу по месту действия, полу, возрасту и расе персонажей, а также по ряду оценок: от весёлой до грустной, от возвышенной до приземлённой, от сексуализированной до асексуальной.

Если вы искали, что почитать, теперь вы знаете, ещё один способ подобрать книгу:
https://www.whichbook.net/character-plot/

Читать полностью…

data.csv

Яндекс сделал свой генеративный язык, который позволяет рисовать валентинки.

Все параметры можно описать js-подобным кодом, но можно и «натыкать» в интерфейсе, если с кодом вы не дружите

Ну прелесть?
https://ya.ru/lovescript

Читать полностью…

data.csv

Пока москвичи радуются стремительному развитию транспортной доступности, метро в других городах не может похвастаться такими успехами

Собака.ru в новом дата-материале рассказывает, как обстоят дела в Северной столице. За последние 10 лет метро в Питере строилось даже хуже, чем в 90-ые, хотя планы были хорошие...

https://www.sobaka.ru/city/transport/194548

Читать полностью…

data.csv

Вот вам идея для дата-исследования:

1) взять список популярных в мире музыкальных групп (например, из чартов Billboard Hot 100) и отобрать 100 самых прослушиваемых за каждый год
2) выгрузить с Setlist.fm все их концерты (обычно там всё подробно, вот пример)
3) посмотреть, как часто популярные артисты в разных жанрах на своих крупных выступлениях практикут «выход на бис»

Гипотеза — крупные артисты больше на бис не выходят. По крайней мере, так пишет колумнист издания The Paper.

А у меня для вас исследования нет, зато будет песня, которая так и называется — «Мы не выходим на бис». Это задорный и ироничный рок в духе Sum 41, который рассказывает о ценности момента.

Выйдет она в следующий четверг, но по правилам музыкальных площадок, чтобы эту песню могло услышать много людей, она должна получить много «пресейвов». Это заочный «лайк» песне, который напомнит вам о релизе.

Для вас — одна минута и один клик, для меня — возможно — много-много радости от новых слушателей 🥺

Поставить пресейв можно тут: https://band.link/RveEX

Читать полностью…

data.csv

New York Times в своём материале раскрывают проблемы двухпартийной системы США в конгрессе, которая сложилась из принципа «победитель получает всё».

Партия, победившая в избирательном округе, в итоге забирает все места в конгрессе, из-за чего недопредставленными остаются как сторонники проигравшей партии, так и люди, не нашедшие своего кандидата. Отчасти это копенсируется неожиданными союзами, из-за которых в одной партии оказываются сторонники радикально разных взглядов.

Не мне рассуждать об американской политике, но в моих силах заметить тренд на скошенные Scatter Plot'ы в визуализации данных. В этот раз такое необычное положение особнованно метафорой — все либеральные показатели сконцентрированы слева, а все консервативные — справа.

https://www.nytimes.com/interactive/2025/01/14/opinion/fix-congress-proportional-representation.html

Читать полностью…

data.csv

New York Times пишут про проблему, которая может привести к потенциальной стагнации генеративных нейросетей.

Дело в том, что для улучшения моделей нужно много контента, который создатели сеток беспорядочно пылесосят из интернета. Но вот незадача — в интернете становится всё больше контента, который уже сгенерирован нейросетями. И оказывается, что сетки, обученные на сгенерированном контенте, с каждой итерацией начинают выдавать всё большую чушь.

New York Times понятно и популярно объясняют, почему качественное определение сгенерированного контента — это сейчас вопрос выживания для компаний, занимающихся разработкой подобных моделей

https://www.nytimes.com/interactive/2024/08/26/upshot/ai-synthetic-data.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Очаровательный проект про одинаковые имена на выборах в Индии.

Есть там такая проблема на выборах разных уровней: в одном бюллетене могут оказаться кандидаты с крайне созвучными именами. Автор приводит пример, когда однажды выбирать предстояло из четырёх Gandhi, трое из которых к тому же были и Rahul'ами. Неприятно.

Материал притягателен разными формами подачи: тут и иллюстрации, и графы, и интерактив.

https://diagramchasing.fun/2024/votes-in-a-name

Читать полностью…

data.csv

Смотрите, какая очаровательная штучка от NASA!

На лендинге можно ввести своё имя, и получить набор спутниковых снимков, на которых местность напоминает буквы из него. На каждое место можно клинкуть, посмотреть, где оно находится.

https://landsat.gsfc.nasa.gov/apps/YourNameInLandsat-main/index.html

Читать полностью…

data.csv

В материале SCMP помимо прочего есть такой симпатичный дата-арт

На инфографике показана активность Солнца за последние почти 200 лет. Временной ряд идёт по спирали, а цвет и одновременно размер полосочек показывает среднее за год число пятен на Солнце.

Читать полностью…

data.csv

В декабре я побывал в Гонконге, где своими глазами увидел одно из самых впечатляющих шоу в своей жизни. Прямо над бухтой Виктория в воздух взлетели дроны, создавая светящиеся изображения милых панд: они анимировались, искрились и плавно перетекали в другие формы.

Огромные панды на фоне небоскрёбов выглядели так, словно кто-то смонтировал видео со спецэффектами, но всё это происходило на самом деле.

И вот South China Morning Post выпускает инфографику, которая объясняет, как устроены такие шоу, и что может помешать их проведению.

После завершения разработки дизайна каждый дрон программируется со всеми необходимыми данными: точным местоположением, высотой и цветом подсветки в каждый момент шоу. Эти данные загружаются в контроллеры полёта дронов, что позволяет им автономно выполнять представление.

Во время шоу дроны не общаются друг с другом и не получают инструкций в режиме реального времени. Вместо этого они независимо друг от друга следуют по заранее запрограммированным траекториям, подобно танцорам, выступающим по памяти.


https://multimedia.scmp.com/infographics/news/world/article/3292066/drone-shows/index.html

Читать полностью…

data.csv

Планируя 2025 год, важно помнить о правиле: за каждым большим делом всегда стоят маленькие шаги

Очень мне нравится эта метафора в картиночках @newhappyco

У них вообще клёвый стиль: выглядит как визуализация данных, но в основе скорее что-то философское про жизнь

Источник:
https://www.instagram.com/newhappyco

Читать полностью…

data.csv

Мой дата-год ❤‍🔥

Хочется зафиналить 2024, рассказав себе и вам о самых важных своих дата-активностях

1⃣ Придумал и запустил свой курс по визуализации данных. Испытываю огромное удовольствие от обсуждений со студентами и особенно работы над финальными проектами.

Прошло уже два потока, за время которых ребята сделали много крутейших работ. Посмотреть их можно тут: #работы_студентов@data_csv

2⃣ Выпустил два исследования вместе со своей прекрасной командой в Яндексе: про то, как изменился климат России за 70 лет, и о том, что заказывают в доставке в разных городах страны.

3⃣ Много выступал. Съездил на фестиваль TIME CODE в Екатеринбург, выступил на главной сцене Матемаркетинга, прочитал две лекции на Летней Школе под Дубной; ходил в гости к магистрам из Вышки, а ещё провёл тренинги для своих коллег из Яндекс Лавки и команды 1C.

А ещё — вёл вебинары для студентов своего курса и профессии «Дата-журналист» в Нетологии.

4⃣ Сделал исследование для Картетики о рынке ГИС-специлистов, которые они презентовали на своей конференции Мапакон. Некоторые выводы есть в двух материалах, которые они выпустили «по следам»: 1, 2

5⃣ Разработал небольшой курс по дата-журналистике в МГУ. Коллега в рамках этого курса предложил использовать платформу «Яндекс Контест» для проверки заданий. Студенты загружали эксельки в систему, мы писали тесты, и программа автоматически проверяла работы. Опыт был любопытный, хотя и местами стрессовый

6⃣ Написал для Т—Ж цикл авторских материалов под кодовым названием «Одураченные статистикой»: о том, какие манипуляции осознанно или неосознанно используют авторы графиков, чтобы нас запутать

Спасибо, что следите и читаете! 20 тысяч пересылок и почти полторы тысячи комментариев — это мощь 😍

Читать полностью…

data.csv

Дата-сторителлинг по-шанхайски: заходишь во двор жилого дома, а там цифры висят. Эти цифры — доля вакцинированных жителей в доме.

Увидишь низкое число, значит, к этим не ходи, люди это нехорошие 😁

Читать полностью…

data.csv

Потрясающей красоты датавиз / дата-арт про шутинги в американских школах.

Формы, цвета, анимация — всё тут заставляет прилипнуть к экрану.

Вдохновиться и оценить красоту (лучше с компьютера):
https://alhadaqa.github.io/wakeup/

Читать полностью…

data.csv

«Собака» рассказывает как «Ленфильм», бывший некогда флагманом отечественной киноиндустрии, медленно скатывается в пропасть. Меньше картин, хуже качество, и всё меньше внимания они привлекают.

Почему так получилось:
https://www.sobaka.ru/entertainment/cinema/194995

Читать полностью…

data.csv

Про цензуру на Супербоуле в США

Супербоул — это одно из самых значимых ежегодных событий в Штатах: его смотрят десятки миллионов зрителей, собираются компаниями друзей и семьями. И неминуемо это шоу смотрят дети, поэтому на него налагают множество требований.

Приличные костюмы, приличные песни, приличные жесты. Только вот популярные музыканты, которых приглашают выступать в перерыве между играми, в своих треках в выражениях обычно не стесняются.

Но чего не сделаешь ради шоу! Вот Dr. Dre и Snoop Dogg в своём выступлении заменили 22 из 392 слов. Среди них как и мат, так и просто потенциально оскорбительные выражения — в адрес чернокожих или даже полиции.

О том, как ещё преобразились песни популярных артистов, читайте в материале Washington Post

Читать полностью…

data.csv

В прошлом году я делал для «Картетики» исследование и инфографику о работе и зарплатах в сфере ГИС, а теперь флаг перехватила моя студентка — Ольга Хлопкова.

Получилось отлично. Если вы работаете в этой области — обязательно следите за серией, пока вышла только первая часть исследования:
https://cartetika.ru/tpost/bfolz40031-analiz-geo-sferi-2024-chast-1-znakomstvo

А если вам нужен такой датавиз — пишите, за два потока «Эстетики в графиках» уже выпустилось немало звёздочек, попробуем найти вам классного инфографера 🙌

#работы_студентов@data_csv

Читать полностью…

data.csv

Коллеги собрали красивый-красивый проект о том, когда ставят встречи пользователи Яндекс Календаря

Помимо «солнца встреч», которым можно полюбоваться в начале лендинга, есть много занятных выводов.

Например, что в начале дня чаще ставят более длинные встречи. Или что раньше всего встречи ставят сотрудники ЖКХ и производств, а позже всех — айтишники и креаторы.

https://yandex.ru/company/researches/2025/calendar

Читать полностью…

data.csv

Т—Ж решил опросить своих читателей, чтобы узнать, действительно ли «троечники» более успешны, чем отличники

По субъективным ощущениям кажется, что — да. По крайней мере, троечники чаще отвечают, что довольный карьерой, и она движется быстрее, чем у окружающих.

Но метод, как мне кажется, мудрённый. Сходу не понять — среди троечников довольных примерно в два раза больше?
Я бы предпочёл смотреть на долю довольных, чем на не очень понятные коэфициенты.

Ещё прикольно, что «троечники» и «отличники» по-разному отвечали про качества, которые помогают им в работе. Первые значительно больше опираются на умение учиться на ошибках и смекалку, а вторые — на терпение и широкий кругозор.

И жаль про зарплаты ничего, хотелось бы опираться на что-то объективное, а не на самоощущения!

https://journal.tinkoff.ru/opros-pro-otsenki-rez/

Читать полностью…

data.csv

Дата-сторителлинг на большой сцене

Если вы посмотрите видео, то обнаружите на нём человека, выкрикивающего разные источники данных. Это титры к спектаклю «Человек среднестатистический», премьера которого состоялась вчера в Театре Ермоловой (Москва).

Вся постановка строится на данных официальной статистики, опросах и данных частных компаний, рисуя портреты персонажей. Особенно я порадовался, когда в какой-то момент со сцены цитировали данные одного из исследований Яндекса 😄

Спектакль очень сильно отличается от всего, что я раньше видел в театре. Это непривычно и может зайти не каждому. Но мне понравилось: получилось необычно, мило и моментами смешно.

Повторные показы планируют 5 и 27 февраля, так что берите билеты, если вдруг вас заинтересовало:
https://www.ermolova.ru/afisha/view/218/

Читать полностью…

data.csv

Любопытно. Чтобы серьёзно это воспринимать, критически не хватает чисел и ограничений данных — например, какие страны вошли в выборку и за какой год (UPD: источник намекает, что это может быть только Великобритания)

Но двухсекундный фактчек показал, что это должно быть близко к правде:

В 2021 году 933 тысячи россиян умерли от болезней сердца и сосудов, 283 тысячи — от злокачественных новообразований.

— Т—Ж

В январе - ноябре 2024 года зарегистрировано 6,4 тыс. убийств (с покушениями), что ниже на 7,1% уровня сопоставимого периода 2023 года

— ТАСС

Тут интересно и важно, что инфографика вызывает эмоцию: с гораздо большей вероятностью вы умерёте от заболеваний (проще сказать, от старости), чем от внешних факторов — убийств, несчастных случае и т.д

Это, кстати, можно было и цветом выделить 👀

Читать полностью…

data.csv

Изучал материалы предыдущего года и нашёл такую залипательную анимацию о том, как в мире менялось число ядерных боеголовок

Вообще весь материал NYT про ядерное оружие — это просто какой-то впечатляющий боевик, просто полюбуйтесь:

https://www.nytimes.com/interactive/2024/03/07/opinion/nuclear-war-prevention.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Как начать работать с SQL?

Пройдите бесплатный мини-курс “SQL для новичков” от Changellenge >> Education и освойте SQL всего за 5 часов и получите практические знания, необходимые для работы с базами данных.

🔥 Преимущества курса:
- Выделите всего 5 часов на обучение,
- Изучите ключевые функции и операторы SQL,
- Получите видео-разборы от эксперта,
- Выполните более 30 практических заданий.

🎁 За прохождение мини-курса вы получите скидку 10 000 рублей на обучение на программе "Аналитик данных" от Changellenge >> Education.

📅 Скорее регистрируйтесь, осталось всего 15 свободных мест: https://u.to/TKREIQ

Реклама. ООО «Высшая школа аналитики и стратегии». ИНН 7716917009. erid:2VtzqxAmdq5

Читать полностью…

data.csv

Вот несколько моих видео с того самого шоу в Гонконге, на которое я попал

Читать полностью…

data.csv

Андрон Алексанян собрал список интересных и актуальных авторских каналов, посвящённых аналитике. data.csv уже несколько лет входит в подборки Андрона, что очень приятно 😌

В статье есть ссылки, описания каналов и примеры любопытных постов:

https://habr.com/ru/articles/869116/

Читать полностью…

data.csv

Анализ новогодних обращений президента от студентов магистратуры ВШЭ

Настроение, популярные темы и пожелания — в карточках

Авторы: Валерия Немна, Филипп Попов, Владимир Малючков

Читать полностью…

data.csv

Моё уважение коллегам из «Новой газеты Европа», которые сделали очень подробный калькулятор инфляции с 2019 года, называется «Новогодняя корзина»

Можно буквально собрать корзину из привычных для вас товаров, и посмотреть, как поменялась цена каждого; можно посмотреть на готовые наборы.

Новая-Европа — нежелательная организация в России, за распространение ссылок на их материалы граждане РФ могут получить наказание, поэтому ссылки здесь не будет.

Читать полностью…

data.csv

Во время моей поездки в Японию я выкладывал много инфографики, которую находил в городе

Кажется, многим это понравилось, мне недавно даже коллега выразила за это отдельный респект. Поэтому продолжим рубрику!

Сейчас я в Шанхае, в музее шоколада. Как вам кажется, что показывает график снизу? Правильный ответ выложу под спойлер в комментарии :)

Читать полностью…
Подписаться на канал