data_csv | Неотсортированное

Telegram-канал data_csv - data.csv

12726

Блог о журналистике данных и дата-сторителлинге ====== Канал ведут: @BlackPineapple — аналитик в службе дата-журналистики Яндекса, @marohovskaya — редакторка дата-отдела «Важных историй»

Подписаться на канал

data.csv

Протестировал новую килер-фичу Datawrapper — плагин для PowerPoint.

Подхватывает все ваши графики из сервиса, позволяет убрать заголовок, позволяет сделать подложку прозрачной: ну сок?

Интерфейс максимально простой, мучаться с подгонкой размера не нужно. Плагин есть в двух версиях: статика, а есть интерактив
Интерактивные графики работают только с интернетом, а статику можно сохранить в любом формате и показывать даже в глухом лесу.

Единственная ложка дёгтя: шрифты на графике менять можно только в платной версии, а она стоит недёшево. Но кажется, большинство офисных работников и без этого проживёт.

Напомню, что у Flourish подобная интеграция есть с сервисом Canva, но простите, где Canva, а где — PowerPoint...

Читать полностью…

data.csv

Мои студенты из Вышки шлют привет. Очень радостно и тепло получать такие весточки ☺️

Читать полностью…

data.csv

Яндекс исследовал поисковый интерес к туристическим запросам и нашёл забавное:

Оказывается, пик поисковой активности про билеты и туры приходится на стандартный рабочий день. Это и так самые горячие часы в поиске, но для туристических запросов — особенно.

Пожалуй, можно сделать вывод, что мысли «куда бы отсюда поскорее уехать» у большинства людей появляются прямо в офисе 😄

Читать полностью…

data.csv

А вообще есть ещё один тип графика, в котором категории соединяются линиями. Это — Parallel coordinates.

Скажу честно — я его не очень понимаю. Очень специфичная вещь, удачных применений можно пересчитать по пальцам одной руки.

Вот неплохой вариант от Нейтана Яу. Что тут можно понять?

1) Что на уход работающий мужчина 65+ тратит меньше времени, чем на домашние хлопоты
2) Что люди всех категорий спят больше времени, чем ухаживают за собой (как бы это ни было очевидно), а вот со сравнением ухода и работ по дому всё не так однозначно
3) Что мужчины 65+ в будние дни спят больше, чем ~треть из категорий на графике (примерно треть линий расположено левее)

Интерактив можно тут пощупать:
https://flowingdata.com/2016/12/06/how-people-like-you-spend-their-time/

Читать полностью…

data.csv

#работы_студентов

Почти половина домохозяйств в России не могут позволить себе неожиданные траты, заменить изношенную мебель или неделю отпуска вне дома.

Такой вывод следует из данных Росстата и дипломного проекта по визуализации данных моей студентки — Ирины Григал.

Работа получилась лаконичной, но в ней запрятано много приёмов визуализации данных, которые делают её убедительной. Ирина проделала большую работу, чтобы найти ключевые идеи, которые уместно и интересно показывать при помощи графиков.

В комментариях выложу одну из первых версий — ей до такой ясности было далеко.

Сегодня последний день, когда можно занять место на курсе по визуализации данных и сделать подобную работу под моим руководством.

Следующий поток стартует не раньше, чем через три месяца. Если хотите с нами, присоединяйтесь по ссылке:

https://clck.ru/3CPYWL

Читать полностью…

data.csv

Не очень хорошие новости для людей, которые опираются на списки рекомендаций.

The Economist взяли 500 самых высоко оценённых книг с портала The Greatest Books of All Time и посчитали, что среднему читающему американцу потребуется 45 лет жизни, чтобы изучить их все.

Как и везде — взять всё от этого мира не получится, придётся быть очень избирательным.

К слову, 4% из этих 500 «великих книг» изначально написаны на русском языке. Не знаю, есть ли тут искажение, связанное с тем, что сайт англоязычный.

Статья под жёстким пейволлом, но подсмотреть можно в веб-архиве.

Кстати, порекомендуйте под этим постом, что почитать?
Мне в этом году очень зашёл писатель Йоав Блум — читал его книги «Я всегда остаюсь собой» и «Что другие думают во мне».

А из нонфикшна — «Гиперфокус. Как я научился делать больше, тратя меньше времени»

Читать полностью…

data.csv

Запись вебинара и основной старт продаж курса «Эстетика в графиках»

Спасибо, что пришли вчера на стрим! До сих пор радуюсь количеству людей, увлечённых датавизом и желающих узнать про красивые графики 🌿

Вебинар будет доступен по ссылке до 7 августа. Успевайте посмотреть, чтобы узнать, как и зачем использовать дата-сторителлинг при создании графиков в любой сфере, и из каких шагов состоит работа над убедительной визуализацией.

〰️〰️〰️

Все шаги, озвученные на вебинаре — от правил визуализации до работы в программах — в деталях разбираем на курсе «Эстетика в графиках». Сегодня открываем основные продажи на второй поток, который стартует 10 августа.

В результате курса вы научитесь делать залипательные графики за 2 месяца и получите толчок для карьерного роста.

Длительность обучения: 9 недель, включая время на выполнение дипломных работ. Примеры работ учеников смотрите по хэштегу #работы_студентов

На тарифах с обратной связью я лично буду разбирать каждую вашу домашку и дипломный проект.

До 7 августа действуют скидки — например, тариф с обратной связью будет стоить 29 900 вместо 35 000. По беспроцентной рассрочке за обучение на тарифе можно платить от 2 492 рублей в месяц.

Посмотреть подробности и внести оплату можно тут:
https://clck.ru/3CEuwJ

Читать полностью…

data.csv

Одна из моих самых любимых дипломных работ на курсе «Эстетика в графиках» — работа Константина Амозова.

Здесь — и шикарная история, и множество экспериментов с графиками, и детальки, в которые хочется вглядываться 💔

В работе я исследовал, какой вклад внесли советские и современные застройщики в то, каким мы видим Калининград сегодня. По сути после войны на фундаменте старого города построили новый. И моя задача была показать этот процесс: как менялись подходы, масштаб и объёмы застройки.

В основе почти всех графиков годы и площадь зданий. И, пожалуй, самым сложным было однотипные данные визуализировать разными способами.


Как начать визуализировать данные понятно, интересно и привлекательно для окружающих, буду рассказывать завтра в 19:00 на онлайн-лекции «Как сделать график, который впечатлит коллег и поможет бизнесу принимать решения».

На лекции разберем:
⭐️Графики Центробанка, Т—Ж, The Ecomonist. Что в них хорошо, что не очень, и какие простые приемы вы можете взять в свою практику, чтобы убедить кого угодно и в чём угодно;
⭐️Как графики могут искажать данные, и манипулировать читателями;
⭐️Почему важно правильно выбирать тип графика, и какие вообще типы существуют помимо банальных столбиков и кружочков;
⭐️Алгоритм создания графиков, которые выглядят профессионально.

Регистрируйтесь, если ещё не:
https://clck.ru/3CC3Qo

#работы_студентов

Читать полностью…

data.csv

Выступил сегодня на Летней Школе с двумя лекциями — научным коммуникаторам рассказал о том, что такое дата-журналистика, а ребятам из мастерской дата-журналистики показал свои кейсы и рассказал об особенностях работы в разных командах

Получил большой заряд энергии и кайфанул с вопросов. Пишите, если мы что-то не успели обсудить.
Вы супер 🫶

А тут хочу оставить милый момент: дата-журналисты сегодня дежурили на завтраке и сделали для каждой из каш график с составом 📊

Читать полностью…

data.csv

хохотнул и локализовал мем для дата-журналистов

надеюсь, вы только левого видели...

Читать полностью…

data.csv

Написал для Т—Ж ещё одну статью о том, как можно манипулировать восприятием при помощи графиков

На этот раз речь пойдёт про линейные графики и проблемы, которые с ними связаны

Очень понравилось, какой у нас получился материал

Почитайте и вы :)

https://journal.tinkoff.ru/stat-manipulation-line/

Читать полностью…

data.csv

Обучаем IT-специалистов и берём в команду ⚡️

Лучших выпускников пригласим на интервью и предложим карьерный фаст-трек до мидла в Т1.

🎓 Открытые школы Т1 — это месяц онлайн-интенсива с возможностью попасть в штат Холдинга Т1 — крупнейшей ИТ-компании в России по версии RAEX 2023, в портфеле которой 800+ масштабных проектов и 70+ продуктов и услуг.

Зачем участвовать?

⚙️ Уникальный рыночный опыт. Одними из первых на рынке внедряем технологии для управления данными. В ближайшем будущем ими будут пользоваться большинство крупных предприятий страны.

⚙️ Попасть в число лучших. Проекты Т1 ежегодно получают лучшие награды на ИТ-конкурсах: Global CIO, Национальная банковская премия и др.

⚙️ Поддержка. Нам удалось собрать команду опытных профессионалов в области разработки хранилищ данных и аналитических систем, которые помогут расти и развиваться.

Выбирай:

📁 аналитик DWH
🖥 разработчик DWH
📊 системный аналитик

Для участия нужен опыт работы от 1 года в выбранном направлении.

Быстрое обучение: 1 месяц
📱 Гибкий формат: онлайн по вечерам (от 8 часов в неделю на вебинары и практику)

Подавай заявку до 24 июля!
Старт интенсива: 29 июля.

Реклама. ООО "Т1". erid: 2SDnjeyK2o4

Читать полностью…

data.csv

Как интересно визуализировать доходы чиновников из Минфина?

Отвечает ещё одна моя студентка, пожелавшая остаться анонимной.

Взялась за датасет с налоговыми декларациями чиновников, который ты предложил. Тема популярная, эмоциональная, хотелось и свои силы в ней попробовать.

Поначалу жутко запуталась, но затем заметила, что медианные доходы чиновников из Министерства финансов значительно выше, чем доходы чиновников из других министерств. Решила оттолкнуться от этого и сделать серию минималистичных графиков про зарплаты минфиновцев. Графики вышли элементарными, но процесс их создания был не так очевиден и прост. И даже несмотря на то, что взялась за диплом в последний момент, вышло толково и аккуратно. А этого в такие короткие сроки без курса бы не получилось, спасибо :)


UPD. Внимательные читатели нашли в работе разного рода фактические ошибки. Поскольку это их личная работа по визуализации, а не редакционный материал, я не проверяю за студентами данные, но вам полезно будет знать, чтобы не обманываться:

* В 2019 году медиана зарплаты в России была 31 639 ₽, а не 26 364 ₽
* На пайчарте долька «остальные» подписана неверно — там должно быть 36%. Но визуализировано правильно

#работы_студентов

Читать полностью…

data.csv

Как изучать глобальные процессы и региональную политику на основе больших данных с помощью R и Python?

Шанинка — независимый университет в Москве — открывает магистратуру «Глобальные исследования и анализ данных», которая дает теоретический и методологический инструментарий для прикладного анализа на стыке политической науки и политической социологии.

Особенности обучения:

🔵 Образование через исследования. Никаких устных экзаменов — только авторские исследовательские тексты, темы которых студенты определяют самостоятельно.
🔵Количественные и цифровые методы. Программа учит применять языки программирования для исследования социальных, политических и экономических процессов на макро- и микроуровнях.
🔵Возможность глубинной региональной специализации. Для студентов доступно 5 треков по исследованиям отдельных регионов и языковые программы дополнительного образования.
🔵Сильная теоретическая подготовка. Для корретного выбора методологии, концептуализации и интерпретации результатов исследования студенты изучают теории из областей экономической и политической социологии, антропологии, международных отношений, неймейнстримных политических теорий.
🔵Удобный график, чтобы совмещать работу и учебу. Занятия проходят 3-4 раза в неделю по вечерам в современном кампусе в центре Москвы (7 минут от м. Охотный ряд).

Узнайте подробнее на консультации и подавайте заявку до 18 июля, чтобы поучаствовать в грантовом конкурсе. Прочитать про программу можно по этой ссылке, а зарегистрироваться на бесплатный месячный интенсив по работе с аналитическими исследовательскими инструментами — здесь.

erid: 2Vtzqxc4sWE
Реклама. ОАНО «МВШСЭН», ИНН 7729459892

Читать полностью…

data.csv

Коллеги посчитали, что генерят пользователи Шедеврума (это нейросеть Яндекса, которая генерирует картинки по текстовому запросу) в зависимости от пола и возраста

Некоторые различия удивляют: к примеру, радость и счастье по доле генераций сильно «перекошены» в женщин, а ужас, ненависть и безысходность генерируют в основном мужчины

Зато лень всем гендерам покорна!

Читать полностью…

data.csv

Залипательный проект и интересный источник данных — One Million Screenshots.

В базе — скриншоты более миллиона популярных сайтов, есть история за несколько месяцев, можно посмотреть метаданные сайта, найти похожие.

https://onemillionscreenshots.com/

Читать полностью…

data.csv

Крутой сайт с визуализациями от Яна Хольца

188 чудесных графиков от 110 авторов, разбитых по типам и инструментам, а для некоторых ещё и есть исходный код!

Залипнуть и вдохновиться 🥰🥰🥰:
https://www.dataviz-inspiration.com/about

Читать полностью…

data.csv

Издание «Вёрстка» ищет в свою команду опытного дата-редактора. Вдруг это вы? Подробнее:

/channel/svobodnieslova/5458

Читать полностью…

data.csv

В комментариях к прошлому посту многие задавались вопросом: можно ли использовать Slope Chart для визуализации разницы в категориях. К примеру, для сравнения значений у мужчин и женщин, пенсионеров и работающих, котов и собак.

Лично я считаю, что да — неоднократно встречал подобные визуализации в изданиях мирового уровня.

Вот вам совсем свежий пример — New York Times объясняет, может ли повлиять изменение методологии подсчёта очков на результаты японских олимпийцев в скейтбординге. Сравниваются результаты одних и тех же спортсменов по трюкам и проездам (простите, если тут ошибаюсь в терминах).

Обычно Slope Chart более наглядно показывает разницу в изменении за счёт соблюдения принципа близости: линии, как ни крути, будут расположены друг к другу ближе, чем столбики, поэтому их проще сравнивать.

https://www.nytimes.com/interactive/2024/07/26/world/olympics/japan-skateboarding.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Вчера пришёл в гости к коллегам из Яндекс Лавки — рассказал про дата-журналистику и грамотную визуализацию данных.

Лекция началась с вопроса мне:
— Лёша, какой у тебя любимый товар из Лавки?
— Желейные шарики


В конце лекции они уже были у меня в руках 🥺

На самом деле, этим постом хочу сказать, что меня можно приглашать к вам: подготовлюсь и соберу лекцию по вашему запросу. Осталось только найти свободный слот в расписании 🥲

Читать полностью…

data.csv

Есть два человека, которых я могу назвать своими наставниками в сфере визуализации данных: Денис Запорожан и Александр Богачёв.

Денис был моим преподавателем по визуализации данных в ВШЭ. Он привил мне любовь к нестандартным графикам, Моне Чалаби и дал возможность поработать с крутыми коллегами из Студии инфографики РИА.

На его занятиях мы вырезали и раскрашивали фигурки, слушали рассказы от профессионалов индустрии и восщихались, глядя на самые красивые проекты из медиа. Уже после курса долгое время я приходил к Денису за помощью и советом, и он помогал мне придумывать интересные ходы в инфографике.

Саша был моим руководителем на первой дата-работе — в РБК. Также я проходил у него несколько интенсивов. Сначала — в рамках воркшопа для сотрудников «Новой газеты», а потом и его авторский марафон.

Саша открыл мне глаза на то, что даже простые графики могут быть интересными, а элементарные правила позволяют делать их значительно лучше. Как сейчас помню — когда я проходил курс от Саши, я уже года два работал дата-журналистом, и думал, что и так всё знаю. Однако в каждом новом модуле оказывалось, что есть простейшие вещи, которые я раньше напрасно не замечал.

Здорово и приятно, что теперь уже я в рамках своих курсов могу открывать для людей чудесный мир визуализации данных. Если среди читающих есть мои студенты, знайте: я буду счастлив увидеть ваши работы, порадоваться вашим успехам, подсказать и покритиковать. Можете смело со мной делиться!

P.S. на фото уже я в 2022 году читаю лекцию для коллег Дениса в Газпромнефти, а Денис слушает 😌

Читать полностью…

data.csv

Люди воспринимают графики не слишком точно

Нашёл исследование, в котором испытуемым ненадолго показывали две пары выдуманных финансовых показателей и просили оценить, какой из графиков показывает больший рост.

В эксперименте использовали две пары столбиковых диаграмм. Во второй из них рост столбиков увеличивали на значение от 5 до 50% по сравнению с первой. То есть, первый столбик у пары графиков был одинаковый, а последний — на X% больше.

Оказалось, что разницу 5-10% люди вообще не видят, 20% в одном из экспериментов заметила лишь половина испытуемых — и это при прямом сравнении!

Представьте, что будет, если сравниваться не с чем?
Этим, увы, пользуются компании в своих отчётах.

О том, что делать, чтобы посыл, содержащийся в ваших данных, считали более точно, поговорим уже сегодня в 19:00 на бесплатном вебинаре:

https://clck.ru/3CDA9p

Читать полностью…

data.csv

Зову вас на свой открытый вебинар «Как сделать график, который впечатлит коллег и поможет бизнесу принимать решения»

Я часто вижу презентации и статьи с графиками, которые невозможно понять.

Они сложные, некрасивые, и если внимательно не слушать спикера или не читать сопровождающий текст — вывода по ним не сделать.

Но можно и иначе:
Лаконично. Привлекательно. Понятно без лишних объяснений.

О том, как делать графики «второго типа» расскажу на открытой онлайн-лекции «Как сделать график, который впечатлит коллег и поможет бизнесу принимать решения».

Что на нем будет?

🔸 5 шагов для создания графика, на котором захочется залипнуть надолго.
🔸 Секрет управления вниманием читателя в дата-сторителлинге, и как вам его использовать
🔸 Как выбрать график таким образом, чтобы он подталкивал к принятию верных решений
🔸 Разберем графики Центробанка, Т—Ж, The Ecomonist и поймем, как использовать их опыт в своих работах

Вебинар приурочен к старту второго потока моего курса «Эстетика в графиках», поэтому, само собой, про него я буду рассказывать тоже.

Я подобрал на 100% новый материал — пересечения с прошлыми моими выступлениями не будет. Зато будет много интересных примеров, на которых я объясню, что сделано хорошо, а что можно было бы улучшить.

На лекции вы также сможете задать мне вопросы, связанные с визуализацией данных, и поделиться своими проблемами.

Время: Среда (31 июля) в 19:00 по МСК

Прошлый вебинар я решил не повторять, возможно, и этот не стану.

Поэтому переходите по ссылке и регистрируйтесь:

https://clck.ru/3C8yWu

Читать полностью…

data.csv

Люблю такие красивые истории. Оказывается, среди профессиональных спортсменов очень многие родились в начале года

Это называется «эффект относительного возраста». Особенно он заметен в командных видах спорта и наиболее ярко проявляется в детском возрасте.

Это связано с тем, что детей в детстве ставят в сборные по году рождения, и ребёнок, родившийся в январе, будет более развит и более успешен, чем ребёнок, родившийся в декабре. В дальнейшем эта разница определит его спортивную карьеру

https://journal.tinkoff.ru/relative-age-effect/

Читать полностью…

data.csv

В выходные еду в турне в особенное для моего сердечка место — на Летнюю Школу

Впервые я побывал там в 2016 году, и с тех пор езжу туда практически каждый год: как участник или как спикер

В этот раз заеду с лекциями на мастерскую дата-журналистики и в просветительскую лабораторию им. Кота Шрёдингера

С кем обнимемся под соснами?

Читать полностью…

data.csv

тут тоже похвастаюсь:

мы с Т—Ж сейчас делаем цикл статей про манипуляции с данными и на графиках.
очень это интересный процесс —

перечитываю для этого разные книжки, ищу презентации, классные кейсы в различных каналах про датавиз

времени бы только на всё хватало 🙈

сегодня вышла вторая статья из цикла — и я прямо кайфнул от того, как всё получилось

Читать полностью…

data.csv

если вы тоже хотите научиться делать красивые и понятные графики, для вас — мой второй канал:
/channel/perfectgraphs

делаю там разборы графиков, пишу про полезные приёмы, рассказываю, как вам может помочь датавиз

ну и про курс в том числе!

Читать полностью…

data.csv

Яндекс обновил свой Нейростат — теперь это большое исследование с классной статистикой о том, как люди используют нейросети.

Например, из него можно узнать, что:
* Самая востребованная задача у пользователей нейросетей — генерация текстов с нуля. Её решают 40% респондентов
* Чаще все генерируют названия брендов, посты для соцсетей или код
* Если говорить про генерацию картинок, то люди помладше генерируют людей, а люди постарше — цветы 🌻

https://ya.ru/ai/stat

Читать полностью…

data.csv

Т—Ж на цифрах объясняет, почему программе льготной ипотеки в России пришёл конец.

Если коротко — благодаря ней жильё стало менее доступным 🥲
Рост цен на квартиры обогнал инфляцию, разница в стоимости между новыми квартирами и вторичкой улетела в космос, а концу программы позволить себе ипотеку могли в основном только люди с высоким доходом.

https://journal.tinkoff.ru/lgotnaya-ipoteka-vse/

Кстати, тут редкий случай, когда линейный график лучше было бы построить от нуля. Согласны? Напишите в комменты, почему 🙂

Читать полностью…

data.csv

Опытные бизнес-аналитики, вас тут ищут

С 13 по 19 июля можно попасть в Т-Банк еще быстрее: пройти собеседование и присоединиться к ИТ-команде за неделю.

Все этапы пройдут онлайн. Успейте зарегистрироваться до 10 июля.

erid:2Vtzqvk2B2Q
Реклама. АО "Тинькофф Банк", ИНН 7710140679, лицензия ЦБ РФ № 2673

Читать полностью…
Подписаться на канал