data_csv | Неотсортированное

Telegram-канал data_csv - data.csv

12726

Блог о журналистике данных и дата-сторителлинге ====== Канал ведут: @BlackPineapple — аналитик в службе дата-журналистики Яндекса, @marohovskaya — редакторка дата-отдела «Важных историй»

Подписаться на канал

data.csv

История эмодзи от сервиса Statista: 76 в момент появления, резкий всплеск в 2010 году и почти 4 тысячи ожидаемых картинки к следующему году. Правда, в это число входят все цвета кожи, чем и объясняется стабильный рост последние десятилетия: так, в обновлении на следующий год планируется 164 новых пиктограммы, из которых лишь девять — абсолютно новые.

Меня удивило, что «лайк» сделали в 2015 (UPD: комментах пишут, что в 2010), а 🫠 и 🫶 появились только несколько лет назад!

Источник

Также по теме:
Какие смайлики ищут в поиске Яндекса

Читать полностью…

data.csv

Сегодня вышел проект, за который я болел долгие месяцы.

Вместе с коллегами мы научили нейросеть по инструкциям выделять среди большого количества точек на карте крутые и неочевидные туристические места.

В ходе работы над проектом я, например, узнал, что под Выборгом есть инсталляция из пары десятков Лениных, в Воронежской области — замок с пивоваренным производством, а в Якутске можно спуститься в подземную лабораторию, чтобы потрогать вечную мерзлоту.

Надеюсь, что и у вас получится совершить какие-нибудь классные открытия:
https://yandex.ru/company/researches/2025/wow-places

Читать полностью…

data.csv

В России немного премий по инфографике. Приятно, что появляются новые площадки, где можно проявить себя

kImpact Design Awards — это премия по дизайну презентаций и инфографики. В этот раз она проходит в расширенной версии: будет торжественное награждение с выступлениями профессионалов сферы и возможность приобрести оффлайн-билеты.

Отправить работу можно тут

🔴Приём заявок — до 7 июля включительно ❗️
🔴Офлайн-награждение и конференция — 2 августа, Москва
🔴Форматы работ: продающие презентации, выступления, инфографика, свободная тема
🔴4 категории, 12 номинаций — до 56 победителей

Читать полностью…

data.csv

Как ChatGPT пытается вас перехитрить

Я сейчас буквально живу в LLM. Пишу там код, тексты, генерю обложки к песне, спрашиваю обо всём на свете. В умелых руках это второй мозг и десяток рук. Но бывают и казусы.

Вчера делал очередной материал по визуализации данных. Попросил ChatGPT найти мне научную публикацию на определённую тему. На часах третий час ночи, сил читать самому нет.

Кидаю ему файл, прошу — перескажи основные выводы. Тезисы получились — огонь: ровно такие, как я себе представлял. Но я что, дурак — просто так верить LLM? Пишу:

Проверь вот этот фрагмент на соответствие тексту прикреплённой научной работы. Оцени его критично, выдай все несоответствия.


ChatGPT выдаёт мелкие неточности — говорит, вот это поправь — там не совсем так было написано. А остальное — огонь!

Пишу ему ещё раз:

Ты — учёный, которому поступил текст на peer review. Посмотри эту научную работу и определи, насколько верно взята из неё цитата. Разбери критично


Он мне прямо выдаёт цитаты. Это — верно. Это — тоже верно. Тут всё точно.

Я выдыхаю. Но работа важная, поэтому напоследок делаю ещё одну проверку: ищу в тексте PDF цитаты, которые мне выдал ChatGPT. И... не нахожу ни одной.

Пишу об этом в чат, говорю: мол, кажется, в тексте такого нет. Мой друг говорит, что статья — на другую тему. Он уверенно: нет, твой друг ошибается, вот цитаты.

Думаю — что-то странное. Кидаю файл и аналогичный запрос в другую LLM, Claude. Его ответ буквально: статья совсем о другом, приведённая цитата ему не соответствует. Пу-пу-пу.

Что хочу сказать в качестве выводов:
— «Отключать мозг» при работе с LLM строго запрещено. Если берёте результат модели, вы должны проверить его максимальным количеством способов. Да, надо зайти по всем ссылкам, найти первоисточники и точные цитаты.

— Мы привыкли к тому, что модели быстро признают свои ошибки. Но оказывается, что они могут идти в них до конца. Даже просьба перепроверить и прямое указание на подлог — не всегда гарантия исправления.

— Закинуть повторную просьбу другой модели или в другой чат — всегда хорошая идея.

А какой у вас опыт с LLM? Есть полезные лайфхаки и истории?

Читать полностью…

data.csv

Сделали вместе с коллегами из Яндекса картинки о том, какую окрошку пытаются найти люди в поисковых запросах.

Начиналось всё с кваса и кефира, а закончилось окрошкой с килькой в томатном соусе, окрошкой с холодцом и окрошкой с редькой на рассоле.

Сошлись с Надей, что люди совсем разучились есть. На том интернет было решено закрывать 🙈

Читать полностью…

data.csv

Помимо каналов data.csv и «Сделай это красиво» в телеграме, у меня ещё есть блог в «Сетке»!

Это социальная сеть для нетворкинга от HH.ru — там много профессиональных каналов и разговоров про работу.

Если вы есть там — подписывайтесь, а если мы где-то взаимодействовали — смело добавляйте меня в друзья. Соцсеть пока работает только в виде мобильного приложения (iOS / Android), ссылка откроется там:

https://set.ki/channel/LZLaze9

Читать полностью…

data.csv

Зачем разговаривать с незнакомцами

The Pudding рассказывают об исследовании, где учёные из Стэнфорда и Чикагского университета проанализировали более 1700 видеозвонков — по 30 минут каждый. В эксперименте сводили случайным образом двух незнакомцев: они могли иметь разные политические взгляды, быть разного пола, возраста и расы. Цель проста — посмотреть, что происходит, когда незнакомцы разговаривают друг с другом.

Почти никто не ждал от разговора ничего хорошего. Но уже в процессе многие начинали делиться очень личным — говорили о тревоге, потере, семье. Один участник признался: «Я рассказал тебе вещи, о которых не говорил своим близким друзьям». А в конце почти все говорили, что общение оказалось приятнее, чем они думали. Настроение у большинства стало лучше — люди чувствовали себя более счастливыми, бодрыми и живыми. Разность в возрасте, расе, взглядах или образовании почти не мешала — наоборот, иногда делала разговор глубже.

Этот эксперимент напомнил: разговор с незнакомцем может дать больше, чем мы ждём. Он не обязательно неловкий или утомительный — а может быть тёплым, живым и удивительно личным. Мы окружены людьми, с которыми никогда не говорили. И, может быть, зря.

На лендинге — как всегда — красивые визуализации и очень интересный сторителлинг:
https://pudding.cool/2025/06/hello-stranger/

Читать полностью…

data.csv

Моя коллега Надя Андрианова наделала в прошлом году какой-то невероятной красоты. Участвуя в челлендже по визуализации данных, она решила использовать всю силу подручных средств: вместо привычных графиков в её работе ткань, бумага, пайетки и свет.

Каждая работа — живая метафора, где материал подобран не случайно. Дни с облаками в Москве — сотканная мозаика из блестящих лепестков. Визуализация качества воздуха — из марлевых масок. А моя любимая — про возобновляемые источники энергии — показывает данные в виде пламени от свечи, которую надо аккуратно вставить в альбом визуализаций.

Проект Нади на днях получил золото главного инфографического конкурса Information is Beautiful 🏅🏅🏅

Надю — поздравляем, а всем остальным — срочно вдохновляться:
https://designingnumbers.tilda.ws/worldintangiblefragments_en

Читать полностью…

data.csv

Украинское издание Texty пишет о том, как в российской официальной риторике меняется отношение к Сталину.

Короткий ответ — памятников всё больше, а упоминания в официальных речах президента из негативных превратились в положительные.

Расстроило, что временную шкалу на графике сделали неправильно — много пропущенных лет в реальности никак не обозначили, что частично искажает восприятие данных (занудничаю про визуализацию)

Своеобразной кульминацией стало открытие барельефа вождю на метро Таганская в Москве. Проезжаю его почти каждый день, и только один раз чудом видел это место без охраны.

Исследование (не открывается из России)

Читать полностью…

data.csv

Нейросети жаждут

Если верить Bloomberg, ИИ не только пишет тексты и делает картинки — он ещё и пьёт воду. Много.

Речь про дата-центры, где работают нейросети вроде ChatGPT и Gemini. В прошлом году только в США такие центры потратили почти столько же воды, сколько весь Нью-Йорк. Вода нужна, чтобы охлаждать серверы — особенно летом, когда температура внутри может переваливать за 40 °C.

Самое парадоксальное — где именно строят эти центры. Один из кампусов Microsoft стоит в Аризоне, рядом с городом Гудиер, где воды и так немного. Meta, Oracle и Amazon — там же. Google — в Юте, где воду берут из той же речной системы, что питает озеро Мид (а оно мельчает).

Дата-центры с ИИ строят в зонах с дефицитом воды по всему миру — от Китая и Индии до Германии и Австралии. Россия тоже в списке: уже 92 центра расположены в регионах с высоким водным риском.

Компании выбирают эти места не случайно: там дёшево, много земли и сравнительно просто получить разрешения. Но климат в этих регионах становится суше, и всё чаще звучит вопрос — как долго такой подход сможет просуществовать.

Полный разбор (и красивые графики) — тут:
https://www.bloomberg.com/graphics/2025-ai-impacts-data-centers-water-data

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Что будет, если ваша страна станет центром мира?

Занимательный инструмент от проекта Engaging Data в очередной раз напоминает: все карты врут.

Автор берёт один из самых популярных способов изображения Земли — проекцию Меркатора — и предлагает простую, но эффектную мысль: а что если центр этой карты будет не в привычной нам точке, а где угодно? Например, в Узбекистане. Или в Чили. Или в Сомали.

Результат дезориентирует. То, что казалось краем света, внезапно оказывается в центре. А Европа или Африка — где-то сбоку. Потому что карты не просто отображают мир, они ещё и формируют наше представление о нём.

Поиграться:
https://engaging-data.com/country-centered-map-projections/

Читать полностью…

data.csv

В ноябре я выступал на Матемаркетинге — одной из крупнейших российских конференций, посвящённых аналитике

Не все знают, но команда «Матемаркетинга» делает ещё одну крупную конференцию весной, с бо́льшим уклоном в технологии — Aha!
На Aha!25 разберут кейсы интеграции LLM, ML и AI в цифровые сервисы, cовременные подходы к A/B-тестированию, обсудят оцифровку пользовательского опыта, применение машинного обучения в управлении продуктом и другие проблемы в сфере данных, ML и проектирования продуктов.

Конференция платная. Попросил у организаторов скидку для читателей канала, получить можно по ссылке по промокоду DATACSV10

Программа: http://ahaconf.ru/program

Читать полностью…

data.csv

Необычный способ показать долю и количество домашних животных, сохранив при этом относительное расположение стран

Правда, при всей красивости, шансов быть понятной у такой инфографики мало — географических паттернов тут не видно, понять, кто где является лидером — крайне сложно, даже перекос кошек и собак просто так не найти.

Но для чего-то с ярко выраженной географией попробовать можно. Типа, источники энергии? Или их производство?
Кидайте в комменты свои варианты)

Инфографика: @theeuropeancorrespondent

Читать полностью…

data.csv

Что скрывается за торговой войной Трампа

Корабль OOCL Violet, прибывший из Поднебесной в порт Лос-Анджелеса, стал символом последствий эскалации торговой войны между США и Китаем. На борту находились товары на сумму $564 млн, а новые пошлины на эти товары составили 417 миллионов!

Интересно, что Bloomberg тут нарушают одну из заповедей хорошего дата-визуализатора: никакого 3D в столбиках! Но делают это так талантливо, что можно смириться — правила можно нарушать тем, кто умеет это делать.

Или нет?
Если график нравится — ставьте 🔥
Если нет — 🙈

https://www.bloomberg.com/graphics/2025-china-ship-cost-in-tariffs-trade-war/

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Одно из самых безумных исследований, которые я видел. The Pudding решили выяснить, как животные на винных этикетках влияют на вина: какие чаще оказываются вкусными, а какие — переоценёнными.

Они собрали почти 1500 бутылок с животными — от кошек и птиц до насекомых и амфибий — и сравнили их по рейтингу и цене. И самое странное, что связь нашлась!

Выяснилось, что птицы — почти всегда выгодная покупка. Кошки — дороже, но чаще хороши. А вот вина с лягушками, змеями и прочими рептилиями — почти всегда стоят больше, чем заслуживают. В среднем животное на бутылке снижает её цену примерно на $3 — при том же качестве.

Теперь будем надеяться, что эту статью не увидят производители вин:

https://pudding.cool/2025/04/wine-animals/

Читать полностью…

data.csv

Наш проект про достопримечательности России сегодня висит на главной странице Яндекса

Коллеги сделали там другую версию, меньше сервис, больше фан: отрисовали всё в виде магнитиков на холодильнике

https://ya.ru/wow-places

Если видели оба, какой вам больше зашёл?
🫡 — без магнитов (из прошлого поста)
👾 — с магнитами (версия из этого поста)

Читать полностью…

data.csv

Что в России происходит с врачами?

Число врачей по большинству специальностей увеличивается, число наиболее квалифицированных в последние годы — сокращается. Всего врачей в России много, но терапевтов — почему-то — мало. Это выводы из работы моей студентки Прасковьи Бирюковой, визуализации к которой она делала в качестве дипломного проекта на курсе «Эстетика в графиках».

Вот её открытия в ходе работы над проектом:

Именно с врачами первичного звена (терапевтами и педиатрами) пациент встречается в первый раз в случае возникновения заболевания, и именно от этих врачей во многом зависит то, насколько своевременно и квалифицированно пациенту окажут медицинскую помощь. <...>

К сожалению, выводы анализа свидетельствуют о дефиците высококвалифицированных кадров в государственных учреждениях и низкую обеспеченность населения России терапевтами. Открытием для меня стало сокращение числа врачей санитарно-противоэпидемической группы почти в 2 раза с момента распада Советского Союза. И это — в ситуации, когда сохраняется угроза возникновения инфекционных заболеваний, пандемий; снижение качества пищевой продукции.


P.S. Поработать над подобным дипломным проектом под моим наблюдением можно на курсе «Эстетика в графиках». Уже скоро анонсируем запись на следующий поток, а пока можно записаться в лист ожидания.

Записавшимся — напомним про курс и дадим самые большие скидки.

Читать полностью…

data.csv

Нашёл новый интересный проект с «физическими» визуализациями — Data You Can Touch. Автор мастерит «инфографику» из подручных материалов, создавая масштабные объёмные инсталяции.

На сайте выложено 4 проекта и behind the scenes: можно с разных углов рассмотреть, как это было сделано.

enjoy:
https://datayoucantouch.com/

P.S. недавно писал про похожий проект от Нади Андриановой

Читать полностью…

data.csv

Где в России — деньги, а где — пшеница?

Сегодня я к вам с рекомендацией канала — Случайное блуждание.

Его автор, Станислав Адамайтис — практикующий экономгеограф. Он изучает, как экономика распределяется по территории, где сосредоточены ресурсы, люди, производство, транспорт и как всё это влияет на регионы.

В его канале много карт и интересной статистики, например:
Расположение компаний с выручкой 1 млрд;
Преобладающие с/х культуры по районам
Ответ на вопрос, где на самом деле живут россияне

Хотите лучше знать, как устроена наша страна, залетайте: @totalepc

Читать полностью…

data.csv

Не так часто публикую тут вакансии, но тут кому-то повезёт:

Точка ищет сразу трёх продуктовых аналитиков в свои команды. Что подкупило — указали вилку: успешному кандидату с грейдом senior обещают удалёнку по всему миру и зарплату до 550 тысяч рублей.

Обязанности — стандартные: проводить исследования, работать с финансовым моделированием и помогать команде принимать решения на основе данных. Ждут SQL, умения работать с графиками и выстраивания аналитики в продукте.

Про Точку слышал, что это финтех с классной штаб-квартирой в Екб без бюрократии и большой свободой в действиях.

Попробовать себя

Читать полностью…

data.csv

Артём Иволгин очень красиво проиллюстрировал, как расселены люди по России

«Добавляет» этой картинке тот факт, что на карте закрашены районы, а не фактические населённые пункты, где живут люди. И даже при этом на последней карте красным отмечена примерно половина территории страны 🤯

Читать полностью…

data.csv

Видео на выходные: что лежит «под капотом» конкурсной визуализации

Ещё одна награда Information is Beautiful ушла по сути российской команде — за проект Urbi Atlas: инфографику и рассказы о жизни и проблемах арабских городов

С одним из авторов, Александром Богачёвым, которого многие из вас знают, я в этом году делал интервью. Обсудили подходы, инструменты и пользу таких проектов для бизнеса. Всем, кто интересуется интересной аналитикой и хочет научиться так же — маст си:

/channel/data_csv/1508

Команду Urbi — поздравляю! Вы очень вдохновляете 🔥

Читать полностью…

data.csv

Больше половины читателей Т—Ж врали при устройстве на работу 🤯

Например, добавляли несуществующий проект в портфолио, преувеличивали навыки или свою значимость на прошлой работе, а то и вообще — указывали несуществующую должность.

Больше всего врут начинающие специалисты, выходящие на «большой рынок труда», а разницы между мужчинами и женщинами почти нет.

Правда, в материале справедливо отмечают, что врут все: соискатели про опыт, работодатели — про зарплату и карьерный рост. Достойно!

А вы врали в резюме или на собеседованиях?
👀 — да
🫡 — не было такого, даже по мелочам

https://t-j.ru/opros-pro-cv-i-sobesy-rez/

Читать полностью…

data.csv

ИИ меняет наш мир навсегда — и вот вам ещё один факт, подтверждающий это. The Economist рассказывает об эксперименте в Нигерии: в нескольких школах ученики использовали образовательную платформу с ИИ-ассистентом на базе GPT-4. Он помогал разбираться в задачах, отвечал на вопросы и подсказывал, как их решать — всё это происходило в обычных классах, под наблюдением преподавателей.

За шесть недель дети достигли прогресса, сопоставимого ранее с двумя годами обучения. Проверяли это с помощью обычного финального теста — без компьютеров и ИИ, на бумаге.

Но однозначно восхищаться пока рано. В статье пишут, что в Турции и Нидерландах похожие эксперименты дали совсем другие результаты: дети быстро привыкали к подсказкам, начинали полагаться на них слишком сильно — и после отключения ИИ справлялись хуже, чем те, кто учился без него.

И даже в случае с Нигерией есть оговорки. Во-первых, уровень подготовки у детей был настолько низкий, что почти любой понятный инструмент мог дать заметный прирост. А во-вторых — рядом всё время были учителя. Они помогали, подсказывали, объясняли, как пользоваться ботом. Так что понять, сработал ли именно ИИ, или всё дело во внимании со стороны взрослых, — не так-то просто.

Оригинал без пейволла

Читать полностью…

data.csv

Литературный прогноз: у Бунина — жара, у Блока — туман, у Пришвина — солнце

Коллеги из Яндекса прошлись по тысячам произведений и изучили в них всё, что связано с погодными явлениями — от тумана до антициклона.

Самое частое погодное слово у рускких классиков — ветер. Но даже он у всех разный: у Пушкина — осенний, у Блока — поёт, у Мережковского — воет. Бунин чаще других пишет о жаре и морозе. Пришвин — о тумане и солнце. А у Лермонтова — пасмурно.

Узнать погоду у вашего любимого автора:
https://yandex.ru/company/researches/2025/literary-weather

Читать полностью…

data.csv

Тут на днях законичлся очередной финал Евровидения. Хороший повод вспомнить работу Виктора Ямбаршева, которую он делал год назад в качестве диплома на моём курсе «Эстетика в графиках».

Следующий поток стартует только в августе, но сейчас можно записаться в лист ожидания. Записавшимся — напомним про курс и дадим самые большие скидки.

А как у вас с «Евровидением»? Болели за кого-нибудь?

Читать полностью…

data.csv

Узкое горло ИИ

Развитие искусственного интеллекта часто представляли как путь к демократизации технологий — мол, теперь любой студент может запустить стартап с ИИ. Но есть и обратная сторона: инфраструктура ИИ концентрируется в руках единиц.

Главный бенефициар — Nvidia. У неё сейчас около 80% рынка ИИ-ускорителей, а вместе с этим — монополия не только на «железо», но и на софт. Их платформа CUDA стала настолько незаменимой, что все крупные модели — от OpenAI до Meta — завязаны на неё.

Формально конкуренция есть, но выйти из экосистемы Nvidia — значит переписать тонны кода, потерять производительность и рискнуть миллионами. Это уже не просто поставщик, а операционная система современного ИИ.

Подробнее — в разборе Bloomberg

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Го учиться дата-журналистике под соснами?

В этом году снова открыта мастерская дата-журналистики на «Летней Школе». Кто не знает, ЛШ — это свободный образовательный проект, куда любая инициативная группа таланливых людей может подать заявку и учить других чему угодно: от танцев до физики.

Проект полностью некоммерческий, поэтому участники не платят за обучение, а только сдают небольшие взносы за питание и пользование электричеством.

Мастерскую делают многие мои таланливые коллеги: участвуют журналисты «Системного блока», проекта «Если быть точным», мои ближайшие коллеги из Яндекса и много других прекрасных людей.

От прокачки вас отделяет только тестовое задание:
https://letnyayashkola.org/data-jour/

Читать полностью…

data.csv

Вот так новость!
Оказывается, в свой день рождения по разным оценкам умирает от 6 до 14% больше людей, чем в среднем в любой другой день года.

Это явление называется Birthday Effect, оно встречается во множестве научных работ, но пока не имеет чёткого объяснения. Одна из гипотез — в том, что пожилые и тяжело больные люди как будто «удерживают» себя до важной даты, а после неё наступает психологический спад. Другие версии связывают эффект с празднованием: стрессом, перееданием, алкоголем и возможными травматичными последствиями.

Сам материал — крутое пособие для начинающих аналитиков, о том, как проверять гипотезы. Автор The Pudding наглядно и последовательно исследует реальные данные, чтобы убедиться, является ли «эффект дня рождения» случайностью — или в него можно верить на самом деле.

https://pudding.cool/2025/04/birthday-effect/

P.S. Пережил своё 29-летие 3 дня назад. Кажется, можно расслабиться 😄

Читать полностью…

data.csv

«Город гаснет» — так кажется, если смотреть на ночные снимки Саудовской Аравии: с 2018‑го целые кварталы будто растворяются во тьме, и к 2021‑му их яркость в среднем падает на четверть.

Но это не закат, а тихая световая революция. Старые натриевые фонари заменяют LED‑светильники: они точнее направляют поток, меньше слепят и почти не попадают в диапазон, на который настроены спутниковые датчики. Для орбиты город тускнеет, для горожан — наоборот, становится безопаснее и уютнее.

Urbi Atlas разобрали этот парадокс на живых примерах Аль‑Хофуфа, Джидды и Эр‑Рияда, наложили демографию на данные со снимков NASA, добавили 3D-модели стадионов к ЧМ‑2034 и показали, как LED-освещение снижает энергопотребление уличного освещения на 30–50%, а при масштабном переходе по всему миру может сэкономить до 490 миллионов тонн CO₂ в год.

https://atlas.urbi.ae/bright-spots/

Читать полностью…
Подписаться на канал