Крупнейшие производители кобальта в мире, 2022 (Elements)
Кобальт в основном используется для изготовления литий-ионных батарей — 40% добытого в 2022 году кобальта участвовало в производстве аккумуляторов. Ещё он необходим для изготовления суперсплавов, пигментов и магнитов, а также широко применяется в терапии онокологических заболеваний
С большим отрывом лидирует Демократическая республика Конго — в 2022 в стране было добыто почти 145 тысяч тонн кобальта или 73,3% от мирового производства. Для сравнения — на втором месте находится Индонезия, которая добыла в прошлом году почти 9,5 тысяч тонн кобальта
Ещё мы писали:
— Крупнейшие производители стали в мире, 2022
— Крупнейшие производители нефти в мире, 2021
— Крупнейшие производители природного газа в мире, 2021
— Сколько металла и металлической руды было добыто в 2021 году
Общие объёмы убытков Uber с 2014 по 2023 год (Chartr)
Каждый красный прямоугольник — объём квартальных убытков
Второй финансовый квартал 2023 года стал первым с 2014, когда Uber показала прибыль. За последние 9 лет компания потеряла 31,5 миллиардов $
Ещё мы писали:
— Оценка доли рынка Яндекс.Убера
Объёмы производства электроэнергии в США по источникам, 1990–2022 (Chartr)
Объёмы указаны в мегаватт⋅часах
Другие данные по энергетике:
— Мировое потребление энергии по источнику, 1900–2021
— Количество материалов, которые нужно вложить в инфраструктуру разных типов энергии, чтобы произвести 1 тераватт-час
— Сколько земли требуется для добычи 1 МВтч из разных источников
— Как изменилась стоимость производства мегаватт-часа электроэнергии разных типов с 2009 по 2020 год
— Доля энергии из возобновляемых источников в энергобалансе стран мира, 2020
1 датасет, 100 визуализаций
Авторы проекта взяли за основу число объектов всемирного наследия в Норвегии, Дании и Швеции в 2004 и 2022 годах и представили их 100 разными способами. Целью было показать, насколько визуализация данных сложная и разнообразная дисциплина
Выше ряд примеров, остальные на сайте: 100.datavizproject.com
Ранее мы писали о другом проекте агентства Ferdio — Flag Stories. Там они сгруппировали флаги стран мира по цветам, формам, символам, пропорциям и многим другим признакам
Бразильские статистические атласы кофе начала 20 века (Departamento Nacional do Cafe)
В атласах можно найти данные о производстве и экспорте кофе в Бразилии с конца 19 века по 40-е годы 20 века. К каждой таблице приложены красочные иллюстрации с необычными шрифтами
Другие интересные справочники прошлого века:
— Статистический атлас Французского Индокитая 1914 года, Анри Бренье
— Всеобщий географический и статистический карманный атлас 1908 года
— Справочник цен на напитки и мороженое в Москве, 1938
@rationalnumbers
Уровень преступности в России в 2021 году (Если быть точным)
Согласно исследованию аналитиков проекта «Если быть точным», за 2021 год от 2 млн преступлений пострадали 1,3 млн человек. Количество зарегистрированных преступлений, идущих в статистику, составляет 15% от всех совершённых. Из всех дел в среднем расследуется 51%, среди киберпреступлений — всего лишь 23%
Самые частые преступления среди зафиксированных — кража и мошенничество (54%). Жертвами почти всех преступлений чаще становятся мужчины. Женщины чаще мужчин становятся жертвами только угроз убийством или причинением вреда здоровью, а также неуплаты алиментов. Число потерпевших детей выросло на 18% по сравнению с 2020 годом, а количество уклонений от алиментов — на 26%
Вопреки предрассудкам, лишь 3% преступлений совершаются мигрантами. Статистически «средний преступник» — гражданин РФ, мужчина 30-49 лет, со средним образованием
Публикацию с остальными данными можно посмотреть по ссылке
@rationalnumbers
Статистика самоубийств в мире, 1990–2020 (Our World in Data)
На диаграммах и картах выше:
— Число самоубийств на 100 000 населения, 2019
— Число самоубийств, 2019
— Число самоубийств, совершённых при помощи огнестрельного оружия, 2019
— Соотношение самоубийств среди мужчин и женщин, 2017 (чем выше значение, тем сильнее перевес в сторону мужчин)
— Соотношение самоубийств среди мужчин и женщин, 2017 (диаметром обозначена численность населения стран)
— Число самоубийств на 100 000 населения с разбивкой по полам, 2000–2019
— Число самоубийств с разбивкой по возрастным группам, 1990–2019
— Число самоубийств с разбивкой по возрастным группам в 6 странах мира, 2019
— Доля самоубийств от смертности в 8 странах мира, 1990–2019
В источнике по ссылке в описании можно посмотреть интерактивные версии. Некоторые из них позволяют настроить логарифмическое или линейное отображение, а также выбрать список стран для отображения данных
Другие наши публикации про суициды:
— Связь наличия высшего образования и смертности от суицида, алкоголя и наркотиков в США
— Топ-15 стран по числу суицидов на 100 тысяч человек, 1990–2018
— Сравнение уровня суицидов среди американских ветеранов и среди гражданских, 2001–2014
— Причины смерти музыкантов и жанры музыки
Как форма снежинок зависит от температуры и влажности (Visual Capitalist)
По вертикали указана температура в °C и °F, по горизонтали — влажность
На канале Veritasium выходил ролик с подробным описанием природы снежинок. В нём рассказывают, почему у них именно 6 лучей и как получаются снежинки в виде конусов. Версия на русском языке
Ещё мы писали про снег:
— Площадь снежного покрова Северного полушария Земли
— Вероятность снега на Рождество в Европе
— Климатические изменения в Арктике
Какова вероятность выиграть в лотерею в России, 2021 (Тинькофф Журнал)
Если брать данные из отчёта «Столото» отдельно по игре «7 из 49», то в среднем игрок имеет шансы на джекпот 1 к 86 млн и на выигрыш в 86₽ с вероятностью в 20,9%. Всего в этой лотерее в 2021 году было продано 68,8 млн билетов по средней цене в 34₽, 14,3 млн билетов из них были выигрышные, общая сумма выигрышей — 1,24 млрд ₽. Математически это означает стопроцентный шанс выиграть 18₽ — сумму выигрыша (86₽) умножаем на его вероятность (20,9%). Если вычесть эту сумму из средней цены билета в 34₽, то получим -16₽ ожидаемой прибыли с билета в лотерее «7 из 49»
Вероятность выиграть миллион в любой лотерее на сайте «Столото» составляет 1 к 500000: в 2021 году было продано более 638 млн билетов, больше миллиона выиграли 1400 билетов (26 новых миллионеров в неделю). Средняя доходность с билета во всех играх в 2021 году колебалась от -2₽ до -76₽
В 2021 году операторы под брендом «Столото» продали лотерейных билетов на 60 млрд ₽ и потратили часть выручки следующим образом: 34 млрд ₽ — призовые выплаты, 7,5 млрд ₽ — в бюджет России, 18,4 млрд ₽ — на зарплату сотрудников, печать билетов, поддержку сайта и т. д. Чистая прибыль АО ТК Центр, которой принадлежит бренд «Столото», составила около 1% от общей суммы реализованных билетов
Также по этой ссылке можно изучить статью Т—Ж об устройстве российских лотерей
Источники данных: ВГЛ-5, Zoom Market, Анкетолог
Рациональные числа / Рациональные числа ++
Потребление этилированного бензина и доля детей с допустимым объёмом свинца в организме в США, 1940–2020 (Reddit)
Этилированный бензин — бензин с добавлением тетраэтилсвинца. Это вещество увеличивает степень сжатия топлива без детонации, отчего бензин лучше сгорает в двигателях внутреннего сгорания. Из-за содержания свинца этот вид топлива крайне опасен для людей
В 1972 в США было запрещено использование и производство двигателей, рассчитанных на этилированный бензин, а процесс вытеснения ТЭС-содержащего топлива завершился в 1986. Аналогичный запрет ввёл ЕС 1 января 2000 года, но в отдельных странах-участницах запрет начал действие намного раньше. В России этилированный бензин запрещён с 15 ноября 2002 года
На канале Veritasium выходило видео с историей этилированного бензина, где подробно разбираются причины его распространения и последствия для человечества
Данные учитывают детей до 10 лет, безопасным уровнем содержания свинца считается 5 мкг/дл
Рациональные числа / ++
Пять графиков перед четвёртым халвингом биткоина (Ecoinometrics)
Халвинг — заложенное в архитектуру биткоина регулярное уполовинивание комиссий майнеров. Оно происходит каждые 210 тысяч блоков. Также халвинг означает сокращение скорости выпуска новых биткоинов в обращения в два раза. Всего их было три, а запланировано 32. Последний халвинг состоялся 11 мая 2020 года, а следующий состоится примерно в апреле 2024 года
В 2009 году вознаграждение за каждый добытый блок в цепи составляло 50 биткоинов, сейчас это число стремится к 3,125. По состоянию на 23 мая 2023, в обращении находится около 19,3 миллиона биткоинов
На диаграммах выше — во сколько раз изменилась стоимость биткоина:
— с начала медвежьих рынков (когда биткоин терял в цене более 20% от предыдущих максимумов)
— до и после халвингов
— после халвингов
— до и после халвингов и активное предложение биткоина (обозначено цветом)
— до и после халвингов и соотношение покупок и продаж (чем выше соотношение, тем чаще покупали)
Данные с диаграмм актуальны по состоянию на 17 мая 2023 года
Ещё про биткоин:
— Курс биткоина и халвинг
— Спиральные графики показателей биткоина, 2009–2022
— Стоимость майнинга биткоина в странах мира, 23 марта 2022
— Выбросы CO₂ биткоина и других индустрий, 2021
— 14 лет со дня первой транзакции биткоина
Измерение неравенства: что такое коэффициент Джини?
Специально для читателей нашего канала мы перевели статью Our World in Data про коэффициент Джини. Как он рассчитывается, для чего полезен и чем отличается от других показателей неравенства — обо всём этом читайте на нашем сайте
Стоимость одной книги из 200 страниц в рабочих днях, 13–17 вв. (Our World in Data)
По вертикали указано число рабочих дней, шкала логарифмическая. Красным и синим указаны стоимости рукописных книг, синим — печатных. Напомним, что станок Гутенберга был изобретён в 1440-х годах
Ещё про производительность труда:
— Производительность труда и реальная медианная заработная плата в странах ОЭСР, 1995–2013
— За сколько часов можно заработать на iPhone X в разных городах
— Сколько часов в неделю в среднем работают американцы с различным уровнем дохода, 2022
Среднее число приложений у пользователей из разных индустрий занятости, 2017–2020 (Benedict Evans)
Данные основаны на ответах клиентов Okta — крупной американской компании, занимающейся защитой цифровых данных и оптимизацией рабочих процессов
Наши публикации про мобильные приложения:
— Самые скачиваемые мобильные приложения, первый квартал 2022
— Самые скачиваемые мобильные приложения, 2021
— Количество приложений в Google Play и App Store, 2022
— Динамика количества приложений в App Store, июль 2008 – март 2022
Динамика доли доходов 1% самого богатого населения в некоторых странах мира, 1910–2021 (Our World in Data)
На первой картинке — страны с U-образным трендом, где доля доходов самого богатого процента населения начала расти после долгого падения. На второй картинке — страны с L-образным трендом, где доля снизилась и практически не менялась со временем
Больше данных по неравенству в мире:
— Показатели экономического неравенства в мире, 1905–2021
— Распределение богатства в странах ОЭСР, 2019
— Динамика распределения доходов в мире, 1976–2023
— Пирамида глобального распределения богатства, 2020
— Индекс Джини по распределению национального дохода стран мира в 2018 году
Число пивоварен в США, 1900–2022 (Chartr)
Ещё мы писали про потребление алкоголя:
— Потребление пива и цены на него в разных городах мира
— Подушевое потребление алкоголя в год в странах Европы, 1980–2019
— Как менялось потребление спиртных напитков в странах мира, пиво/крепкие/вино, 1965–2015
— Потребление водки, пива и вина в России, 1990–2016
Количество космического мусора на разных орбитах Земли, 1961–2022 (Visual Capitalist)
По горизонтали — временна́я шкала, по вертикали — высота на орбите сверху вниз. Цветом обозначены страны, которые создали космический мусор. Снизу указано распределения общего количества мусора среди всех стран
Ещё мы писали про объекты на орбите Земли:
— Число искусственных объектов на орбите Земли, 1963–2023
— Распределение объектов на орбите Земли
— Распределение космического мусора на низкой орбите Земли
— Количество космического мусора диаметром более 10 см, 1960–2022
— Интерактивный лонгрид об угрозе космического мусора
Распределение мировых запасов лития по странам, 2023 (Chartr)
Размером обозначена доля от мировых запасов
Больше данных по литию:
— Крупнейшие производители лития в мире, 2022
— Мировые объёмы добычи лития по странам, 1995–2021
— Цена литий-ионных батарей и объём рынка, 1992–2016
Статистический атлас Французского Индокитая 1914 года, Анри Бренье (Gallica)
В книге можно найти данные о населении, административном строении, агрокоультуре, промышленности, финансах, и других социально-экономических показателях бывшей французской колонии
Ещё публикации на эту тему:
— Всеобщий географический и статистический карманный атлас 1908 года
— Справочник цен на напитки и мороженое в Москве, 1938
Рациональные числа / ++
Количество калорий, потреблённых Брэдом Питтом в кадре, кассовые сборы и оценки фильмов с его участием (Reddit)
По горизонтали указано количество потреблённых в кадре калорий. По вертикали на первой диаграмме — кассовые сборы в млн $, на второй — оценки на IMDB
#рацкек
Ещё мы писали про киноиндустрию:
— Динамика количества выпущенных в прокат фильмов, 1909–2022
— Длительность фильмов с 1885 по 2005 год
— Динамика хронометража фильмов, 1995–2021
— Жанровое распределение фильмов, 1913–2021
— Самые успешные голливудские фильмы, 1970–2023
Статистика по наборам конструкторов Лего (Brian Moore)
На «лицевой стороне» визуализации история компании и количество выпущенных наборов с разным количеством деталей. На «обороте»: диаграммы с разбивкой по тематике и цветам деталей в наборе, а также 5 самых крупных конструкторов. Там же две диаграммы со средним количеством деталей в наборах и их выпущенное количество по десятилетиям (1950–2020)
Интерактивную версию можно посмотреть в источнике
Ещё про Лего:
— Механизм из лего с передаточным числом 1 к гуголу
— Наборы конструктора Лего с годами становятся больше и разнообразнее
— Зависимость между ценой наборов Лего и числом деталей в них
Визуализация первых 500 последовательностей чисел согласно гипотезе Коллатца (Reddit)
Гипотеза Коллатца — одна из нерешённых проблем математики, сформулированная 1 июля 1932 года. Она заключается в том, что при любом натуральном числе (n) мы рано или поздно получим 1, если n будем делить на 2, если оно чётное, или умножать на 3 и прибавлять 1, если оно нечётное. Последовательность с начальным числом 3 будет выглядеть так: 3, 10, 5, 16, 8, 4, 2, 1. Подробнее об этой гипотезе в ролике канала Veritasium: оригинал, перевод на русский язык
По вертикали — полученные в ходе операций числа, по горизонтали — количество операций. Для всех первых 500 натуральных чисел было достаточно до 140 операций
Другие публикации про математику:
— Число Грэма на пальцах
— Как часто встречаются разные цифры в первых 800 знаках числа Пи
— The Beauty of Pi — несколько красивых визуализаций числа Пи
@rationalnumbers
Если вы хотите стать аналитиком данных — приходите учиться в Практикум. Мы создаём курсы, чтобы наши выпускники находили работу, — 10 000 из них уже трудоустроились.
◾️ Практика, практика, практика
Учёба похожа на работу в обычной IT-компании: вы проводите учебные исследования, как настоящий аналитик, и следите за сроками. Вам помогают старшие товарищи — аналитики: наставники и ревьюеры.
◾️ Учёба, совместимая с работой
У нас есть программы с разной интенсивностью и мобильное приложение, чтобы учиться где и когда угодно. Если что-то пойдёт не так — можно взять паузу и продолжить с другим потоком.
◾️ Карьерная поддержка
Мы поможем составить резюме и портфолио, проведём тестовые собеседования и предложим партнёрские вакансии.
◾️ Прозрачные оплата и возврат
Оплачивать можно частями, почти как по подписке, — и отменить в любой момент. А если вы оплатите курс полностью и захотите вернуть деньги, достаточно просто написать в поддержку — мы вернём остаток за те материалы, которые вы не успели изучить.
Курс стоит 96 000 ₽, но в кредит или рассрочку получится от 5 000 ₽ в месяц.
→ Познакомьтесь с нами поближе в бесплатной вводной части.
#промо
Закон Бенфорда
Этот закон описывает то, как часто цифры будут первыми в числах из большого массива значений в реальной жизни. Например, единица в 6 раз чаще восьмёрки будет встречаться в начале чисел, что показано на первой диаграмме. По горизонтали — первые значащие цифры, по вертикали — вероятность их появления
Контринтуитивность закона позволяет выявлять мошенничества с финансами, фальсификации на выборах или подтасовки статистики. Если распределение цифр в массиве данных значительно отличается от распределения Бенфорда — числа с большой вероятностью имели искусственную природу. Например, при помощи этого закона пользователь с Reddit указал на подтасовки в данных о заболеваемости короной в России. На третьем изображении — его визуализация распределения цифр в количестве новых заболеваний коронавирусом в Германии, Великобритании, США и России
Необходимо понимать, что закон верен не для всех распределений. Он не работает, если заданы минимальные и максимальные значения или у величин только один или два порядка значений. Например, распределение цифр в списке компаний с доходом от 50 тыс до 100 тыс $ или показатели IQ у взрослых не будут под него подходить
В последнем вложении — распределение цифр в числе голосов, поданных за кандидатов на президентских выборах в США, по округам
Пять интересных корреляций на картах мира (Vivid Maps)
1. Карта округов штата Алабама. Береговая линия Мелового периода проходила через штат 100 миллионов лет назад и обогатила местную почву меловыми отложениями. Плодородный чернозём позволял активно заниматься земледелием, для которого фермеры в большом количестве привлекали труд чернокожих рабов. Позже чернокожее население начало составлять большинство в этих округах, а оно чаще голосоует за демократическую партию США
2. Результаты выборов по округам и места проживания племён коренного населения в штате Аризона
3. Карты боевых действий во время Испанской революции 1936 года и результаты выборов в 2019 году. Слева — расположение сил республиканцев и националистов, справа — голоса за консерваторов и за остальные партии
4. Карта всех мечетей в Германии, которая коррелирует с разделением страны на Западную и Восточную с 1949 по 1990 год. Авторы публикации предполагают, что это связано с мигрантами с Ближнего Востока, которые отдают предпочтение экономически более развитой половине Германии
5. Распределение голосов на выборах президента Польши в 2015 году и ареал обитания диких кабанов
Стоит помнить, что корреляция не означает причинно-следственную связь — мы уже писали о безумных корреляциях. Но корреляция не означает и отсутствие каузации, об этом комментаторы часто забывают
Другие интересные корреляции:
— Бан Трампа в Твиттере и снижение числа выявляемых заболеваний коронавирусом
— Потребление шоколада на душу населения и количество нобелевских лауреатов на 10 миллионов человек в странах мира, 2012
— Безумные корреляции
@rationalnumbers
Распределение суицидальных мыслей и плохого настроения по времени суток и сезонам (René Freichel, Brian A. O’Shea)
#пост_читателя
Окончательная выборка составила 10 448 людей из базы данных Project Implicit Health
На диаграммах:
A. плохое настроение
B. желание навредить себе
C. суицидальные мысли
D. оценка проблем и отклонений в поведении и мышлении
Другие данные про ментальное здоровье людей:
— Доля населения с ментальными расстройствами в странах мира, 2019
— Депрессия в странах мира, 2019
— Статистика самоубийств в мире, 1990–2020
— Число психиатров на 100 000 населения в странах Европы, 2019
Динамика индекса потребительских цен и номинальных и реальных заработных плат в Великобритании, 1750–2015 (Our World in Data)
Индекс потребительских цен (фиолетовый) выражен в относительных показателях, где 100 — уровень 2015 года. Синим и коричневым графиком обозначены реальные и номинальные заработные платы в фунтах в неделю. На второй диаграмме логарифмическая шкала
Ещё мы писали:
— Среднее число рабочих часов и средняя заработная плата в неделю в странах ОЭСР, 2022
— Производительность труда и реальная медианная заработная плата в странах ОЭСР, 1995–2013
— Распределение доходов в 1800, 1975 и 2015 годах
Индекс потребительских цен в 9 странах мира, 1960–2021 (Our World in Data)
Индекс на диаграммах выражен в относительных показателях, где 100 — уровень 2010 года. Если ИПЦ равен 120, значит, цены на 20% выше показетелей 2010 года
В интерактивной версии на сайте можно выбрать интересующие страны и построить собственные графики
Другие данные по ИПЦ и инфляции:
— Как менялся индекс потребительских цен в США в некоторых категориях товаров, 2020–2022
— Инфляция в странах мира, 2000–2022
— Динамика инфляции индекса потребительских цен в США, 1789–2022
Как менялось распределение занятости в США среди основных индустрий, 1870–1930 (Benedict Evans)
Сферы деятельности из диаграммы сверху вниз:
— сельское хозяйство
— лесничество и рыболовство
— добыча минералов
— обрабатывающее и машиностроительное производство
— транспорт и связь
— торговля
— государственная служба или иное
— профессиональные услуги
— бытовые или персональные услуги
— офисные профессии
Ещё мы писали про занятость в США и в мире:
— Доля трудоустроенного мужского и женского населения США от 25 до 54 лет, 1960–2023
— Доля безработных чернокожих в США, 1972–2023
— Безработица в США по президентским срокам, 1973–2018
— Число трудоустроенного населения, живущего за чертой крайней бедности, в мире и в странах Африки, 1991–2021
— Уровень безработицы людей с разными уровнями образования в России, 2016
— Где и кем работали россияне в 2021 году