Частотность латинских букв в английском и других европейских языках (настенька и графики)
Чаще всего в английском используются буквы S и E, больше всего слов начинаются с S и A. Самые популярные буквы в других языках:
— немецкий: N и E
— французский: S и E
— итальянский: N, A и E
— португальский: S и A
Также хотим напомнить про такую же работу Насти по буквам русского языка и проект Нади Адриановой и Владимира Терентьева
Интерактивная версия
Источник данных — Википедия
Больше лингвистических данных:
— Соотношение скорости и информативности речи в языках мира
— Самые распространённые языки в мире и в интернете, 2023/2024
— Число носителей крупных языков мира, 2023
— Первый и второй по популярности язык для изучения в Дуолинго в странах мира, 2022
Число смертей от предотвратимых причин на 100 тысяч человек в России, 2000–2018 (Если быть точным)
Согласно ВОЗ, предотвратимые причины смерти — это факторы риска, которые можно избежать. Например, курение, нездоровое питание, опасное сексуальное поведение и безрассудное вождение. Подобные причины не указываются в свидетельствах о смерти, но указываются в медицинских отчётах и исследованиях
Согласно официальным данным, более 400 тысяч россиян в год умирают от предотвратимых причин. Это каждая четвёртая смерть в стране. Этот показатель в России падает благодаря снижению числа смертей от рака лёгких, сердечно-сосудистых заболеваний и расстройств, связанных с алкоголем. Но темпы снижения остаются низкими из-за роста числа смертей от ВИЧ и диабета
Ещё мы писали про факторы смертности:
— Как войны и образ жизни влияют на смертность
— Как разные причины смертности меняются с возрастом во Франции
— Смертность от алкоголя в России и мире, 2000–2020
— Смертность в мире в числах, 1950–2020
— Статистика смертности от умышленных убийств в мире, 1990–2021
Распределение 1583 олимпийских спортсменов по росту (Reddit)
Синие графики — распределение среди мужчин, розовые — среди женщин
В данные включены параметры спортсменов, участвовавших в Олимпийских играх с 2008 по 2016 годы
Ещё про антропометрию:
— Распределение игроков НФЛ США по росту и весу, 1920–2014
— Средний рост 19-летних в странах мира, 2019
— Как менялся средний рост россиян, 1890–2019
— Как изменился человек за последние 150 лет
Сообщество TON создало приложение для подписи петиции к французским властям об освобождении Дурова. Подпишите, пожалуйста: /channel/tgresistancebot/letter
Читать полностью…Мировая карта облачного покрова, 2020 (Reddit)
Цветом обозначена доля небосвода, покрытого облаками. На первой картинке — зональные показатели, на второй — среднее значение по странам
Для расчётов использовались усреднённые данные с 2010 по 2020 годы
Источник — CRU TS
Ещё мы писали про атмосферу Земли:
— Наглядно о том, насколько тонка атмосфера Земли
— Карта выбросов NO₂, 2018
— Озоновый слой Земли, 1971–2022
— Концентрация CO₂ в атмосфере Земли за последние 800 тысяч лет
Как менялась ожидаемая продолжительность жизни в странах мира, 1950–2021 (Visual Capitalist)
По горизонтали — ОПЖ, по вертикали — количество стран с такой ОПЖ. Жёлтым цветом выделено среднее значение в мире
Ещё публикации на эту тему:
— Как менялась ожидаемая продолжительность жизни в странах мира, 2012–2021
— Расходы на здравоохранение и ожидаемая продолжительность жизни в странах мира, 2019
— Ожидаемая продолжительность жизни человека и 49 других видов животных
— Ожидаемая продолжительность жизни при рождении в некоторых развитых странах, 1960–2018
Хотите научиться работать с Big Data и освоить базовые навыки аналитики? Приходите на курс «Python для анализа данных».
За 3 месяца вы научитесь работать с Python и Big Data с нуля. Программа подходит для новичков, начинающих аналитиков и специалистов из смежных профессий.
На курсе вы:
— изучите основы синтаксиса Python, освоите работу с ключевыми инструментами и библиотеками;
— погрузитесь в исследовательский анализ данных и разберётесь в основах статистики;
— научитесь проектировать и проводить AB-тестирование.
Вас поддержат действующие эксперты в аналитике данных из компаний разных отраслей. А проекты, которые вы создадите, станут частью вашего портфолио. После курса вы получите удостоверение о повышении квалификации или сертификат о прохождении.
Первые 4 темы можно пройти уже сейчас — это бесплатно. Попробуйте, чтобы понять, подходит ли вам такой формат обучения.
→ Начать обучение бесплатно
#промо
Размерные ниши фауны на Земле (Reddit)
По вертикали — распределение по массе (в граммах) внутри класса, по горизонтали — распределение по классам. В данные не входят животные, масса которых составляет менее 10⁻¹² граммов
Другие наши публикации на эту тему:
— Распределение массы всех наземных млекопитающи
— Распределение различных видов биомассы по средам обитания
— Вся биомасса Земли на одной диаграмме
Мировые объёмы производства пластиковых отходов, 1980–2024 (Statista)
Объёмы отходов указаны в миллионах тонн с разбивкой на сферы применения пластика. Снизу вверх:
— упаковка
— потребительские продукты
— транспорт
— текстиль
— строительство
— электроника
— другое
Другие наши публикации про производство и утилизацию пластика в мире:
— Объёмы годового производства пластика в мире, 1950–2019
— Пластиковые отходы в мире, 2010–2021
— Мусор в мировом океане, 2007–2021
— Сколько тонн пластикового мусора в год выбрасывают страны в мировой океан, 2021
— Неправильное обращение с пластиковыми отходами в странах мира, 2019
Объёмы мировой выручки Nike, 1976–2024 (Statista)
Ещё мы писали про производителей спортивной одежды:
— Два графика про Найк, 1976–2021
— Что входит в цену кроссовок Найк
— Что входит в цену кроссовок Адидас
— Ежегодные чистые доходы и убытки Adidas в мире, 1992–2023
Эффект Даннинга-Крюгера в очередной раз не прошёл проверку реальными данными (Кинжал)
Лаборатория образовательных технологий Практикума проверила на больших данных мифы, связанные с образованием. В частности, выяснили, с чем коррелирует успеваемость студентов, что их мотивирует больше всего и когда они рекомендуют обучение другим. Ещё их данные опровергли эффект Даннинга-Крюгера
На первой картинке — кривая Даннинга-Крюгера. Этот график показывает, как в теории должна меняться уверенность студента в себе со временем обучения
На второй картинке — большие данные студентов Практикума. Красным и зелёным графиками обозначен уровень уверенности отчислившихся и окончивших обучение студентов. Жёлтым цветом отмечены места, где в теории должны быть границы зон на кривой Даннинга-Крюгера. Как мы видим, эффект в очередной раз не прошёл проверку реальными данными
Ранее мы специально для наших читателей переводили статью Блейра Фикса о том, почему эффект Даннинга-Крюгера — просто автокорреляция. Эффект описывает связь между уровнем компетенции человека и его уверенностью в собственных способностях. До обнаружения ошибки в исследовании авторов прошло более 15 лет, поэтому идея успела получить широкую популярность. В том числе в сфере образования
Разница между ожидаемой продолжительностью жизни среди мужчин и женщин в странах мира, 2022 (Reddit)
Разница рассчитана путём вычитания ОПЖ мужчин из ОПЖ женщин
Источник данных — The World Bank 1, 2
Больше данных по ОПЖ в мире:
— Ожидаемая продолжительность жизни в странах мира с разбивкой по полам, 2023
— Ожидаемая продолжительность жизни на момент рождения в 10 странах и в мире, 1900–2021
— Как менялась ожидаемая продолжительность жизни в странах мира, 1950–2021
— Расходы на здравоохранение и ожидаемая продолжительность жизни в странах мира, 2019
Первые прибыльные кварталы Uber с 2014 года и структура его выручки по сервисам (David Crowther, William Coulman)
Каждый красный прямоугольник на первой картинке — объём квартальных убытков. В августе 2023 года мы написали о первом финансовом квартале с 2014 года, когда Uber показала прибыль. С тех пор каждый квартал компании был прибыльным. С 2014 по 2023 годы Uber принесла убытков на 31,5 миллиардов $
На второй картинке — выручка Uber с разбивкой на сервисы такси, доставки еды и цифровых решений в сфере логистики за последние 6 лет
Ещё мы писали про Uber и другие компании с крупными объёмами убытков:
— Как изменилась выручка Uber во время коронакризиса
— Общие объёмы убытков Snap Inc с 2015 по 2023 год
— Выручка и чистые доходы Airbnb, 2015–2022
— Meta и искусственный интеллект в числах, 2021–2024
Вышла третья часть рубрики «одураченные статистикой», которую я веду на Т—Ж. В этом материале рассказал про пайчарты: манипуляции, связанные с трёхмерностью, сложением разных целых и легендарный «петушиный гребень».
https://journal.tinkoff.ru/stat-manipulation-pie/
Предыдущие статьи из цикла:
Первая, вторая
Число видов и степень родства разных семейств растений, 1792 (RJ Andrews)
В 1792 году немецкий ботаник Пауль Дитрих Гизеке изобразил семейства растений в соответствии с их родством. Число растений в семействе указано под названием и обозначено размером круга, сходство описано подписями на границе кругов
Больше визуализаций из прошлых веков можете найти по хэштегу #ретродатавиз
Как снизился спрос на фрилансеров после выхода ChatGPT и генераторов картинок, 2021-2023
Учёные провели интересное исследование о влиянии генеративных ИИ на работы, подверженные автоматизации (automation-prone jobs). К подобным работам относятся, например, написание кода и текста или создание графического дизайна
Исследователи проанализировали 1,2 миллиона фриланс-заказов от 541 тысячи работодателей с июля 2021 по июль 2023 года. Выборка включала анкеты из 61 страны, на которые приходится 95% всех заказов. Для измерения влияния рассчитывали, насколько изменилось число заказов в различных профессиях
На первой картинке — результаты расчётов, красные полоски — даты выхода ChatGPT и первого генеративного ИИ по созданию изображений. В таблице — оценки согласно различным методам рассчёта
В среднем спрос на написание текста и кода за два года упал на 21%, на графический дизайн и 3D-моделирование — на 17%. Сильнее всего упал спрос на редакторов — в среднем на 30,37%. Заказов по разработке ПО, приложений и сайтов стало меньше на 20,62%. Генеративный ИИ не пощадил и инженерные профессии — число заказов снизилось на 10,42%
Другие наши публикации про влияние ИИ:
— Индустрия искусственного интеллекта в числах, 2010–2022
— Насколько выросла в мире доля научных статей с упоминанием искусственного интеллекта и машинного обучения, 1985–2022
— Число изображений, сгенерированных 5 популярными нейросетями, по состоянию на август 2023
— Почти половина новостных изданий запретили ИИ-компаниям сканировать свои сайты, 2023
— Как интерес к ИИ повлиял на доходы острова Ангилья, 2017–2023
ВВП на душу населения и среднегодовая температура в странах мира, 2021 (Reddit)
Размером кругов обозначена численность населения
Другие интересные корреляции:
— Пять интересных корреляций на картах мира
— Число метал-групп на миллион человек и средний уровень счастья в странах мира
— Число самоубийств на 100 тысяч человек и средняя высота в 10 самых «высоких» и «низких» штатах Америки, 2019
— Потребление шоколада на душу населения и количество нобелевских лауреатов на 10 миллионов человек в странах мира, 2012
Атака французского государства на Павла Дурова и Телеграм — это атака на вас лично, уважаемые читатели, и никак иначе это воспринимать нельзя
Вот, написал свои мысли на этот счёт: https://telegra.ph/EHto-akt-vojny-protiv-tebya-username-08-27
Количество заражений до и после изобретения семи разных вакцин в штатах Америки, 1928–2010 (The Wall Street Journal)
Цветом обозначно количество зафиксированных случаев заболевания на 100 000 человек. Верткиальная чёрная линия — дата изобретения вакцины от болезни
Среди болезней:
— корь
— гепатит А
— свинка
— коклюш (данные с 1956 по 1973 отсутствуют, вакцину изобрели в 1914 году)
— полиомиелит
— краснуха
— оспа (вакцину изобрели в 1800 году)
Ещё данные на эту тему:
— Оценка примерного числа жертв крупнейших пандемий в истории человечества
— Смертность от коронавируса и статус вакцинации, 2021
— Вакцинация и ВВП
— Отношение к вакцинации в мире в 2018 году
Как соотносятся ожидаемая продолжительность жизни и пенсионный возраст в странах G20, 2023 (Reddit)
На первой диаграмме — сравнение двух показателей, где бóльший показатель — ОПЖ. На второй картинке — ожидаемая продолжительность пенсии, то есть разница между двумя показателями
В России по состоянию на 2023 год ОПЖ мужчин составляет 67,5 лет, женщин — 78 лет. Пенсионный возраст с 2018 года — 65 и 60 лет соответственно. То есть, показатель на диаграмме для России составит 2,5 года для мужчин и 18 лет для женщин
Ещё мы писали про пенсионный возраст:
— Разница между пенсионным возрастом и ожидаемой продолжительностью жизни в европейских странах
— Средний возраст фактического выхода на пенсию в странах Европы, 2020
Крупнейшие страны мира по производству риса, 2022 (Visual Capitalist)
В 2022 году в мире было произведено почти 780 миллионов тонн риса. Это четвёртый по объёмам производства зерновой злак в мире после пшеницы, кукурузы и сахарного тростника
Источник данных — UN Food and Agriculture Organization
Больше про мировых лидеров по выращиванию продовольственных культур:
— Крупнейшие поставщики и покупатели пшеницы в мире и Россия в мировом экспорте зерна, июль 2020 – июнь 2021
— Топ-12 производителей хлопка в мире, 1981–2020
— Дюжина крупнейших производителей томатов в мире, 1981–2021
— Крупнейшие страны мира по производству какао, 2022
— Дюжина крупнейших производителей арахиса в мире, 1982–2021
— Топ-10 производителей имбиря в мире, 1982–2020
Доказанные объёмы мирового запаса природного газа по странам, 2021 (Visual Capitalist)
Доказанные запасы природного газа — это объём природного газа, который может быть добыт при существующих экономических и производственных условиях. Данные на картинке — результат геологических и инженерных анализов в рамках bp Statistical Review of World Energy по состоянию на 2021 год
Мировые запасы природного газа оцениваются в 188,1 триллионов м². Из них 37,4 триллиона м² принадлежит России, что составляет 19,9% мировых запасов
Ещё мы писали про запасы и добычу полезных ископаемых:
— Объёмы добычи сырой нефти, природного газа и угля в мире, 1900–2020
— Крупнейшие страны по добыче природного газа в мире, 2021
— Динамика относительных объёмов газа в странах Европы по источникам, 2021–2022
— Динамика зависимости стран ЕС от импорта энергоресурсов, 2000–2020
Снижение числа просмотров крупных российских блогеров на YouTube в начале августа (New Media 1, 2)
В середине июля 2024 года российские власти начали «замедлять» работу YouTube на территории России без полной блокировки. Мотивируют они эту меру цензурой видеохостинга: руководство YouTube с 2020 года удалило более 200 каналов российских СМИ и блогеров. 173 из них были удалены за последние два года
New Media в своём исследовании сравнили число просмотров с 29 июля по 4 августа и с 5 по 11 августа. За этот период суммарное число просмотров 62 российских блогеров с 5+ миллионами подписчиков упало в среднем на 20%
Вот некоторые блогеры и процент падения их просмотров неделя к неделе:
— Miss Katy (25 млн подписчиков): -93%
— Познаватель (20 млн): -74%
— TheBrianMaps (18 млн): -62%
— tuzelity Shuffle (36 млн): -61%
— Хабиб (9 млн): -58%
— А4 (65 млн подписчиков): -55%
— Владус (9 млн): -51%
— Маша и Медведь (49 млн): -50%
— Дима Масленников (18 млн): -33%
Были и блогеры, просмотры которых упали незначительно или вовсе выросли за этот период:
— Wylsacom (11 млн): -8%
— Chapitosiki (26 млн): -3%
— EdisonPts (17 млн): +14%
— Compot (16 млн): +19%
В России уже применяли подобную меру: в 2021 году власти «замедлили» Twitter, а в 2022 году — Facebook и Instagram. Позже эти ресурсы были полностью заблокированы и стали доступны только из-под VPN
Источник данных — JagaJam
Ещё мы писали о влиянии блокировок соцсетей российскими властям на трафик в интернете:
— Динамика месячных охватов российской аудитории в 6 соцсетях, октябрь 2021–2023
— Как изменилась активность в социальных медиа в России за год с октября 2021 по октябрь 2022
— Как менялось число активных авторов в 8 соцсетях, февраль 2022 – август 2023
— Темпы роста Телеграма в России, 2017–2022
Как менялись ядерные запасы стран мира, 1950–2022 (Reddit)
Другие наши публикации про ядерное вооружение:
— Инфографика про историю ядерного оружия
— Число ядерных боеголовок по странам мира, 1945–2022
— Ядерные запасы США и СССР/России, 1950–2020
— Сравнение численности населения стран мира с ядерным оружием и без, 2022
Ожидаемая продолжительность жизни в странах мира, 2021 (Landgeist 1, 2, 3)
На первых трёх картах — ОПЖ по регионам Европы, Азии и Африки. На последней картинке — данные по всем странам мира
Источник данных — Global Data Lab
Ещё про ОПЖ в мире:
— Ожидаемая продолжительность жизни в странах мира с разбивкой по полам, 2023
— Ожидаемая продолжительность жизни на момент рождения в 10 странах и в мире, 1900–2021
— Расходы на здравоохранение и ожидаемая продолжительность жизни в странах мира, 2019
— Возраст старейшего живущего человека и средняя ожидаемая продолжительность жизни в мире, 1950–2023
Самый потребляемый вид мяса на душу населения в странах мира, 2020 (Visual Capitalist)
В данные также включены объёмы потребления рыбы и морепродуктов. «Остальное» — крольчатина, верблюжье мясо и мясо дичи
На первой картинке — самое потребляемое мясо в стране, на второй — топ-10 стран по потреблению разных видов мяса
Источник данныхх — Food and Agriculture Organization
Другие данные по производству и потреблению мяса:
— Производство и потребление мяса в мире, 1961–2018
— Распределение и плотность поголовья скота и птицы в мире, 2018
— Потребление разных видов мяса в странах ОЭСР, 2022
— Доля мясоедов, вегетарианцев и веганов в Великобритании, 2021
Сколько россияне оставляют на чай (Т-Банк)
Аналитический проект T-Data провёл исследование обезличенных данных о транзакциях клиентов Т-Банка, T-Pay и CloudTips в период с 1 января 2022 по 1 июля 2024 года. На диаграммах:
— В какие часы и дни недели оставляют больше чаевых в общепите
— Как изменилось распределение всех чаевых в России по регионам
— Сколько чаевых оставляют разные возрастные группы россиян
Основные выводы из исследования:
— В первом полугодии 2024 года россияне потратили на чаевые на 82% больше, чем в первом полугодии 2023 года. При этом число транзакций по оплате чаевых выросло за этот период на 26%
— Люди чаще оставляют чаевые в летние месяцы. Для ресторанов, баров и кафе «горячее время» ― с мая по октябрь
— Средняя сумма чаевых в первой половине 2024 года выросла на 45%. При этом средний счёт в кафе или ресторане вырос на 9%
— Самые щедрые чаевые клиенты оставляют ночью
Ещё про культуру чаевых:
— Как часто, кому и сколько чаевых оставляют американцы и европейцы, 2023
— Чаевые таксистам в зависимости от пола
Авиакатастрофы и их жертвы, 1946–2021 (Our World in Data)
На диаграммах — данные коммерческих авиакомпаний по судам с вместимостью 14+ пассажиров:
— Число авиакатастроф (синий) и угонов воздушных судов (красный)
— Динамика смертей в результате авиакатастроф и угонов воздушных судов
— Число авиакатастроф с погибшими на миллион коммерческих авиаперелётов в мире
— Число погибших на миллион пассажиров в год
— Соотношение числа пассажиров и количества авиакатастроф с погибшими в год
Ещё мы писали про авиацию:
— Авиационные происшествия, 1918–2022
— Все авиакатастрофы за 100 лет и 100 тысяч их жертв
— Число авиакатастроф и их жертв, 1948–2017
— Интерактивная визуализация мирового авиатрафика за 1 сентября 2022