Как менялись возможности систем ИИ по распознаванию речи и изображений относительно способностей человека, 1998–2020 (Our World in Data)
На диаграмме результаты прохождения тестов. За ноль взяты способности человека, за -100 — начальные способности ИИ. Среди тестов:
— распознование рукописного текста
— распознавание устной речи
— распознавание изображений
— понимание текста
— понимание языка
Выборка и методология проведённых тестов — в исследовании «Dynabench: Rethinking Benchmarking in NLP»
@rationalnumbers
Потребление разных видов мяса в странах ОЭСР, 2022 (Reddit)
Объёмы потребления указаны в килограммах на душу населения в год. Синий — мясо птицы, оранжевый — свинина, красный — говядина и телятина, голубой — баранина
Источник данных — OECD 2022
Ещё мы писали про потребление и производство мяса:
— Производство и потребление мяса в мире, 1961–2018
— Доля мясоедов, вегетарианцев и веганов в Великобритании, 2021
— Выручка компании Beyond Meat по кварталам, 2017–2021
— Распределение массы всех млекопитающих, 2015
@rationalnumbers
Чтобы начать карьеру в анализе данных, нужно выбрать направление. А для этого — как-то отличить друг от друга аналитиков данных, системных, продуктовых и бизнес-аналитиков, инженеров данных и специалистов по Data Science.
Яндекс Практикум запускает бесплатный курс, который поможет это сделать. Расскажем, чем занимаются разные аналитики, сколько они зарабатывают и как стать одним или одной из них.
Курс будет полезен, если
→ у вас нет опыта, но хочется работать в анализе данных;
→ хотите сменить профессию, но не знаете, с чего начать.
После курса можно будет пройти бесплатную вводную часть о профессии, которая понравилась. Там вы решите первые практические задачи настоящих аналитиков.
Начините путь в анализ данных вместе с Практикумом →
#промо
Количество сотрудников Google/Alphabet, Facebook/Meta, Apple и Microsoft, 2011–2021 (Chartr)
Также указан суммарный прирост сотрудников в каждой компании за период в 10 лет
Другие интересные данные про сотрудников технологических компаний:
— Крупные увольнения в технологических компаниях мира, 2020–2022
— Выручка 5 крупных медиа-компаний в пересчёте на одного сотрудника, 2013–2021
— 25 американских компаний с самыми высокими зарплатами, 2019
— Как долго работают сотрудники в 10 крупнейших технологических компаниях
— Медианный возраст сотрудников топовых технологических компаний
@rationalnumbers
Все увольнения в технологических компаниях США с января по ноябрь 2022 (Visual Capitalist)
В последние месяцы проходят массовые сокращения в крупных технологических компаниях. Во время пандемии коронавируса они испытали резкий рост и наняли сотни тысяч сотрудников. С окончанием локдаунов выручка многих компаний начала возвращаться к докоронавирусным показателям, и теперь они проводят сокращения штатов
Но не во всех компаниях сокращения вызваны последствиями локдаунов — например, в Амазоне 10 000 сотрудников оказались не нужны компании из-за внедрения частичной автоматизации процессов
Другие данные про сотрудников технологических компаний:
— Крупные увольнения в технологических компаниях мира, 2020–2022
— Выручка 5 крупных медиа-компаний в пересчёте на одного сотрудника, 2013–2021
— 25 американских компаний с самыми высокими зарплатами, 2019
— Как долго работают сотрудники в 10 крупнейших технологических компаниях
— Медианный возраст сотрудников топовых технологических компаний
@rationalnumbers
Какую математику нужно знать, чтобы попасть в IT?
Многие люди, которые хотели попасть в IT, отказывались от этой идеи, когда вспоминали свои школьные оценки по математике.
У нас есть хорошая новость: математика – это интересно, не так уж сложно и доступно всем. В Яндекс Практикуме есть бесплатный тренажер по математике для тех, кто хочет освежить знания, и полноценный математический курс для аналитиков данных.
На вебинаре «Какая математика нужна аналитику и специалисту по Data Science» спикер Ольга Матушевич, наставник курса «Анализ данных» расскажет:
— какую именно математику нужно знать, чтобы зайти в IT;
— как нормально хорошо зарабатывать;
— как решать интересные и сложные задачи;
— как стать супер-экспертом;
— примеры реальных рабочих задач на каждом из этих уровней;
— список тем/учебников/материалов под каждый уровень.
Приходите 13 декабря в 15:00
#промо
Карта мира, где площадь стран зависит от численности их населения, 1800–2100 (Reddit)
Другие интересные карты с населением стран мира:
— Плотность населения Земли, 2022
— Самые густонаселённые области планеты, 2020
— Минимальные круги с 25%, 50% и 75% населения, 2015
@rationalnumbers
Первый и второй по полуярности язык для изучения в Дуолинго в странах мира, 2022 (Duolingo)
Другие интересные данные про языки:
— Какие иностранные языки изучают россияне, 2010
— Самые распространённые языки в интернете
— Топ-10 языков мира по числу носителей
@rationalnumbers
Интерактивная визуализация падения астероида (Neal.Fun)
В настройках можно выбрать материал астероида, его диаметр, скорость и угол падения. На карте будут изображены диаметры кратера, огненного шара, ударной волны, ветров и землетрясения. Справа — количество жертв, описание разрушений и частотность падения подобных астероидов
На картинках результат падения каменного астероида диаметром ≈450 м со скростью ≈61 тысяча км/ч. Средняя скорость движения комет — 20 км/с или 72 тысячи км/ч
Другая визуализация потенциальных разрушений:
— Интерактивная визуализация последствий ядерного взрыва
@rationalnumbers
Сколько стоят бензин, электричество и газ для домохозяйств в странах мира, 2022 (Visual Capitalist)
Средние цены указаны в американских долларах, за бензин — в $/галлон (≈ 3,79 л), за электричество и природный газ — в $/кВт⋅ч
Данные по бензину актуальны по состоянию на 31 октября, по электричеству и газу — по состоянию на 31 марта
Другие наши посты об электроносителях:
— Сколько долларов стоит литр бензина в разных странах, февраль 2022
— Доля населения с доступом к электричеству в странах мира, 1990–2020
— Мировое потребление энергии по источнику, 1900–2021
— Сколько ископаемого топлива потребляет средний житель США за год и за всю жизнь
@rationalnumbers
📈 Где самая высокая инфляция в мире
Сегодня большинство стран сталкивается с двузначными или даже трехзначными темпами роста цен (приведены самые последние данные):
1. 🇿🇼 Зимбабве – 269%
2. 🇱🇧 Ливан – 162%
3. 🇻🇪 Венесуэла – 156%
...
6. 🇦🇷 Аргентина – 88%
7. 🇹🇷 Турция – 85,5%
14. 🇲🇩 Молдова – 34,6%
20. 🇺🇦 Украина – 26,6%
22. 🇱🇹 Литва – 23,6%
23. 🇪🇪 Эстония – 22,5%
26. 🇱🇻 Латвия – 21,8%
31. 🇰🇿 Казахстан – 18,8%
Подробнее здесь, @mapsanddata
Крупнейшие штрафы, выписанные технологическим компаниям за нарушение Общего регламента по защите данных (GDPR) (Statista)
Размеры штрафов скорректированы в соответствии с инфляцией по состоянию на 1 декабря 2022 года
Общий регламент защиты персональных данных был принят Европейским союзом 27 апреля 2016 года и вступил в силу 25 мая 2018
Другие наши публикации на эту тему:
— Крупнейшие утечки данных в мире, 2004–2022
— Визуализация 50 крупнейших утечек данных, 2004–2021
— Размер штрафа, который заплатил Гугл за отслеживание местоположения пользователей Андроид без их согласия
@rationalnumbers
Количество зафиксированных случаев заболевания коронавирусом в день в Китае, 2022 (Statista)
23 ноября в Китае начались протесты против действующей партии и проводимой ею политики «нулевого ковида». Акции усилились после пожара в Урумчи 24 ноября, в котором погибло 10 человек — пожарные не смогли оперативно добраться до здания из-за ограничительных мер местного локдауна. По одной из версий, дом был окружён забором
Протестующие считают, что методы борьбы с коронавирусом потеряли эффективность — 23 ноября в Китае было зарегистрировано 31 444 новых случая заражения, несмотря на строгие ограничительные меры
Стоит отметить, что эти данные — официальные данные китайских властей, и относиться к ним стоит со скепсисом
Ещё данные на эту тему:
— Ежегодное количество экономических показателей Китая в свободном доступе, 1960–2022
— Официальная и расчётная смертность от коронавируса по странам за 2020 год
— Смертность от коронавируса и статус вакцинации, 2021
— Число подтверждённых смертей от коронавируса на миллион населения в Швеции, Дании, Финляндии и Норвегии
Рациональные числа
Количество подписчиков у музыкальных стриминговых сервисов, 2021 (Genuine Impact)
Долевое распределение 494,5 млн подписчиков среди компаний указано в абсолютных числах и %
Ещё данные на эту тему:
— 12 крупнейших стриминговых сервисов по количеству подписчиков, 3 квартал 2022
— Сколько за всё время заработали 20 самых популярных исполнителей на Spotify
— Выручки в индустрии музыкальной записи с разбивкой по носителям и агрегаторам, 1980–2020
— Примерные данные о математике музыкальных стриминговых сервисов и заработке независимых музыкантов
Рациональные числа
Индекс человеческого развития и рождаемость в странах мира, 1990–2020 (Reddit)
ИЧР указан по горизонтали, рождаемость — по вертикали. Размером кружков обозначена численность населения стран
К сожалению, редакции не удалось обнаружить информации о том, все ли страны мира отражены на диаграмме или лишь часть
Другие данные на эту тему:
— Как изменился индекс человеческого развития в странах мира, 2019–2021
— Факторы низкой рождаемости в России
— Браки и разводы в мире, 1970–2022
— Население, ВВП на душу населения, индекс счастья и религии в странах мира, 2020
Рациональные числа
Производительность систем искусственного интеллекта, 1950–2022 (Our World in Data)
На вертикальной логарифмической шкале указана производительность во FLOPS. Временная шкала поделена на эру глубокого обучения ИИ и до неё. Цветами обозначены области применения систем: зрение, игры, рисование, языки и другие
Авторы утверждают, что в эпоху до глубокого обучения производительность ИИ в соответствии с законом Мура удваивалась примерно каждые 20 месяцев, сейчас — каждые полгода
Ещё про закон Мура и реальность:
— Стоимость 1 МБ памяти на цифровых носителях, 1956–2020
— Динамика скорости и стоимости секвенирования генома, 1980–2020
— Число транзисторов в микропроцессорах и предсказание закона Мура, 1970–2017
@rationalnumbers
Производство и ловля рыбы в мире, 2022 (Reddit)
Белым посдвечены зоны активной рыболовли по количеству судов и суммарном времени их пребывания в этих водах. Жёлтыми прямоугольниками выделены зоны нелегальной рыболовли. Закрашенные круги — объёмы рыболовли стран в тоннах, пустые круги — объёмы производства в рамках аквакультуры
Также приведён топ-8 видов рыб по объёму производства: с разбивкой на аквакультуру (зелёный) и рыболовлю (голубой). На диаграмме производство рыбы с той же разбивкой с 1960 по 2015 год
Источники данных: data.worldbank.org, FAO, globalfishingwatch.org
Ещё данные про моря и океаны:
— Мусор в мировом океане, 2007–2021
— Динамика снижения уровня Аральского моря, 1957–2022
— Рост уровня Мирового океана, 1993–2021
— Наглядная демонстрация глубины океанов
@rationalnumbers
Среднесуточное время потребления интернета и телевидения в мире, 2011–2019 (Statista)
Время указано в минутах. Потребление интернета подразумевает выход в сеть как с мобильных устройств, так и с ПК
Источник данных — Zenith Media
Другие интересные данные про потребление интернета:
— Доли интернет-браузеров на мировом рынке, 2009–2022
— 10 сайтов с крупнейшим трафиком, 1993–2022
— Какая доля россиян пользуется интернетом, 2021
— Самые распространённые языки в интернете
— С помощью каких платформ предоставления услуг смотрят телевизор в США, июль 2022
@rationalnumbers
Распределение глубин и возвышенностей на Земле (Reddit)
По вертикали указана высота над уровнем моря, по горизонтали — количество площади этой высоты. Площадь каждого квадратика автором не указана
Источник данных — General Bathymetric Chart of the Oceans
Ещё мы писали про глубины и высоты на планете:
— Наглядная демонстрация глубины океанов
— Некоторые интересные высоты
@rationalnumbers
Уровень инфляции в Европе и некоторых развитых и развивающихся странах, ноябрь 2012 – октябрь 2022 (Markus Schanta)
Отсутствуют данные по месяцам, закрашенным белым цветом. Данные по России за этот год могут отсутствовать в том числе потому, что 25 февраля 2022 года ОЭСР прекратила с ней сотрудничество
Источник данных — OECD Data
Ещё мы писали про инфляцию:
— Инфляция в странах мира, 2000–2022
— Отрицательные ставки центробанков мира и их влияние на экономических агентов, 2020
— Прогнозируемый рост инфляции в странах мира за год, 2022
— 52 страны с подтверждённой двузначной инфляцией, май 2022
@rationalnumbers
Количество зафиксированных заболеваний гриппом и госпитализированных в США в неделю, осень-зима 2016–2022 (Vox)
На первой диаграмме указано количество положительных тестов на грипп, на второй — количество госпитализированных с гриппом на 100 000 населения
Источник данных — Centers for Disease Control and Prevention (CDC)
Ещё посты о гриппе и других вирусах:
— Количество зафиксированных заболеваний гриппом в США в неделю, 2019–2022
— Количество смертей от гриппа в мире, 1918–2019
— Заболеваемость гриппом во время эпидемии коронавируса снизилась до мизерных уровней по всему миру
@rationalnumbers
4,2 триллиона рублей хочет выделить правительство РФ в 2023 году на финансирование внутренних силовых структур (МВД, Росгвардия, ФСИН, спецслужбы)
Это в 1,5 раза больше, чем в 2022. В сумме с военным бюджетом это 8,8 триллиона рублей, то есть примерно каждый третий рубль расходов государства
Другие наши посты про расходы государств:
— Сколько Россия получает в год налогами и куда их тратит, 2020
— Расходы на здравоохранение и ожидаемая продолжительность жизни в странах мира, 2019
— Лидеры по военным расходам среди стран мира, 2021
@rationalnumbers
Рейтинг паспортов стран мира, 2022 (Passport Index)
Рейтинг основан на количестве стран, которые можно посетить без визы с разными паспортами. Для каждого из них можно посмотреть карту и список доступных стран с описанием необходимой визы. Внизу указано, как менялась степень мобильности с этим паспортом за последние 7 лет
Лидирует ОАЭ — с их паспортом можно въехать без визы в 180 стран. Хуже всего дела обстоят с паспортом Афганистана — всего 3 страны позволяют посещать их без визы. С паспортом РФ без визы пустят в 72 страны
Ещё мы писали про путешествия:
— Число стран, которые обладатель паспорта стран Европы может посещать без визы
— Карта всех авиарейсов и аэропортов мира
— Диаграмма Вороного с аэропортами мира
@rationalnumbers
Чем клево число Пи? Во-первых и основных это иррациональность и трансцендентность этого числа. Технически это означает, что π нельзя представить никаким другим числом. В том смысле, что его нельзя предствить в виде корня какого-то другого многочлена с целыми коэффициентами и нельзя представить в виде дроби простых чисел (m/n). Число π бесконечно и непериодично в десятичном представлении. А это значит, что теоретически в числе π найдется любая другая подпоследовательность. Нужно только хорошо ее поискать.
А совсем недавно, по меркам открытий, нашли формулу, которая позволяет вычислять любой знак числа пи без вычисления предыдущих, и эта формула относительно проста. И тут понеслось.
Раз мы знаем, что в числе π спрятана любая последовательность чисел и по указанному смещению и длине мы с легкостью можем вычислить эту подпоследовательность, то можно «спрятать» в числе π любой файл, программу или секретный код, главное, чтобы он выражался через числовую последовательность. В итоге в числе π уже есть «Война и мир», исходный код всех операционных систем, все фотографии, которые все человечество когда-либо сделало или сделает. Нужно просто хорошенечко поискать.
Конечно же, искать подпоследовательность хотя бы в 50 мегабайт очень долго и тяжело, но вот после того, как найти такую подпоследовательность, этот файл можно выписать себе на листик в виде смещения в π и длинне подпоследовательности. Сжатие в 100%! Никаким «зипам» и «рарам» это и не снилось!
К сожалению не все так радужно, как хотелось бы. И дело не в том, что такую подпоследовательность очень долго искать -- закон Мура говорит нам, что искать таки можно и в будущем будет это легко. Дело в том, что такое смещение вполне вероятно будет занимать больше места, чем сам файл.
Ну ничего, давайте файл разобъем на более мелкие кусочки, скажем в 640 килобайт, а их уже будем прятать в π. Тогда на смещение в 640КиБ нам нужно будет потратить, скажем, 2Киб, и тогда сжатие будет не 100%, а ~99%. Звучит более реалистично и вполне реализуемо. Более того, уже даже файловая система такая есть, основанная на этом незамысловатом принципе. Работает, конечно, медленно, но работает.
github.com
#перечитываяэкстраполяцию
_______
Источник | #itextrapolation
Карта наблюдаемой Вселенной (The Map of the Universe)
Каждая точка — это одна обнаруженная галактика или квазар. На карте их около 200 000
В интерактивной версии в источнике можно прочитать про то, почему точки разного цвета и почему у наблюдаемой Вселенной есть край
Ещё мы писали про Вселенную:
— Карта Вселенной
— Из чего состоит Вселенная
— Все объекты, которые изучал телескоп Хаббл, 2020
— Количество обнаруженных экзопланет с разбивкой на методы, 1992–2021
@rationalnumbers
Площадь снежного покрова Северного полушария Земли (Rutgers University Global Snow Lab)
На первой картинке — последние данные о покрытых снегом территориях в Северном полушарии от 5 декабря, полученные со спутниковых снимков. Далее — площадь снежного покрова в млн км² осенью, зимой и весной с 1967 по 2022 (до 2021 для осени)
Данные на эту тему из других наших постов:
— Динамика аномалий глобальной температуры, 1880–2020
— Аномалии зональных температур на Земле, 1880–2021
— Распределение глобальной температуры, 1920–2021
— Погода в странах мира
— Климатические изменения в Арктике
@rationalnumbers
Сколько ископаемого топлива потребляет средний житель США за год и за всю жизнь (Elements)
В визуализации представлены объёмы потребляемого угля, нефтяных продуктов и природного газа. За среднюю продолжительность жизни было принято 80 лет. Для наглядности также изображён средний человек ростом в 170 см
Другие публикации на эту тему:
— Крупнейшие производители нефти в мире, 2021
— Из чего складывается цена на бензин
— Мировое потребление энергии по источнику, 1900–2021
@rationalnumbers
Количество подписчиков у 20 самых популярных демократов и республиканцев в Твиттере до и после покупки Илоном Маском, 30 сентября 2022 – 21 ноября 2022 (The Washington Post)
Синим отмечено количество подписчиков у представителей демократической партии США, красным — республиканской. Пунктирной линией отмечено 28 октября — дата покупки соцсети Илоном Маском
Другие наши публикации на эту тему:
— Количество активных пользователей и потенциальный заработок Твиттера, 2017–2022
— Число новых пользователей в день в Твиттере с 1 февраля по 20 марта 2022 года
— Выручка и прибыль Твиттера, 2010-2020
— Несколько диаграмм и графиков, которые помогут понять контекст покупки Твиттера Илоном Маском
Рациональные числа
Выручка Спотифай от рекламы и платных подписок по кварталам, 2017–2022 (Chartr)
Другие публикации на эту тему:
— 12 крупнейших стриминговых сервисов по количеству подписчиков, 3 квартал 2022
— Сколько за всё время заработали 20 самых популярных исполнителей на Spotify
— Выручки в индустрии музыкальной записи с разбивкой по носителям и агрегаторам, 1980–2020
— Примерные данные о математике музыкальных стриминговых сервисов и заработке независимых музыкантов
Рациональные числа
Сколько космонавтов и из каких стран посетили МКС, 1998–2022 (Chartr)
Ещё данные на эту тему:
— Запущенные в космос объекты по странам, 1957–2021
— Распределение объектов на орбите Земли
— Длительность пребывания космонавтов в космосе, 1961–2019
Рациональные числа