Telegram-канал begtin - Ivan Begtin: Бизнес и стартапы

dateno index search 'границы' --filters '"source.catalog_type"="Geoportal";"source.countries.name"="Russian Federation"' --headers id,dataset.title,source.name,source.uid --mode results --per-page 50 --page 1

и поиск по слову borders

dateno index search 'borders' --filters '"source.catalog_type"="Geoportal";"source.countries.name"="Russian Federation"' --headers id,dataset.title,source.name,source.uid --mode results --per-page 50 --page 1

или данные по морям

dateno index search 'моря' --filters '"source.catalog_type"="Geoportal";"source.countries.name"="Russian Federation"' --headers id,dataset.title,source.name,source.uid --mode results --per-page 50 --page 1

Причём можно искать данные сразу в шэйпах добавив в фильтры "dataset.formats"=".shp" или можно искать только среди инсталляций ArcGIS через "source.software.name"="ArcGIS Server"' или только по геопорталам региональных и муниципальных властей "source.owner_type"="Regional government"

И так далее. Для геоданных следующий шаг - это уже поиск по полигонам и геокоординатам, однажды и он тоже появится

#opendata #datasearch #dateno #data #geodata

Читать полностью…

Ivan Begtin

27 октября 2024 20:40

Любопытное про визуализацию индикаторов. Смотрю публикацию в блоге World Bank с данными по их индексу бедности, замене индекса Gini [1] и она по умолчанию бинарная. Условно: всё плохо и всё не так уж плохо. Там же в той же визуализации есть возможность посмотреть детализированную раскладку по странам, но что-то есть в донесении знаний в виде двух визуализаций: простой и посложнее. Сделано всё это несложно и визуализировано популярными инструментами, вопрос самого подхода. Вначале быстрое послание, потом развернутое.

Второй пример - это рейтинг/индекс WJP Rule of Law Index. Там не все страны, например, Армении нет, но можно посмотреть на примере России [2], весьма любопытный способ визуализации позиций в индексе и многочисленных субиндексах. Создатели явно вложились в визуализацию и интерактивность, можно рассматривать как хороший пример таких визуализаций. Я вот этих индексов перевидал уже под сотню и хорошая подача - это всегда интересно.

А заодно можно увидеть как со стороны оценивают текущую открытость данных и законов в РФ. Оценивают, как ни странно, выше чем некоторые европейские страны. Впрочем тут важно помнить что в в 2021 г. Россия по открытости гос-ва была на 41 месте, в 2022 - тоже на 41, в 2023 на 42, а в 2024 на 47.

Впрочем, возвращаясь к визуализации, жаль что сайт у них не с открытым кодом.

Вообще все эти международные страновые рейтинги почти все можно было бы упаковать в один типовой движок, но почти все они про привлечение внимание и активно развиваются в части интерактивности и визуализации. Так что новые примеры посмотреть всегда любопытно.

Ссылки:
[1] https://blogs.worldbank.org/en/opendata/inside-the-world-bank-s-new-inequality-indicator--the-number-of-
[2] https://worldjusticeproject.org/rule-of-law-index/country/2024/Russian%20Federation
[3] https://worldjusticeproject.org/rule-of-law-index/factors/2024/Russian%20Federation/Open%20Government

#opendata #opengovernment #dataviz

Читать полностью…

Ivan Begtin

25 октября 2024 10:31

Для тех кто любит командную строку и ищет данные регулярно, готова утилита dateno [1] для того чтобы искать в Dateno датасеты.

Утилита поддерживает много разных возможностей, включая отправку фильтров для фасетов, листание страниц, получение отдельных записей из индекса, возвращение результатов в JSON и YAML форматах и получение подробной информации по каталогу данных (первоисточнику).

Как с её помощью искать данные?

Вот простой пример команды поиска по слову бюджет на русском языке по датасетам связанным с Кыргызстаном.

dateno index search 'бюджет' --filters '"source.langs.name"="Russian";"source.countries.name"="Kyrgyzstan"' --headers id,dataset.title,source.name --mode results --page 1

Или узнать сколько датасетов находится по словам "Serbia electricity"

dateno index search 'Serbia electricity' --mode totals

А также много других примеров, обязательно посмотрите их в описании репозитория.

Вопросы по работе инструмента можно задавать мне в чате или личным сообщением, баги и предложения лучше всего отправлять в issues репозитория.

Всё это пример работы API Dateno и далее примеров будет куда больше и интеграции поиска Dateno в другие инструменты и сервисы. API - это сейчас ключевой продукт Dateno, с его помощью можно интегрировать поиск данных для самых разных целей: аналитики, визуализации, обучения ИИ, создания порталов с открытыми данными по темам и регионам и многое другое.

Ссылки:
[1] https://github.com/datenoio/datenocmd

#opendata #opensource #commandline #datasearch #data

Читать полностью…