Ivan Begtin
9.09K subscribers
2.51K photos
4 videos
114 files
5.28K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and etc.

CTO&Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Email ivan@begtin.tech

Ads/promotion agent: @k0shk
Download Telegram
Kepler.gl - проект Uber по созданию красивых карт [1]. Выглядит очень хорошо и демо вроде карты передвижения такси в Нью Йорке [2], карты высот Сан-Франциско [3], карты населения Нью-Йорка [4], все они наглядны и показательны.

Причём это не сервис, а проект с открытым исходным кодом [5], требует Node v6 и выше и может использоваться в любом открытом или закрытом проекте для визуализаций.

Внутри там находится deck.gl [6], библиотека по визуализации, также от Uber и основанная на активном использовании GPU.

Ссылки:
[1] https://uber.github.io/kepler.gl/#/
[2] https://uber.github.io/kepler.gl/#/demo/nyctrips
[3] https://uber.github.io/kepler.gl/#/demo/sfcontour
[4] https://uber.github.io/kepler.gl/#/demo/nyc_census
[5] https://github.com/uber/kepler.gl
[6] http://uber.github.io/deck.gl/#/

#datavis

[6] http://uber.github.io/deck.gl/#/
В блоге Steve Song [1] основателя африканского Village Telco [2], стартапа по созданию дешёвых mesh сетей Wi-FI, появился подробный текст про Open Telecom Data [3].

Он поднимает важный вопрос общественной ценности телекоммуникационной инфраструктуры и необходимости открытости данных о ней, включая данные о каналах связи, подводных каналах, наземных оптических кабелях и спектра радиочастот.

Тема актуальная и в её контексте хочу напомнить про многие проекты в этой области.
Это:
- OpenCellID [4] - крупнейшая в мире база башен сотовой связи
- AfterFibre [5] - карта африканских наземных и подводных кабелей
- данные о распределении радиочастот в канаде (открытые данные) [6]
- RadioCells [7] ещё одна пользовательская карта башен сотовой связи, особенно детально охватывает Германию
- Open Telecom Data на github [8] и прототип визуализации [9]
- данные Telecom Italia 2014 года [10] для конкурса на больших данных

Всё это неполный список инициатив связанных с телекоммуникационной инфраструктурой. В России тоже можно найти немало телекоммуникационных данных, однако общественных проектов в этой области пока маловато.

Ссылки:
[1] https://manypossibilities.net
[2] https://villagetelco.org/
[3] https://manypossibilities.net/2018/05/open-telecom-data-moving-forward/
[4] https://www.opencellid.org
[5] https://afterfibre.nsrc.org/
[6] http://sms-sgs.ic.gc.ca/eic/site/sms-sgs-prod.nsf/eng/h_00010.html
[7] https://www.radiocells.org/
[8] https://github.com/stevesong/open-telecom-data
[9] https://opentelecomdata.org/spectrum-chart/
[10] https://dandelion.eu/datamine/open-big-data/

#opendata #opentelecom
Искусство красиво рассказывать о провалившихся проектов - это особый художественный жанр который можно ощутить читая документ о проекте городского портала обмена данными Копенгагена. В документе "City Data Exchange - Lessons Learned from a public/private data collaboration" [1] в 13 страницах подробно излагаются причины неудачи и дальнейшее будущее этого проекта.

Ссылки:
[1] https://cphsolutionslab.dk/content/2-what-we-do/3-data-platforms/3-city-data-exchange/1-learnings-from-the-city-data-exchange-project/city-data-exchange-cde-lessons-learned-from-a-public-private-data-collaboration.pdf?1527149474

#opendata
Для тех кто интересуется какие данные организации ООН и организации работающие с ООН публикуют в открытом доступе, они публикуют их на портале Humanitarian Data Exchange и там есть раздел по России [1]

Ссылки:
[1] https://data.humdata.org/search?groups=rus&q=&ext_page_size=25

#opendata
Пока в России блокируют Телеграм, в Казахстане Телеграм бот оказывает Госуслуги [1]

За неделю со дня запуска услуг через Telegram-бот [2], на @EgovKzBot подписалиcь 2135 человек.
Общее количество запросов составило - 3222.

Ссылки:
[1] http://egov.kz/cms/ru/news/Teper-Telegram-bot-okazyvaet-uslugi-na-kazahskom-yazyke
[2] https://t.me/EgovKzBot

#privacy
Сейчас мы в Инфокультуре проводим опрос/сбор/исследование всех небольших технологических проектов ориентированный на общественное благо и социальный эффект. Это когда пользу принести хочется другим, а сам проект может быть и не про заработок. Очень много их возникло в результате конкурсов и хакатонов за последние годы, а также самостоятельно. Если Вы такие знаете - поделитесь ими с нами: https://docs.google.com/forms/d/e/1FAIpQLSfCu4nzHg8m5zhRpYVK1UO5XC08DTkLJHG3pDE-5yYU3Yw-lQ/viewform

Цель сбора их не секретна - мы опубликуем обзор подобных проектов ищем тех кто может рассказывать о своём опыте и в далёком дне открытом данных через год и в других мероприятиях этого года

Результаты опроса мы опубликуем обязательно

#opendata #openprojects
Вчера Всемирный банк опубликовал атлас целей устойчивого развития 2018 (Atlas of Sustainable Development Goals 2018) [1], набор визуализаций и разъяснений того в каком состоянии сейчас находятся цели устойчивого развития. Визуализации там подобраны очень тщательно, по сравнению с аналогичным атласом 2017 года [2] можно увидеть что визуализации стали похожи на стиль используемый командой FiveThirtyEight [3].

Подобную визуализацию можно делать и самостоятельно, есть инструкция для Python [4], а также мне попадались аналогичные инструкции для Mathplotlib, plot.ly и ggplot2.

Ссылки:
[1] http://datatopics.worldbank.org/sdgatlas/
[2] http://datatopics.worldbank.org/sdgatlas/archive/2017/index.html
[3] http://fivethirtyeight.com/
[4] https://www.dataquest.io/blog/making-538-plots/

#datavis
В Nature интересная статья о доступности данных коммерческих компаний для исследователей [1], в данном случае в телекоммуникациях и спутниковых данных.

Если изложить её кратко, то суть в том что технологические компании предоставляют доступ к огромным массивам баз данных для научных коллективов исследующих вопросы бедности, нехватки воды и других глобальных проблем.

Впрочем подробнее в самой статье

Ссылки:
[1] https://www.nature.com/articles/d41586-018-05268-w

#opendata #bigdata
Bloomberg пишет что Microsoft может приобрести Github, крупнейший проект репозиториев исходного кода, за 5 миллиардов USD [1], однако пока не подтверждает это какими-либо ссылками на официальные источники. А в Techcrunch пишут что компания пока никак не комментирует эти слухи [2].

О переговорах между компаниями писали ещё несколько дней назад в Business Insider [3], однако Bloomberg теперь пишет всё в гораздо более уверенных тонах.

5 миллиардов USD - это значительно меньше чем, например, 26 миллиардов USD за которые Microsoft купили LinkedIn. А покупка Github'а даст Microsoft существенное преимущество при интеграции Github и облака Azure, например.

Конечно, многое в дальнейшем зависит от того насколько агрессивно они будут внедрять интеграцию с собственными продуктами. Github стал стандартом де-факто для всех проектов открывающих исходный код, но и у него есть множество альтернатив.

Ссылки:
[1] https://www.bloomberg.com/news/articles/2018-06-03/microsoft-is-said-to-have-agreed-to-acquire-coding-site-github
[2] https://techcrunch.com/2018/06/03/microsoft-is-reportedly-acquiring-github/
[3] http://www.businessinsider.fr/us/2-billion-startup-github-could-be-for-sale-microsoft-2018-5

#opensource #github #microsoft
В Люксембурге администрация авиационной навигации опубликовала результаты 3D сканирования (LIDAR) территории аэропорта [1] которое проводилось в формате eTOD (Electronic Terrain and Obstacle Data) [2] по требованиям ICAO (International Civil Aviation Organization).

Подобное сканирование проводят во всех странах где есть хоть один аэропорт, но только в Люксембурге опубликовали результаты онлайн в полном объёме.

Другие данные собираемые ICAO также можно увидеть на их GIS портале [3]

Ссылки:
[1] https://data.public.lu/en/organizations/administration-de-la-navigation-aerienne/#datasets
[2] https://www.skybrary.aero/index.php/Electronic_Terrain_and_Obstacle_Data_(eTOD)
[3] https://gis.icao.int/gallery/index.html

#opendata #avia
К вопросу о медиастартапах. Шведский Newsworthy http://www.newsworthy.se мониторят кучу статистических данных Евросоюза и генерят новостные лиды.

Тоже дата журналистика с элементами робожурналистики, с той лишь разницей что они не текст финальный создают, а значительно облегчают поисковые возможности.

Кстати создать такой сервис в России можно, даже не супер сложно на самом деле, но покупателей на него будет 5-10 изданий, в основном федерального значения и рынок совсем скромный. Так что у нас в можно запускать это скорее как некий in-house проект.

Другой интересный проект - это нидерландский LocalFocus https://www.localfocus.nl/en/ по созданию интерактивной инфографики с данными. Они так и пишут что превращают данные в истории.

#opendata #ddj #datajournalism