Ivan Begtin
9.08K subscribers
2.52K photos
4 videos
114 files
5.29K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and etc.

CTO&Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Email ivan@begtin.tech

Ads/promotion agent: @k0shk
Download Telegram
Яндекс опубликовал статистику запросов о Пушкине [1] за что им спасибо, но совсем не спасибо за то что Яндекс категорически отказывается публиковать данные даже в тех вопросах которые не затрагивают его бизнес интересы.

Вместо этого куча маленьких xlsx файлов.
Это проблема со многими если не совсем информационными бизнесами основанными на данных. Невосприятие необходимости их публикации как механизма репутации.

По этой причине тот же Google даёт скачивать данные их Transparency Report [2] в CSV, а Яндекс не публикует даже гораздо менее "чувствительные" данные.

Ссылки:
[1] https://mediafeeds.yandex.ru/specprojects
[2] https://transparencyreport.google.com/government-removals/overview

#opendata
Китайские исследователи обнаружили способ управления голосовыми помощниками с помощью ультразвуковых команд [1].

Называется это DolphineAttack и довольно несложно в реализации.

Из прекрасного в статье "... He wrote one of the first papers on audio attacks, which he titled “Cocaine Noodles” because devices interpreted the phrase “cocaine noodles” as “O.K., Google.”

Всячески рекомендую к прочтению _до_ покупки систем аудиопомощников.

Ссылки:
[1] https://www.nytimes.com/2018/05/10/technology/alexa-siri-hidden-command-audio-attacks.html

#privacy #security
Написал насколько смог краткий текст о том почему "Открытое правительство" стало тем чем оно стало https://begtin.tech/failed-gov/
Kepler.gl - проект Uber по созданию красивых карт [1]. Выглядит очень хорошо и демо вроде карты передвижения такси в Нью Йорке [2], карты высот Сан-Франциско [3], карты населения Нью-Йорка [4], все они наглядны и показательны.

Причём это не сервис, а проект с открытым исходным кодом [5], требует Node v6 и выше и может использоваться в любом открытом или закрытом проекте для визуализаций.

Внутри там находится deck.gl [6], библиотека по визуализации, также от Uber и основанная на активном использовании GPU.

Ссылки:
[1] https://uber.github.io/kepler.gl/#/
[2] https://uber.github.io/kepler.gl/#/demo/nyctrips
[3] https://uber.github.io/kepler.gl/#/demo/sfcontour
[4] https://uber.github.io/kepler.gl/#/demo/nyc_census
[5] https://github.com/uber/kepler.gl
[6] http://uber.github.io/deck.gl/#/

#datavis

[6] http://uber.github.io/deck.gl/#/
В блоге Steve Song [1] основателя африканского Village Telco [2], стартапа по созданию дешёвых mesh сетей Wi-FI, появился подробный текст про Open Telecom Data [3].

Он поднимает важный вопрос общественной ценности телекоммуникационной инфраструктуры и необходимости открытости данных о ней, включая данные о каналах связи, подводных каналах, наземных оптических кабелях и спектра радиочастот.

Тема актуальная и в её контексте хочу напомнить про многие проекты в этой области.
Это:
- OpenCellID [4] - крупнейшая в мире база башен сотовой связи
- AfterFibre [5] - карта африканских наземных и подводных кабелей
- данные о распределении радиочастот в канаде (открытые данные) [6]
- RadioCells [7] ещё одна пользовательская карта башен сотовой связи, особенно детально охватывает Германию
- Open Telecom Data на github [8] и прототип визуализации [9]
- данные Telecom Italia 2014 года [10] для конкурса на больших данных

Всё это неполный список инициатив связанных с телекоммуникационной инфраструктурой. В России тоже можно найти немало телекоммуникационных данных, однако общественных проектов в этой области пока маловато.

Ссылки:
[1] https://manypossibilities.net
[2] https://villagetelco.org/
[3] https://manypossibilities.net/2018/05/open-telecom-data-moving-forward/
[4] https://www.opencellid.org
[5] https://afterfibre.nsrc.org/
[6] http://sms-sgs.ic.gc.ca/eic/site/sms-sgs-prod.nsf/eng/h_00010.html
[7] https://www.radiocells.org/
[8] https://github.com/stevesong/open-telecom-data
[9] https://opentelecomdata.org/spectrum-chart/
[10] https://dandelion.eu/datamine/open-big-data/

#opendata #opentelecom
Искусство красиво рассказывать о провалившихся проектов - это особый художественный жанр который можно ощутить читая документ о проекте городского портала обмена данными Копенгагена. В документе "City Data Exchange - Lessons Learned from a public/private data collaboration" [1] в 13 страницах подробно излагаются причины неудачи и дальнейшее будущее этого проекта.

Ссылки:
[1] https://cphsolutionslab.dk/content/2-what-we-do/3-data-platforms/3-city-data-exchange/1-learnings-from-the-city-data-exchange-project/city-data-exchange-cde-lessons-learned-from-a-public-private-data-collaboration.pdf?1527149474

#opendata
Для тех кто интересуется какие данные организации ООН и организации работающие с ООН публикуют в открытом доступе, они публикуют их на портале Humanitarian Data Exchange и там есть раздел по России [1]

Ссылки:
[1] https://data.humdata.org/search?groups=rus&q=&ext_page_size=25

#opendata
Пока в России блокируют Телеграм, в Казахстане Телеграм бот оказывает Госуслуги [1]

За неделю со дня запуска услуг через Telegram-бот [2], на @EgovKzBot подписалиcь 2135 человек.
Общее количество запросов составило - 3222.

Ссылки:
[1] http://egov.kz/cms/ru/news/Teper-Telegram-bot-okazyvaet-uslugi-na-kazahskom-yazyke
[2] https://t.me/EgovKzBot

#privacy
Сейчас мы в Инфокультуре проводим опрос/сбор/исследование всех небольших технологических проектов ориентированный на общественное благо и социальный эффект. Это когда пользу принести хочется другим, а сам проект может быть и не про заработок. Очень много их возникло в результате конкурсов и хакатонов за последние годы, а также самостоятельно. Если Вы такие знаете - поделитесь ими с нами: https://docs.google.com/forms/d/e/1FAIpQLSfCu4nzHg8m5zhRpYVK1UO5XC08DTkLJHG3pDE-5yYU3Yw-lQ/viewform

Цель сбора их не секретна - мы опубликуем обзор подобных проектов ищем тех кто может рассказывать о своём опыте и в далёком дне открытом данных через год и в других мероприятиях этого года

Результаты опроса мы опубликуем обязательно

#opendata #openprojects
Вчера Всемирный банк опубликовал атлас целей устойчивого развития 2018 (Atlas of Sustainable Development Goals 2018) [1], набор визуализаций и разъяснений того в каком состоянии сейчас находятся цели устойчивого развития. Визуализации там подобраны очень тщательно, по сравнению с аналогичным атласом 2017 года [2] можно увидеть что визуализации стали похожи на стиль используемый командой FiveThirtyEight [3].

Подобную визуализацию можно делать и самостоятельно, есть инструкция для Python [4], а также мне попадались аналогичные инструкции для Mathplotlib, plot.ly и ggplot2.

Ссылки:
[1] http://datatopics.worldbank.org/sdgatlas/
[2] http://datatopics.worldbank.org/sdgatlas/archive/2017/index.html
[3] http://fivethirtyeight.com/
[4] https://www.dataquest.io/blog/making-538-plots/

#datavis
В Nature интересная статья о доступности данных коммерческих компаний для исследователей [1], в данном случае в телекоммуникациях и спутниковых данных.

Если изложить её кратко, то суть в том что технологические компании предоставляют доступ к огромным массивам баз данных для научных коллективов исследующих вопросы бедности, нехватки воды и других глобальных проблем.

Впрочем подробнее в самой статье

Ссылки:
[1] https://www.nature.com/articles/d41586-018-05268-w

#opendata #bigdata