Ivan Begtin
7.98K subscribers
1.81K photos
3 videos
101 files
4.52K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Ранее я уже писал о странностях в [не]прозрачности распределения средств через Российский фонд развития информационных технологий (РФРИТ) [1], а в пятницу фонд опубликовал итоги первого конкурса [2] в виде ранжированного списка победителей конкурсного отбора. В итоговом файле [3] перечислены 13 проектов 12 компаний:

- Акционерное общество «Концерн Радиоэлектронные технологии»
- Акционерное общество «ОДК-Пермские моторы»
- "Акционерное общество «Особая экономическая зона промышленно производственного типа «Алабуга»"
- "Общество с ограниченной ответственностью «Центр экологической безопасности»"
- Публичное акционерное общество «КАМАЗ»
- Акционерное общество «Татэнерго»
- "Общество с ограниченной ответственностью «Научно-технический центр «Бакор»"
- Общество с ограниченной ответственностью «Самараавтожгут»
- "Общество с ограниченной ответственностью «Научно производственный центр ""Пружина""»"
- Акционерное общество «СМАРТС»
- "Общество с ограниченной ответственностью «Управляющая компания «Предприятие жилищно-коммунального хозяйства»"
- "Общество с ограниченной ответственностью «Торговый дом «Ивановская мебельная фабрика»"

Что тут скажешь когда сказать нечего? Я всё же постараюсь
1. В отличие от Фонда содействия инновациям (Фонд Бортника) [4] или Фонда Президентских грантов [5] раскрытие информации хуже чем минимальное. Нет реквизитов получателей и, например, одних только организаций "Общество с ограниченной ответственностью «Центр экологической безопасности»" существует более 5 штук. Нет ни наименований ни описаний проектов, нет видеозаписей работы комиссии, нет протоколов. И самое главное - нет сумм выделяемых конкретным получателям грантов. Я в своей жизни такого ранее никогда не видел.
2. Из 13 проектов 4 из Республики Татарстан из которых в подчинении Правительства Республики Татарстан через Минимущества Татарстан - 2 организации. А из 12 получателей 3 являются дочерними предприятиями ГК Ростех.
3. Ни одной ИТ или даже около ИТ компании в победителях нет. Неизвестно есть ли они в заявителях, поскольку список всех заявок РФРИТ также не публикует (в отличие от ФСИ и ФПГ).
4. Как я уже упоминал Общество с ограниченной ответственностью «Центр экологической безопасности» существует во многих регионах. Какое победило тут? Никто не знает, деятельности ни одного из этих региональных ООО не выдаёт их победы.
5. Я напомню что согласно конкурсной документации распределяется 3 миллиарда с предельной суммой до 1 миллиарда на победителя. Поэтому отсутствие сумм у победителей в итоговом списке особенно настораживает:

2.1.5. Предельная сумма Грантов, которая может быть распределена по результатам
проведения настоящего конкурсного отбора, составляет 3 093 307 335 (Три миллиарда
девяносто три миллиона триста семь тысяч триста тридцать пять) рублей 88 копеек.
2.1.6. Предельный размер Гранта на реализацию одного Проекта в рамках
настоящего конкурсного отбора составляет 1 (Один) миллиард рублей.

Для всех тех кто хочет самостоятельно изучить список победителей по ссылке на Airtable [6] он доступен с привязкой к субъектам федерации, ИНН организаций, группы компаний и так далее (для Airtable требуется регистрация). Набор данных слишком маленький чтобы выкладывать его как базу данных.


Ссылки:
[1] https://t.me/begtin/1604
[2] https://рфрит.рф/konkursnyy-otbor-19
[3] https://xn--h1apajh.xn--p1ai/attachment/144/download/2_Pobediteli
[4] http://fasie.ru
[5] http://pgrants.ru
[6] https://airtable.com/invite/l?inviteId=inviRf00zG5pjnLiu&inviteToken=39efc31dab96d68cbc9b7d9e28e0d9e1cc4dee8057a9254f965a0e9d4a62c825

#rfrit #opendata #data #contests
В дополнение предыдущего поста [1] в Tadviser вышло обновление статьи про РФРИТ [2] с суммами и описанием проектов. Что ж, картина стала яснее: на структуры Ростеха пошло 64% всех средств, 12% ушли СМАРТС и 8,2% ушло Ивановской мебельной фабрике, остальное по мелочи. А я обновил табличку с детальной информацией по получателям тут [3].

Только один вопрос. А может проще было Ростеху напрямую субсидии дать? Зачем конкурс то?

Ссылки:
[1] https://t.me/begtin/1664
[2] http://www.tadviser.ru/index.php/Компания:Российский_фонд_развития_информационных_технологий_(РФРИТ)
[3] https://airtable.com/invite/l?inviteId=inviRf00zG5pjnLiu&inviteToken=39efc31dab96d68cbc9b7d9e28e0d9e1cc4dee8057a9254f965a0e9d4a62c825

#rfrit #data`
В CNews в итогах года пишут о тренде огосударствления ИТ рынка [1], лично я не могу с этим не согласится, однако я бы сформулировал это иначе. Движение идёт на глубокую перезагрузку ИТ рынка в которой есть 3 тренда.

1-е. Китаемзамещение.
В каком-то смысле этот тренд - это неизбежность в ситуации импортозамещения. Немногие верят в российскую электронику и способность её производить продукцию массового производства, да и со штучным производством не всё просто. Поэтому те или иные способы продать китайскую продукцию были и будут, как под видом импортозамещения, так и напрямую китайское оборудование.

2-е. МегаГосИнтеграторы
Я бы назвал это, в каком-то смысле, неизбежным. Будет ли такой интегратор один, будет ли их 3-4 на федеральном уровне, не так важно. Как только они появятся то неизбежно это станет трендом по всем субъектам федерации, где постараются создать аналогичные монопольные структуры. Остальной рынок будет, либо банкротится, либо стремительно консолидироваться, либо уходить под мега-гос-интеграторов.

3-е. Усиление/ослабление государственного контроля
Сейчас есть одновременно два идущих запроса на усиление контроля за ИТ проектами и наоборот на ослабление, поскольку иначе невозможно их осуществлять. Все эти годы ранее и в других отраслях побеждал всегда тренд на усиление контроля. Благо что в расходах по 44-ФЗ ИТ расходы уже 3-и после строительства и фармы.

Ключевой вопрос вокруг происходящего - это связаны ли 3 этих тренда или просто всё так "удачно" совпало.

Ссылки:
[1] https://www.cnews.ru/articles/2019-12-27_glavnoe_v_ogosudarstvlenii_rossijskogo

#it #russia
Канал Нецифровая экономика пишет с критикой [1] про Ашота Оганисяна, технического директора компании Device Lock и автора канала об утечках данных. Пишут справедливо про ситуацию с публикациями про утечки с сайта Госуслуг, но всей картины явно не знают. Device Lock не только активно торгует продуктом по выявлению утечек, но и одним из их клиентов является Ростелеком. Как минимум 2017 и 2018 годах их продукт продавался через Акционерное общество "Смарт Лайн Инк" (владельцем которого является также Ашот Оганесян) и которые заключили договора 31806519034-01 и 57707049388170034600000, а может быть и в этом году было, точно не скажешь потому что Правительство позволяет с 2018 года скрывать поставщиков по 223-ФЗ, но желающие быстро найдут список клиентов по ключевым словам "DeviceLock" в базах госконтрактов [2]. Сам продукт DeviceLock, видимо, на одноимённой компании где, опять же, Ашот Оганесян является владельцем (иначе говоря технический директор это совсем не то что конечный бенефициар).

Поэтому, при всей моей малой любви к тому же Ростелекому проблема с публикациями об утечках, к сожалению, несёт большой этический вопрос:
1. Публикация любых сведений об утечках до предупреждения и разумного времени на устранение проблем у компании - это, в первую очередь, создание ситуации когда страдают все те граждане сведения о которых в утечках содержаться. Более того, обнародование непубличных канал потенциальной утечки и придание им публичности - это и есть утечка. Иначе говоря - утечка персональных данных становится не "потенциальной", а реальной именно тогда когда ей придаётся максимальная публичность.
2. Наличие у владельца компании контрактных отношений с Ростелекомом и одновременно публикации об их утечках можно трактовать как "шантаж" потенциального или прошлого клиента. Если Ростелеком и Минкомсвязь найдут зацепку засудить DeviceLock за подобное - они будут совершенно правы.

Я напомню что этические вопросы в проблемах с утечками персональных данных являются первоочередными. При передаче РБК материалов по утечкам персональных данных [3] лично я выдержал паузу более чем в 8 месяцев после уведомления Роскомнадзора.

2020 год пройдет под эгидой этики, поверьте моему слову, "этика" будет главным словом.

Ссылки:
[1] https://t.me/antidigital/2088
[2] https://clearspending.ru/contract/?productsearch=DeviceLock&search-submit=&grbs=&regnum=&daterange=&price_gte=&price_lte=&customerregion=&address=&budgetlevel=&okdp_okpd=&sort=-signDate&fz=None&customerinn=&customerkpp=&supplierinn=&supplierkpp=
[3] https://www.rbc.ru/politics/29/04/2019/5cc2df569a7947c83b69b0d5

#dataleaks #leaks #data #personaldata
Algorithwatch публикуют серию предсказаний по развитию автоматизированных систем на 2020 год [1].

Вот ключевые на которые стоит обратить внимание:
1. "Углеродные алгоритмы"

Всё более тематика климатических изменений будет связана с системами искусственного интеллекта.

Предсказание 1: Несколько организаций запустят проекты ИИ для окружающей среды
Предсказание 2: Как минимум одна автоматизированная система будет недоступно из-за проблем с инфраструктурой вызванной

2. Автоматические дома для бедных

Предсказание 3: Как минимум 50 новых примеров автоматизации социального сектора в Европе
Предсказание 4: Не менее 3 из этих проектов будут остановлены по решению суда или как политически неприемлимые местными или национальными парламентами.

3. Платформенная прозрачность

Предсказание 6: Журналисты, политики, исследователи и активисты со всех сторон будут заявлять что платформы и их алгоритмы повлияли на выборы 2020 года. Некоторые из них подтвердят свои заявления данными.
Предсказание 7: До и после выборов платформы, особенно Facebook, заявят что они были и есть прозрачны. Но они не будут прозрачны.

4. Регулирование в 2021 году

Предсказание 8: Европейская комиссия опубликует результаты исследований ИИ в первом квартале, но без последующего нормотворчества.
Предсказание 9: AlgorithmWatch, помимо других, опубликует свои предложения.


Ссылки:
[1] https://algorithmwatch.org/en/9-predictions-for-2020/

#eu #algorithmwatch #ai
Далеко не все открытые данные имеют государственную природу. Многие публикуются некоммерческими организациями ориентированными на технологические проекты. Таких организаций очень мало в России, но много в мире. Одним из примеров таких данных являются климатические данные.

Где подобные данные собираются и публикуются?
1. ResourceWatch [1] ведёт портал с датасетами и кроме 291 датасета ещё и предоставляет инструменты визуализации.
2. World Resource Institutes [2] публикует 125 наборов данных и каталоги платформ с данными [3]
3. ClimateWatch [4] собирают и публикуют данные мониторинга и составляют профили стран, тоже с экспортом данных
4. PrepData [5] для планирования и подготовке к климатическим изменениям
5. The Forest Atlases [6] серия проектов от WRI по созданию порталов открытых данных мониторинге лесов.

И множество других. По многим показателям некоммерческие технологические проекты на данных опережают государственные, хотя и всегда или почти всегда основаны на государственных данных.

Ссылки:
[1] https://resourcewatch.org/data/explore
[2] http://datasets.wri.org/dataset
[3] https://www.wri.org/resources/data-platforms
[4] https://www.climatewatchdata.org/
[5] https://prepdata.org/
[6] https://www.wri.org/our-work/project/forest-atlases

#opendata #climatechange
Под конец года накопилось много примеров и новостей по открытым данным, продолжаю разгребать пропущенное.

1. Портал открытых данных юстиции в Аргентине [1], единственный в своём роде. При том что ничего выдающегося в том как он сделан нет, важнее сама инициатива по раскрытию подобных данных.
2. Open Government Partnership постепенно сокращается. 6 декабря оттуда исключены Тринидад и Тобаго [2], а ранее оттуда вышли или заморозили своё участие: Венгрия, Турция, Танзания. Беда в том ещё и что к Хартии открытых данных [3] тоже мало кто присоединяется. Нельзя сказать что открытость отступает, но точно можно говорить что она приобретает иные формы, без международных институтов подчас. Хорошо ли это или плохо? Это предмет для отдельной дискуссии
3. В Новой Зеландии 17 декабря подвели итог конкурса цифровых инноваций [4] с общим бюджетом в 5 миллионов долларов NZ (примерно 208 миллионов рублей). Особенность конкурса была в том что в нем участвовали только команды органов власти.
4. СуперСервис "Рождение ребёнка" о котором давно говорят в России , уже давно реализован в Новой Зеландии. Он называется Smart Start [5] и помогает родителям ещё когда они только собираются запланировать рождение ребёнка.
5. Во Франции на середину января 2020 года запланировали хакатон по открытым финансовым данным [6]. Данные у них не такого удобства как в России, но хакатон правильно организован объяснениями зачем и как участвовать в нём: программистам, дизайнерам, разработчикам пользовательских интерфейсов, госслужащим и тд. Очень интересно будет посмотреть результаты.
6. Законы-как-код (Legislation-as-a-code) [7] ещё один новозеландский проект для мониторинга. О том как превращать законы/законопроекты и процесс их принятия в код. И государственная инициатива Better Rules [8] с систематизацией лучших практик. Кстати результаты эксперимента можно посмотреть в проекте Rapu Ture [9] на базе OpenFisca [10]. Эксперименты пока малопонятные, но хоть кто-то решается подступиться к этой проблеме.
7. Про открытый код французского Etalab [11] я ранее писал, но всегда неплохо и напомнить. Много кода, довольно неплохо написанного и описанного.

Ссылки:
[1] http://datos.jus.gob.ar/
[2] https://www.opengovpartnership.org/news/open-government-partnership-rescinds-trinidad-and-tobagos-membership/
[3] https://opendatacharter.net/
[4] https://www.digital.govt.nz/news/successful-applicants-for-the-digital-government-partnership-innovation-fund-20192020-announced/
[5] https://smartstart.services.govt.nz/
[6] https://datafin.fr/
[7] https://www.brainbox.institute/legislation-as-code-in-new-zealand
[8] https://www.digital.govt.nz/blog/what-is-better-rules/
[9] https://www.rules.nz/
[10] https://openfisca.org/en/
[11] https://code.etalab.gouv.fr/en/repos

#opendata #opensource #govinnovations
Находка года - это инструмент по обману рекламодателей Track This от команды Firefox (Mozilla) https://trackthis.link/

В нем можно выбрать один из 4-х профилей:
- Hyperbeast - фанат уличной одежды, эксклюзивных вещей и последней музыки. В поисках самого модного мерча
- Filthy Rich - рекламодатели теперь считают что Ваша жизнь теперь как в фильме про Джеймса Бонда, за исключением меньшей дозы алкоголя и больше кредитного максимума.
- Doomsday Prepper - рекламодатели теперь считают что Вы проводите Ваше время в поисках запасов, бункеров и за печатью теорий заговоров для того чтобы вешать их на стены спальной с красным ковром
- Influencer - реколамодатели будут считать что Вы одержимы уходом за кожей, астрологией и конечно тем как завлечь больше лайков в свой видеоблог

В каждом случае открывается до 100 табов, так что будьте готовы потом закрывать их все или браузер целиком.

Кстати идея настолько хороша что можно было бы придумать ещё несколько похожих профилей. Например, каких?

#privacy #tracking #humor #tricks
Федеральная государственная информационная система мониторинга качества атмосферного воздуха в крупных промышленных центрах появится уже в следующем году.

Вышло Постановление Правительства РФ от 24 декабря 2019 года №1806 в котором утверждены Правила создания и эксплуатации федеральной государственной информационной системы мониторинга качества атмосферного воздуха в городах Братске, Красноярске, Липецке, Магнитогорске, Медногорске, Нижнем Тагиле, Новокузнецке, Норильске, Омске, Челябинске, Череповце и Чите, а также перечень включаемой в неё информации [1]

Систему будет эксплуатировать Росприроднадзор, а поставщиками информации предполагаются:
- Росприроднадзор
- Росгидромет
- Роспотребнадзор
- Росреестр
- ИОГВ субъектов федерации

Перечень сведений (вернее, там перечень "типов сведений") приведён на страницах 12-16 постановления [2]

На что следует обратить внимание:
1. Сведения должны быть общедоступны, но слова "открытые данные" нигде не произносятся. Как следствие результат реализации системы может давать графики, таблицы, а данные могут и не давать. Во всяком случае по формальным критериям описания в постановлении Правительства РФ
2. Нет упоминания НСУДа, хотя казалось бы для новых ФГИС это было бы логично. Но нет, все ФГИСы и в том числе новые продолжают существовать в собственных "отраслевых колодцах".
3. В системе собираются данные федерального уровня и уровня субъектов федерации, что возможно из-за принятия 195-ФЗ от 26 июля 2019 года [3].

Хорошо ли или плохо создание подобной системы? На фоне того что творят некоторые власти субъектов федерации с сокрытием информации о экологической обстановке [4] - это, конечно, скорее хорошо. Но, с другой стороны, данные об экологической обстановке как и другие данные о качестве жизни в России раскрываются особенно плохо.

Например, где все те данные которые собирают вышеперечисленные органы власти? А где данные о качестве воды? А где данные о загрязнении почвы? Экологический мониторинг это одна из немногих по настоящему важных тем для общественного контроля. Контроля в виде проверки датчиков, в виде внедрения практик интернета вещей и многое и многое другое.


Ссылки:
[1] http://government.ru/docs/38713/
[2] http://static.government.ru/media/files/omnnf6X4KK7bD4KYvA5pzs4pzLocAJQu.pdf
[3] http://government.ru/activities/selection/525/37561/
[4] https://t.me/begtin/1661

#opendata #data #fgis
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
1019 субсидий на сумму 319,9 млрд руб. распределили за 2 последних рабочих дня года.

Самые крупные новогодние субсидии получили:

Российский фонд развития информационных технологий - 29,9 млрд руб.
Российский дорожный научно-исследовательский институт - 10 млрд руб.
НИЦ «Курчатовский институт» (получил от НИЦ «Курчатовский институт») - 7,6 млрд руб.
Комитет по развитию транспортной инфраструктуры СПб - 7,1 млрд руб.
Государственный университет Морского и речного флота им. Адмирала С.О. Макарова - 4,9 млрд руб.
Многофункциональный комплекс Министерства финансов РФ - 4,5 млрд руб.
Московский государственный технический университет гражданской авиации - 4,3 млрд руб.

Со всеми субсидиями можно познакомиться на сайте проекта «Госрасходы»: https://spending.gov.ru/subsidies/subsidies_list/
В выдавшиеся немного свободные дни я перечитывал последние материалы по тому как в том что называется цифровой трансформацией в мире меняется.

1. В наиболее развитых странах довольно много G2G проектов. Например, в Австралии есть GovCMS [1] проект на базе Drupal 8 созданный в их Департаменте финансов (аналог Минфина России) и, барабанная дробь, официально предоставляемый за деньги в виде облачного SaaS или PaaS решения.
2. В той же Австралии есть проект по каталогизации всех государственных API api.gov.au [2] где пока собрано 12 API, но также разработан стандарт публикации API, действует сообщество. Правда везде есть свои странности, например этот проект написан полностью на языке программирования Kotlin [3] и выбор для веб-интерфейса + API в сторону Kotlin лично мне непонятен, можно лишь предполагать что разработчикам очень хотелось попробовать новый язык/технологию.
3. В США с апреля 2019 года опубликовали и развивают U.S. Web Design System 2.0 (USWDS 2.0) [4]. Это дизайн система для всех официальных сайтов США, полностью открытая (открытый код, свободные лицензии), весьма проработанная, со множеством примеров. Фактически она резко упрощает жизнь всем разработчикам госсайтов и даёт универсальные шаблоны для разного вида страниц.
4. И снова Австралия. GovTEAMS [5] Система цифровых коммуникаций с преодолением межведомственных барьеров. Проектные команды в ней взаимодействуют как между органами власти так и вовлекают представителей подрядчиков и госучреждений. Как и во многих G2G проектах Австралии, он бесплатен для органов власти федерации, но для органов власти штатов там платные аккаунты. Всё это работает на базе Microsoft Teams, SharePoint и Office 365 apps. Опять же проект Департамента финансов федерального правительства Австралии
5. Единый каталог организаций и иных структур правительства Австралии [6] интересен тем что в нем не только организации из австралийского реестра госорганизаций (AGOR), но и многочисленные структуры не имеющие статуса юридического лица. Это включает разнообразные комитеты, комиссии, советы директоров, а также всех тех персон кто входит в эти структуры. Это одна из немногих известных мне подобных всеобъемлющих инициатив по систематизации устройства органов власти.
6. Я ранее упоминал проект Better Rules в Новой Зеландии, по реорганизации законотворческого процесса [7]. У проекта есть важная особенность, его создатели не пытаются создать _цифровую платформу для законотворчества_. Таких проектов много, начиная с проектов по машиночитаемым законам и продолжая платформами написания законов. Нет, в Better Rules куда как более радикальная идея. Основной тезис в том что положения законов всё равно приходится превращать в код при их принятии, а что если сразу писать код, а потом уже на основе этого кода создавать тексты законов и иных регуляторных документов? Вот это и пытаются решить в Better Rules и, кто знает, может быть и смогут чего-то добиться.
7. Очень похожий проект в Италии по цифровому административному кодексу [8]. Большая часть материалов на итальянском языке, пока мало что доступно, вполне возможно что ещё какие-то результаты и не достигнуты.

Ссылки:
[1] https://govcms.gov.au
[2] https://api.gov.au
[3] https://github.com/apigovau/api-gov-au
[4] https://designsystem.digital.gov/whats-new/updates/2019/04/08/introducing-uswds-2-0/?=dg
[5] https://www.govteams.gov.au
[6] https://www.directory.gov.au
[7] https://discuss.digital.govt.nz/BetterRules/
[8] https://teamdigitale.governo.it/it/projects/cad.htm

#digital #digitalgov #data #api
Это заняло какое-то время прочитать документы по НСУДу и я описал свои впечатления в блоге https://begtin.tech/nsud-review/ и дублирую тут

Я добрался таки до документов разработанных в рамках НСУДа (Национальная система управления данными) [1] и, если по началу мне хотелось сделать детальный разбор того что там написано, то по итогам могу лишь сказать что это желание быстро пропало. По той лишь причине что объект/предмет обсуждения отсутствует как явление.

При этом я честно прочитал все документы, даже вернулся к концепции НСУДа утверждённой 3 июня 2019 года [2], перечитал что аналогичного делают в мире и что получается в итоге в России.

Смысловое:
1. Темы открытых данных как не было в концепции НСУДа, так и нет в итоговых документах и материалах. Открытые данные упоминаются только в Концепции создания цифровой аналитической платформы и только в одном из пунктов заключительных положений [3]. Звучит как:
- увеличение доли показателей, раскрываемых в формате открытых данных в рамках платформы;
на странице 45 документа. Однако и это упоминание очень условно потому что увеличение доли показателей с неизвестной доли на неизвестную не даёт уверенности что это вообще произойдёт.
2. НСУД из свода правил превратился странного гибрида-мутанда где, с одной стороны, есть требования к "государственным информационным ресурсам", а с другой стороны по сути эти требования являются приложением к созданию ЕИП НСУД (Федеральная государственная информационная система «Единая информационная платформа национальной системы управления данными»).
3. ЕИП НСУД - это и есть наиболее странная часть всей этой затеи. Во всех документах нет внятного описания что такое НСУД, кроме некоторых сравнений его со СМЭВ3. Но если в СМЭВ можно прокачивать сообщения по условно единой шине, то прокачивать данные через НСУД не только странно, но и формирует немало вопросов по обработке персональных данных, в частности. В принципе, в мире, в крупных и в развитых странах, нет нигде единой системы именно обработки государственных данных. Такое возможно в некоторых городах-государствах, но лишь по причине малого числа систем и их, относительно, простой гармонизации.
4. В документе по систематизации [4], с одной стороны есть упоминания онтологического подхода, а с другой ничего про его практическое воплощение и понимание сложности проблемы. Онтологическое описание данных в RDF/OWL формате - это огромная постоянная работа требующая не только команд онтологов, больших организационных усилий. Причём усилий непрерывных поскольку структуры и виды данных в исходных системах живут по правилам владельцев этих систем и регулярно меняются. Например, в одном только портале госзакупок структуры данных меняются до 6-8 раз в год, и это чаще большие чем точечные изменения.
5. Авторы документов явно не сталкивались в рабочей жизни с реальным качеством данных, поскольку эта тема вообще никак не раскрыта. Ни необходимость проверки, ни практики форматно-логического контроля, ни международные и российские стандарты.
6. Нет даже документа в котором был бы просистематизирован российский и международный опыт. Получается такой "сферический НСУД в вакууме", хотя опыта то много. Очень много и куда более серьёзного чем те результаты НСУДа которые сейчас приходится читать.

Стилистическое:
- документы очень тяжело написаны. В них практически нет ничего про размышления, анализ, объяснения причин, вместо этого там бесконечное число списков. Можно сказать что почти все тексты состоят в основном из списков.
- текстовые формы заполнения паспортов [5] (стр. 22-28), экспертных заключений [6] (стр. 16-17) - это, конечно, кроме как насмешкой над цифровизацией не назвать.
- в случае экспертных заключений сама формулировка "Форма экспертного заключения о проведении экспертизы отказа в предоставлении доступа к государственным данным" является странной. Экспертиза отказа, совершенно новое явление нашей жизни. [6]

Наверняка найдётся ещё что-то, вполне возможно что даже из текущих документов НСУД можно извлечь какую-либо пользу.
Ссылки:
[1] https://digital.ac.gov.ru/materials/methodical-material/
[2] http://government.ru/docs/36940/
[3] https://digital.ac.gov.ru/upload/iblock/354/Концепция создания цифровой аналитической платформы.pdf
[4] https://digital.ac.gov.ru/upload/iblock/56b/Требования по систематизации государственных данных.pdf
[5] https://digital.ac.gov.ru/upload/iblock/a12/Требования по заполнению и ведению паспорта государственного информационного ресурса.pdf
[6] https://digital.ac.gov.ru/upload/iblock/010/Порядок предоставления доступа к государственным данным.pdf

#data #nsud #opendata
В Латвии открыли реестр юридических лиц [1] для общего доступа, теперь искать в реестре довольно просто и удобно и доступны сведения о компаниях, их владельцах и так далее. Об этом подробнее на сайте SmartLatvia [2]. Причём даже декларируется доступность паспортных сведений, но вот тут и есть некоторые оговорки.

На самом деле, этот реестр доступен в 3-х режимах доступа:
1. Общедоступная информация об организации, событиях связанных с ней и персонах аффилированных с организацией. Не требует авторизации или оплаты.
2. Исторические сведения и документы организации доступны после авторизации через одного их провайдеров электронной авторизации. Опять же бесплатно
3. Некоторые документы и личные сведения о персонах можно получить через мотивированный запрос и за деньги.

Формально этот сервис должен был работать с 7 января, но фактически его запустили уже сейчас. Здесь ничего нет про открытые данные, поскольку часть этих данные публикуется уже давно, но не на портале открытых данных Латвии [3], а на специальном разделе реестра организаций [4] где доступны сведения по самим юр лицам, но не по документам и не по владельцам/руководителям. Именно поэтому стоит ждать следующего шага - доступности данных для машинного анализа.

И раз такое дело то напомню о проекте Open Corporates [5] в котором собраны сведения о 170 миллионах юридических лиц по всему миру включая Латвию (в части открытых ранее сведений). Open Corporates существует в форме социального ориентированного бизнеса предоставляющего доступ к поиску по всему реестру юр лиц и предоставляющему за плату доступ к API. Но для некоммерческих организаций и проектов и доступ к API тоже бесплатен.

Ссылки:
[1] https://info.ur.gov.lv
[2] http://www.smartlatvia.lv/informacija-o-latvijskih-kompanijah-teper-dostupna-dlja-vseh-i-besplatno/
[3] https://data.gov.lv
[4] http://dati.ur.gov.lv/
[5] https://opencorporates.com/

#opendata #opengov #latvia #opencorporates
Для тех кто думает о трендах которые существуют в ИТ и разработке ПО в проекте OpenSourceCompass [1] мониторят популярность технологичеcких трендов, вклад участников по направлениям и по странам на основе активности в проектах на платформе Github. Хотя и последние данные там на первый квартал 2019 года, есть немало любопытного. Например, по активности пользователей Россия [2] на 8 месте [3], а в лидерах США, Германия, Великобритания, Китай, Франция, Канада и Индия.

Проект сделан добротно визуально и весьма любопытен исследующим открытый код и технологические направления в ИТ и он был бы невозможен без открытых данных. В его основе база GHTorrent [4], регулярный слепок данных Github'а выкладываемый в формате дампа MySQL и в виде доступной онлайн базы данных.

Кстати, этот проект поддерживался когда-то Microsoft через выдачу им кредитов для платформы Azure.

Тем кто интересуется изучением инструментов анализирующих активность opensource сообщества также могу порекомендовать эту подборку [5]

Ссылки:
[1] https://opensourcecompass.io/
[2] https://opensourcecompass.io/locations/country/137
[3] https://opensourcecompass.io/locations
[4] http://ghtorrent.org/
[5] https://livablesoftware.com/tools-mine-analyze-github-git-software-data/

#opensource #opendata
DataWheel [1] одна из компаний со специализацией на визуализации данных которых я мониторю начиная с их проекта DataUSA [2] в котором они наглядно представили разнообразные статистические данные по рынку труда и образованию в США. Проект и по сей день интересен визуально и содержательно, например, они добавили инструмент Viz Builder по визуализации конкретных показателей [3], а также сделали несколько похожих проектов в других регионах.

Например, DataAfrica [4] охватывает сельское хозяйство, климат и здравоохранение части африканских стран с просмотром до конкретного района.

Проект CNYVITALS [5] даёт визуализацию и сравнение районов центрального Нью Йорка по демографии, экономике, бедности и другим показателям.

А проект DataChile [6] (на испанском языке) даёт визуализацию статистику Чили во множестве разрезов: экономика, образование, жильё, здоровье и выборы.

Если Вы спросите меня как должна бы выглядеть общедоступная статистика в России, именно эти проекты я приведу в пример.
И, конечно, USAFacts [7] аналог которого тоже очень хотелось бы иметь на российских данных.

Ссылки:
[1] https://www.datawheel.us
[2] https://datausa.io
[3] https://datausa.io/visualize
[4] https://dataafrica.io/
[5] https://pro.cnyvitals.org
[6] https://es.datachile.io
[7] https://usafacts.org/

#opendata #dataviz
Давно ищу примеры симуляторов действующих экономик с измерением того как повлияет принятие тех или иных законов или те или иные внешние или внутренние события. С прогнозами последствий, конечно.

Всё что удалось найти - это Budget Model [1] в центре Penn Wharton в Университете Пенсильвании. У них есть действующая модель экономики США и регулярные оценки последствий тех или иных законопроектов. Например, у них есть анализ принятия закона о налогообложении богатых (Wealth Tax) [2] и многое другое, включая симуляторы принятия решений [3].

Знаете ли Вы что-то подобное в России или в других странах?

Ссылки:
[1] https://budgetmodel.wharton.upenn.edu/our-model-0
[2] https://budgetmodel.wharton.upenn.edu/estimates/2019/12/12/senator-elizabeth-warrens-wealth-tax
[3] https://budgetmodel.wharton.upenn.edu/social-security

#economy #data #simulation
Национальная библиотека Люксембурга (BnL) [1] запустила проект веб-архива [2] в рамках которого планирует архивировать все сайты в домене .lu, сайты так или иначе созданные в Люксембурге.

С 2017 года BnL входит в международный консорциум по веб-архивации IIPC, с 2018 года в коалицию по цифровому сохранению DPC и с 2016 года сотрудничает с Интернет-архивом archive.org

Проект веб-архивации - это логичное продолжение инициатив по созданию цифровых архивов и уже сейчас помимо архивации всех сайтов зоны .lu в архиве осуществляется архивация сайтов через направленную индексацию под определённые события.
Уже сейчас собрано 53 терабайта из 100 тысяч доменов .lu и 543 миллиона документов [3].

Это не единственный государственный проект по веб-архивации в мире, большой их список собран в соответствующей странице в Википедии [4]

Ссылки:
[1] https://bnl.lu
[2] https://www.webarchive.lu/
[3] https://www.webarchive.lu/what-we-have/
[4] https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives

#digitalpreservation #archives #digitalarchives #webarchives
Пользователь Reddit'а Kchaxcer выложил пост с анализом пакетов исходящих из мобильных устройств Samsung с кратким, но ёмким выводом что Samsung передаёт чувствительную информацию на сервера в Китае [1], подробнее на русском об этом в CNews [2]. Особенность в том что данные передаются неудаляемой системной утилитой Device Care, а сами данные передаются китайском компании Qihoo 360 [3], разработчикам антивирусного ПО 360 Total Security.

Что есть Qihoo 360 ? Это крупная и весьма успешная китайская интернет компания с частным капиталом с выручкой более чем в 1,9 миллиарда USD в 2018 году [4]. Для сравнения доход Яндекса в России в 2018 году достиг 2.019 миллиарда USD [5] . То есть компания, в любом раскладе немаленькая.

В чем глубинные проблемы в этой ситуации:
1. Общая истерия вокруг китайских продуктов в мире. Я бы даже сказал истерия вокруг китайских, арабских, а скоро и российских продуктов. Обоснована ли она? Это вопрос скорее предубеждений чем последствий. Безусловно современная цифровая экономика - это экономика слежки. Разница лишь в том что кто-то умеет показать что они не творят зло (или уже не умеют?), а кто-то подозревается в самых тёмных грехах.
2. Производителей антивирусов в мире ограниченное количество. Производители ПО и железа пытающиеся защищать устройства пользователей от вирусов/троянов/криптомайнеров и тд. вынуждены выбирать одного из производителей на рынке, а это ограниченный выбор компаний в США, Великобритании, России, Чехии и ряда других стран. А предположим что Samsung бы договорился о внедрении антивируса не от Qihoo 360, а от Касперского, его бы подозревали тогда в сговоре с российскими спецслужбами?
3. В корне всего это то что пользователь не имеет выбора. Выбирая между ограниченным числом производителей мобильных устройств пользователи не имеют возможности выбрать страну/юрисдикцию хранения их данных, то кому предоставлять их, а кому нет, какой антивирусный движок должен использоваться в его устройстве и так далее. За доступ к данным, доступным через устройства пользователя, идёт непрекращающаяся борьба огромного числа коммерческих компаний, а в последние годы и государственных структур.
4. Простого решения здесь не существует. Вот в конкретном случае Samsung заподозрили в нехорошем на основании того что их приложение передавало данные на сервера Qihoo 360 в юрисдикции Китайской республики. А, предположим, что Qihoo 360 и Samsung вдруг резко бы поумнели и то же приложение Device Care продолжало бы передавать данные в Qihoo 360, но через прокси сервер в юрисдикции Samsung'а или сервера в юрисдикции другой страны? Это вопрос скорее юридический чем технический, но безусловно такая схема "проксирования" трекеров вполне осуществимая. И подобные трекеры уже есть и их уже гораздо сложнее отследить.

В качестве резюме я лишь хочу напомнить что тотальная корпоративная слежка это оборотная сторона всех тех цифровых сервисов которые делают жизнь большинства из гораздо комфортнее. Однако именно из-за того что слишком многие пользователи не знают того сколько они платят за тот или иной сервис, не в деньгах, а в данных, то и цифровая защита прав гражданина/потребителя всё более и более актуальна.

Ссылки:
[1] https://old.reddit.com/r/technology/comments/ekx1jx/chinese_spyware_preinstalled_on_all_samsung/?
[2] https://www.cnews.ru/news/top/2020-01-08_samsung_prodaet_dyryavye_smartfony
[3] https://en.wikipedia.org/wiki/Qihoo_360
[4] http://www.chinadaily.com.cn/a/201904/16/WS5cb59d6ba3104842260b6871.html
[5] https://www.statista.com/statistics/225701/revenue-of-yandex-since-2007/

#privacy #trackers
Для тех кто хочет отслеживать реальную ситуацию с пожарами в Австралии, как минимум в штате Новый Южный Уэлльс есть сервис мониторинга всех пожаров Fires Near Me [1]
Аналогичные сервисы есть в штате Виктория [2] (охватывает не только пожары) и сервис MyFireWatch [3] от властей штата Западная Австралия, и вновь более локальный в штате Тасмания [4]

Но, конечно, есть и негосударственные сервисы мониторинга, таких как карта пожаров на карте Google [5] и волонтерский проект от Unorthodox Engineers [6]

И, конечно, карта пожаров NASA по всему миру [7]

Между тем остаётся вопрос о том что до июля 2020 года осталось всего 6 месяцев, а готовится ли кто-либо у нас к ним? СМИ что отражать в реальном времени, пожарные чтобы предупредить, граждане чтобы пережить? В 2019 году пожары были именно что в июле, а год, похоже, будет если не горячим, то тёплым.

Ссылки:
[1] https://www.rfs.nsw.gov.au/fire-information/fires-near-me
[2] http://emergency.vic.gov.au/respond/
[3] https://myfirewatch.landgate.wa.gov.au/
[4] http://www.fire.tas.gov.au/
[5] https://google.org/crisismap/australia
[6] https://www.unorthodox.com.au/
[7] https://firms.modaps.eosdis.nasa.gov/map/#z:5;c:133.5,-25.6;d:2020-01-07..2020-01-08

#fires #australia #russia