Ivan Begtin
7.98K subscribers
1.8K photos
3 videos
101 files
4.51K links
I write about Open Data, Data Engineering, Government, Privacy, Digital Preservation and other gov related and tech stuff.

Founder of Dateno https://dateno.io

Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech
Download Telegram
Вчера на круглом столе по будущему российской статистики в рамках XX апрельской конференции НИУ ВШЭ было обсуждение будущего Росстата.

Я кратко сформулирую мои тезисы, озвученные там:
1. Основными потребителями официальной статистической информации являются граждане, все экономические акторы принимающие решения. Росстат не должен ориентироваться исключительно на потребителей в органах власти.
2. Доверие к официальной статистике может и должно формироваться не только через обеспечение понятности используемых методик расчета показателей, но и через раскрытие исходного кода используемого для расчета этих показателей.
3. Важным аспектом официальной статистики является отсутствие гипер локальных, муниципальных данных. Раскрытие этих данных сейчас недостаточно удобно, недостаточно полно, недостаточно проверяемо.
4. Критичен вопрос огромного объема ведомственной статистики, не подпадающей под публичное раскрытие и не предоставляемых органами власти в Росстат. Как минимум это касается таких ФОИВов как Минздрав, МВД, Миннауки и многих других. Росстат сейчас не выступает единым методологом.

Конечно же ключевой вопрос в этом всём - это кризис доверия к данным официальной статистики и интенсивный поиск альтернативных источников актуальных и оперативных данных, как потребителей данных внутри государства, так и частным сектором. Этот кризис доверия уже не первый год формирует вопрос внутри государства и вне его о необходимости существования официальной статистики в той организационно-технической форме в которой она существует сейчас.

#data #stats #openness
Вот меня спрашивают, а где взять медицинскую статистику, по госпитализации, по ОРВИ?

А мне есть что ответить и, я очень удивляюсь что журналисты до сих пор не подняли эту тему.

Ежегодно ФГБУ «ЦНИИОИЗ» Минздрава России [1} (расшифровывается как - Федеральное государственное бюджетное учреждение «Центральный научно-исследовательский институт организации и информатизации здравоохранения» Министерства здравоохранения Российской Федерации
получает до 540 миллионов рублей в 2019 году [3] и сравнимые суммы в другие годы в виде субсидий [3] лт Минздрава России.

У этого ФГБУ есть госзадание на 2019-2023 годы [4] из которого мы можем узнать о том что данное ФГБУ отвечает за:
---
Ведение базы данных значений форм статистического наблюдения, утвержденных приказами Росстата и Минздрава России, получаемых от органов исполнительной власти субъектов Российской Федерации с использованием программного комплекса МЕДСТАТ. Агрегация значений базы данных в целях формирования сводной информации по Российской Федерации. Ведение базы данных значений форм статистического наблюдения с использованием программного комплекса МЕДСТАТ, получаемых от ФГУ. Проведение контроля достоверности и качества представляемой информации при включении в базу данных статистических показателей, включая идентификацию и расшифровку единиц значений форм статистического наблюдения (словари строк и граф) для актуализации МЕДСТАТ.
---
Это в "Часть 2 Раздел 2" госзадания.

А где находятся эти сведения? В разделе "Медицинская статистика" [5] на сайде данного ФГБУ. Конечно же, закрытое паролем и недоступное.

При том что:
а) Эти сведения не содержат персональных данных
б) Эти сведения не содержат коммерческой тайны
в) Эти сведения не содержат государственной тайны
г) Эти сведения не могут быть "cлужебной тайной" и тд.

Иначе говоря, медицинская статистика должна быть общедоступной. Анализ регламентов её сбора подтвердит что ФГБУ собирает её не реже чем ежемесячно.

Если Вы посмотрите на контракты этого ФГБУ как госзаказчика, то окажется что в основном он тратит средства на заказ рекламы [6] у ООО "ВИЭНДЖИ"

То есть получается что наполнение данными и развитие системы Медстат они делают своими силами. Даже интересно зарегистрирована ли эта информационная система как ФГИС.

А теперь попробуйте запросить её у Минздрава или непосредственно у данного Института. Получится ли её получить? Почти 100% что ничего, даже в разрезе страны Минздрав не предоставит. А собираются то данные с детализацией до региона, муниципалитета и конкретного учреждения. Статистические формы сбора найти не сложно.

Все наводки для полноценного журналистского расследования я предоставил, дальше сами;)


Ссылки:
[1] https://mednet.ru
[2] https://spending.gov.ru/subsidies/subsidies_list/05620PAC000/
[3] https://spending.gov.ru/subsidies/receivers/001X7262/
[4] https://mednet.ru/images/materials/gz/gz_na_2019-2021.xlsx
[5] https://mednet.ru/miac/meditsinskaya-statistika
[6] https://spending.gov.ru/goscontracts/customers/03731000146/

#opendata #stats #medstat
Для тех кто интересуется состоянием открытых данных в России, вот некоторые цифры:
- за 2020 год на федеральном портале открытых данных было опубликовано 223 набора данных, за 5 месяцев 2021 года - только 2 набора данных
- всего с 2020 года объём этих 225 наборов данных - 405 мегабайт из которых более 390 мегабайт - это данные Минкультуры России и ФНС России (и то есть подозрение что цифры завышены потому что в реестре наборов данных есть дублирующиеся записи. Скорее всего реально данных значительно меньше)
- лишь 9 178 наборов данных из 24 002 опубликованы федеральными органами власти, остальные региональными и муниципальными
- 10 ФОИВов не опубликовали ни одного нового набора данных с 2013 года (за 8 лет)
- 20 ФОИВов не опубликовали ни одного нового набора данных с 2015 года (за 6 лет)
- 42 ФОИВа не опубликовали ни одного нового набора данных с 2017 года (за 4 лет)
- 68 ФОИВов не опубликовали ни одного нового набора данных с 2019 года (за 2 года)
- иначе говоря в 2020 и 2021 года лишь 6 ФОИВов разместили хотя бы один новый набор данных на портале открытых данных
- некоторые ФОИВы, при этом, кое что опубликовали на своих сайтах, но куда меньше чем раньше и чем могли бы
- общий объём опубликованных данных на портале data.gov.ru оценить сложно, сайт не даёт статистики, API сайта очень куцое, требуется очень много запросов сделать чтобы подсчитать хоть самые приблизительные цифры, но они будут невелики.
- параллельно этому на сайтах и FTP серверах органов власти опубликовано открытых данных примерно на 20 терабайт. Количественно - это сотни наборов данных, качественно - это данные большого объёма.
- безусловные лидеры по масштабам раскрытия данных - Минкультуры, ФНС России, Федеральное казначейство, Минфин России. Даже при том что тенденции там не только к раскрытию, текущие объёмы доступных данных очень велики.

#opendata #stats
В издании Проект весьма критичная статья про Росстат и раскрытии данных [1], в первую очередь с обвинениями в искажении статистики в угоду политической ситуации и давлению. Проблема эта не на пустом месте, независимость статистического ведомства - это давний вопрос, а политизация статистики в России также уже давно является проблемой.

Но как мне говорили специалисты в кулуарных разговорах проблема куда глубже. Даже в сравнении с СССР. Потому что даже в СССР были статистические справочники двух типов. Публикуемые для всех и находящиеся исключительно в закрытом обращении.

У многих кто сталкивается с современной отечественной статистикой возникают вопросы "Но ведь не может быть что _они_ принимают на ней решения, наверняка где-то есть реальные цифры под ДСП или гостайной". Реальность хуже, проблема в том что потребителями этих цифр являются не только массово граждане, но и те кто принимает решения и пишет нормы законов и иных документов.

Эта проблема системная, из-за сверхприсутствия государства во всех областях жизни и "рейтингодрочества" в нашей стране у почти всех есть просто огромная мотивация в искажении и подлоге статпоказателей.

Системные изменения тут нужны не только в Росстате, а проблемы поднимаемые в статье правильные.

Ссылки:
[1] https://www.proekt.media/narrative/dannye-rosstata/

#rosstat #stats #statistics
This media is not supported in your browser
VIEW IN TELEGRAM
Спасибо читателю моего канала, копирую видео из сообщения из чата

Увы, Росстат это какая-то боль, за данными на сайте совсем не следят. Не только в разделе открытых данных, а и вообще в остальных блоках тоже.

#opendata #data #stats #rosstat