Ivan Begtin
8.08K subscribers
1.46K photos
3 videos
98 files
4.19K links
I write about Open Data, Data Engineering, Government, Privacy and Data Preservation and other gov and tech stuff
Telegram @ibegtin
Facebook - https://facebook.com/ibegtin
Secure contacts ivan@begtin.tech

Contact @NMBabina for ads proposals
Download Telegram
Буквально месяц назад, в июле 2016 года вышел доклад THE DATA ACT Vision & Value [1] опубликованный Data Foundation [2] посввящённый принятом в США в 2014 году The Digital Accountability and Transparency Act (DATA) [3]. Этот закон состоит из поправок к закону от 2006 года Federal Funding Accountability and Transparency Act (FFATA)[4] который в 2006 году прописал требование к созданию единого портала отчётности всех федеральных агентств США на портале USASpending.gov [5].

Кстати, в качестве отступления, первый портал по госрасходам в США был создан НКО OMB Watch [6] и назывался он FedSpending [7].
Fedspending.org появился в октябре 2006 и стал основной для USASpending.gov и тот существовал на том же коде около 2-х лет, после чего судьба двух этих порталов - негосударственного и государственного разошлась.

Как бы то ни было, FFATA обеспечивал лишь базовый уровень раскрытия информации и все эти годы НКО и активисты лоббировали повышение уровня раскрытия информации, её качества и находили многочисленные ошибки и проблемы в уже опубликованных данных. Например, в отчёте Sunlight Foundation и их проекте Clearspending [8].

Сейчас The Data Act должен обеспечить появление стандарта открытости бюджетных данных и с мая 2017 года все агентства в США должны будут публиковать данные в этом стандарте.

Об этом подробнее в самой первой ссылке, в свежем вышедшем докладе THE DATA ACT Vision & Value [1].

В качестве второго отступления - в России раскрытие данные о госзакупках идёт не менее чем 10 лет, с принятого закона 94-ФЗ который обязал с 1 января 2006 года публиковать все закупки и контракты федеральных органов власти в соответствующих федеральных информационных системах, а далее и вообще все органы власти, муниципальная власть и регулируемые корпорации попали под действие 44-ФЗ и 223-ФЗ ужесточившие эти требования. Уровень раскрытия информации о госрасходах превосходит раскрытие в США многократно. Несмотря на всю неэффективность и громозкость 44-ФЗ - его открытость - это ключевая особенность российской системы государственны и муниципальных финансов.

Ссылки:
[1] http://static1.squarespace.com/static/56534df0e4b0c2babdb6644d/t/578642f2893fc0672b741637/1468416780354/Electronic+Version+-+DATA+Act+Vision+and+Value.pdf
[2] http://www.datafoundation.org/
[3] https://www.gpo.gov/fdsys/pkg/PLAW-113publ101/pdf/PLAW-113publ101.pdf
[4] https://www.gpo.gov/fdsys/pkg/PLAW-109publ282/pdf/PLAW-109publ282.pdf
[5] http://usaspending.gov/
[6] http://www.ombwatch.org/about_us
[7] http://www.fedspending.org/
[8] http://sunlightfoundation.com/clearspending/

#opendata #opengov #spending #budget #procurement
Мне не верят когда я говорю и пишу о том что российская система раскрытия информации о госфинансов одна из самых открытых, а зря. Раскрытие информации о госфинансах в России, действительно, носит беспрецендентный характер.

Для сравнение посмотрите на уровень публикации информации о контрактах в Канаде.
Все контракты федерального правительства публикуются на официальном сайте [1] начиная с 2004 года и варьируются от 3200 контрактов в 2004 году, до 26000 в 2017. Это только контракты федерального уровня, начиная с сумм от $10 000 канадских долларов (479 900 рублей). Всего опубликовано чуть более 200 тысяч контрактов за все время раскрытия информации.

Типичный пример записи о контракте [2] не содержит: документов, детализации предметов закупки, реквизитов поставщика (вот так и угадывай по его названию), реквизитов заказчика, места исполнения и взаимосвязи с бюджетом и еще сотен других реквизитов.

Главное из этого всего - это, конечно, документы контракта. В России уровень открытости госрасходов и не только по госконтрактам, но и по субсидиям, грантам и многому другому - беспрецедентный. Он отражает не только уровень прозрачности, но и уровень забюрократизованности.

Стран в которых правительства раскрывают тексты договоров с подрядчиками - единицы. Тех в которых публикуют все как открытые данные - еще меньше. Это не значит что это однозначно хорошо и правильно, это означает что как раз эта тема одна из самых прозрачных в России.

Ссылки:
[1] http://open.canada.ca/en/search/contracts
[2] http://open.canada.ca/search/contracts/reference/e670070a9aca70e09f10541130dc3a1f

#opendata #opengov #budget #procurement
У КБ Стрелка вышло интересное исследование по устройству городских бюджетов региональных столиц [1].

Со многих точек зрения интересное исследование, в первую очередь тем что видна дистанция между городами лидерами по управлению городским имуществом и финансами и городами аутсайдерами.

Всегда жаль лишь что по итогам публикуются только документы исследования, а не созданные данные.

Ссылки:
[1] http://citybudget.strelka-kb.com/
#openbudgets #budget
Полная презентация показателей и структуры национальных проектов на сайте правительства [1] .
Сразу возникает много вопросов:
1. В программе Цифровая экономика скрыта/убрана Национальная система управления данными. Куда она подевалась - непонятно, возможно внутри какого-то другого проекта>
2. У Максима Акимова [2] больше всех нацпроектов в кураторстве: Цифровая экономика, Безопасные и качественные автомобильные дороги и Комплексный план модернизации и расширения магистральной инфраструктуры
3. Три вице-премьера: Чуйченко, Борисов и Трутнев не курируют ни одного наз проекта.

Ссылки:
[1] http://static.government.ru/media/files/p7nn2CS0pVhvQ98OOwAt2dzCIAietQih.pdf
[2] http://government.ru/gov/persons/207/events/

#data #budget #nationalprojects
8 мая прошёл совет при президенте по стратегическому развитию и национальным проектам. Он транслировался в прямом эфире онлайн по Россия24 и сейчас его видеозапись и стенограмма стали доступными [1].

Я лишь частично успел пересмотреть его в прямом эфире и позже перечитывал стенограмму.

Для тех у кого есть время, можно прочитать стенограмму полностью, для тех кто хочет самую суть рекомендую прочитать выступление Чистовой Веры Ергешевной, заместителя председателя Счётной палаты [2], в видео это 1:25:20

Я сожму произнесённое ей тезисами:
- высокие темпы роста заложенные в нац проекте основаны на "оптимистичном сценарии" развития экономики.
- в паспортах нац. проектов кроме двух «Малое и среднее предпринимательство» и «Жильё» нет упоминания их вклада в нац. цели.
- даже если всё что в нац. проектах запланировано будет сделано, всё равно мало шансов что нац. цели будут достигнуты.
- не более 25% (1/4) всех мероприятий в нац. проектах влияют на нац. цели
- значительная часть мероприятий в нац. проектах не отличается от мероприятий в прошлых нац проектах и госпрограммах (безрезультатных).
- в федеральном статнаблюдении нет показателей нац. проектов
- бюджетный манёвр не был совершён, на здравоохранение и образование выделяется недостаточно средств
- проектный подход не работает, а нац. проекты разбросали по многим госпрограммам. Цифровую экономику разбросали на 10 госпрограмм
- создаются непрозрачные структуры в виде государственных АНО и Фондов выводимых из под 44-ФЗ и 223-ФЗ.
- все паспорта нац. проектов проходят корректировку и должны быть скорректированы на достижение национальных целей.

Остальные выступления не так важны, а это впервые прозвучавший чётко взгляд со стороны на то что делает сейчас исполнительная власть на федеральном уровне.

Я добавлю от себя что я вижу:
- нац проекты реализуются также как раньше реализовывались госпрограммы, по модели бюджетного феодализма. Всё больше полномочий "стянуто" на вице-премьеров, всё более техническую функцию выполняют министры, но ничего не меняется в том что разные нац. проекты никак не смешиваются между собой;
- система управления нац. проектами крайне громоздкая и одновременно непрозрачная. За всё это время полноценные документы нац. проектов с описанием хотя бы взаимосвязи мероприятий и показателей нац. проектов так и не появились. про нац. цели я даже не говорю, это кажется какой-то совсем фантастикой если Правительство сможет это сделать;
- Правительство одновременно не идёт на упрощение 44-ФЗ и отказу от "аукционного крена" в 44-ФЗ и вместо этого всё больше распределяет средств не только на единственный источник, но и просто субсидиями без каких-либо контрактных процедур;

В целом ощущения что очень ненулевая вероятностью что все эти нац проекты или перепишут или часть притушат/закроют/разбросают на другие. Вопрос лишь в том в какой форме это будет сделано. Через бюджетное урезание или через привлечение к ответственности?

Ссылки:
[1] http://kremlin.ru/events/president/news/60485
[2] http://kremlin.ru/events/president/news/60485#sel=169:1:yJF,185:3:UZD

#government #budget #govprograms #govprojects
Почему я с 2005 года читаю все бюллетени Счетной палаты? Потому что узнаю много нового о том как идет информатизация и цифровизация в России.

Вот выдержка из отчета о результатах контрольного мероприятия «Проверка использования средств займа Международного банка реконструкции и развития на реализацию проекта № 4867-RU «Развитие системы государственной статистики – 2» в 2008–2018 годах» в бюллетень Счетной палаты №8 (август) 2019 г. [1]
...
В соответствии с пунктом 2 раздела B технических требований в результате выполнения работ в рамках контракта от 28 июля 2017 года ST2/1/B.13.2 «Совершенствование ИВС (информационно‑вычислительной системы) Росстата в части инструментария распространения результатов» должны были быть достигнуты в том числе следующие результаты: обновление дизайна сайта http://gks.ru и кольца сайтов; внедрение единой системы управления контентом; создание мобильного приложения сайта для платформ iOS и Android общей стоимостью 64 566,7 тыс. рублей.Согласно пункту 9 раздела А «Используемые термины и сокращения» технических требований (включая график реализации) контракта сокращение «Сайт (основной сайт, Интернет‑портал)» в рамках контракта означает – официальный Интернет‑сайт (портал) Федеральной службы государственной статистики, доступный в сети Интернет по адресу: http://gks.ru.В нарушение подпунктов 9, 10, 11 пункта 1 раздела В технических требований контракта и абзацев 7, 8, 9, 10 пункта 2 раздела В технических требований контракта на момент проверки дизайн официального Интернет‑сайта (портала) Росстата и кольца сайтов, размещенные по адресу http://gks.ru, не были обновлены.Кроме того, по адресу сети Интернет: http://gks.ru не внедрена обновленная единая система управления контентом. Необходимо отметить, что в соответствии с пунктом 5.2.6.6 «Требования к мобильному приложению» технических требований контракта ЗАО «ЛАНИТ» в том числе должно обеспечить размещение разработанных приложений на площадках App Store и Google Play. При этом фактически на момент проверки мобильное приложение Росстата на площадках App Store и Google Play отсутствовало. Таким образом, Росстатом приняты и оплачены работы, не в полной мере соответствующие техническим требованиям контракта No ST2/1/B.13.2, на сумму 64 566,7 тыс. рублей, что не соответствует статье 309 Гражданского кодекса Российской Федерации, согласно которой обязательства по договорам должны исполняться 198No8(260)І2019 5 МАНУЙЛОВА
надлежащим образом в соответствии с условиями обязательства и требованиями закона.Срок ввода в промышленную эксплуатацию новой версии Интернет‑портала определен в перечне поручений руководителя Росстата от 12 марта 2019 года No ПМ‑15/5060‑ВД – 30 апреля 2019 года. Однако по состоянию на 7 мая 2019 года новая версия Интернет‑портала по адресу в сети Интернет:
http://gks.ru не была введена в промышленную эксплуатацию.
...

Ссылки:
[1] http://audit.gov.ru/activities/bulleten/965/38333/

#budget #it #sprf #lanit
Переориентация госпрограмм на выполнение национальных проектов привела к снижению прозрачности бюджетной статистики Минфина

Запуск национальных проектов, несомненно, одна из наиболее амбициозных инициатив государства за последние годы. Но, как и у всех амбициозных инициатив, у нее есть не только высокие цели, но и последствия. Я бы даже сказал — сопутствующий ущерб. Профессиональные экономисты и эксперты в региональной политике могут рассказать о последствиях национальных проектов для ВВП, уровня жизни и инфраструктуры, а я расскажу о том, как они влияют на открытость государственных финансов в России.
...
Подробнее на РБК:
https://www.rbc.ru/opinions/economics/20/09/2019/5d81e9f99a7947a59b1f7cea

#budget #opengov
В публичном пространстве сейчас много и больно критикуют нац. проекты, я тоже приложил руку в колонке РБК про то что бюджетная роспись по нацпроектам стала непрозрачной [1].

Предположим что с нац проектами не настолько всё плохо как я критикую и пишут другие, предположим что те кто отвечает за их проектирование и исполнение готовы слышать критику.

На основе этих, возможно, наивных предположений я постараюсь изложить основные шаги которые необходимо делать _прямо сейчас_.

1. Создать портал раскрытия информации по нац проектам по аналогии с порталом госпрограмм и порталом нац проектов 2006-2009 года. И не потратить на это самых минимальных средств.
2. Публиковать детальную сводную бюджетную роспись с полной детализацией всех мероприятий нац проектов. Темам самым вернуть необходимую минимальную прозрачность госрасходов.
3. Обеспечить раскрытие информации о результатах нац проектов. Не KPI, не медийный статьи, а конкретные результаты с фото, видео, аэрофотосъёмкой, актами принятых работ, ФИО ответственных за каждое мероприятие, каждый объект, каждый контракт
4. Обеспечить аналогичное раскрытие информации по каждому участвующему субъекту Российской Федерации и муниципальному образованию.
5. Разумеется ФОИВам публиковать все материалы связанные с нац проектам в форматах открытых данных
--
Всё перечисленное, кстати, очень несложно сделать. При наличии соответствующей мотивации у федеральных органов исполнительной власти.

А теперь поговорим о гораздо более "фантастических" действиях, сложных не только в росийской системе госуправления, но и не во всех странах существующая.
6. Обязательное протоколирование всех совещаний и доступность стенограмм и протоколов для граждан и журналистов.
7. Провести большую смысловую работу по учёту результатов не по освоенным средствам, а по достигнутым KPI.
8. Реорганизовать систему бюджетирования, контрактации и субсидирования мероприятий так чтобы акцент был на результатах, а не на имитации конкуренции или освоенных средствах.
9. Создавать и обязывать использовать обязательные системы регистрации результатов и их раскрытие во всех случаях кроме гостайны

И я сейчас не только про нацпроект "Цифровая экономика". Это касается всех нацпроектов. Да и не только их, если быть до конца честным.

Ссылки:
[1] https://www.rbc.ru/opinions/economics/20/09/2019/5d81e9f99a7947a59b1f7cea

#budget #government #procurement #nationalprojects
В этом году, наконец-то открываем большой проект spending.gov.ru по мониторингу госрасходов. С особым акцентом на нац проектах, аналитике, рейтингах и данных. Я вскоре буду много писать об этом всё подробнее. Пока предлагаю для самостоятельного изучения

#spending #budget
Беда-беда с нацпроектом "Цифровая экономика", в Счетной палате подвели первые итоги нацпроектов [1] и результаты по нацпроекту "Цифровая экономика" - исполнение бюджета 53,6%, ниже чем у всех остальных нацпроектов.

Об этом уже пишут CNews [2], РБК [3] и наверняка ещё многие издания напишут в эти дни. С чем это связано? Кто виноват? Извечные русские вопросы на которые практически всегда находятся (неправильные) ответы. Главный же вопрос в куда более сложном измерении достижения результатов по нацпроектам. И измерение в деньгах лишь тень реального измерения в результатах и их отсутствии.

Ссылки:
[1] http://audit.gov.ru/press_center/news/39776
[2] https://www.cnews.ru/news/top/2020-01-13_tsifrovaya_ekonomika_provalila
[3] https://www.rbc.ru/rbcfreenews/5e1c4ffe9a79474b297f200d

#natprojects #budget
Я бы сказал удивительно, но на самом деле не очень то что на сайте Открытого бюджета Москвы есть новость о том что проект бюджета на 2021-2023 годы внесен в Московскую городскую думу [1] а ссылки на сам текст внесенного проекта бюджета или данные отсутствуют.

В виде текста в формате DOCX он есть на сайте МГД [2], для тех кому очень лень извлекать таблицы из этого файла вручную рекомендую утилиту docx2csv [3] с её помощью можно извлечь все таблицы в CSV формате или в виде Excel файлов.

Ссылки:
[1] https://budget.mos.ru/news05112020
[2] https://duma.mos.ru/ru/0/regulation_projects/corebofs002080000nb3mf7d2btjvc48
[3] https://github.com/ivbeg/docx2csv

#opendata #moscow #budget
Хотя я всё время и говорю о том что открытость государственных финансов в России высокая, но она не без "нюансов".

Вот несколько примеров:
1. Не могу нигде найти в удобном формате данные об исполнении федерального бюджета за 2019 год. Закон об исполнении бюджета был принят в 30 сентября 2020 года, утверждён Советом Федерации 7 октября 2020 года [1], но на сайте ЕПБС отсутствует [2] и на сайте Минфина тоже нет. Есть он на сайтах официального опубликования pravo.gov.ru и других справочно-правовых системах, но там только текст из которого ещё надо вычленять таблицы. Хорошо хоть не сканом, но для непытливого ума - это то ещё испытание.

2. В Республике Татарстан закон об исполнении бюджета данные к закону об исполнении бюджета публикуют без ключевого документа детальной ведомственной структуры расходов [4], а сам закон об исполнении бюджета (не буду даже догадываться почему), но публикуется в виде скана.
А если всё таки заглянуть в ведомственную структуру расходов в этом законе, то она будет приведена с детализацией только до 1-го уровня вида расходов, для сравнения, в отчётах Федерального казначейства детализация до 3-го уровня видов расходов, а в отчетах об исполнении бюджета Москвы как минимум до 2-го уровня видов расходов. Каждый уровень даёт возможность конкретизировать то на что пошли деньги. Например без детализации до 3-го уровня невозможно идентифицировать объёмы средств идущие на ИТ (242 вид расходов) в ведомственном разрезе по субъекту федерации.

Ссылки:
[1] http://pravo.gov.ru/proxy/ips/?docbody=&firstDoc=1&lastDoc=1&nd=102887899
[2] http://budget.gov.ru/epbs/faces/p/%D0%91%D1%8E%D0%B4%D0%B6%D0%B5%D1%82/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD%20%D0%BE%20%D0%B1%D1%8E%D0%B4%D0%B6%D0%B5%D1%82%D0%B5/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD%20%D0%BE%D0%B1%20%D0%B8%D1%81%D0%BF%D0%BE%D0%BB%D0%BD%D0%B5%D0%BD%D0%B8%D0%B8%20%D0%B1%D1%8E%D0%B4%D0%B6%D0%B5%D1%82%D0%B0?_adf.ctrl-state=1invsu6rd_77&regionId=45
[3] https://minfin.gov.ru/ru/perfomance/budget/federal_budget/budgeti/2020/
[4] https://minfin.tatarstan.ru/godovoy-otchet-ob-ispolnenii-byudzheta.htm?pub_id=2362274
[5] https://minfin.tatarstan.ru/godovoy-otchet-ob-ispolnenii-byudzheta.htm?pub_id=2373238

#budget #data #finances
Новый отечественный госсервис, похоже что, информационная система, аналог Национальный Мультисканер virustest.gov.ru в виде системы проверки на вирусы [1] и это такой импортозамещённый VirusTotal [2], но, если VirusTotal поддерживает 60 антивирусов, то здесь их только 3, все отечественные и нет таких важнейших возможностей как проверка через API и ещё многое другое. VirusTotal выдает кратно больше информации о проверяемом файле. Если единственной особой характеристикой Национального Мультисканера является импортозамещённость то всё довольно печально. Вопрос как всегда один и тот же - зачем на это вообще потратили бюджетные средства?

Ссылки:
[1] https://virustest.gov.ru
[2] https://www.virustotal.com

#security #budget
И я не могу не добавить и не акцентировать на закрытости всей этой истории. Вот мы знаем что у портала "Знания", оказывается, есть Научно-редакционная коллегия портала, а как это она есть, а портала нет? Где её состав? Где протоколы заседаний? А Дмитрий Чернышенко, оказывается, председатель Совета Портала «Знания». А где можно почитать положение об этом совете? Его состав? И, простите, я буду зануден, протоколы заседаний совета ? Вообще Дмитрий Чернышенко знает во что ввязался? Думается мне догадывается, иначе присутствовал бы на мероприятии лично, а не направлял бы письмо его участникам.

Многим уже понятно что когда портал Знания будет запущен весной 2022 года, то он получит очень много публичной критики, по всем тем причинам что я озвучивал выше и, с высокой вероятностью, может не пережить 2022 год. Но деньги то уже будут потрачены и это ещё большой вопрос какая их доля пойдет на этих 10 тысяч экспертов.

Ссылки:
[1] http://www.ras.ru/news/shownews.aspx?id=b2fbc33e-71bb-4f9d-8d47-8afe983cfd01
[2] https://ru.wikipedia.org/wiki/Знания
[3] https://t.me/begtin/3236
[4] https://rg.ru/2021/10/19/v-rossii-sozdaetsia-pervyj-v-mire-enciklopedicheskij-portal.html
[5] https://wikimediafoundation.org/about/annualreport/2020-annual-report/financials/

#budget #znanie #spending
На днях я выступал на X Васильевских чтениях организованных журналом Бюджет и как всегда говорил о том что в России средний уровень открытости, высокий в финансовой сфере, и низкий в теме качества жизни. Вот тут выложили мою презентацию [1]. В ней не так много нового как хотелось бы, конечно.

Ссылки:
[1] https://bujet.ru/action/X_chteniya/propramm_Xvch/

#opendata #opengov #budget
Юлия Старостина в The Bell пишет о том что Минфин РФ засекретил данные оперативного отчета о бюджете [1] и в опубликованных данных теперь нет детализации расходов.

Действительно, если сравнить предварительную оценку исполнения федерального бюджета за январь-апрель 2022 года опубликованную 17 мая Минфином [2] и предварительную оценку исполнения федерального бюджета за январь-май 2022 года [3] то видно что данные закрыты.

Туда же я бы добавил то что Федеральное Казначейство перестало публиковать оперативные отчеты по исполнению федерального бюджета, последний был на 1 апреля 2022 г. и опубликован 15 апреля и изменен 25 апреля [4], а также с февраля 2022 года не публикуется ежемесячная статистика государственных финансов [5] и ещё много чего.

Как тут не вспомнить что ещё недавно речь шла про высокую степень открытости российского бюджета, а теперь нет никого из официальных лиц кто мог бы сказать о том что закрывать данные бюджета ошибочно.

Недавно я писал о том что открытость - это признак жизни [6] экономической системы и общественной жизни, чуть позже я доделаю на эту тему большой текст, я как раз над ним работаю.

Закрытие данных о бюджете укладывается в идею "омертвения" бюджетной активности. Не стоит верить тем кто утверждает что оно нужно для сокрытия военных расходов или усложнения работы разведчиков других стран. Причины закрытия подобных данных куда более прозаичны.

Первое - это сокрытие сигналов о реальном состоянии экономики от внутренних экономических агентов. Без достоверной информации многие не могут планировать свои действия. Закрытие данных один из сигналов _крайне плохого состояния_ сейчас и в будущем

Второе - это перераспределение финансовых (бюджетных) потоков. Фактически это означает что ограниченная группа лиц близкая к политическому руководству будет иметь значительно больше информации и, как следствие, ещё большую монополию на распределение бюджетных ресурсов.


Ссылки:
[1] https://thebell.io/minfin-zasekretil-dannye-po-raskhodam-rossiyskogo-byudzheta
[2] https://minfin.gov.ru/ru/press-center/?id_4=37915-predvaritelnaya_otsenka_ispolneniya_federalnogo_byudzheta_za_yanvar-aprel_2022_goda
[3] https://minfin.gov.ru/ru/press-center/?id_4=37970-predvaritelnaya_otsenka_ispolneniya_federalnogo_byudzheta_za_yanvar-mai_2022_goda
[4] https://roskazna.gov.ru/ispolnenie-byudzhetov/federalnyj-byudzhet/1021/
[5] https://roskazna.gov.ru/ispolnenie-byudzhetov/statistika-gosudarstvennykh-finansov-rf/1038/
[6] https://t.me/begtin/3955

#budget #openness #govfinances #government
budget2023_ved.zip
252.2 KB
Для тех кто изучает открытые данные открытой части федерального бюджета России напомню что официальное опубликование бюджета происходит в системе СОЗД Государственной Думы РФ это законопроект № 201614-8 [1]․ Внутри него 602 файла в форматах PDF и DOC и для тех кому сложно с ними работать у нас в на сайте архива мы сделали копию всех файлов, 348 мегабайт ZIP архив [2]. Содержание архива есть в списке извлеченных с веб-страницы ссылок файле dataset.csv [3] и в файле processed.csv [4] по итогам выгрузки файлов.

Как работать с этими документами ? Внутри PDF документов и DOC файлов тексты и гигантские таблицы на тысячи строк. Для извлечения текстов и таблиц из PDF документов я рекомендую использовать коммерческие продукты вроде ABBYY Finereader. А для DOC файлов таблицы извлекаются другими инструментами.

Например, таблицы из файлов DOCX извлекаются с помощью утилиты docx2csv [5] о которой я ранее писал и я же её автор. Таблицы извлекаются в командной строке командой экстракт. Например вот такая команда docx2csv extract DACE8F84-B774-4B5B-B747-F3189B25E596.docx создаст две таблицы из этого файла.

Ограничение в том DOCX файлов среди этих файлов всего 49, а файлов в формате DOC 45 и самые большие таблицы внутри DOC файлов.

Поэтому DOC надо преобразовать в DOCX. При наличии MS Office на компьютере это автоматизируется с помощью утилиты Wordconv которая идёт в его базовой поставке. Вот тут есть инструкция [6] для командной строки.

Прилагаю полученный таким образом набор данных ведомственной структуры расходов фед. бюджета.


Ссылки:
[1] https://sozd.duma.gov.ru/bill/201614-8
[2] https://cdn1.ruarxive.org/public/datacollect/budget2023/files.zip
[3] https://cdn1.ruarxive.org/public/datacollect/budget2023/dataset.csv
[4] https://cdn1.ruarxive.org/public/datacollect/budget2023/processed.csv
[5] https://github.com/ivbeg/docx2csv/
[6] https://stackoverflow.com/questions/2405417/automation-how-to-automate-transforming-doc-to-docx

#opendata #opensource #datasets #budget #russia #government
В телеграм канале Счетной палаты РФ начали публиковать материалы уровня ликбеза о том что такое ГРБС или что такое Бюджетная роспись. Когда то я в Счетной палате вёл проект Госрасходы, а ранее несколько лет совместно с Минфином РФ организовывал несколько конкурсов BudgetApps по разработке приложений и визуализаций данных открытых государственных финансов. Это очень большая и важная тема в любой стране, в России она была на довольно высоком уровне много лет, и тем печальнее, конечно, смотреть на происходящее последние 1.5 года если не больше, когда доступность финансовой информации снижается.

Однако, возвращаясь к определениям. Когда-то, ещё при работе над вовлечением участников в BudgetApps у нас была задача дать простые и понятные описания сложным бюджетным определениям. Задача это сложная по двум причинам.

Во первых некоторые определения дать реально сложно потому что они описывают сложные понятия финансовой системы которые несведующему человеку прочитать непросто. Переводить в простой и понятный язык это сложно

Во вторых когда даёшь простое и понятное определение то оно всегда не-юридическое, а юристы сразу встают на дыбы и говорят что так описывать нельзя ни в коем случае.

Для госорганов второе особенно катастрофично и в текстах что в телеграм канале Счетной палаты видно что они особо то не упрощают, потому что пытаются соблюсти юридическую чистоту.
Работает это плохо, не специалистом это непонятно.

Ещё много лет назад я считал что самое яркое объяснение бюджетных определений можно дать через описание бюджета какой-то очень большой семьи например, ... мафиозной.

Что такое ГРБС? Предположим босс мафии уже старенький, а организация велика, один капо курирует бордели, другой утилизацию мусора, третий распространение запрещёнки, а ещё есть не только те кто зарабатывает, но и отмазывает от полиции, защищает в судах и тд., то есть только тратящих. И бойцов и других расходов у них много. Не самому же боссу выдавать лично деньги каждому сотруднику члену семьи. Вот он и распределяет регулярно собранное этим капо, а чтобы те не воровали назначает казначея чтобы следить и выдавать деньги.

Что такое бюджетная роспись? Это когда тот же босс мафии на регулярной встрече с этими же капо в начале года распределяет кому и как сколько положено и на что пойдет во всех деталях. А поскольку босс капо не доверяет то требует чтобы расписано было во всех подробностях. Сколько на выплаты бойцам, сколько на взятки, сколько на помощь семьям сидящем в тюрьме и тд. Получается такая большая простыня таблицей. Вот этот план расходов на год и можно называть бюджетной росписью.


Конечно такой словарик никогда бы не опубликовали, он так и остался у меня в черновиках.

#openfinances #government #budget #likbez #humour