будущее есть!
  • После
  • Конспект
  • Документ недели
  • Бутовский полигон
  • Колонки
  • Pro Science
  • Все рубрики
    После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша
После Конспект Документ недели Бутовский полигон Колонки Pro Science Публичные лекции Медленное чтение Кино Афиша

Конспекты Полит.ру

Смотреть все
Алексей Макаркин — о выборах 1996 года
Апрель 26, 2024
Николай Эппле — о речи Пашиняна по случаю годовщины геноцида армян
Апрель 26, 2024
«Демография упала» — о демографической политике в России
Апрель 26, 2024
Артем Соколов — о технологическом будущем в военных действиях
Апрель 26, 2024
Анатолий Несмиян — о технологическом будущем в военных действиях
Апрель 26, 2024

После

Смотреть все
«После» для майских
Май 7, 2024

Публичные лекции

Смотреть все
Всеволод Емелин в «Клубе»: мои первые книжки
Апрель 29, 2024
Вернуться к публикациям
открытое государство открытые данные
Июль 15, 2025
Страна
Сакоян Анна

BudgetApps: современное и историческое

BudgetApps: современное и историческое
opendata
Открытые данные

Министерство финансов РФ при участии НП «Инфокультура» организовало ежегодный всероссийский конкурс BudgetApps для разработчиков и журналистов, от которых ожидаются приложения, инфографика и статьи на основе опубликованных министерством открытых данных. Заявки на участие в первом запуске конкурса можно подавать ориентировочно с 23 декабря 2014 г. по 10 февраля 2015 г.  Подведение итогов состоится в конце февраля 2015 г. Сайт конкурса BudgetApps откроется 23 декабря либо в ближайшие последующие дни, и там можно будет ознакомиться с условиями и требованиями для участников, а также собственно подать заявку.

15 декабря организаторы провели встречу с потенциальными участниками – разработчиками, дизайнерами и журналистами – и рассказали о конкурсе и специфике данных, с которыми предстоит работать. Главное требование к проектам-участникам состоит в том, что в них должны использоваться открытые данные Минфина. Как следствие, приложения на основе этих данных тоже должны быть открытыми. Помимо этих данных, участники, конечно, могут по мере надобности привлекать и другие. Так как времени между объявлением конкурса и его завершением приема заявок мало, участники могут представлять любые свои работы, отвечающие условиям, за весь 2014 г. В последующих итерациях конкурса заявки будут приниматься в течение всего года. Общий объем призового фонда в этот раз составляет 300 000 рублей.

В конкурсе две номинации – «разработчики» и «журналисты». От первых ожидаются мобильные или веб-приложения, от вторых – инфографика или статьи на основе данных. «Мы работаем над раскрытием данных уже два года, - сказала Елена Чернякова, директор департамента информационных технологий в сфере управления государственными и муниципальными финансами и информационного обеспечения бюджетного процесса, один из организаторов конкурса, - и мы, конечно, заинтересованы в том, чтобы наши наборы данных пользовались спросом и получали новые формы представления. Мы понимаем, что есть люди, у которых может быть более точное, чем у нас, представление о том, как лучше показать эти данные для той или иной аудитории. Поэтому мы решили в этом году открыть конкурс для разработчиков и журналистов на основе открытых данных Министерства финансов».

Данные Минфина публикуются на трех порталах: на Официальном портале Минфина, на Едином портале бюджетной системы и на Официальном сайте для размещения информации о государственных учреждениях. На официальном сайте публикуются более формальные наборы данных в соответствии с требованиями раскрытия данных. Единый портал бюджетной системы больше ориентирован на раскрытие бюджетного процесса. Здесь представлены данные по расходам и доходам, представлены реестры участников бюджетных процессов и много внимания уделяется визуализации данных прямо на сайте (чтобы пользователи могли просматривать данные, не прибегая к помощи дополнительных программных средств).

Специфика этих данных в значительной мере определяет тематику потенциальных конкурсных работ. Однако помимо этого, к началу конкурса Минфин планирует открыть также несколько наборов данных исторического бюджета. В настоящее время Минфин, среди прочего, занимается оцифровкой архивных документов – сохранившихся бюджетных росписей Российской Империи (начиная с 1886 г.) и статистических справочников СССР. Сканы этих документов, в свою очередь, постепенно переводятся в машиночитаемый формат, позволяющий автоматически обрабатывать и исследовать эти данные.

 
Пример скана исторического бюджета

С конвертацией сканов в машиночитаемый формат есть технические сложности, автоматизировать процесс пока не удалось, поэтому данные фактически перепечатываются в таблицы вручную, а это занимает много времени. Есть вероятность, что алгоритм для переработки из формата PDF в машиночитаемый будет разработан позднее. В ходе встречи высказывалось, в частности, предложение выложить сканы в открытый доступ, чтобы все желающие могли так или иначе принять в этом участие, и организаторы обещали рассмотреть такой вариант. Так или иначе, к 2016 г. планируется завершить конвертацию этих документов.

Однако одними техническими сложностями проблемы с историческими бюджетами не исчерпываются. Для анализа этих данных также требуется разработка определенной методики. Об этом на встрече рассказывал еще один организатор конкурса Иван Бегтин (директор «Инфокультуры»). Одна из проблем связана с тем, что во многих случаях нет важных вспомогательных документов, которыми можно было бы руководствоваться при работе с данными. Хотя некоторые структурные моменты уже удалось реконструировать из самих данных, но из-за отсутствия справочников, классификаторов и нормативных документов возможности анализа ограничены.

Другая проблема вызвана тем, что данные Российской империи и СССР сильно разнятся по структуре и степени детализации. Как выяснил уже ознакомившийся с данными Бегтин, по сравнению с дореволюционными бюджетными росписями, советские статистические справочники менее подробны, поэтому сопоставлять эти данные друг с другом, например, по ведомствам, территориям или целевых статей расходов. Тем не менее, есть возможность сравнивать бюджетные расходы по функциональной классификации.

«По историческим бюджетным данным, - считает Бегтин, - проекты могут быть самыми разными: Россия на переломе (1914-15 гг.), до войны и сама война, секвестр бюджета, военные расходы, расходы на транспортную инфраструктуру. Там есть данные периода зарождения железных дорог, данные периода среднеазиатских волнений, данные выкупа земли у крестьян в XIX веке. Некоторую методику работы с этими данными мы уже разработали и готовы поделиться нашими наработками. Цель нашего конкурса, с одной стороны, в том, чтобы сделать понятным современный государственный бюджет (это большая и сложная тема), а, с другой стороны, попробовать разработать подход к обработке исторических данных».

Как в случае с историческим бюджетом, так и в случае с актуальными современными данными нужно решить, во-первых, какое приложение или какая визуализация на их основе может заинтересовать ту или иную аудиторию, и, во-вторых, как представить данные в наиболее понятном и информативном виде. В этом смысле конкурс, среди прочего, представляет собой повод для генерирования такого рода идей.

В качестве примера приложения на открытых данных Минфина можно привести онлайн-сервис OpenБюджет, разработанный Геннадием Артамоновым, который выступил на встрече с рассказом о своем проекте.

До создания OpenБюджет Артамонов разработал портал «Открытый бюджет Тульской области», а затем, используя аналогичные принципы представления данных разработал более общий сервис по открытым бюджетным данным России. Сервис представляет собой интерактивный онлайн-инструмент с интуитивно понятным интерфейсом для просмотра и первичного анализа бюджетных данных. Данные организованы таким образом, что вначале показывается наиболее общий уровень, а затем, по мере надобности, пользователи могут сами выбирать интересующий их уровень детализации.

 
OpenБюджет, http://age71.ru/

Ростислав Яворский (НИУ ВШЭ), в свою очередь, рассказал о нескольких типоахвизуальной аналитики, которые следует учитывать при создании приложений для разной аудитории. Эти типы отчасти соответствуют последовательным этапам анализа данных и фактически представляют собой их визуализацию. Первым Яворский упомянул общий обзор необработанных данных, то есть визуальное описание набора данных, дающее первичное представление об объеме, структуре, типе и качестве данных. Это бывает полезно на самом раннем этапе знакомства с данными, когда конкретных вопросов к данным еще не сформировалось. Собственно, такого рода обзор позволяет сформулировать исходные вопросы, от которых сможет отталкиваться дальнейший анализ. Следующий этап (и, соответственно, тип) – это первичный анализ данных, выявляющий разброс значений, наличие значений, резко отличающихся от общей массы, и корреляций между некоторыми параметрами.

Еще один возможный тип визуализации – это выборка, то есть возможность рассматривать данные не в масштабах всей коллекции, а на уровне отдельно взятых экземпляров. Также в качестве продуктивного подхода к визуализации Яворский выделил фильтрацию, то есть создание возможности для отсеивания данных по определенному признаку. Наконец, последний выделенный им подход (ориентированный, вероятно, на более узкую аудиторию) касается визуального описания методов анализа многомерных данных, объектно-признакового моделирования, сетевого взаимодействия и временных рядов.

Сакоян Анна
читайте также
Страна
«Россия – административно-территориальный монстр» — лекция географа Бориса Родомана
Февраль 19, 2022
Страна
Сколько субъектов нужно Федерации? Статья Бориса Родомана
Февраль 12, 2022
ЗАГРУЗИТЬ ЕЩЕ

Бутовский полигон

Смотреть все
Начальник жандармов
Май 6, 2024

Человек дня

Смотреть все
Человек дня: Александр Белявский
Май 6, 2024
Публичные лекции

Лев Рубинштейн в «Клубе»

Pro Science

Мальчики поют для девочек

Колонки

«Год рождения»: обыкновенное чудо

Публичные лекции

Игорь Шумов в «Клубе»: миграция и литература

Pro Science

Инфракрасные полярные сияния на Уране

Страна

«Россия – административно-территориальный монстр» — лекция географа Бориса Родомана

Страна

Сколько субъектов нужно Федерации? Статья Бориса Родомана

Pro Science

Эксперименты империи. Адат, шариат и производство знаний в Казахской степи

О проекте Авторы Биографии
Свидетельство о регистрации средства массовой информации Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством Российской Федерации по делам печати, телерадиовещания и средств массовой информации.

© Полит.ру, 1998–2024.

Политика конфиденциальности
Политика в отношении обработки персональных данных ООО «ПОЛИТ.РУ»

В соответствии с подпунктом 2 статьи 3 Федерального закона от 27 июля 2006 г. № 152-ФЗ «О персональных данных» ООО «ПОЛИТ.РУ» является оператором, т.е. юридическим лицом, самостоятельно организующим и (или) осуществляющим обработку персональных данных, а также определяющим цели обработки персональных данных, состав персональных данных, подлежащих обработке, действия (операции), совершаемые с персональными данными.

ООО «ПОЛИТ.РУ» осуществляет обработку персональных данных и использование cookie-файлов посетителей сайта https://polit.ru/

Мы обеспечиваем конфиденциальность персональных данных и применяем все необходимые организационные и технические меры по их защите.

Мы осуществляем обработку персональных данных с использованием средств автоматизации и без их использования, выполняя требования к автоматизированной и неавтоматизированной обработке персональных данных, предусмотренные Федеральным законом от 27 июля 2006 г. № 152-ФЗ «О персональных данных» и принятыми в соответствии с ним нормативными правовыми актами.

ООО «ПОЛИТ.РУ» не раскрывает третьим лицам и не распространяет персональные данные без согласия субъекта персональных данных (если иное не предусмотрено федеральным законом РФ).