28 марта 2024, четверг, 23:25
TelegramVK.comTwitterYouTubeЯндекс.ДзенОдноклассники

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

07 февраля 2015, 13:32

Конкурс BudgetApps: теория и практика

Семинар для участников конкурса BudgetApps на основе открытых данных
Семинар для участников конкурса BudgetApps на основе открытых данных

30 января 2015 г. Министерство финансов РФ совместно с НП «Информационная культура» и при поддержке компании «Яндекс» провело семинар для участников конкурса BudgetApps на основе открытых данных. Было объявлено, что сроки подачи заявок на конкурс теперь продлены до 1 марта 2015 г. Это связано с тем, что у конкурса появился новый партнер в лице «Яндекса», который ввел дополнительную номинацию. Если раньше номинации было две – для разработчиков и для журналистов, - то теперь к ним добавилась еще отдельная номинация работ, использующих технологии собственно «Яндекса».

«Очень приятно, - сказал выступавший от «Яндекса» Григорий Бакунов, - что теперь активность происходит не только с нашей стороны. Раньше мы приходили и говорили: давайте вы выложите данные, а мы поможем раздать их разработчикам. Сейчас это происходит наоборот: министерства сами понимают, зачем им открывать данные. Разработчики сами понимают, что они хотят с этими данными что-то делать. Это показатель того, что мы всем государством и компания "Яндекс" в частности переместились на какую-то новую ступеньку: наконец-то общество стало понимать, зачем нам данные».

Бакунов поблагодарил Минфин за предоставление данных, отметив, что они, безусловно, интересны разработчикам, в том числе с точки зрения визуализации, и есть надежда, что по итогам этого конкурса появятся проекты, качественно превосходящие то, что получалось по итогам прежде проводившихся в России конкурсов для разработчиков на основе открытых данных.

Потенциал открытых данных

О том, как на сегодняшний день оценивается значение открытых данных, рассказала доцент университета ИТМО Ирина Радченко. Она напомнила, что открытыми данными принято считать те данные, которые отвечают двум ключевым критериям: они публикуются под открытой лицензией, допускающей повторное использование и неограниченное распространение, и в машиночитаемых форматах, то есть тех, которые позволяют автоматически обрабатывать данные. У машиночитаемых форматов есть своя градация по признаку возможностей использования (эта градация была предложена в свое время основателем Веба Тимом Бернерсом-Ли в виде концепции пяти звезд). Наиболее высокий рейтинг (5 звезд) присваивается на уровне публикации данных с использованием модели RDF. Однако такой формат требует и большой технической грамотности от тех, кто имеет с ними дело, поэтому при всех достоинствах высокого уровня наиболее популярен сейчас компромиссный вариант в виде формата CSV (3 звезды). Здесь Радченко привела характеристику, которую дал этому формату один из основателей проекта OpenSpending Фридрих Линденберг: CSV похож на автомат Калашникова: очень прост и используется по всему миру.

 
Ирина Радченко

Тем не менее, процесс формирования распределенной связанной базы данных – эталона, который Бернерс-Ли начал продвигать в 2009 г., - постепенно идет. Параллельно с этим в мире растет число стартапов, бизнес-модели которых строятся на использовании открытых данных. Специальные инкубаторы для таких стартапов есть в США (GovLab) и в Великобритании (ODI). Некоторые такие проекты уже вышли на рынок в качестве самостоятельных компаний. В качестве одного из примеров Радченко привела проект OpenCorporates, который собирает данные по корпорациям. Также она упомянула недавно появившийся и сейчас развивающийся журналистский стартап Journalism++ (агентство по дата-журналистике), основанный французским журналистом и программистом Николя Кайзер-Брилем (Nicolas Kayser-Bril).

Радченко подчеркнула, что многие крупные медиаплатформы создают свои собственные проекты с данными: например, NY Times (собирающая, помимо прочего, собственную базу данных), Financial Times (большой раздел, посвященный инфографике), РИА Новости (специальный раздел инфографики + свои проекты по обучению работе с данными). Также Радченко отметила, что, по прогнозам McKinsey в применении к США, потенциальный эффект от бизнесов на основе открытых данных может составить порядка $3-5 млрд. в год при сравнительно небольших инвестициях.

Открытые данные и Всемирный банк

О том, как собираются и используются международные бюджетные данные в мире, рассказал представитель Московского отделения Всемирного банка Михаил Бунчук – на примере собственно Всемирного банка. ВБ уже давно занимается сбором и публикацией данных (для этого проекта у него есть специальная страница). По словам Бунчука, одна из ключевых целей этого в том, чтобы способствовать экономическому развитию стран, так как ВБ видит в этом направлении большой потенциал. Также в числе целей ВБ Бунчук назвал усиление прозрачности и подотчетности государства и повышение качества взаимодействия между гражданами, государством и бизнесом.

ВБ был одним из первых институтов, которые отреагировали на призыв Бернерса-Ли раскрывать «сырые» данные, а не только плоды их обработки. В итоге ВБ стал одним из крупнейших агрегаторов социально-экономической информации по странам. Кроме того, ВБ старается публиковать в формате открытых данных информацию о тех проектах, которые он финансирует. Этому посвящен специальный портал Open Financial Data.

 
Михаил Бунчук

Некоторые из этих проектов касаются раскрытия государственных данных, и в ряде таких случаях ВБ, помимо финансирования, предоставляет техническую помощь (такое сотрудничество имеет место, например, в Молдавии). Один из продуктов ВБ – Open Government Data Toolkit – представляет собой систему инструментов, призванных помогать правительствам эффективно внедрять программы по открытым данным. Также ВБ создал отдельный портал по открытым бюджетам (Open Budgets Portal) и в рамках его предложил проект Boost – инструментарий для качественной публикации открытых бюджетных данных, который сейчас используется более чем в 40 странах.

Кроме того, ВБ занимается вовлечением общественности в работу с открытыми данными. По словам Бунчука, ВБ продвигает системный подход к публикации данных: «Инициативы по открытым данным будут эффективными только в том случае, если будут учитываться самые разные аспекты. Это, естественно, обеспечение потока данных, но также и вовлечение разработчиков, и наличие технической инфраструктуры, нормативно-правовой базы. Мы стараемся помогать правительствам разрабатывать такие программы, которые учитывали бы все эти факторы в совокупности».

В декабре 2014 г. были опубликованы результаты исследования ВБ по потенциалу открытых данных для экономического развития России. В частности, по итогам исследования в качестве наиболее перспективных, с точки зрения использования открытых данных, были признаны такие области, как образование, транспорт, энергетика, здравоохранение. При этом когда говорят об экономическом потенциале в таком контексте, имеется в виду не только доход компаний, которые используют открытые данные, но и выгода для конечных пользователей, в том числе экономия времени и принятие более информированных решений, что повышает эффективность их бизнес-процессов.

Данные Минфина

О том, как формируются данные Минфина, которые затем публикуются в открытом доступе, рассказала Елена Громова, начальник отдела Департамента информационных технологий в сфере управления государственными финансами и информационного обеспечения бюджетного процесса Минфина РФ. По словам Громовой, вся работа министерства сейчас выстроена на принципах электронного государства за счет использования информационных технологий.

 
Елена Громова

В соответствии с этими принципами, любой рабочий процесс готовится в два этапа: сначала он проектируется так, чтобы в нем не было противоречий, дубликатов и подобных накладок, а затем автоматизируется. Сначала создается архитектура электронного бюджета, а потом на ее основе создается нормативный правовой акт. Таким образом, она изначально выстраивается как система, которая может быть опубликована в цифровом виде практически полностью (за исключением того, что подпадает под ограничения государственной тайны). Схему Громова показала на одном из слайдов в своей презентации, где зеленым цветом отмечено то, что уже полностью переведено в электронный формат:

 

Полностью презентацию Громовой можно скачать здесь.

Такой подход, отметила Громова, качественно отличается от того, как зачастую публикуются государственные данные. Чаще всего, когда ведомство начинает публиковать свои данные, оно создает специальную страницу, на которой размещает некоторое количество наборов данных, доступных для скачивания. Это просто данные по нескольким тематикам, собранные ведомством по тем или иным направлениям его работы. Обычно они никак не связаны между собой и не встроены в общую схему его деятельности, а существуют как побочный продукт. Минфин, со своей стороны, фактически раскрывает части своей рабочей системы, которая полностью соответствует его актуальной деятельности. В скором времени, по словам Громовой, Минфин планирует подключить также данные по субъектам РФ и чуть позднее – данные уровня муниципальных образований, что может повысить ценность соответствующих приложений для пользователей.

Громова привела примеры того, какого рода приложения на основе уже открытых данных могут быть интересны самой широкой аудитории. Это, в частности, приложения по школам, показывающие у каких из них финансирование больше, у каких меньше, у кого больше внебюджетных доходов, как об этих школах отзываются граждане. Можно сделать приложение по банкам, где можно в режиме практически реального времени (данные обновляются ежедневно) узнавать о наличии предоставляемых банками гарантий и об актуальности лицензий. Еще есть реестры аудиторских компаний: приложения на основе этих данных, показывающие как сами компании, так и их послужной список, могут быть интересны владельцам бизнесов. Также она напомнила, что, помимо современных баз данных, Минфин начал публиковать наборы данных по историческим бюджетам (в цифровом формате) и вскоре планирует публикацию сканов справочников и росписей, которые имеются в его распоряжении.

В заключение Громова подчеркнула, что одна из практических задач конкурса – это выявить, какие еще аспекты могут быть важны для повышения общей ценности публикуемых данных. Речь идет не о раскрытии каких-либо имеющихся данных (они уже открываются), а о вероятности того, что нужно собирать еще какие-то показатели по определенным параметрам, необходимость которых может быть неочевидна публикаторам, но легко выявляется разработчиками приложений.

 Как быстро сделать проект на основе данных

Глава НП «Инфокультура» Иван Бегтин рассказал о том, какие инструменты и сервисы могут стать подспорьем для участников конкурса. Он отметил, что хотя сроки конкурса в этом году ограничены, существуют способы быстрого создания приложений и инфографики, с помощью которых можно сделать интересный проект в пределах одного дня. Бегтин предложил несколько примеров готовых зарубежных визуализаций с открытым исходным кодом, который можно применить и к бюджетным данным разных стран, в том числе в рамках этого конкурса. В частности, он назвал британский проект Where Does our Money Go? (OKF), который дает возможность визуализировать бюджетные данные на различных уровнях детализации. Также он привел в пример интерактивные визуализации The National Budget (Дания) и New York City Budget Visualization (США).

 
Иван Бегтин

Тем, кто не умеет программировать, Бегтин предложил использовать такие сервисы, как Infogr.am и Socrata. Помимо этого, он всем порекомендовал проект Visual Literacy, где подобраны наиболее подходящие способы визуализации для разных типов данных. Полностью презентацию, в которой содержатся многочисленные ссылки на полезные ресурсы, можно скачать здесь.

«Минфин, - сказал Бегтин, - это одна из немногих структур, данные которой комплексно показывают, как устроено наше государство изнутри. Это всё – карта денежных всплесков нашей страны». При этом, подчеркнул он, наиболее интересные приложения получаются в результате сочетания нескольких массивов данных – как из официальных, так и из других источников.

Редакция

Электронная почта: polit@polit.ru
VK.com Twitter Telegram YouTube Яндекс.Дзен Одноклассники
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2024.