Освободите данные!

Олег Жаров:
Предприниматель, тру-маркетолог. В прошлом - журналист и редактор владимирских СМИ.
OlegJarov
Кому и зачем нужны так называемые «открытые» данные (спойлер – журналистам и бизнесу) и почему региональные власти не торопятся их открывать (спойлер – не умеют готовить)
ИСТОРИИ 8 марта 2017, 13:11 1 6224

4 марта в некоторых прогрессивных странах мира прошел День открытых данных. В России тема open data находится в зачаточном состоянии (мода началась только на big data и пока только в около-айтишных бизнес-кругах столицы), но тем она и интересна. Причем потенциально не только журналистам с маркетологами-аналитиками, но и предпринимателям. Попробую в нескольких словах осветить две весьма объемные темы – открытого государства и открытых данных.

Так совпало, что в этот же день во Владимире представили вице-губернатора по развитию информационного общества Сергея Невзорова. Ему вменено переводить областной документооборот в электронный вид, координировать многофункциональные центры госуслуг, налаживать инфо-обмен между органами местного самоуправления. Кроме того, губернатор хочет интегрировать в местное «электронное правительство» и камеры видеонаблюдения программы «Безопасный город».

Сразу скажу, что во Владимире и Владимирской области с открытыми данными дела обстоят никак. Размещение органами местного самоуправления информации о своей деятельности в форме открытых данных предусмотрено указом президента от 2012 года "Об основных направлениях совершенствования системы государственного управления". Совершенная у нас система госуправления? Так вот и открытые данные закрыты.

На сайте мэрии Владимира открытым данным посвящен целый раздел (абсолютно пустой) и на сайте администрации Владимирской области в соответствующем разделе представлены жалкие 14 наборов бесполезных данных, из которых половина отдают ошибку 404.

Что такое открытые данные?

Подробнее о том, что это такое и зачем это нужно. Государственные данные представляют один из ключевых интересов для общества, поэтому активисты и добиваются открытости государственной информации в машиночитаемой форме. Многие правительства в рамках стратегии «открытого государства» распространяют часть данных, обрабатываемых в секторе госуправления, например: data.gov (США), data.gov.uk (Великобритания), data.gov.ru (Россия).

Говоря простым языком, государство (и муниципалитеты) обладают огромными массивами информации, которой могли бы делиться с обществом. Происходит расшаривание властью этих данных, как правило, в формате таблиц (csv и пр.), называемых наборами данных. Заинтересованными представителями общества я в первую очередь называю:

- журналистов, поскольку лучшая их часть способна анализировать и упаковывать информацию в нужном виде для общественной пользы и изменения мира к лучшему;

- предпринимателей, особенно IT-стартаперов в хорошем смысле этого слова, поскольку на обширных открытых данных можно запилить массу ярких проектов.

Зачем нужны открытые данные?

Вообще, достаточно включить фантазию. Первые попавшиеся три набора открытых данных на сайте data.gov.ru такие: Реестр камер городского видеонаблюдения Москвы (27 тысяч записей), Wi-Fi в парках Москвы (824 записи), Рекламные конструкции на территории Москвы (13 тысяч записей).

Любой из этих наборов – почти готовый веб-сервис или андроид-приложение, бери и делай.

Из расхожих западных примеров сервисов, основанных на открытых данных – CommoPrices, позволяющий пользователям отслеживать цены на товары и Bike Citizens, планирующий маршруты велосипедистам и также используемый для байкшеринга.

А как во Владимире?

Уже можно и привести пару примеров того, как начинают адаптироваться под нужды бизнеса открытые данные во Владимире, пусть это пока и ничтожная доля используемого потенциала. Не дожидаясь предоставления государством необходимых наборов данных, обе компании просто-напросто парсили (опрашивали силами робота) соответствующий интересующий их сайт и адаптировали полученную информацию под цели бизнеса.

Первый пример – компания, оказывающая b2b-услуги по поиску тендеров и участию в них. В данной фирме программа мониторит гос- и муниципальные закупки и отбирает по заданным критериям интересные заказчику торги для участия. Безусловно, данные операции можно производить и вручную, но тогда о масштабировании речи идти не может, так как один специалист способен качественно вести от силы пять клиентов, в то время как робот не ограничен.

Второй пример – агентство недвижимости (не №1), которое следуя лучшим зарубежным практикам, внедрило на своем сайте поиск квартиры на карте города, на которую нанесены объекты инфраструктуры. Таким образом, можно выбирать недвижимость во Владимире из 7000 объектов прямо на карте, по заданным ценовым и прочим фильтрам и сразу имея перед глазами школы, детсады, больницы, фитнес и так далее.

Безусловно, открытые данные (а также опубликованные, но не адаптированные, то есть - условно закрытые) используются бизнесом более широко, но для иллюстрации этого будет достаточно. Данные же примеры говорят о пионерах, создающих конкурентные преимущества из цифровой среды.

В заключение

Целью данной колонки является привлечение внимания не столько к проблеме недоступности открытых данных в регионе, сколько к возможностям, которые эти данные открывают для заинтересованных специалистов.

На западе data journalism вот уже лет пять является весьма модной специализацией журналистов (и гораздо более интересной по сравнению с рерайтом коллег и пресс-релизного официоза). Кстати, магистерская программа «Журналистика данных» появилась недавно и в одном из крутых вузов страны. Буду рад, если побудил кого-то из журналистов попробовать новые подходы к работе (используя парсинг данных для выявления интересных закономерностей и тенденций, создания сказочно красивой вирусной инфографики).

Для программистов и собирающихся ими стать считаю язык phyton просто необходимым для изучения (а именно он в основном используется для скрапинга и парсинга данных, анализа больших массивов и для последующей визуализации).

С коммерческой точки зрения, сбор и адаптация (упаковка) данных также перспективны, в чем можно убедиться на портале «OpenData 500», где собрано по 500 коммерческих проектов из США, Канады, Австралии, Мексики, Кореи и Италии.

Положительным результатом также будет считаться скорое появление открытых данных на сайтах городских и областной администраций. Быть может, на основе городских данных сразу и не появятся успешные коммерческие сервисы или умопомрачительные публикации, нацеленные на решение многочисленных городских проблем. Однако, чем больше думающих людей удастся привлечь к анализу данных и урбанистике, тем лучше будет становиться городская среда.

Мнение автора может не совпадать с мнением редакции