政府数据开放平台架构
政府掌握的数据要公开,除依法涉密的之外,数据要尽最大可能地公开,以便于云计算企业为社会服务,也为政府决策、监管服务。
研究框架与方法
(一)评估框架
“开放数据晴雨表”从准备度、执行度和影响力三个维度对不同国家或地区开展开放政府数据项目的评估排名,以揭示全球范围内开放数据计划的普遍流行和影响力,并分析其全球发展趋势。“开放数据指数”则针对各国政府是否开放10个关键性数据集进行评估。万维网基金会(World WideWebFoundation)和纽约大学的治理实验室(TheGovernanceLabat NYU)基于现有评估项目如“开放数据晴雨表”“开放数据指数”“开放数据500”[3]等总结提炼出了开放数据的通用评估框架(CommonAssessment Framework)[4],包括四个层面:
①环境。指提供开放数据的背景环境,例如政府开放数据的国家整体背景或一个特定部门的背景,包括法律法规、组织、政治意愿/领导力、技术、社会、经济等。
②数据。指开放数据集的本质和质量,包括定义、维度、数据的分类/部门、质量。
③使用。指数据被谁使用、如何使用及其可能产生的结果,包括使用者、目的、活动。
④影响。指使用特定开放数据得到的效益,包括社会、环境、政治/政府、经济/商业方面的效益。
基于该通用评估框架,并考虑到中国开放政府数据发展目前处在初始阶段,数据利用及其效果尚未充分展现,本研究将评估重点置于数据开放的供应端??政府一方,建立了基于“基础”“数据”“平台”层面共13个维度的评估框架,以期较为全面系统地评估中国各地的开放政府数据实践。
(二)数据采集方法
基于上述评估框架,研究主要采用了文献调研、数据抓取和人工观察三种方法采集数据。数据采集的时间截止到5月20日,且所有数据均来自于公开渠道。
1.文献分析
有关基础层的评估指标,例如组织领导力、管理体制、IT产业比例及创新产业发展水平等,采用文献检索方式,如通过搜索相关的政府政策文件、统计年鉴等方法采集数据。
2.数据抓取
针对数据层的评估指标,本研究自动化抓取了各平台上所发布的所有数据集信息(包含数据标题、发布机构、更新日期、下载量、浏览量等)。
⒊人工观察
针对无法自动抓取的数据,例如平台层是否提供了数据评价功能等,研究中采用了人工观察记录并交叉验证的方式进行数据采集。
(三)样本选择
为开展此次评估调研,研究首先通过媒体报道、官方报道的途径查询了解到北京、上海、武汉、无锡、佛山南海这5个地方的开放政府数据实践,再通过搜索引擎以“数据+gov.cn”和“data+gov.cn”为关键词查询到了另外8个地方的开放政府数据实践。考虑到各地方开放政府数据实践的成熟度、相关资讯完善度、地方行政层级和地域的多样性,本次评估首先从13个地方中选取了北京市、上海市、武汉市、无锡市、湛江市、宁波市海曙区、佛山市南海区等7个地方作为评估样本,并最终考虑到当前社会关注度,将贵州的“云上贵州”项目也纳入研究对象。