大数跨境
0
0

政府数据开放的六大“痛”点

政府数据开放的六大“痛”点 明悦数据
2016-06-08
0
导读:什么样的数据可以开放、应该开放?又以什么形式开放?谁来开放?这些都是必须回答的问题。
点击上方
“蓝色字”
可关注我们!

 

 

什么样的数据可以开放、应该开放?又以什么形式开放?谁来开放?这些都是必须回答的问题。

 

来源|观数智库研究员 葛育民


“目前我国信息数据资源80%以上掌握在各级政府部门手里,‘深藏闺中’是极大浪费。”上个月,李克强总理以这句形象的比喻,点出了政府数据开放的紧迫性。

 

本周,上海数据开放周正在举办中,活动号召推动开放数据生态建设、普及开放数据文化、提升公众数据素养。那么,我国的政府数据开放又面临着哪些“痛点”呢?



1
政府数据开放“赶晚集”



全球开放数据运动始于美国。2009年1月,美国总统奥巴马签署了《开放透明政府备忘录》,要求建立更加开放透明、参与、合作的政府,体现了美国政府对开放数据的重视。同年,数据门户网站Data.gov上线。

     

2011年9月20日,巴西墨西哥、美国等八个国家联合签署《开放数据声明》,成立开放政府合作伙伴(OGP,Open Government Partnership)。截至2014年2月10日,全球已有63个国家加入开放政府(数据)合作伙伴。

     

相比之下,中国的政府数据开放步伐缓慢得多。2015年9月,国务院印发《促进大数据发展行动纲要》,提出要加强顶层设计和统筹协调,大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推进数据资源向社会开放。

     

从全国看,目前政府数据开放的实验仍集中在沿海发达地区,已正式上线开放数据项目的城市和地区包括:北京、上海、武汉无锡湛江佛山南海、宁波海曙、深圳罗湖、深圳坪山、深圳福田和厦门海沧。



上海市政府数据服务网截图



2
公开的数据机器读不懂



观数智库创始人、大数据专家涂子沛在《大数据》一书中指出,开放数据指的是将原始数据及相关元数据以可以下载的电子格式让第三方自由使用。开放数据不仅意味着公开数据,更要让数据可以重复使用、自由加工。

 

根据英国开放知识基金会(Open Knowledge Foundation)的定义,开放需具备3项基本元素:非歧视性、机器可读性和开放授权性。所谓“机器可读性”,是指开放的数据应该能让机器读懂,如对于表格数据应该采用.csv。

 

机器可读,数据才能通过算法进行分析,才能实现数据的价值。因此,如果某地政府开放的数据是PDF格式,那就属于“装姿势”了。

 

截至2015年5月20日,北京、上海等地的开放数据平台共发布了1946个数据集,但是这些数据集也并非完全实现了机器可读。

 

研究者发现,这些数据集的平均可机读率为84.1%,其中北京和宁波海曙两地的可机读比例最高(100%),武汉最低(54%)。而从可机读总数量的角度看,上海则以398个居全国第一。


 数说南海提供5种数据格式



3
把数据开放等同于信息公开



“三公”详细地列出了公车、公款吃喝、因公出国支出的数据,经济和社会发展统计公报囊括了GDP增速、居民人均可支配收入等大大小小的数据。因此,很多人误认为这些就是数据开放。

 

但是,事实并非如此。

 

涂子沛在《数据之巅》中写道,数据是信息的载体,信息是有背景的数据,而知识是经过人类的归纳和整理,最终呈现规律的信息。


传统意义上的数据和信息的差别

 

因此,上述的“三公”公开数据、经济和社会发展统计公报,属于在原始数据基础上进行加工、分析、归纳后得出的结果,并不属于数据公开的范畴。

 

复旦大学数字与移动治理实验室主任郑磊指出,传统的政府信息公开,公开的是经过加工和分析的信息,甚至只是一些文件。他认为,放数据要求开放到底层的、原始的数据。

 


4
数据烟囱阻碍开放



当前,我国政府部门组织架构上的条块分割和各自为政,使数据分散在各部门,形成了一个个数据烟囱或数据孤岛,阻碍了数据的开放和利用。

 

一方面,政府部门往往把数据资源看成是本部门的权力资源,“你的就是你的,我的就是我的”,部门间的数据共享都难实现,更谈不上对社会的开放;另一方面,各部门的数据获取途径、筛选标准不同,一些数据还是纸质记录,数据质量参差不齐,加剧了开放的难度。

 

就以常见的纸质档案为例,由于不同地域的档案信息不开放、未联通,当一位公民需要办理异地档案存续时,他可能遭遇办事难,接受函、调档函、盖章签字,手续繁杂。

 

这些档案的规模十分庞大,仅北京2014年6月期间就保存了171万份人事档案,一边是档案调进调出费时费力,一面是纸质档案占地儿,频繁查阅转移易丢失、损毁。可见,为了优化办事流程,提高效率,将档案数据化并实现异地开放共享、消除数据烟囱迫在眉睫。



5
数据产权尚不明确



公民的社保缴费记录,患者的就诊记录,企业的工商登记信息……这些数据的产权是个人或企业,还是属于政府部门?如何做出清晰界定,将直接决定谁享有数据的权益。

 

研究者认为,当前关于数据的产权归属问题还远未达成共识,特别是在去除个人身份属性的数据交易中,到底是数据主体(产生数据的个人)还是记录数据的企业拥有数据的所有权,各方莫衷一是。

 

2010年,发改委批复公安部所属的全国公民身份证号码查询服务中心对外提供公民信息比对服务,提供“一致”或“不一致”信息,可收取公民身份认证服务费,收费标准为:比对内容五项以下(含五项),每次5元;比对内容五项以上,每次10元。

 

公民信息作为政府数据的一部分,这种收费受到质疑。

 

中国社会科学院法学研究所副研究员支振锋撰文指出,这个拥有13亿人口身份数据的“全国公民身份信息系统”是真正的“全民所有”,谁能够开发和利用这些信息获利是个问题。此外,数据库开发、建设的几千万投资来自公共财政,数据收集、整理、报送属于政府履行公权,数据库的经营服务性收费也是问题。

 


6
数据隐私保护待解



大数据时代,传统的隐私保护路径已经失效,如何兼顾隐私保护,是政府数据开放时不可回避的问题。

 

在隐私保护方面,曾有人提出了全生命周期的概念。持有这种观念的英美国家认为,应该在政府数据开始产生的每个流程,都加入隐私分析和设计,而不是在最后环节才考虑。

 

此外,美国规定,各部门应对照现有法律规定和部门高级隐私专员一起,决定数据的公开是否恰当,并需向法律部门咨询协商最后确定;英国则在推进数据开放的主要部门任命专门的隐私保护专家。

 

我国尚未出台全国性的数据隐私保护法规,而在全国首部地方大数据法规《贵州省大数据发展应用促进条例》则规定:“数据共享开放,应当维护国家安全和社会公共利益,保守国家、商业秘密,保护个人隐私,保护数据权益人的合法权益。”


 

企业经营数据应用挖掘

建立专属数据应用领域的圈子

欢迎加入企业大数据交流

QQ群515593611


回复 关键字 获得推荐头条文章

回复 HR 阅读文章 HR,你必须得用数据说话                      

回复 pp88 观看视频 Como activar el complemento de Power Pivot


点击下方“阅读原文”查看更多
↓↓↓


【声明】内容源于网络
0
0
明悦数据
明悦数据是一家专注于企业数智化升级的咨询公司。自2012大数据元年成立,明悦以「内生为王」为核心,融汇世界优秀企业管理模式,打造中国成长型企业的数智化管理决策系统,加速企业数智化升级,内生企业数智化组织能力,助力企业实现高质增长和永续经营。
内容 464
粉丝 0
明悦数据 明悦数据是一家专注于企业数智化升级的咨询公司。自2012大数据元年成立,明悦以「内生为王」为核心,融汇世界优秀企业管理模式,打造中国成长型企业的数智化管理决策系统,加速企业数智化升级,内生企业数智化组织能力,助力企业实现高质增长和永续经营。
总阅读29
粉丝0
内容464