众源地理数据(crowd sourcing geographic data, CSGD)是由大量非专业人员志愿获取并通过互联网向大众或相关机构提供的一种开放地理空间数据。代表性的众源地理数据有GPS路线数据(如OpenStreetMap),用户协作标注编辑的地图数据(如Wikimapia),各类社交网站数据(如Twitter),街旁用户签到的兴趣点数据等。这些数据需经过处理才能形成规范的地理信息。与传统地理信息采集和更新方式相比,众源地理数据具有现势性高、成本低、传播快、来源丰富、数据量大等优势,但也存在质量差、覆盖范围不均匀、缺少统一的数据规范、隐私和安全问题难以控制等方面的问题。目前众源矢量数据的应用仍停留在辅助遥感影像信息的生产于更新过程中。同事矢量数据融合技术也仅专注于专业、规范的地理部门数据融合,并未向复杂多样的众源数据融合发起挑战。



遥感影像数据 地形数据 矢量数据



BIM数据 倾斜摄影数据 视频数据

照片数据
1. 众源地理数据的来源与获取方法
-
公共版权数据。这一类数据多由政府部门、企业、公益组织以网站或网络服务的形式发布,例如Google Map网站提供的正射影像,OpenStreetMap网站提供的交通路网等。也有一些部门和企业免费赠送的地理数据,例如OpenStreetMap上部分国家的主干交通数据由汽车导航数据公司AND(Automotive Navigation Data)赠送。 -
GPS接收机数据。主要包括三类:1)应某些组织和项目请求而特意收集GPS数据的志愿者;2)共享自己拥有的有价值的GPS数据的普通人或组织;3)相对被动、无意识上传GPS数据的网民,如“街旁网”用户的手机“签到”会上传GPS定位数据。 -
网民自发创建的地理数据。OpenStreetMap等网站向用户提供了创建地理对象的功能。部分网民出于自我满足、利他主义、兴趣或是描述周围环境等目的,主动地在这些网站上创建、编辑、描述各种地理对象。Google Earth甚至允许用户对感兴趣地物进行三维建模。 -
Web2.0催生的其他地理数据。Web2.0简化了客户交互过程,出于信息共享和社交目的,部分民众积极地将自己地信息发布到网上,这些信息可能包含了地理数据。例如Flickr提供了上传照片并在地图上关联实际地理位置地功能。类似地数据源使得众源地理数据地种类更多样化、更完整。
-
以建立众源数据的质量模型和多源数据配准和变化检测为核心,研究众源地理数据的信息提取与更新的协作机制和方法。主要研究方向包括: -
研究实现中原地理数据的高覆盖率和高完整性。众源地理数据虽然来源广泛,但是在单一的某个平台上部分区域的覆盖率存在较大的局限性。需要从现有的众源地理数据平台中获取尽可能多的数据以提高区域覆盖率和属性信息完整性。同时应研究将不同区域的更多用户参与到众源地理数据的协作机制。
-
建立规范合理的质量模型。为来源广泛、质量各异的众源地理数据建立有效的综合取舍和聚类机制,以及快速处理算法。需要研究数据量和来源控制的范围,从而最有效地得到能满足数据库更新这一应用的数据覆盖率、完整性和几何精度。
-
提高众源地理数据库地几何精度。可结合高分辨率遥感影像、全景影像、Lidar数据等对初始建立地数据库地几何位置进行精纠正,对不同数据地配准和修正位置精度地算法进行研究。
-
基于众源地理数据建立地理数据库并进行更新。研究两种不同规范的数据库的配准,对不同时间数据库的几何与属性信息进行比较,发现较少或新增部分,并用判别规则合并两套数据库的信息以实现数据库更新。
参考文献
[1]单杰,秦昆,黄长青,胡翔云,余洋,胡庆武,林志勇,陈江平,贾涛.众源地理数据处理与分析方法探讨[J].武汉大学学报(信息科学版),2014,39(04):390-396.

