前言
在讨论数据赋能基层治理时,数据质量是一切话题的基础。如果没有“好用”的数据,谈“数据赋能”就如同无源之水,无本之木。
那什么样的数据,是“好用”的数据?
我们可以先试着回答以下问题:
上海现在有多少人?相信大部分人都能脱口而出:两千多万。
那么,上海人口数字精确到个位是多少?这时候,也许你会打开搜索软件,找到2020年第七次全国人口普查中上海常住人口的数字回答:24870895。
如果再问你,你知道你所居住的社区有多少个年满65岁的老人吗?社区内的养老机构有哪几所,当下它们的服务资源是否能满足老人们的看护需要?有多少老人需要上门服务?随着人口老龄化趋势的加剧,未来社区的养老资源和老年人口是否能匹配?大概率你不知道怎么回答了,而且发现网络上也搜不到答案。
回答这些问题,需要更精细的数据来支撑。人口数据需要覆盖年龄、性别、户籍、健康状况等更多维度,还需要知道人的住址,并且要精确到房屋。此外,还需要用社区养老资源的数据和人口数据进行计算比对,等等。
而类似的问题,现实中还有很多。比如,确定残障补贴的发放名单:如何在一个十多万人口的街道里找到最困难的10个居民?
事实上,比起“两千多万”的“大数字”,精细到身边的“个体数据”,才是指导解决社区层面具体问题所需要的数据,才是基层治理中“好用”的数据。
那么,我们有如此精细的数据吗?
答案是肯定的。
PART.01
数据为什么不好用?
实际上,我们的城市积累了大量的线下线上方方面面细致入微的社会主体数据。比如人的数据,从一个人的出生办出生证开始,到上学、看病、就业、入党,数据都会沉淀对应的教育、卫健、人社、党建等相关部门的数据库里。企业的数据也是一样,从工商注册、投融资上市、项目招投标,到专利申请,等等。
但是,我们时常听到的是,基层反馈下发的数据“不准”、“不好用”。
比如,社工要上门给老人送免费牛奶,民政给了名单,上了门发现这人不住这里;再到公安系统里一查这户人家又是另外的数据。比如,社区要给老人免费打新冠疫苗,居委从卫生服务中心拉出一份需要打疫苗的老人清单,挨家挨户上门服务结果发现不少老人早就在别的地方打过了。
为什么社会主体数据会“不准”、“不好用”?
这是由社会数据的特性决定的。
一方面,居民、企业等社会主体往往是流动的,它们不存在单一责任归属部门。不同部门有着各自的数据统计方式和标准,社会数据很难被单一部门以某一种方式“数清楚”。此外,通过不同技术手段获取的数据也存在差异。例如,通过手机信令获取的人口信息是无法完整覆盖所有人群的。
另一方面,不同政府主管部门往往只关注社会主体某几个侧面的信息,只从有限的几个角度收集和掌握数据。然而,当复杂的业务需要协同多个部门多个视角的数据进行综合评估时,就会发现各源头数据口径不一,无法直接拼合。有时甚至会出现不同来源的信息相互矛盾,无法确定哪个“人”才是真实的。
从基层工作的角度,所有的业务和服务最后都是要触达到具体的“个体”,需要数据的信息准确、维度完整。因此,首先要确保数据真实唯一,再来讨论数据如何在各类业务场景中发挥更大的价值。
那么,对于“千头万绪”的社会主体数据,我们要如何做才能确定其精确和唯一?
PART.02
数据确认的三个步骤
把大象装进冰箱要三步,那么确认社会主体数据精确且唯一需要几步?我们以人口数据为例,也可以从以下三个步骤去思考:
一,我们知道了某一个人的存在,就需要把他/她记录下来。只有当这个人被“登记在册”了,能在数据系统中被找到了,这个人的“数据”才算被建立起来了。
二,已经“登记在册”的“人”,也需要在现实世界能被“按图索骥”找得到。只有数据背后的“人”是能在现实世界中被定位确认存在的,系统中的数据才是有意义的。
三,我们需要确保记录者以外的其他人,都能根据系统中的数据,在现实世界“追根溯源”找到这个人。并且,信息也是能“对号入座”的,以证明一、二的数据是真实无误的。
完成了以上三个“确认”步骤,那么我们基本可以确定一个独一无二的人无论是在物理空间,还是在数字世界都是真实存在,并且一一对应的。此时此刻,他/她的信息被记录为“两千万中具体的某个人”,而非一个统计学上的分子。
这样一套数据“三确认”的动作,也是基层精细化治理工作的基础。只有数清楚了具体的人,了解他们的处境和需求,才能更高效精准地提供服务。
这“三步曲”说起来容易做起来难,具体每一步的落地实施,既需要组织协同保障,也需要技术的支撑。
PART.03
用数据底座实现“三确认”落地
这几年,我们有幸参与了上海、杭州等多地多个街道、社区的数据底座建设工作。对于社会数据的“登记入册”、“按图索骥”和“追根溯源”的三步“确认”工作,我们都有一定的实践探索和经验积累。
首先,是数据入库——在“系统”中找到这个人。建立辖区统一的数据底座,需要协同多个组织部门,打通公安、人社、工商、民政、教育、残联、统一地址库等数据,经过业务规则梳理,数据融合治理与校验匹配,最终形成街道级别统一的人口、企业、商户底座。社会主体的基础信息来自于权威机构,以确保诸如市民户籍、企业注册属性等信息真实可靠。
数据的业务信息来自于不同业务系统,以及一线工作采集,以确保数据维度丰富。我们参考了《公安信息代码》、《常住人口管理信息规范》等国家、行业、地区相关标准,调研数十个市区级部门的工作台账和信息平台的数据规范,结合多个项目的实践经验,初步形成一套完整的围绕“人、企、商”的业务标签体系,还原每个居民、每个企业真实的画像。
其次,是数据落图——把人放进“房子”里。我们通过一套标准化的地址处理流程,将所有的社会主体数据都与精确的城市空间相关联,实现每个人,每家企业、每个商户都“有房可依”,能在现实世界被找到。将每个社会主体的数据存放在其生活、工作具体的物理空间位置,就像将流动的散沙分装进大小嵌套的盒子中,流动数据由此在空间中“静态可见”。
最后,是数据校验——地面工作人员,在现实世界中的“房子”里确认这个“人”的存在。现实中社会主体在不断变化,系统也在不断产生新的数据。底座中的数据既要与数源保持同步更新,也要及时地被校验和修正,才能保持真实和鲜活。因此,建立一套数据循环流转机制必不可少。我们将数据验证权限开放给一线的社工。他们通过手机端小程序,可以在线下工作中同步逐一排查数据底座中的问题数据,保障所有数据真实存在、信息新鲜、准确无误。
完成以上数据底座的建设,社会主体在系统中“数据”的精确和唯一性,终于被确认了。
最后的话
为什么要确认社会数据的精确和唯一?
因为只有将城市中成千上万的数字层层拆解到个位,每个数字背后真实的个体才能被描述,被发现。
当精细数据被确认,它们便能实实在在帮助基层工作者解决老百姓生活中具体的问题:是社区工作者查找到社区每一个独居老人,可以定期地走访探望;是社区医院筛选出街道每一个新手妈妈,可以及时发送要给宝宝打疫苗的通知;是妇联了解到社区每一个学龄小朋友,以及他们家附近的儿童设施现状,以便决定哪个老小区空地最适合被改造为儿童室外活动场,等等。
这才是我们真正需要的数据,这才是我们在基层治理中为每一位市民、每一家企业、每一个商铺提供服务的基础。
有商业合作需求,欢迎联系我们
请备注:基层治理平台
↓添加企业微信↓
ABOUT US
上海脉策数据科技有限公司(简称脉策科技)成立于2015年,是国内数据智能领域中具有引领性的科技公司、高新技术企业、市区两级“专精特新”企业、杨浦区小巨人,上海市经信委下属的大数据创新企业成员。致力于城市数字化领域,结合智库能力和数据科技,基于自主研发自主产权的低代码数据系统开发平台和领域算法,叠加行业认知和数据服务,提供多样化综合解决方案能力。主要业务是为政府和大型企业提供智库咨询、数据研究、算法服务、平台产品及系统解决方案。

