(本文作者系前橙智库高级研究员、北京市法学会电子商务法研究会副会长)
概括:曾经,数据被吹的神乎其神,视为神器,甚至大有数据崇拜的趋势,好像天下所有的难题只要用上数据手段都变得轻松易解了。但我今天我要告诉你的是,千万不要把数据变成神话,也不要过分夸大数据的功能,我们需要全面客观地认识数据和信息化,数据和数据治理都有你所不知道的属于无奈和尴尬的另一面。
说明一下,这里的数据治理指的是利用数据和大数据实施治理,而不是指治理数据和数字经济。
昨天,中美两国首脑举行了视频会晤。在我们的印象里,以前这种会晤都是见面会谈的,只是在疫情下的特殊时期,这样的领导人会晤形式变得越来越普遍了。如果我们把这个道理延伸到治理领域,其实也是这样。
线下的、面对面的治理还是主要渠道和常态,线上的数据治理更多的时候还只是补充和不得已而为之的。就像不管我们在线上的世界和元宇宙里玩的多嗨,还得乖乖地回到线下世界吃饭、睡觉、长身体和发呆一样,线上线下治理可以相互融合、取长补短,但主次关系还是不能颠倒。虽然数据治理是有一些优势,但也有很多你可能不了解的短板。
我们不展开,简单地说,数据治理的短板主要是两个,一个来自虚拟化,一个来自平台化。
为什么说虚拟化是短板呢,就是因为见不到真人,无法面对面核实,只能通过虚拟空间判断和了解,也就是通过数据来了解。当然习惯了虚拟化生活的你可能不会认为这是什么短板,但我要提醒你,就拿你的银行账号来举例,你去柜台办的、经过面对面核实的才是一类账号,在网上在线办的只能是二类账号,央妈就是这么规定的;
那为什么又说平台化也是治理的短板呢?以前我们讲平台,会加一个“第三方”,即第三方平台,现在这么加的不多了,但意思还是一样。即平台是买卖双方之外的第三方,第三方的特点是物流不通过这里,平台无法核实比对他们交易的信息和实物,这又给治理留下了很大的隐患。现在我们把平台大数据治理看得高大上,其实如果问到这里的渊源,平台可能会做一个你熟悉的微信表情包里捂眼睛的无奈表情,然后告诉你,其实它这个网上的福尔摩斯是被硬逼出来的。
套用那句俗语解释你可能就容易懂了,这种基于数据的间接治理就像隔靴搔痒,如果痒痒的难受,谁不愿意咔哧咔哧地直接上手挠呢?
说过了数据治理的无奈,该说属于尴尬的那一面了。这里我要抛出的,是数据治理的三个悖论(咳咳,敲黑板、划重点了哈)。
第一,数据治理的过度拟合悖论。所谓拟合,是指画曲线发现趋势,有经验的数据分析师后来发现,有时候数据越精准选取的纬度越多,画出来的趋势反而更不准确。在《指导生活的算法》这本书里,记录了这样一个过度拟合的案例,万维钢老师在“得到”的课程里也介绍过:在一项德国人结婚10-15年里婚姻满意度的调查分析中,分析师发现,使用两个左右的指标评估基本还是准确的,当使用到九个指标维度再进行评估时,结果画出的趋势却完全失实了。

如果引用“得到”课程里另一位老师吴伯凡的观点,就是:有时候需要眯着眼睛看问题而不是瞪着眼睛,因为眯着眼睛才能看清楚整体。
这个已经被数据工程师掌握的经验很值得法学家和治理者在实施数据治理时借鉴。我们希望依靠大数据实现精准的治理,但这种精准可能是有合适的度的,有时候数据精准过头了做出的结论可能反而更失真。
第二,数据治理的鞭打快牛悖论。这个悖论更容易理解,当我们利用数据和算法治理时,线上线下会产生巨大的差别。线下的商业模式既产生不了那些海量的便于传输的数据,也没有什么算法可言,数据治理和算法治理对传统的线下商业模式基本是起不到太多的作用。
这样在数据治理之下,线上和线下的监管就会逐渐产生越来越严重的不平衡和不公平,就是我们常说的鞭打快牛。而鞭打快牛的结果是促使一些已经数字化的企业回到线下,把自己藏起来,寻求监管洼地。
第三,数据治理的数据充分保护与充分利用的悖论。这个悖论其实也很简单,疫情防控中就有很多鲜活的例子,就是个人信息数据保护和为了防控疫情而采取的对个人信息的各种调查和公开之间的平衡。你这几天去了哪里、和谁吃了饭、去哪家超市购物了、坐的哪趟地铁,等等,只要涉及到疫情,或者“有幸”成为“时空伴随者”,这些你的个人隐私都要一五一十地上报,甚至通过处理后向全社会公开。
进一步说,信息社会发达与否的判断标准其实就是数据的流动性和利用率。当我们强调数据保护、个人信息安全和数据安全时,保护的力度越大,社会上数据的流动性就会越差,数据质量也会变差,数据治理的效果就会受限。疫情这样的极端情况相对比较好操作,也会得到当事人和社会公众的理解,但如果是一般情况下的治理,其间希望充分收集和利用数据与害怕被滥用而不愿被收集掌握之间的矛盾则难以避免。
时至今日,当全社会卖出四件商品时,来自网上交易的只占一件;即便你是一只网虫,每天上网超过六个小时,占到全天的四分之一,时间长了,你也一定会改变这种不健康的生活方式。其实,线上线下、虚与实的合理配比,可能就在这里。
数据治理当然有着太多线下治理无可比拟的优势,精准、动态、个性化、可追溯,但我作为一个从95年就开始从事第一代国产操作系统(COSA)版权合法性论证的老兵,还是有义务告诉你关于数据治理你可能不知道的另一面,让大家更全面客观地认识它,从而实现数据治理和传统治理的有机结合,实现国家治理能力和治理体系现代化。
前橙智库高级研究员
中国网络空间安全协会理事
网规研究中心主任
电子商务法律网创始人
北京法学会电子商务法治研究会副会长