
数据的出现只是伴随科技进步而产生的免费副产品。而今天,我们可以通过数据了解一些截然不同的东西,但遗憾的是,很少有公司能真正利用数据创造价值。
难点何在?究其原因,是人们在大数据处理和应用方面,常常会跌入一些错误的逻辑中去。

贪婪:对数据无止境的收集
大数据产业是一种“资源型产业”。对数据源的重视,在前期数据池的扩充方面具有正面效应,但是,因此大量诞生的依托数据资源优势的企业,也为大数据产业带来了低附加值的垄断经济模式。
而对于主营业务并非数据源的企业来说,即使那些看起来可能对你的业务毫无关联、没有产出的数据,宁可闲置不用也不去售卖,将数据转换为有利可图的新服务项目。
售卖的关键在于识别那些不是竞争者的公司——在相关领域运营。如丰田就开创了一项新业务,就是利用它在日本卖出的车里安装的GPS定位设备,捕捉车的速度和位置,再将其以每月2000美金的价格卖给市政规划部门,帮助改善交通问题,同时整合自己公司的发货渠道。
数据资源打通难,是因为缺乏在生产环节解决数据权属等核心问题的规则和制度。以开放的视野打破数据孤岛,仍需要在数据资源层面形成统一的行业共识和行为规范,引导产业走向综合发展为导向的良性发展模式。
麻木:非法数据交易猖獗
以国有数据资源和公共数据资源为主、看得见的数据,像冰块一样凝结不动,而地下数据交易黑市规模坐大,针对用户信息的非法收集、窃取、贩卖和利用行为猖獗,甚至形成一条龙式的产业链形态。
在国内,数据交易流通产业规模逼近百亿产值,整个数据流通产业如火如荼。
随着数据流通交易产业的变现模式的大量涌现,在利益诱导和监管缺失的情况下,数据流通交易面临的问题也愈发凸显:数据侵权、据窃取、非法使用、非法买卖已成为行业乱象。
盲从:用“巨量”掩盖个性化
在大数据时代,个人的信息更多的是以数据为载体来进行互动的。海量的数据在为研究和分析社会现象带来便利的同时,实际上也掩盖了许多具有个性特征的数据的意义。
大数据的复杂性不仅在于其数据样本巨量,更在于其多源异构、多实体和多空间之间的交互动态性。当前,只有少数人掌握处理这种复杂的巨量化大数据的技术,这很容易导致“数据暴力”。
归根结底,数据是关于个体的呈现。其中蕴含着各异的社会文化价值,是数据内涵中更深层次的内容。无论是可以数字化的数据还是不可数字化的数据,比较、分析和归纳的过程,其实反映的都是个体行为所呈现出来的趋势。
如果脱离了个体及其所在社会的价值本性,就可能本末倒置,最终产生许多难以预期的后果。
分歧:在“因果性”和“相关性”中走极端
数据的本质,是快速让大家知道发生了什么事,只有降低成本,把简单数据简单化或者复杂化分析,快速变成结果去变现,大数据公司才能活下去。
在一场变革或者技术的初期,需要找到最简单方式发挥出其效能。当然,这也还跟现在数据量、数据化等错综复杂的因素有关,利用此类相关性关系研究,将数据里面的金子挖出来,或者利用相关性,预防或促成某些结果的发生。
对因果性的执着,强调更多是个体甚至人类整体的记忆,或者经验、规律性等条件,必须从“人的态度”来理解,因果是“自然的人化”。做大数据,最怕听到去解释“为什么”,因为大数据能做到最真实情况的还原,就已经很难了。
现实市场状况往往是混乱的,尝试去找出项目成败的因果关系,实际上是没有必要的。大数据的作用是趋势判断,而不是找出因果。
客观:数据价值不易标准化
目前数据的商业化仍面临诸多挑战,如应用场景和价值不易标准化,从而引发数据定价及资产评估难的问题。
数据与工业时代的商品有截然不同的属性,工业时代的商品是实体物品为主,其商品经历了上百年的发展之后,已经形成了大家都认同的标准化定价模式,比如基于物权的定价模式,是由成本加上品牌定价决定。
而目前的数据应用水平和程度有限,数据标准化程度很低,数据的权属问题等制约着数据无法按照传统的商品销售模式进行销售,因此,目前从数据加工的成本和基于数据加工衍生出的服务出发,商业模式有待优化。


