
在数字经济时代,伴随商品和服务的交易活动产生的大量数据已成为一种新的价值存在形式。数据同样可以被存储和交易,并且其价值可能会随时间而发生贬值,许多公司,尤其是最有价值的美国公司,其估值主要取决于它们积累的数据。Wilson(1975)曾指出,思想、信息、数据和其他非竞争性投入能够产生规模回报[1]。大公司可以从数据中获益更多,产生更多的数据并发展壮大,数据的回报通常会增加,这引发了生产者们对于数据资源的争夺和重视。但与此同时,数据科学家则认为,数据的所带来回报是递减的:大多数预测价值往往都来自于最初的几个观察结果。那么,存在上述对立力量的数据经济与传统的生产经济或创新经济有何不同?这些差异对GDP的核算、企业价值、社会福利和外部性的衡量由会产生何种影响?
基于上述思考,来自美国哥伦比亚大学商学院的Laura Veldkamp教授与麻省理工学院斯隆管理学院的Maryam Farboodi助理教授共同在其工作论文《A Model of the Data Economy》中构建了一个包含数据要素的、新的、动态的一般均衡的平衡框架,试图探究数据这一新型要素为经济发展与增长所可能带来的短期与长期的特殊意义。
与其他研究数据要素与经济增长的文章不同,该文章并没有将数据直接引入到生产或研发与创新部门,而是在构建模型时参照经典的索洛增长模型(Solow,1956)提出的资本积累与经济增长的问题,考察了在没有任何技术进步的情况下,单纯的数据积累本身是否能够维持经济增长,这有助于我们更好地加深对数据的理解[2]。文章中的数据积累模型与索洛的资本积累模型的主要区别有三个方面:(1)数据用于预测;(2)数据是经济活动的副产品;(3)数据至少部分是非竞争性的,即多家公司可以同时使用相同的数据。
在上述假定下,模型的主要思想为,假设企业的产出会受到资本投入
和产品质量
的影响
,是一种质量调整型的生产函数(quality-adjusted output)。商品的质量取决于企业对生产技术的选择,每个时期企业i都拥有一个最优技术,包含“稳定”部分(
,服从AR(1)过程)和“随机”成分
,即:
。产品质量由企业选择的生产技术和最优技术之间的距离的平方所决定,即:
。选择的生产技术越靠近最优技术,二者之间的差异越小,产品质量越高,产出也就越多。数据主要由经济活动产生,其主要作用在于帮助企业识别最优技术选择“稳定部分”(
)中的信息,进而来帮助企业选择生产技术
。由此,建立起一个可以帮助企业推测当前的市场状态的数据经济模型,从而使企业可以选择更加合适的技术、生产质量更高的产品。

文章首先探索了单个企业的成长与转变。从短期来看,数据可能会带来规模收益递增。图1展示了单个企业的流入、流出和动态变化的一种可能情形[3]。当某一企业在新进入市场后其关于数据的积累会呈现“S”型增长,在企业发展的早期阶段,其自身的数据储备量较低,数据处于一种净流入状态,此时数据的回报将催生短期的经济繁荣。随着产量的提高,伴随而生的数据也会更多,这会形成一个“数据反馈循环”,即更高的产量伴随着更多的数据,更多的数据又提高了产品质量,使得企业拥有更大的市场份额,并进一步产生更多的数据,进而带动知识积累的加速,如此循环反复,直到企业发展到一定阶段,数据储备量达到一定规模后,数据转变为净流出状态。

接下来,文章考虑了一个企业在规模、数据和选择变量上都对称的经济体,通过探索对称企业共同成长背景下数据的流入和流出来进一步对该数据经济增长模型进行探索。对于这个经济体中的代表性企业,文中将时间
经济活动产生的数据存量的增加定义为流入,并将折旧造成的总损失定义为流出。图3展示了该经济体数据流入与流出的动态变化。当经济体中的数据储备量较少时,数据流入和流出之间存在着的巨大差距,在该时期内,数据快速积累,商品质量和企业价值也实现了快速增长。之后,随着时间的推移,过往数据对当前状态的信息量会逐渐贬值(Data Depreciation),且新增数据对于预测精度的边际提升作用也会逐渐递减,这就会使得数据流入和流出量之间的差距慢慢缩小,从而使增长出现放缓。直到数据流入和流出在稳定状态下相交于一点,此时数据的流入与流出达到平衡,知识存量不再改变。同样,质量和总产出也将随之停止增长。因此,从长期来看,数据类似于传统的资本,会表现出规模收益递减的形式,仅仅依靠数据积累会导致经济在长期的零增长。
造成上述现象的主要原因在于,数据在模型中被设定为发挥预测信息的作用,而并没有引入创新活动。而要想实现经济的持续增长,一方面,在没有创新的情况下,必须同时满足如下两个条件:(1)完美的一期预测可以实现无限的实际产出;(2)未来是今天可观测数据的确定性函数。而这两个条件在现实中往往无法得到满足,因而单独的依靠数据积累无法实现长期的经济增长。另一方面,则需要引入创新活动,作为创意输入的数据可以很容易地产生增长。这要求我们要像对待资本一样,将数据区分为用于研发的数据和用于非研发的数据。
综上所述,从长远来看,数据的资本回报递减,但在向稳定状态过渡的早期阶段,它的资本回报则越来越高。因此,虽然数据的积累和分析可能是“新经济”的标志,但这种新经济有许多古老而熟悉的经济力量在起作用。尽管该文章目前 还处于工作论文的状态,但正如Veldkamp教授在论文中所说,该文章更大的贡献在于其提出的模型可以作为一种工具来评估数据,衡量其影响,并帮助人们来清楚地思考数据积累的总体经济后果。
论文链接:
[1]Wilson, Robert, “Informational Economics of Scale," Bell Journal of Economics, 1975, 6, 184-95.
[2] Solow, Robert M., “A Contribution to the Theory of Economic Growth," Quarterly Journal of Economics, 1956, 70 (1), 65-94.
[3] 数据产生(Data Production)可能位于数据流出线(Outflows)的上方或下方。数据流入(红色实线)和数据产生(红色虚线)之间的区别在于数据购买(Data Purchase)。这些购买推动了资金流入,并有助于加速趋同。


