导语
“数据将会像土地、石油和资本一样,成为经济运行中的根本性资源。”被热炒多年的大数据,终于在近期快速发展出多个交易渠道。
来源|软件定义世界
2014年初,数海大数据交易平台在北京中关村启动;今年4月,中国首个大数据交易所在贵阳挂牌运营;今年7月底,武汉东湖大数据交易中心开业,长江大数据交易所开始筹建。这股热潮还在不断加温。据财新记者了解,到2015年底前,江苏、浙江、重庆等省份计划筹建的大数据交易中心或交易所将超过12家。
《2015中国大数据交易白皮书》的数据显示,2014年中国大数据市场规模达767亿元,预计2020年这一数字将突破8000亿元。
大数据已经作为一种生产资料流向市场,关于它的交易也备受争议。是否侵犯隐私、政府大数据可否拿来出售、基于大数据的金融创新会否带来泡沫,以及大数据交易的监管缺失应如何补位,都是需要尽早厘清的问题。
谁在买卖?
“数据将会像土地、石油和资本一样,成为经济运行中的根本性资源。”这是《大数据时代》一书中描述的未来场景。但在中国,地下数据交易、个人信息贩卖等,早已经成为一个庞大的灰色产业。市场寄希望于专业交易机构的出现,能让数据市场变得规范。
贵阳大数据交易所采取会员制交易,获得会员资格才能进行数据买卖,目前只面向机构开放,个人用户不能参与。交易所每年收取10万元到30万元不等的会费,并与数据卖方进行成交额的四六分成。该交易所总裁王叁寿透露,4月初开业至今,与征信、风险控制、投融资并购有关的金融类数据成交最多,买家主要是银行、投资公司、证券公司、基金公司、保险公司等金融机构。
“不只是简单的数据买卖,还会把不同数据整合、碰撞、融合之后再进行交易。”王叁寿介绍,“现在已有2000多笔数据成交,交易额达千万元,155家会员中不乏天弘基金、泰康人寿、神州数码、华为等知名机构。”他希望,未来3年至5年,每天的交易量能突破100亿元。
与交易所不同,刚成立的武汉东湖大数据交易中心对机构和个人都开放,没有会费,只收取成交额10%左右的佣金。第一笔交易,是北京拉卡拉公司花8.6万元从武大吉奥信息技术有限公司手中,购买了一组“基于政府公开数据和互联网信息的中小企业综合评估”数据。其总经理杜小军把交易中心比作数据交易的“淘宝网”,“只要是有价值的数据,都能通过交易平台获得收益”。后台数据显示,开业不到一周,马化腾、万达信息、亿赞普等圈内人和机构都已注册。
中关村数海大数据交易平台的交易方式更为多样,包括在线、离线、托管、招标等。通过API(应用程序接口)提供第三方数据调用平台,卖方可开放自己的系统数据并定价,买方则可通过平台购买数据调用权限。
其创始人秦翯说:“平台本身并不存储和截流任何数据,仅仅作为通道来实现交易和流程管理。”截至7月底,该平台上1217家数据提供商累计成交的数据量超过16000笔,数据需求方以金融机构为主。
数据公司TalkingData高级副总裁蒋奇对财新记者表示,最早开展外部数据需求的就是金融企业。随着移动互联网时代来临,个人用户行为偏好的数据需求也会越来越旺盛。“数据使用的范围不仅局限于风控和征信的场景,还会结合企业自身的经营,优化获客、营销以及各种特色型业务模式”。
但在独立互联网评论人洪波看来,大数据交易现在更多的还是概念炒作,市场规模不会太大。“企业手上掌握的真正核心数据,是不会拿去交易的,比如腾讯手里大量的社交关系数据,阿里巴巴平台上的零售数据;拿去交易的,肯定只是筛选过的或者是一小部分加工过的,关键数据是不会开放的。”洪波说。
数据定价,是每个数据交易平台需要突破的核心问题。杜小军坦言:“给数据定价确实很难,现阶段还没有足够的历史交易作参考,我们会用一些独特的算法和模型估出一个价提供给交易双方参考。”
亚信数据总裁张灏介绍,数据定价目前有三种形式。一是成本定价,主要参考数据采集、数据挖掘和数据输出的成本。二是从买方购买数据用途的角度定价,“同样的数据给不同的人用,去做广告、去做业务,数据的价格是不一样的。”第三种是基于数据本身的定价,“新鲜的数据和已经过时的数据价格是不一样的,第一手数据、独家数据的价格更不一样。”
此外,数据交易中常见的多行业交叉混合数据,也很难剥离开来单独去评估每种数据的价格。“未来数据的价格应该是市场供需关系确定的价格,应该是一种动态的、市场化的定价机制。”张灏说。
![]() |
定价争议
王叁寿的另一个身份,是交易所大股东九次方大数据公司的创始人;杜小军是交易中心大股东北京中润普达公司的总裁;亚信数据是武汉长江大数据交易所的大股东,公司总裁张灏也是交易所董事长。
不难发现,这些地方数据交易所和交易中心,基本都是数据公司与当地政府合作搭建。王叁寿曾在接受《贵阳日报》采访时说:“发展大数据,谁的政策力度大,谁就具有先发优势;哪个地方政府重视,哪里就可以做起来。”
“地方政府在大数据领域的兴趣很浓,这是个热点,他们非常关注。”张灏表示,“交易平台的形式,是发展大数据的方式之一,地方政府会选择有大数据专业背景、值得信赖的伙伴去合作。”
一位接近武汉市政府的人士称,地方政府目前主要有两大动力:一是想通过发展大数据带动传统产业转型升级;二是开始认识到自己手中掌握的数据的确是一种资源,可以用起来。
今年7月1日发布的《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》指出,要进一步加大政府信息公开和数据开放力度,提高政府数据开放意识,有序开放政府数据,方便全社会开发利用。
一些地方政府在积极合作搭建数据交易平台的同时,也以参与交易政府大数据的方式,进行着开放数据的工作。在贵阳大数据交易所和武汉东湖大数据交易中心的平台上,就有政府统计大数据、政府审批数据、政府管理数据、海关大数据等交易品种。
以贵阳大数据交易所为例,截至目前,已有贵阳、宁夏、武汉、苏州、海南、广东等11地在该交易所开通了政府数据公开账号。“政府部门把核心底层数据提供给自己的投控平台或金控平台,让他们做数据清洗、分析、建模、可视化,然后再拿到交易所交易。”王叁寿介绍。
在北京理工大学网络法研究所执行所长孟兆平看来,政府数据是在行政过程中收集而来,根据《政府信息公开条例》,应属于免费向公众开放的范畴,而现在用于商业交易,有失偏颇。“本来应该无偿向公众公布的东西,现在变成了一个有偿的东西,这种理念是有问题的。”
《政府信息公开条例》起草小组专家、国家行政学院杨伟东教授表示,政府信息和数据的公开应该是常态、原则,它能够让信息效益最大化、管理成效最大化。“目前这种现实情况似乎远低于公众的期望,与政府确立信息公开制度的决心和初衷不相称”。
新浪高级法律顾问、政策研究总监王磊认为,政府数据和公开条例中的政务信息应区别对待。“政府数据的范畴要比政务信息大得多。涉及交易时,要注意是否会对数据来源和个人造成不必要的权利侵害。但目前的做法确实不是很统一和明确。”
数海科技董事长秦翯从市场的角度回应称,政府数据交易过程中的收费,收的并不是数据本身的价格。“和申请政府信息公开类似,要交检索费、打印费,政府数据也是一样。因为交易的不是底层数据,它需要一定的加工、清理、整合,这是需要成本的”。
张灏以政府部门手中的气象数据为例解释,面向公众发布的天气预报数据是免费的,但数据的颗粒度很大,“而专业的气象数据是以每10平方米为单位进行采集,这些颗粒度很精细的数据不会免费对公众发布。”“能够精确到农民的某一块田地会不会遭受冰雹,这种数据对农耕、保险公司就会产生很多实际价值。”
秦翯向财新记者透露,今年数海会和地方政府合作建设10家区域性的大数据交易平台。但洪波认为,大数据交易所完全没有必要全国“遍地开花”。“数据不依托于任何一个实体和地域界限去承载,它可以无远弗届在网络上流动。地方政府建立大数据交易平台更多的是一种政绩考虑,也会造成大量的资源浪费。”洪波说。
![]() |
如何保护隐私
提及大数据交易,似乎人人“谈隐私色变”。
阿里巴巴上半年推出了一款大数据产品——阿里经济云图,可以查看维度细化到区县一级的电商数据,包括各类销售排行、销售额走势、卖家信息等,但这款产品并不面向公众。
阿里巴巴集团副总裁涂子沛对财新记者表示,目前阿里经济云图的确只对政府开放。“我们也想开放数据,但并不简单,主要涉及隐私的问题”。
阿里云7月22日亦在北京发出了一封《数据保护倡议书》,向全行业呼吁:任何运行在云计算平台上的开发者、公司、政府、社会机构的数据,所有权绝对属于客户;平台方有责任和义务,帮助客户保障其数据的私密性、完整性和可用性。这些都从侧面反映出开放大数据与保护隐私之间的矛盾。而作为一个参与者众多、数据品类繁杂的大数据交易平台,隐私保护问题则更为突出。在实际交易中,基本上是以卖方对隐私的判断标准为依据,交易所也会参与甄别隐私数据,通过技术手段让敏感信息“可用不可见”。
“隐私是数据交易平台的生命底线。”杜小军说,东湖大数据交易中心会对数据卖方进行征信,也会要求卖方承诺所卖数据没有违法。但他也坦言,所交易的数据是真是假、是否侵犯隐私和违法,很难做到万无一失的准确鉴别。
贵阳大数据交易所的具体做法是,在开户协议中要求交易者承诺:“交易的数据不能是底层数据,而是基于底层数据,通过数据的清洗、分析、建模、可视化出来的结果,必须解决数据如何保护隐私及数据所有权的问题。”
数海大数据交易平台在个人隐私的信息使用方面,参考了《全国人大关于加强网络信息保护的决定》《互联网信息服务管理办法》和《电信和互联网用户个人信息保护规定》等法律法规,明确“禁止交易的数据包括涉及国家秘密和个人信息等法律保护的数据”。
秦翯表示,平台有一套完善的数据脱敏机制,通过技术手段对数据源的属性进行描述和标注,如果涉及个人隐私和敏感数据调用,也会进行清洗、屏蔽等处理。
孟兆平认为,所谓的数据脱敏采用了什么技术、处理到什么程度,都是没有对外公开的,在这种保密的状态下很难去判断隐私保护工作是否做到位。
“如果用一个非常简单的方法清洗数据,表面上看确实没有隐私信息。但卖出后,对方能不能用更加复杂的技术手段还原隐私信息,这些都是不可控的。”孟兆平说,法律上目前也无法界定数据脱敏的程度,如何界定数据隐私也是空白。
蒋奇表示,与个人身份和账户有关的敏感信息,理论上不适合公开市场交易。对一些特定业务场景而言,如个人征信报告、身份信息核实等是需要的,且应在可监管的条件下使用。但对于商业化查询,现在还需要一个能让个人用户有明确授权或者明确拒绝的机制。
“绝对根本上的隐私保护还是有一定难度。即使不是大数据交易,其他的方面也很难做到。”张灏坦言,在大数据交易的初期,只能通过交易规则和技术手段来把关。等待市场交易频繁后,会有更多的场景和技术来解决个性化的隐私问题,这是一个持续演进的过程。
涂子沛认为,隐私是个巨大的问题,但目前还没有集中爆发。数据,这个技术符号要做成文化符号,什么可以什么不可以,要划清界限。隐私也需要得到具体的规范,国家应该有针对隐私保护权的立法。
“我认为未来五年、十年,隐私一定会成为一个头号社会问题。”涂子沛说。
对接金融
前述四家大数据交易机构的负责人均向财新记者表示,数据是一种资产,列入企业的资产负债表只是时间问题。在他们看来,把大数据变成可交易的商品只是第一步,接下来还会和资本市场对接,赋予大数据更多的金融属性。
7月21日刚成立的中关村数海数据资产评估中心,让这一路径更加明晰。
据了解,该数据资产评估中心的主要业务,是数据资产登记确权、盘点、整合、评估,还将与华夏银行、贵阳银行、中融汇金融资租赁有限公司等合作,开展基于数据的资产抵押贷款等服务。
秦翯也担任该中心的主任一职,他向财新记者透露,数海之前采取的是“数据工厂+数据电商”的简单模式,除数据交易平台,下一步还会有数据融资平台。“现在很多的轻资产公司,原来的负债标准已经不能够完全适用于它。除电脑等固定资产,数据资产就是创新型企业与生俱来的核心价值所在。”秦翯说。
把这种数据价值利用到极致的,则是该中心的另一个目标:与中关村股权交易服务集团合作打造北京四板互联网优选板块,建立创新型企业基于数据资产的价值评估模型,让数据资产在公司挂牌上市、企业融资过程中发挥出优质资产的价值,成为公司估值和投资判断的重要依据之一。
愿景固然美好,但现实中要融合大数据与金融这两种不同属性的东西,谈何容易。
早在2014年,数海就与新时代证券签署了全面战略合作协议,共同探讨数据资产证券化的相关业务。一位接近新时代证券的人士告诉财新记者:“这事到现在根本还没开始落实。数据又不是房产或者债务,哪那么容易证券化,流动性、所有权、隐私等问题都难以界定。”
上述人士表示,大数据概念近几年一直高温不下,和各个领域都能沾上边。“务虚的多、务实的少,会让人有产生泡沫的担忧,就和当年的互联网泡沫一样”。
王叁寿称,现在谈大数据交易,确实和20年前谈互联网一样,都还刚刚开始。“但大数据是浮在海面的冰山,你还没看到它完整的面目,怎么可能是泡沫呢?”他表示,很多早先成立的大数据公司今年才刚刚开始盈利。“日后大数据在各个细分领域还会有大作为,比如交通大数据、医疗大数据领域等等,会逐渐形成一些寡头。我们也正在设计大数据金融工具和衍生品。”
张灏也认为,今天的大数据绝对不是一个泡沫的代名词。“怎么去挖掘和利用价值,才是现在应该要做的事情。”张灏称,以前很多企业会把数据当垃圾扔掉,还问为什么要花钱来管理、有什么用。“现在大家在慢慢接受数据是资产这个理念,开始在企业内部积累数据,并积极和其他行业的数据交叉混合使用,将来也会真正把数据当作资产来管理、建设和维护。”
杜小军的看法略有不同,他认为大数据的确有泡沫,但只是出现在某些领域。“比如云存储,各地建了那么多云计算中心,没几个是全负荷运行的。大数据的泡沫还没有到破灭的时候,现在只是部分的产能过剩。”
“大家都忽略了一个问题,到底什么是大数据?国内真正的大数据公司其实没多少,关键是要看有没有过硬的数据采集能力和挖掘能力。”杜小军说。
谁来监管
大数据交易所和大数据交易中心的根本区别,在于有无类金融牌照。
2011年11月,由证监会牵头的清理整顿各类交易所部际联席会议,开始对各类交易所进行清理整顿,新批准成立交易所的工作一度被叫停。在此背景下,大数据交易所何以拿到牌照开张运营?
据财新记者了解,贵阳大数据交易所是由此前已成立的贵州阳光产权交易所改制而来,筹建中的武汉长江大数据交易所正在改制武汉光谷一知识产权交易所。
不过,秦翯认为,把数据交易机构上升为一个持牌的交易所,“不利于大数据交易的发展和产业创新”。
今年底前拟成立的多家区域性大数据交易机构也多为交易中心,并不是持牌的交易所。
“有牌照的交易所不仅受限于现在的金融监管,在资本退出上未来还会面临很多问题。”杜小军也认为,“不受严格监管的草根数据交易中心会更有发展、更有冲劲。不是要等所有的法律法规都健全了我们才开始做,行业规范和市场创新要同步进行,边走边完善。”
截至目前,政府专门设立的与大数据相关的管理机构有广东省大数据局、广州市大数据管理局和沈阳市大数据管理局。
这些机构多设在地方政府的经济和信息化委员会下,主要以推动政府的数据资源整合与数据开放为目的,并没有涉及数据监管和交易层面。
在大数据监管上,美国一直走在前列,也是最早提出大数据战略的国家。
2009年,建立了开放数据平台Data.gov;2012年,白宫发布了《大数据研究和发展计划》;2014年,《美国大数据白皮书》发布。
涂子沛表示,美国有一套非常完善的大数据监管体系,大部分州都有关于数据管理和数据开放的立法,但中国的情况很不理想,同样需要通过立法来解决这个问题。
孟兆平也认为,现行的大数据交易缺乏法律监管,但立法也存在诸多难点。“大数据这个概念是产业界的说法,在法律上还没有办法界定。在《物权法》上,数据到底是有体物还是无体物、怎么去判断它的产权权利、它能不能被所有权所覆盖、还是说它属于另一种权利的客体,这些问题在法律的技术层面上都没有解决”。
“最大的可能性,还是按照产业界的运作规律制定自己的规则。”孟兆平说,“大数据交易中心越多,也会遇到越多的风险,推动行业立规是个比较现实的办法。”
在大数据具体交易环节的管理上,蒋奇建议,公开数据、可交易数据、需监管交易的数据和不可交易的数据,这些范畴都需要明确。“如何设计一种数据交易的机制,并保障各方权益同样是一个挑战 ”。
秦翯认为,国家现在也不会急于出手监管大数据交易,更多的是出一些指导性的意见。“就像互联网金融一样,那个市场要比大数据交易大得多,也是先有一些规定,到现在才刚刚界定清楚‘一行三会’监管体制的分配”。
财新记者获悉,工信部、网信办和发改委目前正在牵头制定《大数据交易标准》,包含数据的格式标准、交易的技术标准、交易的安全标准、交易的监管标准四个方面的内容,该标准有望年内推出。
企业经营数据应用挖掘
发挥企业信息系统作用
欢迎加入群友通讯录
建立专属数据应用领域的圈子……



回复 关键字 获得推荐头条文章
回复实践 阅读文章 用大数据管理企业,HR大数据思路与腾讯实践
回复柱形 阅读文章 数据产品开发前的必修课之柱形图应用



