点击蓝字关注我们
我们人类对大数据技术的使用也经历了一个发展过程。从一开始的茫然无知到现在无处不在的各种人工智能应用,伴随着大数据技术的发展,大数据应用也从曲高和寡走到了今天的遍地开花。
今天大数据和人工智能的种种成就,离不开全球数百万大数据从业者的努力,这其中也包括你和我。历史也许由天才开启,但终究还是由人民创造,作为大数据时代的参与者,我们正在创造历史。同时也因为大数据时代的到来,让我们一丝不挂,成为暴露的羔羊同时,也让我们的生活发生了快活的便利,一呼百应的效果。

数据为何、如何被获取和争夺
数据是人工智能的学习养料,是未来的石油。阿里巴巴创始人马云在去年6月的一次演讲中,甚至将以数据为基础的人工智能竞争上升至“第三次世界大战”的高度;苹果CEO库克说,iPhone的未来就在人工智能。
根据金融公司高盛近期发布的AI报告,中国每年产生的数字信息约占全球的13%。到2020年,随着中国成为全球最大的经济体,中国产生的数字信息会占到20%至25%。
根据公开资料,腾讯的数据存储中心存储总量大于1.5万个全球最大图书馆的总量。这些运营数据已经积累了18年,且以每天500TB的数据量上升。这些数据在以精准营销和互联网金融的方式变现;在更大的时间维度来看,它们有着更大的想象空间。
大数据应用的数据挖掘时代
大数据一旦进入更多的企业,我们就会对大数据提出更多期望,除了数据统计,我们还希望发掘出更多数据的价值,大数据随之进入数据挖掘时代。
讲个真实的案例,很早以前商家就通过数据发现,买尿不湿的人通常也会买啤酒,于是精明的商家就把这两样商品放在一起,以促进销售。啤酒和尿不湿的关系,你可以有各种解读,但是如果不是通过数据挖掘,可能打破脑袋也想不出它们之间会有关系。在商业环境中,如何解读这种关系并不重要,重要的是它们之间只要存在关联,就可以进行关联分析,最终目的是让用户尽可能看到想购买的商品。
除了商品和商品有关系,还可以利用人和人之间的关系推荐商品。如果两个人购买的商品有很多都是类似甚至相同的,不管这两个人天南海北相隔多远,他们一定有某种关系,比如可能有差不多的教育背景、经济收入、兴趣爱好。根据这种关系,可以进行关联推荐,让他们看到自己感兴趣的商品。

更进一步,大数据还可以将每个人身上的不同特性挖掘出来,打上各种各样的标签:90 后、生活在一线城市、月收入 1~2 万、宅……这些标签组成了用户画像,并且只要这样的标签足够多,就可以完整描绘出一个人,甚至比你最亲近的人对你的描述还要完整、准确。

除了商品销售,数据挖掘还可以用于人际关系挖掘。你听过“六度分隔理论”吗,它认为世界上两个互不认识的人,只需要很少的中间人就能把他们联系起来。这个理论在美国的实验结果是,通过六步就能联系上两个不认识的美国人。也是基于这个理论,Facebook 研究了十几亿用户的数据,试图找到关联两个陌生人之间的数字,答案是惊人的 3.57。你可以看到,各种各样的社交软件记录着我们的好友关系,通过关系图谱挖掘,几乎可以把世界上所有的人际关系网都描绘出来。
现代生活几乎离不开互联网,各种各样的应用无时不刻不在收集数据,这些数据在后台的大数据集群中一刻不停地在被进行各种分析与挖掘。这些分析和挖掘带给我们的是美好还是恐惧,依赖大数据从业人员的努力。但是可以肯定,不管最后结果如何,这个进程只会加速不会停止,你我只能投入其中。

大数据应用的机器学习时代
我们很早就发现,数据中蕴藏着规律,这个规律是所有数据都遵循的,过去发生的事情遵循这个规律,将来要发生的事情也遵循这个规律。一旦找到了这个规律,对于正在发生的事情,就可以按照这个规律进行预测。
在过去,我们受数据采集、存储、计算能力的限制,只能通过抽样的方式获取小部分数据,无法得到完整的、全局的、细节的规律。而现在有了大数据,可以把全部的历史数据都收集起来,统计其规律,进而预测正在发生的事情。
这就是机器学习。
把历史上人类围棋对弈的棋谱数据都存储起来,针对每一种盘面记录何种落子可以得到更高的赢面。得到这个统计规律以后,就可以利用这个规律和人下棋,每一步都计算落在何处将得到更大的赢面,于是我们就得到了一个会下棋的机器人,这就是前两年轰动一时的 AlphaGo,以压倒性优势下赢了人类的顶尖棋手。
再举个和我们生活更近的例子。把人聊天的对话数据都收集起来,记录每一次对话的上下文,如果上一句是是问今天过得怎么样,那么下一句该如何应对,通过机器学习可以统计出来。将来有人再问今天过得怎么样,就可以自动回复下一句话,于是我们就得到一个会聊天的机器人。Siri、天猫精灵、小爱同学,这样的语音聊天机器人在机器学习时代已经满大街都是了。
将人类活动产生的数据,通过机器学习得到统计规律,进而可以模拟人的行为,使机器表现出人类特有的智能,这就是人工智能 AI。
现在我们对待人工智能还有些不理智的态度,有的人认为人工智能会越来越强大,将来会统治人类。实际上,稍微了解一点人工智能的原理就会发现,这只是大数据计算出来的统计规律而已,表现的再智能,也不可能理解这样做的意义,而有意义才是人类智能的源泉。按目前人工智能的发展思路,永远不可能出现超越人类的智能,更不可能统治人类。
大数据时代已来

创新应用,无限可能
大数据和AI的融合正在催生一个又一个创新应用,让更多不可能变成可能。
京东就正在将AI和大数据技术结合在一起,打造智慧供应链。基于AI和大数据技术,京东构建了智慧物流体系,包括建立无人仓储,让机器人融入生产、包装、搬运、挑选等诸多环节。而更为重要的是,大数据和AI的结合,能够帮助京东打造智慧供应链,深入了解和挖掘用户的需求,根据产品、库存、促销、生命周期等多种因素,动态制定价格,最终拉动销售。
同样是借助大数据和AI技术,重庆法院在信用卡纠纷案件中打造“类型化案件智能审判平台”。该平台已具备批量网上立案、智能审理裁判、深度运用数据、规范监督管理四大功能。平台上线后,大大提升了法院的办案效率,案件平均立案时间缩短到10分钟以内,平均审理时间缩短27.26天。
AI和大数据技术正在应用到工业、农业、金融、交通、教育等行业中,而除了提高生产效率,提升服务质量之外,还能给我们的生活带来一些“趣味”。比如国外设计师Minki Kim就设计了一个智能香氛系统,其能够通过大数据采集、分析以及AI技术,自动调制出用户喜爱的专属香味,提升愉悦感。
尽管大数据和AI技术的发展刚刚起步,很多应用尚在落地推广阶段,但是已经给我们带来了改变和惊喜。正因如此,我们对于两者未来的“相知相助”有了更多的想象和期待。
在大数据面前,我们一丝不挂,我们一呼百应。


