
葛大爷曾说过,“21世纪什么最贵?”——“人才”,深以为然。只是今天,大数据时代也带来了身价不断翻番的各种数据。数据的增长从未停歇,甚至呈井喷式增长。
最早提出“大数据”的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。
大数据到底能有多大?
一组名为“互联网上一天”的数据告诉我们一天之中:
互联网产生的全部内容可以刻满1.68亿张DVD;
发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);
发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);
卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万…
一分钟内,微博推特上新发的数据量超过10万;
社交网络“脸谱”的浏览量超过600万……
这些庞大数字,意味着什么?
大数据不只是海量的数据,必须有能力对海量数据进行处理和分析、挖掘,才能获取到数据的价值。除了从挖掘中获取真知外,大数据还会从理念上改变我们对数据的认识,给我们带来一些趋势预测方面的叠次价值。
在大数据时代,数据数量级很大,按照目前的IT系统,我们每年的数据量增加了百分之四五十,而且大数据每时每刻、时时都在产生,数据特征主要就是非结构化的数据分析,其中很多是用户的行为数据。
所以我们现在谈到挖掘大数据,更多是以人为中心的数据,尤其是以手机用户为中心的挖掘,将是最有价值的大数据挖掘。
很多人会问,究竟数据挖掘能够为企业做些什么?在数据挖掘中最经典的案例来解释这个问题:一个关于尿不湿与啤酒的故事。
超级商业零售连锁巨无霸沃尔玛公司拥有世上最大的数据仓库系统之一。在沃尔玛庞大的数据仓库里集合了其所有门店的详细原始交易数据,在这些原始交易数据的基础上,沃尔玛利用数据挖掘工具对这些数据进行分析和挖掘。一个令人惊奇和意外的结果出现了:“跟尿不湿一起购买最多的商品竟是啤酒”!
这是数据挖掘技术对历史数据进行分析的结果,反映的是数据的内在规律。那么这个结果符合现实情况吗?是否是一个有用的知识?是否有利用价值?
为了验证这一结果,沃尔玛派出市场调查人员和分析师对这一结果进行调查分析。经过大量实际调查和分析,他们揭示了一个隐藏在“尿不湿与啤酒”背后的美国消费者的一种行为模式:
在美国,到超市去买婴儿尿不湿是一些年轻的父亲下班后的日常工作,而他们中有30%~40%的人同时也会为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫不要忘了下班后为小孩买尿不湿,而丈夫们在买尿不湿后又随手带回了他们喜欢的啤酒。
另一种情况是丈夫们在买啤酒时突然记起他们的责任,又去买了尿不湿。既然尿不湿与啤酒一起被购买的机会很多,那么沃尔玛就在他们所有的门店里将尿不湿与啤酒并排摆放在一起,结果是得到了尿不湿与啤酒的销售量双双增长。
按常规思维,尿不湿与啤酒风马牛不相及,若不是借助数据挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可能发现数据内这一有价值的规律的。
事实上,当你仍然在把微博等社交平台当作抒情或者发议论的工具时,华尔街的敛财高手们却正在挖掘这些互联网的“数据财富”,先人一步用其预判市场走势,而且取得了不俗的收益。


