
随着网络信息水平的不断提高,“云计算”、“物联网”、“大数据”、“智慧工程”等名词不断出现在人们视野中。美国早在2012年就宣布将启动“大数据研发计划”,投资超过2亿美元以改进从海量和复杂的数据中获取知识的能力。
2013年,全国人大代表在“两会”中提出要把发展“大数据”上升为国家战略。那么,究竟什么是大数据?经过几年的发展,大数据时代又为我们的生活带来了哪些改变呢?
在维克托•迈尔-舍恩伯格及肯尼斯•库克耶编写的《大数据时代》 中,大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理的分析方法;而研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;根据维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
我们这里主要采用第三种定义,即所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到获取、管理、处理、并整理成为帮助企业经营决策的目的资讯。
由于指纹的独特性,指纹识别技术已经被广泛应用于刑侦调查当中,成为了打击犯罪的有效工具。
中国自动指纹识别系统(Chinese Automatic Fingerprint Identification System)早在26年前就曾被引入参与破案。如今,中国大陆的每个省市自治区都建有各自的指纹数据库,共存有约3亿枚来自不同场合、时间、地点的指纹。目前该系统的访问需求是每秒钟80万枚指纹。
为此,中科院大学的团队设计了一系列快速而准确的新型指纹识别算法和优化模型,建立了东方金指指纹自动识别系统(GAFIS)。
新版的 GAFIS已被用于搜索一千二百万至一千五百万人的数据库,并且仅需十台服务器。2005至2015年间,借助新系统的帮助,上海共抓捕了逾1500名嫌疑犯,并清理了3000多件案件。
INFORMS的期刊市场科学(Marketing Science)上的一篇新研究发现,机器学习真的可以改善对消费者需求的识别过程。
各大品牌都有着长期使用且怀旧的消费关注群。研究人员还通过调查和采访测量了客户的需求、偏好和心愿,并进一步将它运用到市场、销售乃至产品提升等环节当中。机器学习可以帮助分析来自博客、微博、社交媒体和在线评论的用户生成文本(user-generated content or UGC),从而判断用户的主观情感,为体察用户需求提供依据。
3、算法能通过推测选出“疯狂三月”(‘March Madness’)的种子队伍吗?
2018世界杯前夕,瑞银集团(UBS)发布报告,通过 10000 次数据模拟验算,得出了一份世界杯排名预测名单,其中德国位列榜首,巴西排名第二,而在随后的正式比赛中,也确实是这两个足球大国夺得了冠军和亚军的好名次,只不过和预测掉了个个,这不禁让人感叹大数据的“言灵之力”。
INFORMS的期刊跨界(Interfaces)上的一篇新研究,开发了一种自动缩小范围并排名的方法,通过数学编程,可以将参加“疯狂三月”巡回赛的第一级别高校篮球队从351支缩减到68支,这项比赛每年会吸引约8千万观众的关注。用2017年数据实验时,该算法识别出了当年前38支队伍中的37支。此技术有望替代现有系统,减少人工判断带来的偏差和失误。
如果这项技术得以实行的话,或许能减少腐败的问题。而另一方面,机器预测的结果,也有可能成为赌徒们重要的参考砝码。
大数据给人们的生活带来了便利,但在“鱼缸生活”中,每个人都赤裸裸地暴露着,从衣食住行到医疗信息,无一不被外界掌握,一旦被不法分子或别有用心的人利用,都将带来巨大的威胁。可以说,大数据对人们的隐私权带来严重挑战。
“随着互联网、移动互联网快速发展,人们在使用手机、电脑等设备时,就会暴露个人隐私,未来大家都是裸露的人,要查找个人信息将非常容易,我们都活在大数据的‘阴影’下。”
如今,大数据正以稳定的步伐渗透到各个行业和领域之中,未来,我们生活中所接触到的大数据的应用会越来越多。
不论企业还是个人,唯有借力于大数据,高效地利用所获得到的信息,发展才能保持强劲动力,生生不息。大数据时代已经到来,它正在改变我们的生活。
