在澳大利亚西海岸,阿曼达·霍奇森(Amanda Hodgson)向印度洋上空放出了多架无人机,从空中拍摄这片水域。它们拍下的照片可以用来定位珀斯附近海湾中的海牛,以防止这种濒危海洋哺乳动物的灭绝。这件事的困难在于,霍奇森的团队没有足够的时间来查看这些航拍照片。照片数量太多了,大概有45000张,未经训练的人想在这些照片中找到海牛非常困难。所以,她把这件事交给了深度神经网络。
神经网络是一种机器学习模式,它可以识别Facebook图片中的人脸,也可以理解用户对安卓手机提出的问题,然后运行谷歌搜索引擎。这类数学模型基本上是对人的大脑的神经网络的粗略模拟,可以通过对大批数字化数据的分析,学习上述全部内容。现在,霍奇森这位默多克大学的海洋生物学家正利用同样的技术,在公开水域的数千张照片上寻找海牛,她正用名为TensorFlow的开源软件运行自己的神经网络,谷歌的机器学习服务也使用这个软件。
哈奇森解释说,对这些海牛进行监测需要一种特殊的精确性,这主要是因为这种动物生活在海平面以下。“它们看上去可能就像浪花或水上的波光。”她说。但神经网路现在可以识别出海湾附近约80%的海牛。
该项目仍处于早期阶段,但它表明深度学习在过去一年的广泛影响。 在2016年,这个出现很早但最近才变得强大起来的技术帮助了一台谷歌开发的机器击败了世界顶级围棋手之一,这在此前几个月中似乎还是不可能完成的任务。不过这还只是最突出的例子。随着2016年即将结束,深度学习不再只是玩具,也不是个应用范围狭窄的研究。这一技术正在从内到外地重塑谷歌、Facebook、微软和亚马逊等公司,并迅速传播至世界其他地方,这在很大程度上归功于这些巨头的互联网开源软件和云计算服务。
新的翻译技术
在过去几年中,神经网络通过谷歌照片等应用改造了图像识别功能,并通过Google Now和微软 Cortana等数字化助手将语音识别提升到了新的高度。今年,它们实现了机器翻译的大飞跃,即自动将一种语言翻译成另一种语言的能力。9月,谷歌推出了一项名为“谷歌神经机器翻译”的新服务,它完全通过神经网络运行。据该公司称,这种新引擎在翻译某些语言时,错误率降低了55%到85%。
谷歌通过大量现有翻译的集合来训练这些神经网络。训练数据中的一部分是有瑕疵的,其中包括旧版谷歌翻译应用质量较差的翻译。不过也包括人类专家的翻译,这提升了训练数据的整体质量。克服缺陷的能力是深度学习的神奇能力的一部分:只要给予足够的数据,即使这些数据是有缺陷的,深度学习也可以通过训练达到远远超出那些缺陷的水平。
谷歌翻译服务的首席工程师迈克·舒斯特(Mike Schuster)乐于承认他的创作远非完美。但它仍然称得上是一次突破。由于该服务完全基于深度学习,因此谷歌可以更轻松地继续改进服务。它可以集中精力从整体上改进整个系统,而不是像过去一样,对构成机器翻译服务的各个部分小修小补。
同时,微软也在朝着同一个方向发展。本月,微软发布了新版微软翻译应用程序,可以让讲着九个不同语言的人之间实现即时对话。微软副总裁哈里·舒姆(Harry Shum)负责公司AI和研究团队的管理。他表示,这个新版翻译系统几乎完全在神经网络上运行。这很重要,因为这意味着微软的机器翻译质量很可能会更迅速地提高。
新的聊天机器人
2016年,深度学习也进入了聊天机器人领域,其中最引人注目的是今年秋天发布的新版Google Allo。Allo可以分析用户收到的文本和照片,并立即给出可能的回复建议。 它基于一种名为“智能回复”的早期Google技术,与电子邮件的功能大同小异。该技术的运行效果非常理想,在很大程度上是因为考虑到了当前机器学习技术的局限性。建议的回复总是非常简短,而且程序总是给出不止一个建议,因为目前的AI还不是总能给出正确回答。
在Allo内部,神经网络也会对用户向谷歌搜索引擎提出的问题做出反应。这些神经网络可以帮助公司的搜索助手了解用户在问什么,并帮助制定出答案。谷歌研究产品经理大卫·奥尔(David Orr)表示,如果没有深度学习,应用程序就无法实现回答。“你需要使用神经网络,或者说至少这是我们找到的唯一方法。”他说。“我们必须使用我们拥有的所有最先进的技术。”
神经网络力有不逮的事情是进行真正的对话。无论科技公司的CEO们在演讲演示文稿中做出什么承诺,这种聊天机器人都还有很长的路要走。但谷歌、Facebook和其他公司的研究人员正在探索深度学习技术,向着这个崇高的目标而努力。希望这些努力能够带来和今天的语音识别、图像识别和机器翻译领域同样的进步。对话就是下一个前沿领域。
新的数据中心
今年夏天,丹米斯·哈撒比斯(Demis Hassabis)和他领导的谷歌DeepMind实验室在构建了一个破解围棋项目的AI后宣布,他们还构建了另一个AI,可以帮助操作谷歌在全球的计算机数据中心网络。这个AI使用一种名为“深度增强学习”的技术,该技术支持学习围棋游戏和更早期的用于掌握Atari老游戏的DeepMind服务。这个AI可以决定何时开启数据中心数千台计算机服务器中的冷却风扇,何时打开数据中心窗户,进行额外制冷,以及何时依靠昂贵的空调制冷。总之,它可以控制每个数据中心内的120多个功能
正如彭博新闻所报道的那样,这个AI的效率非常高,为谷歌节省了数亿美元。 换句话说,它等于支付了收购DeepMind的费用(谷歌在2014年以约6.5亿美元收购了Deepmind)。现在,Deepmind计划在这些计算设备上安装更多的传感器来收集更多的数据,并将这个AI到训练至更高的水平上 。
新的云技术
当互联网巨头们将这项技术用在自己的产品中作为服务时,他们同时也正在将该技术传给了他人。2015年年底,谷歌开源了TensorFlow,在过去一年中,这个曾经专有的软件的传播远远超出了谷歌公司的范围,一路传到了阿曼达·霍奇森这样的人手中。与此同时,谷歌、微软和亚马逊开始通过云计算服务提供他们的深度学习技术,任何程序员或公司都可以使用这些技术来构建自己的应用程序。人工智能即服务(AIAAS)可能会成为这三个网络巨头的最主要的业务。
在过去的12个月中,这个新兴市场激发了又一次AI人才争夺热潮。谷歌聘请了斯坦福大学教授李飞飞来管理一个专门致力于AI的新的云计算团队,她是全球AI研究领域最著名的人物之一。亚马逊争取到了卡内基梅隆大学教授亚历克斯•斯莫尔那(Alex Smolna)的加入,在公司的云帝国中发挥同样作用。这些大企业都在以最快的速度聚集世界顶尖的AI人才,不给其他企业留什么机会。好消息是,这些人才的目标是至少将他们的最终开发成果与任何需要的人共享。
随着AI的演变,计算机科学家的角色正在改变。当然,这个世界仍然需要能够编写软件的人。但更需要的是可以训练神经网络的人。这是一种完全不同的技能,更多的是从数据中慢慢得出结果,而不是自己去构建一些东西。 像谷歌和Facebook这样的公司不仅是雇用了一种新型人才,而且是在以这个未来为目标对现有员工进行再教育,即:人工智能未来会将在每个人的生活之中重新定义“技术”这个词。

