
人工智能元年开启
2017年7月份,国务院印发《新一代人工智能发展规划》,规划明确人工智能成为经济发展的新引擎。
2017年11月科技部公布了首批国家人工智能开放创新平台名单,“人工智能国家队”出列。
坊间已将2017年称为人工智能元年。人工智能已明确成为新一轮产业变革的核心驱动力。引爆一个产业必须要求技术确实要达到一定的水平,人工智能日益精进背后的产业驱动因素如何?
凯石基金研究部TMT研究组从产业层面为您带来系列深度剖析。
上期我们开启了人工智能发展的市场空间讨论。
今天,我们继续开展产业驱动因素的探讨。
本文大概
6000
字
读完共需
6
分钟
人工智能深度产业研究系列二:
【产业驱动因素:深度学习带来技术上根本性突破】
人工智能可分为弱人工智能与强人工智能,弱人工智能主要基于规则实现某领域类人系统,能够解决复杂分类问题以及简单推理。强人工智能拥有真正的类人智力,能够推理拥有感情与意识。
深度学习算法06年被hiton提出,10年开始应用于图像处理与语音识别并取得较好的效果,随后图像识别与语音识别准确率大幅提升。当前人工智能浪潮是由于深度学习带来算法上的突破后,使得复杂任务分类准确率大幅提升,从而推动了图像处理、语音识别以及语义理解技术的快速发展。
而人工智能主要就是图像处理与语音识别为核心的感知智能以及语义理解为核心的认知智能组成,图像处理与语音识别以及语义理解上技术的突破使得大量人工智能应用得到解决,从而推动人工智能技术的快速发展。
图表1:弱人工智能与强人工智能异同

图表2:专家预测2040年迎来强人工智能

资料来源:整理自网络
1.技术:深度学习算法带来人工智能技术突破
神经元是大脑处理信息的基本单元,它是以细胞体为主体,由许多向周围延伸的不规则树枝状纤维构成的神经细胞。神经元之间通过树突与轴突相互连接组成庞大的生物神经网络用来处理与存储信息,神经元之间通过脉冲与电位变化来与其他神经元产生联系。
研究人员发现大脑皮层是由许多不同的功能区构成的。例如,有的区专门负责运动控制,有的区专门负责听觉,有的区专门负责视觉等。在每个功能区中,又包含许多负责某一具体功能的神经元群。
图表3:神经元基本结构

图表4:神经元群

人们通过模拟人脑神经网络构建人工神经网络来处理信息,人工神经网络中的节点就好比神经元,节点之间的连线相当于树突与轴突,节点之间通过数字的输入和输出产生联系处理信息。
1.1深度学习解决复杂任务分类问题。
人工神经网络分为浅层学习与深度学习,浅层学习通常只有2-3层的节点,像决策树、SVM以及传统人工神经网络都属于浅层学习,由于节点深度小,所以只能表达简单函数,也只能完成一些先验的统计判断工作,而深度学习包含多层节点,自动分层提取特征,类似人脑分层处理信息,能够构建复杂的人工智能模型,从而模拟人脑解决人工智能问题。
图表5:人工神经网络算法结构图

图表6:深度学习算法结构图

研究人员通过实验发现人脑中神经-中枢-大脑的工作过程可能是一个不断迭代、不断抽象的过程。从原始信号,做低级抽象,逐渐向高级抽象迭代,人类的逻辑思维,经常使用高度抽象的概念。
同样人的视觉系统的信息处理也是分级的。从低级的V1区提取边缘特征,再到V2区的形状或者目标的部分等,再到更高层,整个目标、目标的行为等。也就是说高层的特征是低层特征的组合,从低层到高层的特征表示越来越抽象,越来越能表现语义或者意图。而抽象层面越高,存在的可能猜测就越少,就越利于分类。
例如,从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是椭圆形的),然后进一步抽象(大脑进一步判定是人脸)。
图表7:人脑分层处理信息流程

同样,深度学习算法是模仿动物分层处理模式来处理信息。深度学习首先在计算机上构建出多层神经网络,再输入大量的图像信息进行逐层训练之后,各层会提取相应的特征,其中包含的深层次概念会被逐步提取出来。而传统人工神经网络增加节点的层数只是增加了选择特征的数量,没有分层通过特征抽象,对于复杂问题的解决效果较差。
深度学习算法通过调整每一层encoder与decoder参数,使得每层输入与输出信息损失尽量小,这样encoder模型选取的特征能够很好的表示输入信息,通过逐层选取的特征来不断抽象处理输入信息,最终实现判断与预测功能。
传统人工神经网络等浅层学习,通过调整模型参数使得模型输出和标签尽量一致,这样模型只有一层,节点与深度的增加只是增加了特征数量,没有分层对输入信息特征进行分层处理。
图表8:浅层学习算法结构

图表9:深度学习算法结构

从1980年代末期以来,机器学习的发展大致经历了浅层学习和深度学习两次浪潮。80年代末期BP算法的发明,给机器学习带来了希望,90年代各种各样的浅层机器学习模型相继被提出,比如支撑向量机(SVM)、Boosting、最大熵方法等。这些模型的结构基本上可以看成带有一层隐层节点(如SVM、Boosting),或没有隐层节点(如LR),所以只能表示简单的函数解决简单的分类问题。
2006年,加拿大多伦多大学教授Geoffrey Hinton发表了深度学习算法文章,开启了深度学习在学术界和产业界应用的浪潮。深度学习算法包含多层节点能够表示非常复杂的函数,为解决复杂任务的分类问题带来重大突破。
经过大量数据训练的深度学习模型相比其他算法效果大幅提升。微软研究院和Google的语音识别研究人员先后采用DNN技术降低语音识别错误率20%~30%,是语音识别领域十多年来最大的突破性进展。2012年,DNN技术在图像识别领域取得惊人的效果,在ImageNet评测上将错误率从26%降低到15%。
图表 10:人工智能算法发展阶段划分

图表11:深度学习算法表现优于其他人工智能算法

资料来源:百度《Deep Learning:Overview and trends》凯石基金
1.2深度学习是核心,云计算与大数据是基础
深度学习对分类准确率的提升依赖于大量数据的训练,一般需要千万级别的训练数据,所以不管是训练数据的需求量上还是训练所消耗计算资源上来看都是极大的挑战。互联网的普及与云计算的兴起分别从训练数据与计算资源方面很好地支撑深度学习发挥作用共同推动这波人工智能浪潮发展。
图表12:计算成本不断下降

数据来源:公开资料 凯石基金
云计算使得计算成本与时间大幅下降。一方面是半导体等硬件成本的下降,另一方面云计算使得开发与维护成本的下降,从而导致计算成本大幅下降,数据显示90年到现在计算成本、存储成本逐年下降,年均降幅达33%。日前国内云计算代表阿里云再次下调云产品价格,在14年上半年该公司连续第四次降价,部分服务降幅达50%,阿里云总裁王文彬表示今后云计算价格每年至少降低30%以上。
图表13:多核并行计算使得计算性能大幅提升

资料来源:互联网 凯石基金
图表14:GPU大幅提升深度学习训练计算效率

资料来源:互联网 凯石基金
高性能并行计算使得训练时间大幅缩短。数据显示随着处理器核数的增加,计算时间大幅缩短,在2至4核时体现了近似线性的加速比,甚至到采用32核计算时,并行效率才有所降低。百度第二代深度语音系统应用了HPC技术,系统实现了7倍的提速,使得原先需要几周才能完成的实验现在只需要几天。
1.3图像识别与语音识别准确率大幅提升
图表15:人脑是通过分层来处理语音、图像以及文本等信息

数据来源:公开资料 凯石基金
深度学习带来图像处理与语音识别准确率的大幅提升。06年深度学习被提出,10年有人将它用于图像识别与语音识别并取得了较好的效果,此后深度学习开始普及并将它应用图像处理、语音识别以及NLP中,图像识别与语音识别技术也得到了根本性的突破。
图表16:深度学习使得图像识别错误率大幅下降

图表 17:深度学习使得语音识别错误率大幅下降

资料来源:互联网凯石基金
同时自然语言处理方面也取得了一些突破,当前开放性的语义理解准确率能达到70-80%,通过自定义数据库的优化能够使得垂直行业语义理解准确率能达90%以上。
2.资本:巨头大幅投入,资本不断进入
在互联网创新逐渐枯竭,互联网带来的产业红利逐渐消失的背景下,在寻找下一个科技革命的征途中巨头们均把目光投向了“人工智能”,谷歌、微软、IBM、百度无一例外在人工智能研究方面大幅投入,重金招揽泰斗级人物GeoffreyHinton、Yann LeCun以及Andrew NG,就连深度学习领域的应届博士年薪已经高达200-300美金,是其他领域工程师年收入的十倍。
2.1谷歌致力于成为行业的推动者与通用技术的提供者。
谷歌致力于做人工智能底层的技术积累为开发者提供服务,借助自身人工智能技术与大量数据为开发者提供人工智能云服务,降低开发门槛与成本,推动人工智能行业发展。同时谷歌自身也将丰富具体的人工智能场景比如:翻译、无人驾驶、个人助手、智能家居等为用户提供智能化服务。近期谷歌收购多家人工智能领域创业公司,加强该领域技术储备,同时加强在无人驾驶、个人助手等领域的投入。
谷歌人工智能围棋AlphaGo挑战人类智力。2015年10月AlphaGo以5:0战胜欧洲冠军樊麾,2016年3月又战胜了职业九段棋手李世石,2017年5月再次战胜世界冠军柯洁。AlphaGo能够在短短几个月实现性能的大幅提升。用五个月走完了深蓝走了4年的路,体现了当前人工智能系统学习速度之快,只要规则机制有效后面准确率与性能的提升将会很快。谷歌透露这一系统将会逐渐应用与游戏、医疗以及金融等领域。
图表18:谷歌大脑

图表19:AlphaGo战胜世界顶尖棋手柯洁、李世石


资料来源:公司资料 凯石基金
2.2微软在人工智能领域也不甘落后
从小冰到cortana一直引领者智能问答系统技术进步,致力于通过智能助手实现终端的智能化。同时近期微软在机器翻译领域也有所突破,通过模型的训练与学习能够实现同步语言翻译,并且翻译后通过模拟说话人声音合身播放,翻译效果已接近同声传译,这一成果将极大地促进国际贸易发展与文化交流。
图表20:微软个人助手Cortana

图表21:微软机器翻译系统

资料来源:互联网 凯石基金
在计算机视觉领域,微软使系统能够描绘图片中的画面与情景,实现了机器看懂图片内容。
图表22:计算机描绘图片中的画面与情景

数据来源:公开资料 凯石基金
2.3继深蓝之后IBM历时四年开发出“Watson”系统
能够检索分析数百万条信息然后再筛选还原成“答案”来回答各种问题,11年参加美国最受欢迎智力问答节目《危险边缘》,并击败该节目历史上两位最成功的选手,借助IBM积累的医疗数据,沃森能够通过病人的症状来找出病因与治疗方法。近期IBM组建了全新的Watson业务集团开始推进沃森商业化,全面推动认知计算的普及,这是IBM继1995年提出“电子商务”、2008年提出“智慧地球”后的又一次战略转型。
图表23:IBM沃森参加智力问答节目《危险边缘》

数据来源:互联网 凯石基金
2.4百度豪赌人工智能,从搜索走向智能搜索。
2014重金从谷歌挖来了三大人工智能泰斗之一的深度学习专家Andrew Ng(吴恩达),负责同期成立的北美研究中心与百度大脑计划,加强人工智能前沿技术的研究。
在智能搜索领域百度先后推出百度助手与度秘,度秘能够实现衣食住行领域的智能搜索,已经嵌入到百度的搜索与O2O等产品中,未来将会逐渐丰富与优化衣食住行以外的其他功能,从搜索到智能搜索是百度的使命也是出路,未来在该领域百度必将重金投入。
图表24:百度大脑

数据来源:互联网 凯石基金
驾驶项目开始于13年,2015年2月百度无人驾驶车国内首次实现城市、环路及高速道路混合路况下的全自动驾驶。当前无人驾驶技术上的问题基本得到解决,未来随着成本的下降以及法律法规的健全,辅助驾驶甚至无人驾驶将会逐步普及。
图表25:度秘

资料来源:百度 凯石基金
图表26:百度无人驾驶车

资料来源:百度 凯石基金
2.5科大讯飞14年公司推出讯飞超脑计划,研究方向是:
1、更加贴近人脑认知机理的人工神经网络设计,更好的支撑人工智能的实现。
2、实现与人脑神经元复杂度可比的超大人工神经网络(相当于目前感知智能网络的1000倍)。
3、构建基于连续语义空间分布式表示的知识推理及自学习智能引擎。
讯飞超脑计划构建神经网络神经元数量达100亿个,从参数上来看超脑计划和百度大脑网络规模相当。三个研究方向从神经网络规模、认知神经网络以及知识表示方面解决认知智能算法上的根本问题,超脑研究方向紧跟世界人工智能最前沿的研究,技术比肩百度谷歌。
同时公司还参加国家863答题机器人项目,目标考上一本,答题机器人类似沃森系统相当于专用领域的机器人,需要实现单一领域的语言理解能力以及简单推理能力。
图表27:讯飞超脑应用领域

数据来源:科大讯飞 凯石基金
资本不断进入。12年开始人工智能行业的创业公司以及融资金额都出现大幅增长,资本不断进入催化整个行业爆发启动,据 CB insights 数据,投资者 2014 年在人工智能领域共完成 40 笔交易,获投资额比 2013 年增加了302%。事实上,在人工智能领域,大公司的内部投资占据着主要地位:麦肯锡估算,在 2016 年这一数字是 180 亿-270亿美元;而外部投资(来自风投机构、私募股权投资、并购、资助和种子轮投资)大约为 80 亿-120 亿美元。
图表28:风投在人工智能领域的投资额快速增长

资料来源:Bloomberg 凯石基金
行业新贵崛起。当前在深度学习应用、机器视觉、自然语言处理以及智能机器人等领域出现了大量的创业公司,其中机器视觉领域的metamind、Cortica,自然语言处理领域的SwiftKey、NarrativeScience,个人虚拟助手厂商Tempo,智能机器人公司Jibo,堪称人工智能行业的新贵。
图表 29:全球人工智能领域公司
数据来源:公开资料 凯石基金
3.政策:政策逐渐出台,人工智能成国家战略
美国总统奥巴马曾在2016年10月发布了全国性人工智能战略,为人工智能的研究和发展规划了一条路线图。相应的,中国最具影响力的商业和科技领袖呼吁中国政府制定相应的政策,他们提交了各种提案,希望通过政府牵头的方式,让中国企业可以在人工智能研究领域展开合作,并促进这项技术的工业化。
作为未来科技皇冠上的明珠,未来中国一定不会缺席人工智能这场科技盛宴。从多位官员近期表态来看,人工智能产业政策正在制定,产业规划也将上升为国家战略。
相关重磅政策的逐步出台,首先使得政府对人工智能各方面的资金支持力度提升,其次从底层计算平台到训练数据的共享方面也将对行业发展起到巨大促进作用,有望加速我国人工智能行业的快速发展。
图表 30:国内人工智能产业政策

本篇文章是人工智能行业深度研究报告的第二部分,后续继续为您带来产业链发展、前沿发展等,敬请期待。
凯石基金将坚持以产业研究为核心的投研发展模式。传承原有私募基金的精准研究能力及投资理念,专注产业价值和产业逻辑研究,坚持和提升主动管理能力。构建全新的贯穿产业研究到投资的完整体系,强调研究支持体系的专业化、深度化及前瞻性。打造投资经验丰富、责任意识强烈及投资风格鲜明的投资和研究团队。
免责条款
本报告仅供参考,不构成任何投资建议或承诺。本材料非基金宣传推介材料,亦不构成任何法律文件。若本材料转载第三方报告或资料,转载内容仅代表该第三方观点,不代表本公司立场。本报告版权归凯石基金管理有限公司所有,未获得本公司事先书面授权,任何人不得对本报告内容进行任何形式的发布、复制。如引用、刊发,需注明出处为“凯石基金管理有限公司”,且不得对本报告中的任何内容进行有违原意的删节和修改。投资有风险,敬请谨慎选择并详细阅读基金法律文件。


