
赋予计算机一双慧眼
让它也能看懂这个多彩的世界,一直是计算机界孜孜以求的目标。2017年下半年,数家计算机视觉公司单笔融资上亿美元,再次将计算机视觉推向人工智能领域最受关注的方向之一。除了学术探讨和安防领域的应用外,计算机视觉一方面在泛金融认证、商品识别、工业制造、广告营销等领域有更多应用场景,并逐步解锁;另一方面也给手机产品及互联网娱乐应用带来了新的活力,契合了消费升级的市场背景。凯石基金研究部TMT研究组继续从人工智能应用的芯片、计算机视觉和深度咨询层面为您带来系列深度剖析。
前四期我们开启了人工智能发展的市场空间、技术发展及应用讨论。
今天,我们继续展开人工智能之芯片、计算机视觉和深度咨询发展的探讨。
全文字数:5000字
阅读时间:6分钟
【计算机视觉技术已成熟,商业化大步向前】
1、芯片
GPU通用芯片任是主流,专用芯片是趋势
人工智能从GPU到FPGA再到TPU等ASIC专用芯片。当前人工智能领域的处理芯片主要有CPU、GPU、FPGA以及TPU等ASIC专用芯片。由于深度学习模型的训练与识别中需要大量的并行运算,所以相比传统CPU处理GPU能够使得计算性能得到大幅提升,数据显示Pascal GPU相比英特尔E5在性能上有1-2个数量级的提升,这大幅缩短深度学习中海量数据训练的时间。
深度学习训练需要至少千万级别的数据,所以训练时间较长,GPU能够使得从原来需要几周的时间缩短到几天,提升了整个模型算法迭代速度,推动整个人工智能行业快速发展,所以我们看到当前GPU被大量地应用于深度学习的模型训练中。但是GPU的成本与能耗的问题使其难以大规模部署,所以在线服务领域逐步选择能耗与成本较低的基于FPGA的专用芯片。
图表 1:人工智能芯片,从GPU到FPGA再到ASIC专用芯片

从计算性能上来看,GPU比CPU有数量级上的提升。深度学习需要很高的内在并行度、大量的浮点计算能力以及矩阵预算,GPU出色的浮点计算提升深度学习分类与卷积计算的效率,所以其相比CPU能够实现更快的计算以及更低的功耗。根据NVIDIA的数据,在训练图像识别的卷积神经网络时,GPU实现了8倍以上的性能加速。
图表 2:从计算性能上来看,GPU比CPU有1个数量级上的提升

数据来源:互联网 凯石基金
然而从成本与能耗角度来看,GPU存在高成本与高能耗等问题,同时在高并发输入后的缓冲以及带宽方面都存储在瓶颈,所以GPU不适合大规模部署。FPGA功耗相比GPU能够降低1个数量级,性能功耗比存在较大优势,同时性能成本比上也有较大幅提升.
图表 3:基于FPGA的专用芯片相比GPU功耗大幅下降

数据来源:互联网 凯石基金
所以我们看到,近几年国内的人工智能巨头均在采用FPGA部署在线服务。
2015年11月全球超级计算大会(SC15)上,多家巨头,共同发布了一套面向深度学习、基于AlteraArria 10 FPGA平台、采用OpenCL开发语言进行并行化设计和优化的深度学习DNN的语音识别方案。
图表 4:科技巨头开始采用FPGA部署在线服务领域

数据来源:互联网 凯石基金
基于FPGA设计的DPU性能相比GPU有显著优势。2016年1月国内创业公司深鉴科技基于DPU的一整套深度学习硬件解决方案,在性能超过同类产品的同时,功耗、售价都大幅下降。从其官方数据来看,其嵌入式芯片性能超过Nvidia TK1,功耗与售价能够下降75%,服务器端产品性能接近Nvidia K40 GPU,功耗与售价分别只有前者1/10。
但当前基于FPGA的专用芯片的架构与开发环境均不成熟,主要还是科技巨头先行先试,产业成熟尚需时日。
图表 5:基于FPGA设计的终端DPU性能相比GPU有显著优势

数据来源:互联网 凯石基金
图表6:基于FPGA设计的服务器端DPU性能相比GPU有显著优势

数据来源:互联网 凯石基金
算法仍在发展,专用集成尚需时日。
ASIC 则是专用集成电路 (Application-Specific Integrated Circuit),一旦设计制造完成后电路就固定了,无法再改变。 FPGA 芯片内集成大量的数字电路基本门电路以及存储器,而用户可以通过烧入 FPGA 配置文件来来定义这些门电路以及存储器之间的连线,这种烧入不是一次性的。
与FPGA相比ASIC在相同功耗性能上能够有5-10倍的提升,而量产成本只有1-10%,所以随着人工智能算法上的成熟ASIC一定是趋势。然而人工智能算法从机器学习到DNN再到RNN与CNN,深度学习虽然在图像识别与语音识别等领域取得突破性进展,但任有诸多难题需要攻克,所以算法与模型架构任在快速发展,相应的芯片架构也会发生变化,所以我们认为短期任以GPU与FPGA为主,随着人工智能技术与芯片架构逐渐成熟ASIC专用芯片将大行其道。
图表 7:基于ASIC的专用芯片是趋势

数据来源:互联网 凯石基金
模型训练GPU是标配,在线服务逐渐应用FPGA,随着人工智能算法的成熟终端与在线服务期待高性能低成本专用芯片。人工智能应用分为云端与终端,云端主要进行模型训练与在线服务,首先通过大量数据对深度学习模型的训练才能够实现准确率较高的识别模型,随后用训练好的模型在云端部署在线服务。
模型训练不需要大规模的设备部署,性能是主要考虑因素,所以GPU凭借其强大的计算性能以及完善的生态体系成为当前模型训练的标配。在线服务领域会不断收到大量的高并发服务请求,需要大规模的设备与系统部署以满足大量用户的服务请求,对能耗比与成本比都有较高要求,所以在线服务需求迫切的厂商已经开始应用FPGA来实现在线的大规模高并发服务。
我们认为当前终端领域只有在对延时与计算性能要求极高的情况下(如无人驾驶)才需要CPU以外的高性能芯片进行加速,其他领域均能够在云端实现,随着专用芯片价格下降有望在终端普及应用。
图表 8:模型训练、在线服务以及终端计算均需要高性能计算芯片支持

数据来源:互联网 凯石基金
综合来看,GPU依然是通用领域高性能并行计算的主角,将会广泛应用游戏、人工智能、VR等领域,同时在模型训练与在线服务部署中继续广泛应用,FPGA作为物联网时代通用芯片向专用芯片过度发挥重要作用,比如通用并行计算GPU芯片向专用芯片的过度。专用芯片的设计需要针对深度学习具体算法进行架构的设计与优化,需要算法与芯片的不断融合与迭代。
我们认为最终深度学习专用芯片一定是趋势,但是同时包括GPU、FPGA在内的芯片也在不断根据深度学习做相应的优化,性能也在不断提升,而且整个生态比较完善,所以未来很长一段时间将是GPU与基于FPGA的专用芯片共存,最终在专用芯片的不断迭代与产品打磨后逐渐普及。
2、计算机视觉
技术已成熟,商业化大步向前
2.1人脸识别与视频监控:应用逐渐普及,业绩开始兑现
深度学习能够自动抓取图像特征,对复杂的任务进行分类,所以2012年算法普及以来图像处理准确率大幅提升(ImageNet比赛图像处理准确率从2012年的76%上升到2016年的97%),随之各种计算机视觉应用也陆续问世。主要的应用领域包括:远程业务办理、支付、门禁、图片搜索、工业4.0、机器人、安防以及无人驾驶。
相应的2012年开始计算机视觉市场规模增速逐渐提升, 2016年行业市场规模30亿,增速接近30%。
当前除了无人驾驶以外的计算机视觉应用均处于商业化快速推进阶段,但由于深度学习的出现使得计算机视觉技术门槛大幅下降,门槛的下降的同时大量厂商加入人脸识别、视频监控、机器人与工业4.0 等领域,竞争也较为激烈,单纯的技术服务商压力较大,产品化能力较强公司能够享受近几年计算机视觉行业应用扩散的高增长红利。
图表 9:2014年开始计算机视觉市场规模迎来快速增长

数据来源:前瞻网
图表 10:计算机视觉应用领域

数据来源:凯石基金
人脸识别。之前人脸识别由于准确率等原因只用在门禁领域,随着深度学习普及当前在光线较好的条件下人脸自动识别准确率已经超过人眼达到99%的准确率水平,已经能够应用于支付与远程开户等身份认证领域,逐渐成为多因素身份验证的重要一环。尤其马云在德国向默克尔展示了人脸支付后,国内更是掀起了人脸识别身份认证的高潮,当前公共交通与金融业务办理等应用均在快速普及。
图表 11:马云在德国向默克尔展示刷脸支付

资料来源:互联网 凯石基金
图表 12:face++人脸识别技术全球领先

资料来源:face++ 凯石基金
深度学习带来人脸识别准确率提升的同时使得整个行业门槛在下降,在图像的降噪方面还是有一些技术壁垒,国内涉足人脸识别的公司很多,竞争较为激烈。
图表 13:国内厂商人脸识别准确率对比

数据来源:互联网 凯石基金
安防。视频分析主要应用在安防与交通领域,实现智能监控、快速搜索等功能。行人检测能够在各类遮挡的情况下精确找出行人位置,并能够进一步分析行人姿态和动作,可应用于安防监控、交通监控等。行车场景、交通监控场景、卡口场景中检测多种不同角度的车辆,并同时给出车牌号码、汽车品牌、型号、颜色等物理特征。
安防+人工智能是智能化浪潮中安防行业产业升级的必然选择,由于整个计算机视觉技术门槛随着深度学习的普及逐渐降低,传统安防厂商与创业企业纷纷涉足智能视频监控,单纯提供智能视频分析软件的创业企业竞争压力较大,看好拥有技术优势能够提供智能视频分析整体解决方案传统安防厂商。
图表 14:基于计算机视觉的行为监控应用

资料来源:sencetime Sencetime 凯石基金
图表 15:交通车辆识别应用

资料来源:sencetime 凯石基金
综合来看,计算机视觉技术与产品化能力较强的公司,能够享受近几年计算机视觉行业应用扩散的行业高增长红利;同时通过模式创新能够将初期的技术优势转换成品牌、用户或者规模优势的应用也具备一定优势,如美颜相机、搜图购物、机器人。
图表16:淘淘搜通过图像搜商品

资料来源:淘搜搜 凯石基金
图表 17:阿U智兔能够识别2000多种物品

资料来源:互联网 凯石基金
2.2无人驾驶:成本下降是趋势,三级自动驾驶2020年获量产
当前自动驾驶产业两大核心问题是成本与安全性验证两大问题。
图表 18:自动驾驶技术发展现状

数据来源:地平线 凯石基金
成本。虽然深度学习使得图像处理准确率大幅提升达到99%的水平,但是自动驾驶对安全性要求非常高,可以说是要求万无一失,所以只能通过其他传感器弥补视觉识别先天的“不完美”。 然而激光雷达与计算平台成本依然居高不下。
当前自动驾驶产业发展主要有成本与安全性验证是自动驾驶两大核心问题,随着低成本激光导航与车在专用芯片的推出,业界对成本的下降较为乐观。 安全性的验证需要长时间与多场景的路测。
图表 19:自动驾驶技术成本分析

数据来源:地平线 凯石基金
安全性验证。自动驾驶对安全性要求极高,但自动驾驶安全性的验证的困难与成本均比较高,谷歌2010年开始路测到2016年也只有二百多公里测试里程,即使这样也很难讲安全。特斯拉的“影子模式”在车辆行驶过程中启用自动驾驶功能,但不实际控制车辆,将机器输出与人类驾驶员输出就行对比,这样可以在各种场景下验证系统的可靠性与安全性,成为未来路测趋势。
商用进程。当前产业处于从二级向三级过渡的阶段,Mobileye依托其长期在芯片与标记数据领域的积累在自动驾驶二级领域优势明显,但博世等一级供应商ADAS逐渐推出自己的产品, Mobileye 面临竞争越发激烈。
当前内资车企在产业变革中逐渐崛起的背景下,相关国内ADAS厂商有望享受内资品牌出货量高增长以及ADAS渗透率持续提升共振影响。
对于三级自动驾驶的量产时间业绩普遍的共识在2020年左右,三级相比二级自动驾驶市场集中度将进一步提升,技术与品牌效应得到强化,看好拥有技术、资金以及品牌等优势厂商。
图表 20:自动驾驶发展阶段划分

数据来源:互联网 凯石基金
图表 21:主流车厂在预计在2020年推出量产三级自动驾驶汽车

数据来源:互联网 凯石基金
B端限定领域率先应用。自动驾驶的应用受制于道路环境的复杂性,我们认为自动驾驶应用路径将沿着封闭限定领域、B端货运、公交出租最后才是C端乘用车领域。
3、深度咨询
解放智力密集型劳动,占领行业服务入口
咨询系统分为智能客服与深度咨询系统,深度咨询系统依赖大量的行业数据,能够对知识库中的数据进行快速处理找出符合问题答案的内容,同时提供基于知识图谱的简单推理。
深度咨询的本质是从连接人与信息到连接人与知识,实现信息到知识过程的自动化,解决金融、医疗与教育等智力密集型行业智力稀缺以及人力成本的问题,将颠覆现有企业生产方式,对新人培训、辅助工作以及对客户的服务方式产生重大变革,重塑各行业产业格局。
图表 22:从智能客服到深度咨询

数据来源:凯石基金
现有人工智能算法以及计算资源的规模已经能够实现专用领域的人工智能系统,像IBM的沃森能够实现机器答题以及医疗咨询的功能,其通过现有语义理解技术与自定义数据库的方式已经能够实现垂直领域的语义理解,通过大数据与推理实现咨询方面的功能。
IBM沃森系统在美国某一答题比赛中以优异成绩打败人类,同时他还能够充当医生助手提供医疗咨询服务,所以现有语义理解技术辅以自定义数据库能够实现专一领域的语义理解功能,加上大数据技术还能够实深度咨询功能。
图表 23:沃森

资料来源:互联网 凯石基金
图表 24:沃森赢下答题比赛

资料来源:互联网 凯石基金
深度咨询解决智力密集型行业人力资源稀缺与成本的问题,市场空间达2000亿以上。2011年我国执业(助理)医师为246.6万人,中国国务院在2015年—2020年五年规划中表示,到2020年医生数量是2013年的两倍,届时我国医生数量将超过500万,假设医生助手70%的渗透率,云服务每名医生助手1万元每年,单医疗行业市场规模将达350亿。
行业入口方面,未来深度咨询必将占领用户的行业咨询入口,行业消费的流量入口,按20%人口渗透,人均增值服务费100元计算,市场规模达260亿。加上金融、教育、政府、企业服务等行业市场,市场空间将达2000-4000亿。
自然语言处理算法上的积累与医疗数据的积累造就沃森认知能力。沃森的主要技术原理是通过搜寻很多知识源,从多角度运用非常多的小算法,对各种可能的答案进行综合判断和学习。首先系统会对问题进行语义理解,接着各个知识库进行搜索、语义分析、提取备选答案、对备选答案证据的搜寻、对证据强度的计算和综合等等。
沃森系统的一个关键步骤是评价备选答案的可靠性。这个可靠性是由上百个算法从各种不同的角度评价得出的。例如:关键字匹配程度、时间关系的匹配程度、地理位置匹配的程度、类型匹配程度等等。沃森在每一个角度上都能得到量化的可靠性评价。
图表 25:IBM沃森工作原理

数据来源:IBM沃森 凯石基金
目前国内厂商也紧随其后进行了积极布局。在智慧医疗领域,借助自己的技术优势和强大的人工智能研发团队,不仅将智能语音技术应用到了医疗,业务还涉及了医疗影像,以及类似于Watson的基于认知计算的辅助诊疗系统另外,在辅助诊疗领域也有涉及,然而从Watson研发过程来看,深度咨询系统既需要有行业大量数据的积累,同时在自然语言处理方面也需要大量算法的积累以及算法的组合与优化。当前国内厂商相关研发才刚刚开始,预计商业化仍需要2-3年。
本篇文章是人工智能深度产业研究报告系列的最后部分,感谢您的时间与厚爱。
凯石基金将坚持以产业研究为核心的投研发展模式。传承原有私募基金的精准研究能力及投资理念,专注产业价值和产业逻辑研究,坚持和提升主动管理能力。构建全新的贯穿产业研究到投资的完整体系,强调研究支持体系的专业化、深度化及前瞻性。打造投资经验丰富、责任意识强烈及投资风格鲜明的投资和研究团队。
免责条款
报告仅供参考,不构成任何投资建议或承诺。本材料非基金宣传推介材料,亦不构成任何法律文件。若本材料转载第三方报告或资料,转载内容仅代表该第三方观点,不代表本公司立场。本报告版权归凯石基金管理有限公司所有,未获得本公司事先书面授权,任何人不得对本报告内容进行任何形式的发布、复制。如引用、刊发,需注明出处为“凯石基金管理有限公司”,且不得对本报告中的任何内容进行有违原意的删节和修改。投资有风险,敬请谨慎选择并详细阅读基金法律文件。


