大数跨境
0
0

直播干货 | AI赋能让一切皆有可能

直播干货 | AI赋能让一切皆有可能 元年服务
2020-04-10
0
导读:人工智能再次爆发,在很多领域,取得了超过人类水平的优异成绩。

本篇内容阅读大概需要4分钟

作者:科大讯飞AI研究院 副院长  陈志刚


人工智能的发展并非一帆风顺,它经历了三次浪潮。每一次浪潮发展过程中,都有一些典型事件发生。

人工智能技术进展


人工智能第一次浪潮发生在20世纪60年代,彼时人工智能刚起步,还处于科研探索阶段。20世纪70年代出现了知名感知机算法,这一神经网络算法引起了学术界、工业界注意,同时也就此开展了很多研究及产品实际落地。人工智能由此在20世纪70年代中期迎来了第一次黄金期,但人们很快发现,这些理论和算法可实现的功能很有限,人工智能在20世纪10年代末进入第一次寒冬。


20世纪80年代,Hopfield神经网络以及误差反向传播BP训练算法的提出,由此人工智能兴起第二次浪潮。这段时间出现了推动了语音识别、机器翻译等研究热潮,同期日本提出建设第五代计算机的计划。但因受场景等因素的限制,人工智能研究慢慢地陷入了低谷,加上政府支持减弱,第二次浪潮又破灭了。


第三次浪潮,也即我们正在经历的这次,它是以2006 年 Hinton 提出的深度学习技术为代表,它通过用深度的神经网络去提升整体性能,先后在语音识别、图像识别、自然语言理解方面等领域取得良好提升,人工智能再次爆发,在很多领域,取得了超过人类水平的优异成绩。


人工智能有四个层面的区分:运算智能主要解决机器的能存会算,感知智能能听会说、能看会认,运动智能能抓会握、能走会跑,认知智能则是让机器能理解会思考认知智能是人工智能的高级阶段,涉及到对人类当前环境所有收入信息的判断、分析,人们经常提到的认知智能还主要体现在语言理解层面。由于语言本身的复杂性,在语言理解层面实现认知智能,人类依然还有差距。


那么,人工智能的实现有哪些路径呢?目前,人类处于人工智能第三浪潮,现阶段有三条实现路径。深度神经网络是当下最适合实现人工智能的一条路径。第二条路径是全脑模拟,它主要是通过对人脑本身的模拟,在计算机协助下去实现人工智能。第三条路径还不明朗,就像从飞机的发明其实来自于人类对鸟类飞行的分析,从而提出了空气动力学,也许对于人工智能的研究未来也会有智能动力学的突破性进展。


人工智能的实现需要三大法宝,即深度神经网络、数据和涟漪效应。深度神经网络是基础,同时一定要有数据,有了数据之后,它可以在深度神经网络训练下得到一个基础模型,同时还要有涟漪效应。这三者缺一不可。


当前,感知智能的语音和图像进步比较快,自然语言理解还没有实现本质突破。以科大讯飞为例,2013年科大讯飞开始设立讯飞超脑计划,模拟人类各种能力来研究能听会说,能理解会思考,获得了多项世界级比赛的冠军。在语音合成、语音识别方面取得多项重大进展,在医疗、自动驾驶、逻辑推理、机器翻译、阅读理解等方面的应用也给大家带来不少惊喜。


人工智能行业应用


人工智能在医疗领域的应用首先体现在语音电子病历。它让医生在看病过程当中,特别是不方便记录病情的情况下,把检查发现的信息记录下来,以确保信息完整。人工智能在医疗领域的应用还体现在读片上,医学影像辅助诊断系统处理一个肺部CT只需要1秒,针对医生漏报的肺部CT的质检成功率达到30%以上。同时机器也可以根据病人的描述及检查数据,对病人进行诊断,并且给出诊断建议。科大讯飞人工智能辅助诊疗中心已经上线试点应用,目前已远程接入安徽省50多家医院。值得一提的是,在今年的疫情期间,科大讯飞的电话机器人随访了全国30多个省市,达3500多万人次,为疫情防控部门提供了一些有价值的报告


目前中国教育负担很重,特别是学生、老师,他们的负担主要来自于作业、课程、教案、作业批改等。怎样能够减轻他们的负担?科大讯飞把人工智能技术跟教学场景相结合,提供了一些个性化教学应用。目前教学产品覆盖8000万师生和10000所学校,惠及1500万师生,学生无效重复训练大幅降低,真正实现了因材施教。


在司法领域,对于法官特别是基层法官来说,人手的缺少使得他们工作量非常大。科大讯飞率先在司法领域进行了尝试, 2019年1月23日,上海市二中院使用科大讯飞开发的“刑事案件辅助办案系统”,全球首次进行公开庭审,受到国家机关领导好评。目前这套系统已经在上海常态化运行。此外,在司法领域,人工智能在案件办理的公平公正方面提供一系列的辅助功能,包括法条匹配、量刑依据等,为司法人员提供辅助决策参考。


人工智能在财务领域的应用场景非常多。从员工填单、领导审核、财务审核以及入账与付款的过程中,人工智能技术的使用使得OCR录入、语音录入、智能校验以及对财务真实性、合规性、合理性的审核等流程大幅地简化。财务领域的知识图谱对于某一个场景下的智能化应用必不可少,特别是打通规章制度到智能审核。在合规性审核方面人工智能的应用也很普遍,比如打车票据的报销,公司可能会有一些规范,首先我们可以通过OCR技术对纸质票据要素进行识别,同时人工智能会通过相关技术在规范规章制度方面再对其进行识别。推理引擎会去做相关的推理决策,从而做出发票符合或者不符合规范的判断。人工智能也可以进行合同付款的审核,它在财务领域有着广阔的应用空间。


人工智能发展趋势


人与机器的连接无处不在。目前已经有一些场景实现了应用,它通过越来越多的机器终端,使得人类方便地去操纵背后的人工智能。比如分布式麦克风阵列,它可以把家里每个空间都布置上一个麦克风,人走到哪里都可以去操纵。随着设备硬件、芯片的智能化,使得人类未来越来越多的智能应用场景成为现实。


垂直领域人工智能应用多模态化。很多垂直领域的应用不再是输入信息为主,越来越多地开始结合更多信息。比如屏幕,它上面的信息可能是文字、语音、图像的结合,同时信息输入从手写模式慢慢地发展成其它的一些形式,比如虚拟现实输入形式。


以人为本的个性化人机交互。个性化人机交互涉及到四个方面:身份验证、用户画像、精准理解、情感合成。人跟机器进行交流,那么机器首先要表现得越来越智能化,它就要知道你是谁,用户是谁,用户喜欢做什么事情,用户想要我干什么,同时它要用一种更像人的语气去和人交流。相信在不远的将来,人类能够看到更多不可能的事情在人工智能的加持下变为现实。


问题精选


1、讯飞可以识别方言吗?


讯飞语音识别目前可以识别方言。比如四川话、广东话、粤语、东北话、上海话。另外,也可以通过讯飞输入法切换语种去切换语言。


2、元年最近推出的智答产品,是采用的讯飞技术吗?


没错,元年和科大讯飞目前是紧密战略合作关系,元年目前推出的智答产品中,讯飞提供了语音识别技术,它可以分析出来用户请求背后各种各样的元素,从而实现更加智能的查询。


3、机器人现阶段能不能达到能编程的程度?


涉及到编程的话,离不开编程语言,目前机器人写的是一个相对比较垂直领域的应用程序。开放性的编程目前对它来说稍微有点遥远,但是也在开展研究工作。


4、讯飞的同声传译功能现在在市场上使用吗?


稍微解释一下,讯飞的同声传译这个说法其实并不准确。现在机器翻译并不是在做同声传译的任务。同声传译员在实际的任务和场景中,需要做很多内容重新组织以及加工。目前想实现机器同声传译功能还不能达到实际使用门槛。讯飞“同声传译”的形式其实在做类似字幕工作,特别是在演讲场景下,让线下观众及时看到翻译结果并帮助理解当时情景。要让机器达到人工同声传译的“信雅达”,我们还有很长一段路要走。


扫码即可观看
课程精彩回放

【声明】内容源于网络
0
0
元年服务
为您提供元年科技的最新资讯、观点、活动与解决方案。
内容 160
粉丝 0
元年服务 为您提供元年科技的最新资讯、观点、活动与解决方案。
总阅读194
粉丝0
内容160