大数跨境
0
0

思必驰创始人俞凯:别看深度学习现在这么热,之前也坐过冷板凳|元璟分享

思必驰创始人俞凯:别看深度学习现在这么热,之前也坐过冷板凳|元璟分享 元璟资本
2017-04-14
0
导读:人工智能成为最近几年对人类社会影响最大的技术浪潮,而其中深度学习更是被称为人工智能发展的突破性拐点,近年来在实际应用中也屡屡令人振奋。在深度学习领域,不仅有Google、微软、IBM等巨头加入,更有大


[本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载]


几天前,亚洲首度德州扑克人机大赛在海南落幕,由六位中国顶级德州扑克选手组成的龙之队不敌由卡内基梅隆大学开发的德州扑克AI冷扑大师Libratus,继去年轰动的李世石败给人工智能AlphaGo之后,人类在棋牌维度的又一败绩。


人工智能成为最近几年对人类社会影响最大的技术浪潮,而其中深度学习更是被称为人工智能发展的突破性拐点,近年来在实际应用中也屡屡令人振奋。在深度学习领域,不仅有Google、微软、IBM等巨头加入,更有大量优秀的创新企业参与其中,表现不俗。


由剑桥大学团队在2007年创立的思必驰就是其中的佼佼者,作为国内领先的人工智能语音公司,思必驰目前为智能车载、智能家居和智能机器人三大垂直领域提供自然语言交互方案,致力于打造最实用、有趣的人机交互体验。


今年3月,思必驰创始人、首席科学家俞凯接受了机器之心专访,谈到了从对行业的研究、技术的思考谈到了个人经历以及创业。



机器之心:从博士期间一直到现在,你一直在做语音和语言处理方面的研究,你看到行业有哪些明显的变化?


俞凯:我在剑桥待了10年,前5年做的是语音识别,后 5 年做的是对话系统。我在博士毕业的时候,同学都不想找语音的工作,我同级毕业的很多同学去了金融公司。那个时候,相对来说是语音发展的一个低谷。


我看到一个特别特别大的一个变化,是从 2010 年左右,尤其是 siri 出来之后,整个语音在机器学习和人工智能领域里,应用这个层面的地位,就是变得非常非常的高,而且技术的更新迭代也特别快。


第二个感觉就是,很多事情可能在你开始做的时候,你没有意识到它是那么前瞻。我在开始做口语对话系统的时候,只是认为语音识别本身是不够的,需要在闭环里面去做优化。2007 年刚开始做的时候,感觉这是未来的方向,心里也不是那么有底。但是到了 2013 年 2014 年之后就非常明显,语音识别本身由于它的快速发展,很快接近饱和,那么越来越明显的问题就是怎样做交互。尤其是到了 2015 年 2016 年到现在交互式的对话,这个方向已经俨然成了整个业界都非常关注的。所以从基础研究的角度上讲,没有办法太功利,而且也不能太功利,但是如果整体方向判断是对的话,那么终将还是会有一些结果。


机器之心:成立于2007年,目前思必驰在市场上的定位是什么?


俞凯:思必驰2007年成立于英国,回国是在2008年。期间经历了几个阶段,之前一个阶段是以口语教育作为主要方向,利用智能语音技术来实现口语的发音评估和口语综合能力的评估;第二个阶段2012年我回到国内之后,整体方向向移动互联网和智能硬件转移,以全面的端到端口语对话系统作为最终极、完整的系统解决方案。现在思必驰整个的定位是在做以口语为主体的自然人机交互的智能解决方案的平台。


机器之心:思必驰主要研究方向是哪些?


俞凯:主要的研究方向包括了自然口语交互所能涉及到的各个方面。典型的包括语音识别、合成、理解和交互控制,我们一般把它叫做对话管理。还包括了语言的表述、一些背景自然语言文本的处理,也包括了一些丰富音频的分析,比如说声纹。总之就是人和人之间所需要进行语音和语言交互的各个阶段的模块,以及整体系统的架构等。思必驰未来的目标就是要让机器能够像人一样,人性化的去做交互。



机器之心:思必驰的研发技术是怎样应用到产品中去的?


俞凯:一般来说,首先会有基础算法的研发阶段。自身的研究积累以及在国际上所能够碰到的最好的技术,我们会结合非常实际的场景,做出评估。技术本身存在的算法壁垒、数据壁垒,或其它一些技巧性的壁垒,这些是需要在基础研究阶段解决的。解决之后,结合公司自身的实际情况,把相应的技术转化成实际产品当中。


此外,思必驰是一个具有基础研发能力的企业。真正有意义的很多科学问题,是从现实世界中的难题提炼的。真正在做人机口语自然交互过程中,碰到的各种各样的难题会倒过来,再把它变成科学问题,继而去做基础性的研究,再反哺到现有的基础上。


举个典型的(纠正)例子。如果把它看成一个产品设计,单纯从纠正号码这个角度讲,谁都可以把它做出来。但如果把它看成是一个技术问题,比如动态规划的推理,比如去做架构层面的一般性的设计。不单单是大家看到的现实产品,还要把背后的所以然搞清楚。这就是从现实问题,再到研究再回去。这是思必驰比较特殊的一个地方。


机器之心:目前自然口语对话领域,最值得关注的方向有哪些?


俞凯:首先从文本性的对话交流来讲,未来一定是要走向文本和口语结合的。纯文本在PC互联网时代比较容易获得重视,因为大家天天都在看。但是在移动互联网时代,无论是现在的手机,还是未来的智能硬件,更多时候大家是在交互。


未来自然语言的信息交互,它是以口语通道为主,辅以其它通道。从这个角度上讲,未来的方向从我来看,有两大部分:一部分是通过以深度学习为主的方式来解决语义本身的表达和分析,当然这也包括知识的表达和分析;另一部分就是解决交互问题。交互是一个新领域,在过去10年,才逐步得到大家的重视,交互要做的就是让机器可以像人一样去做决策。


机器之心:目前科技巨头都在致力于发展语音交互的机器人如 Alexa、 Siri、Cortana 等,未来是否可能会有公司或是会议牵头制定语音行业的标准?


俞凯:我相信人工智能的标准一定会在很多地方都会被制定,这个我相信。但具体是说,行业联盟的形式还是什么这个我们还需要看。包括思必驰自己,因为我们在做的东西,是端到端的交互,而且我刚才也提到,从我来推动的一个方向,把它推到所以然方面,会比较有架构的方式,系统性的方式来观察它。所以我们自己也在做一些这种标准化的工作,这对未来和这个行业的一些同行,我们一块来做这个标准我相信都是有帮助的。



机器之心:思必驰要打造一个人工智能技术的平台。不做具体的应用级产品,只做语音技术平台,出发点是为什么?


俞凯:我们整个团队相对来说,具有的比较明显的一个能力,就是平台级的技术能力。我们还是一个比较技术驱动的团队,加上我们有基础研发的能力,是最适合做平台的。


我经常会把整个的人工智能企业大概分成三类。一类是做模块性技术,一类是做平台型技术,另一类是做人工智能的应用的。这三类里面涨得最快的是做应用的,走的最宽的应该是做平台的,小而美的就是模块型的。能够做平台的,它需要有很多条件。


第一,有底层基础比较好的技术团队,它能够使得平台越来越往上翻。第二,从整个商业模式出发,在历史流程上讲,团队的基因比较适合做这个事儿。第三,就是会有现实条件。思必驰是在移动互联网发展起来的新的时机,产生了人机交互方式的变革,我们恰恰在这个方面有先期的研究积累,并且有比较清晰的 vision,还有一个算不错的团队。恰恰在这个时间点,而恰恰我们有这样的能力。所以我们也会说:If not now,when? If not us,who?


机器之心:面对科技巨头和创业公司,思必驰在市场上的核心竞争力是什么?


俞凯:首先,技术层面有一定的先发优势,这是一小部分,比较大的一个层面是我们对人机交互、人工智能整个的产业方面的这些积累。目前思必驰在做平台我们很专注,这一点很重要。现在人工智能发展的机会太多了,就算是平台都有很多不同的平台,不同的机会。这个蛋糕太大了,巨头总会需要去切一部分,而在我看来蛋糕的增长速度比分蛋糕的速度甚至还要更快。所以我会认为很多情况下,巨头的专注性不会比我们强。和巨头比,我们会聚焦于到一个点。第三个层面就是人,我们是义无反顾的,全力以赴的在做这件事。做不成这件事情,那可能对于我们来讲就是一辈子的事,所以在做这件事情的决心上,以及整个团队所能够付出的这个努力上面,那我会有一个感觉,叫做狭路相逢勇者胜。


机器之心:思必驰未来发展愿景为何?


俞凯:我会希望它是新的人工智能时代的一个信息交互平台,就是一种人和机器可以去沟通的平台。这个如果说你让我去描述一下的话,就是让人和机器的沟通更自然更人性,是一个能实现这种使命的平台,我觉得就是比较好的。



【声明】内容源于网络
0
0
元璟资本
元璟资本,由阿里巴巴联合创始人吴泳铭和资深投资人王琦于2015年创立,团队成员由来自于一线互联网公司核心岗位的专家和国内一线VC基金的资深投资人组成,能为创业公司提供各阶段的实战经验和团队支持。元璟资本致力于发现和帮助互联网技术与生活消费、医疗健康、商业流通以及金融领域融合的变革性机会。
内容 604
粉丝 0
认证用户
元璟资本 元璟资本 元璟资本,由阿里巴巴联合创始人吴泳铭和资深投资人王琦于2015年创立,团队成员由来自于一线互联网公司核心岗位的专家和国内一线VC基金的资深投资人组成,能为创业公司提供各阶段的实战经验和团队支持。元璟资本致力于发现和帮助互联网技术与生活消费、医疗健康、商业流通以及金融领域融合的变革性机会。
总阅读219
粉丝0
内容604