大数跨境

AI翻译离无障碍交流有多远?

AI翻译离无障碍交流有多远? 舜禹环球通
2017-10-13
3
导读:AI 翻译服务通过硬件、软件连接千千万万个应用场景,将会打破语言不通的尴尬局面。甚至有人认为,AI 翻译是人工翻译的终结者。现实真的如此吗?

|卓越的全球化语言服务供应商 

      

       AI 翻译服务通过硬件、软件连接千千万万个应用场景,将会打破语言不通的尴尬局面。甚至有人认为,AI 翻译是人工翻译的终结者。现实真的如此吗?


 现状:产品虽多,准确率有待提高

       2017 年可谓是 AI 大行其道的一年,作为现代科技的流行趋势,不管是谷歌、苹果,还是百度、阿里,都在相继发布自己的人工智能产品,向智能行业进军。而 AI 翻译,几乎是所有互联网巨头都想涉足的领域。

       机器翻译已出现了 70 年,但过去一年里涌现出的 AI 翻译软硬件产品,已超过最近 30 年的总和。

  在国外,微软发布了翻译工具 Microsoft Translator,可以实现 9 种语言实时语音转为文本翻译。国内的互联网巨头也不甘示弱,百度翻译支持全球 28 种语言互译、756 个翻译方向,每日响应过亿次的翻译请求。除百度外,科大讯飞也走在语音交互前列,推出了讯飞听见升级版产品,加入多语种翻译功能,五种语言同步翻译成汉语,还发布了智能翻译产品“晓译翻译机”。就连网络游戏开发大户腾讯公司,也悄然上线了一款实时语音翻译 APP “翻译君”,这款以AI内核驱动的翻译产品,运用了语音识别+ NMT(神经网络机器翻译)等技术,可以实现“同声传译”功能,对着屏幕说话时,边说边翻,就像身边带了一位私人翻译官。此外,电商大咖京东也开始涉足AI翻译,推出了一个可以进行多国语言实时翻译的人工智能翻译机——准儿翻译机的众筹项目,目前已经有 5008 名支持者,轻松筹得 320 万元的项目基金。

       尽管 AI 翻译进步神速,却不被传统的翻译行业所看好。今年 2 月,谷歌全新 NMT 系统在韩国世宗大学与人类译员进行的翻译对战就是一例佐证。在规定的 50 分钟内,人类和机器同时翻译两段随机文本。结果,人类以巨大优势战胜了机器。赛后,评委表示,NMT 系统翻译出的文本 90% 都有语法问题。


 难点:数据有限,且语言规则不规律

       全球范围内,服务于各大跨国会议、发布会等的 30 多种翻译机能帮人们解决一些场景中语言交流的问题,但目前的现状就如科大讯飞声明的那样:虽然机器翻译已经取得非常大的进步,但距离高水平翻译所讲究的“信、达、雅”还存在很大差距。

  以“千山鸟飞绝,万径人踪灭”这句人们耳熟能详的诗为例,国际翻译界最高奖项之一“北极光”杰出文学翻译奖得主许渊冲教授将其译为“from hill to hill no bird in flight,from path to path no man in sight.”这不仅符合近代著名翻译家严复提出的“信、达、雅”翻译原则,而且其中的意境与精髓只有熟习汉语的人才能领会。

  “文学艺术翻译要体现情感、色彩、语调、温度、韵致、字里行间的意味等种种幽微之处。要传达出这些,译者的水准、敏感、境界和心灵力量尤为重要。”中国社会科学院外国文学研究所编审高兴说。

  此外,AI 翻译要想达到“信、达、雅”的高度,还需克服口语化的两大难题。一方面要听得清,能准确判断出指令发出者的语音、停顿,并在极短时间内进行“语音断句”。另一方面要克服口语交谈中的语法问题,以及句子不连贯、没有明确句子边界等问题。

  机器靠什么解决上述问题?在清华大学计算机系副研究员刘洋看来,AI 机器翻译的难点其实也是整个人工智能的难点——如何让机器真正像人一样有智能行为。他认为,机器翻译采用数据驱动的方法,其准确程度取决于给计算机提供哪些数据。目前提供最多的翻译数据来自于政府文档,比如联合国有多种官方语言,基本每份文件都有多语种版本,但基本没有体育、娱乐等领域的数据。再加上各国的口语中都存在较多随意性口语或网络用语,生活化气息浓厚,多为非正式的语体材料,因此智能翻译需要庞大的基础词汇库支撑。


 展望:前路漫漫,发展需数据推动

       近两年,神经网络机器翻译 (Neural Machine Translation, NMT) 技术异军突起使翻译应用进一步革新。

  NMT 模仿人脑的神经思考模式,产出媲美人工翻译的高质量译文,并将误差降低了 55%—85%。目前,谷歌公司己将该技术应用于网页翻译与手机应用,译文质量明显提升。此外,腾讯、百度、阿里巴巴等国内互联网公司也将深度学习理念应用到机器翻译。同时,语言处理、语音交互等技术的进步又加速了翻译产品的场景升级,促使机器辅助翻译” (CAT,Computer Aided Translation) 过渡到“人工智能交互翻译” (AI Interactive Translation)。

  “语言是形式,而不是实质。”现代语言学理论奠基者费尔迪南·德·索绪尔说。同样,对各种花哨的技术概念抽丝剥茧,其核心仍然是 AI 处理人类语言的三种方法:即基于规则的机器翻译、基于实例的机器翻译和统计的翻译方法。目前谷歌、搜狗等公司基本采用的是最后一种方法。

  伴随着翻译方法的完善,机器将完成未来大部分的简单翻译需求,而那些细腻、多元、充满人文特质的复杂沟通以及专业化翻译,人工智能究竟能不能实现?还需要哪些改进呢?

  清华大学计算机系教授孙茂松说:“世界语言好几千种,几千种之间的互译,其中绝大多数语言之间都没有足够语料。所以这方面的翻译还需要去做,包括一些模型的探索。”

  “AI 翻译是一个交叉学科,取决于数学、语言学、计算机科学、神经认知科学等很多方向的进展,因此AI翻译应该和更多的‘知识’结合在一起,让数据推动机器翻译发展。”刘洋说。


原文来源:科技日报


舜禹环球通

AI 翻译并非万能  交流仍需专业翻译

       AI 翻译前景广阔但非万能。语言的背后是多元的文化和复杂的社会属性,这就注定了语言规则不可能规律化。目前 AI 翻译可以解决短句子、制式或者大批量且要求不高的翻译,但高端、专业性的翻译还是要依靠人类。未来人工智能将与人工翻译相辅相成,通过人工智能技术的充分应用,可最大化释放翻译市场潜力,推动翻译领域的变革与进步。

   
【声明】内容源于网络
0
0
舜禹环球通
舜禹环球通
内容 445
粉丝 0
舜禹环球通 舜禹环球通
总阅读109
粉丝0
内容445