点击蓝字关注我们
有细心的网友发现,微信翻译出现故障,得出了很多让人啼笑皆非的翻译结果。比如明星们的名字被翻译成各种风马牛不相及的字眼,Cai Xukun 被翻译成“傻蛋”也真是非常尴尬了。
哈哈大笑的同时,对机器人的翻译水平感到担忧!
事件发生后,微信团队第一时间做出回应,称这是微信翻译引擎在翻译一些没有进行过训练的非正式英文词汇时出现误翻,导致部分语句翻译出现问题,正在修复。目前正常的句式以及单词是可以正常翻译的,但是遇到不认识的词语,微信翻译干脆就“罢工”了,不知道仍然是故障状态还是说这是一个临时的解决方案!
实际上,腾讯在翻译上不止翻过一次车。去年博鳌论坛期间,腾讯的翻译君就曾在会上闹过乌龙,当时,翻译错误的地方多为常见的专用术语,如“一带一路”、“道路”等词汇,翻译还出现乱码结果,现场不得不再次聘请人工翻译“接盘”。
热闹看完了,本着严谨的态度,我们还是来看一下这里提到的微信翻译引擎。在早些时候,有消息称微信的英译汉功能由有道实现,其他语种则由微软负责。而据微信相关方面说法,目前微信聊天对话及朋友圈的英中、中英翻译已经替换成其自行开发的全新神经网络翻译引擎,但该神经网络的具体信息无从得知,也只是能找到关于它的零星信息。
小伙伴们一定好奇机器翻译的原理是怎样的呢?请看下图:
翻译机器就是其中带有问号的黑箱,它的作用就是能够将一个语言的序列(如 Economic growth has slowed down in recent years)转化成目标语言序列(如 La croissance economique sest ralentie ces dernieres annees)。其中翻译机器在正式工作之前可以利用已有的语料库(Corpora)来进行学习和训练。
所谓的神经网络机器翻译就是利用神经网络来实现上述的黑箱翻译机器。它的架构如下图所示:
与之前不同的是,这里用一个神经网络替换了上图中的黑箱。在神经网络中存在着大量的链接权重,这些权重就是要通过数据训练、学习的参数。训练好的神经网络可以将输入的源语言转换为输出的目标语言。
那么计算机是如何翻译人类的语言呢?最简单的方法,就是把句子中的每个单词,都替换成翻译后的目标语言单词,由于上下文语境的关系,翻译结果并不完美。
为了解决这个问题,机器翻译系统需要使用了不同的方法,通过分析大量文本来分配文本中的规则,以改进结果。 也就是教会计算机语法规则,然后让它根据规则翻译句子。可惜事情并不是这么简单,当把程序的规则写的特殊时,翻译的质量就无从保证。
这就又回到了被讨论了很长时间的话题:机器翻译能否替代人工翻译。按照目前各家同声传译机的表现,机器翻译的确无法替代人类。但是人工翻译也无法像以前那样风光了,有了机器翻译这个对手的存在,人工翻译这一行的竞争更加激烈了,简单一些的翻译场景机器已经可以胜任,人工翻译只有向高端化方向发展。
机器翻译还远未到替代人工翻译的水平,我们也大可不必像旧时代那样因为刚诞生的火车速度比马车还慢就去嘲笑新技术。这届 AI 翻译到底行不行,时间会给出答案。
中国讯网云计算
域名注册 云服务器租用
长按扫码关注我们

