

现在他们声称机器翻译在适应性方面优于人工翻译

云译AI机器翻译资讯

2020-09-11

原文选自：slator

译文原创：云译科技网页翻译

在2016年左右机器翻译成为神经机器翻译之后，学术界和大型技术研究小组开始发表论文，暗示机器翻译已经达到了人文水平（无论意味着什么）。随后，科技出版物的标题被简化了，研究人员争辩说，记者挑出了引人入胜的名言，而Slator则试图通过问专家来弄清一切。

但是，“实现文本翻译”在2018年事情。到2020年，它已成为“超越人类水平的翻译”。这项声明是在2020年9月1日发表的一篇关于CUBBITT 的论文中提出的，CUBBITT是一种新的基于Transformer的深度学习系统。作者包括Google的ŁukaszKaiser，Google Brain Berlin的Jakob Uszkoreit和布拉格查尔斯大学的OndřejBojar。

好吧，我们从备注开始，该论文的标题仅提及在“新闻”翻译领域达到与人类专业人员“可比”的翻译质量。超越人类的主张被保留为“充足”指标。尽管如此，在速度以外的任何指标上“超越人类”的主张似乎都是新的。

此外，作者们承认，“具有有限时间和资源的高素质翻译人员可能会比任何MT系统产生更好的翻译。”

“ MT并非无法达到专业机构翻译的质量”

但是，他们补充说：“许多客户负担不起这类翻译人员的费用，而只能使用专业翻译公司的服务，因为这些公司的翻译人员承受一定的时间压力。我们的结果表明，至少在某些方面，领域和语言上，MT并非无法达到专业机构翻译的质量。” 从以翻译谋生的语言学家中找到一个有趣的例子。

句子级翻译图灵测试

那么，CUBBITT的出色表现是如何产生的呢？该研究将充分性定义为“以目标语言充分表达[源文本]的预期含义。” 因此，CUBBITT优于人工翻译的断言意味着，人工评估者认为CUBBITT的翻译比人工参考翻译更能代表源文本的含义：52％的CUBBITT句子得分高于人工翻译。CUBBITT翻译中有26％的得分低于人工翻译。

使用相同的原始文件和CUBBITT在WMT 18个新闻翻译任务，15名人工评估人员对53个文档中将近8,000个句子的质量进行了评估。但是，与新闻翻译任务不同，为评估人员提供了翻译的文档级上下文。这使评估人员能够发现在没有上下文的情况下可能无法发现的错误，例如性别不匹配或歧义表达不正确。

与人的参考译文相比，作者观察到“ CUBBITT在含义，含义省略，含义转移，其他适当性错误，语法和拼写上所犯的错误明显更少。” 另一方面，CUBBITT由于交叉句子的上下文而犯了更多的错误（正如研究人员所预期的那样），而人工翻译仍然被认为是更流利的。

该组还进行了“句级翻译图灵测试”，向评价者展示了100对句子，每对句子由一个源句子和一个翻译组成。然后，参与者确定每一个翻译都是由一个人或MT制作的。与谷歌翻译公司制作的翻译相比，CUBITT翻译不太可能被确定为MT。

作者认为，“CUBBITT的一个潜在的人类学贡献因素可能是它能够重组英语结构在捷克语中听起来不自然的句子。”

为了克服缺乏用于培训的英语-捷克语并行数据，研究人员使用反译，将更广泛的可用单语种目标语言数据翻译成源语言。所得的句子对包括附加的合成并行训练数据，其传统上以随机顺序与真实句子混合。

CUBBITT“以一种新颖的区块方式（block-BT）接受了反向翻译数据的训练，其中，训练数据以真实的并行数据与合成数据的区块交替呈现给神经网络。”

作者指出，反译有时会无意中带来提高最终翻译的流畅度（有时甚至是适当性）的好处，“因为反译的目标方是最初用目标语言写成的真实句子。”

CUBBITT的英语（英语）和英语（波兰）版本获得的BLEU结果与英语（英语）版本的一致。文档级评估表明，CUBBITT在与商业和政治相关的文章上表现最佳，而在与艺术，娱乐和体育有关的文章上表现最差。

“在看”富三代，转发美一生

【声明】内容源于网络

云译AI机器翻译资讯

云译致力于打造自然语言处理与机器翻译技术的研究发展平台，做一个有价值的语言技术公司。

内容 407

粉丝 0

云译AI机器翻译资讯云译致力于打造自然语言处理与机器翻译技术的研究发展平台，做一个有价值的语言技术公司。

总阅读273

粉丝0

内容407