翻译记忆库(Translation Memory, TM)是翻译本地化行业内容管理的基础数据库,用来辅助人工翻译。项目经理使用翻译记忆库管理工具管理翻译记忆库,译员接收这些翻译记忆库和本地化工具包,并在计算机辅助翻译工具(Computer-Assisted Translation, CAT)中查看和工作。

翻译记忆库文件一般为TMX格式,可通过其他文件如XLIFF、Excel等转换形成。简单来说,在每个语言对(Language Pair)里,它主要包含两列信息– Source(源语言列)和Target(目标语言列)。翻译软件在提取翻译记忆库文件时,会按照相应的匹配率对译员提供译文建议,译员可以选择直接接受,或者在有需要的时候进行编辑、或重新翻译。译朗科技(TranslateNow)通过企业级翻译记忆库的应用,协助客户平均降低翻译成本20-30%,在大型项目中效果尤为明显。

如果没有翻译记忆库,项目会怎么样?如有一款产品,假设其App在发布前已经做完了多语言本地化,但发布后,它不断增加新的内容,这些内容又需要本地化。如果没有前面翻译内容的正确记录,译员在每一次拿到新内容的时候都必须从头开始翻译所有的东西,耗时耗力耗成本。
翻译记忆文件非常重要,它通过对翻译过的文档进行留存,提高了工作效率和准确率。翻译记忆库中一个工作原理,就是可查询到的匹配(Match)。要了解的是,并不是所有的匹配都是相同的,在这里介绍常见匹配的几种类型。
上下文匹配(In-Context Exact, ICE Match)
指在一个文档中,其中的某些字符串能够与TM中已有的字符串完全相同,而且上下文也匹配。
精确匹配(Exact Match)
即100%匹配,指文档中的某些字符串与TM中已有的字符串完全相同,但不需要在相同的上下文中。
模糊匹配(Fuzzy Match)
文档中,其中的某些字符串能够与TM中已有的字符串相似,一般认为相似度为74%- 99%的内容都可以称为模糊匹配(注:具体区间,不同的翻译CAT工具可能会不同)。

举个例子来说,译员在处理包含以下英文内容的原文:"Syncingfor Google Fit is currently disabled. It is required for the app to workcorrectly.” CAT工具通过对加载的记忆库文件查询,推荐译员使用已记录并存储的相似的内容。以下是翻译记忆库推荐使用的一些匹配项:
"Syncing for Google Fit is currently disabled. It is required for the app to work correctly.” 这是100%匹配,因为TM的字符串和译员的完全一致。如果这句话的上下文和TM中的上下文一致,则我们将其称为上下文匹配(ICEMatch)。译员直接应用它提供的译文”谷歌健身的同步功能目前已被禁用,应用程序需要正常工作”即可。
"Syncing for Gmail is currently disabled. It is required for the app to work correctly.” 这是一个模糊匹配,只有一个字不同于提供给翻译者的字符串,它提供的译文”谷歌邮箱的同步功能目前已被禁用,应用程序需要正常工作”只需要译员小范围修改即可使用。
"Syncing for Google Fit is currently disabled.” 这也是模糊匹配,但是由于缺少较多单词,所以匹配百分比也较低。它的译文”谷歌健身同步功能当前被禁用”只有小价值的参考意义,译员需要对原文自行进行翻译。

由此可以看到,译员在通过辅助工具的应用,能更便捷的获取待译文档的目标语言提示,并能快速做出选择,提高工作效率、准确率和译文一致性。现在的翻译记忆库,早已从线下文件,连入云端,生成在线记忆库。先进的翻译操作软件,已经尝试接入人工智能的红利,更加提高了利用率和产能。
总而言之,使用翻译记忆库不仅提高了翻译和本地化项目参与者的工作效率,更为最终用户节省了成本和时间。围绕翻译记忆库衍生的产品和平台,已经枚不胜举,更加应证了大家对翻译记忆库的喜爱和信赖。

![]()
感谢使用译朗科技的产品和服务!

