背景介绍
CMS,即内容管理系统(Content Management System),是一套用于管理和发布数字内容的软件系统。通过使用 CMS,用户能够独立地创建、编辑、组织和发布内容,而不必具备专业的编程或设计技能。CMS 的主要特性包括友好的用户界面、内容创建与编辑功能、内容存储与复用、工作流管理以及对扩展和插件的支持等。借助这些功能,组织能够高效地管理其数字内容。
本地化中常见的 CMS 平台包括三类:
WCMS
WCMS(网页内容管理系统,Web Content Management System),这是一种广泛使用的内容管理系统,组织通过它来创建和管理动态内容,从而在网站上展示各类数字信息。WCMS 广泛应用于企业门户网站和电子商务平台。常见的 WCMS 平台包括 WordPress、Drupal 和 Joomla 等。
ECMS
ECMS(企业内容管理系统,Enterprise Content Management System),这是一个功能强大的平台,专门用于管理组织内部跨多个部门(甚至跨国界)的全部数字信息和内容。典型的 ECMS 软件有 Microsoft SharePoint、OpenText 和 IBM FileNet 等。
CCMS
CCMS(组件内容管理系统,Component Content Management System),与传统 CMS 不同, CCMS 是以部件或内容块为单位来管理内容的。这对于需要频繁在不同文档中重用内容的组织极为有用。依赖于此类平台的企业通常采用结构化写作,典型的 CCMS 软件包括 Adobe Experience Manager (AEM)、Tridion 和 Author-it 等。
CMS 内容本地化中的典型问题
作为一家专业的本地化翻译公司,我们参与了许多国内外的 CMS 内容本地化项目。通过这些项目的横向比较,我们发现了一些常见问题。在这里,我们总结并分享这些问题及其解决方案,希望能帮助您预先了解并有效避免这些问题,从而节省时间、人力和成本。
1
重要词语的翻译不一致
这是 CMS 内容本地化中最常见的问题之一。CMS 内容经常包含一些关键词语,这些词语在不同句子中出现时,应表达相同的概念。然而,这些词语可能会因其多义性,在翻译成目标语言后表达出了不同的含义,从而导致翻译的不一致,给用户带来了使用上的困扰。
例如,让我们来看一个中文词汇——问题——的翻译示例,这个词根据句子中的语境有多种含义:
• 当句子是下面我来提一个问题时,它表示的是询问的概念,应翻译为 question。
• 当句子是生产过程有严重问题时,它表示的是故障或错误的概念,应翻译为 problem。
• 当句子是请在系统中创建问题,然后指派给相应负责人时,它表示的是工单或事项的概念,应翻译为 ticket 或 issue。
这种一词多义的现象在多语言翻译中非常常见。如果 CMS 内容中的重要词语具有多义性,很容易导致翻译的不一致。例如,考虑以下两种翻译情况:
|
原文 |
译文 |
出现位置 |
|
新建问题 |
New Ticket |
UI 界面 |
|
请点击新建问题按钮。 |
Please click New Problem. |
用户指南组件 |
当英语用户通过使用指南去操作时,他们在操作界面中找不到名为 New Problem 的按钮,只能看到 New Ticket,这将造成困惑。这个问题的根源在于,UI 界面和用户指南组件可能由不同的翻译团队独立翻译,而且译者可能仅看到了片段内容。特别是在翻译更新内容时,译者可能只处理几个句子,难以把握全貌。
尽管翻译流程中包含了审校和质量检查等步骤,这些步骤主要用于检查原文和译文的对应关系,却很难发现跨批次的翻译不一致问题。
解决方法
由于翻译不一致是 CMS 内容本地化中的一个常见问题,以下四种方法可以有效解决这个问题:
1. 建立多语言术语管理机制:这包括指定专职的多语言术语负责人和制定术语更新的审批流程。术语管理是 CMS 的一个核心功能。通常使用 CMS 管理数字内容的企业会安排专人负责术语管理。但这些负责人往往不涉及多语言术语的管理,从而形成了管理上的灰色地带。我们建议明确指派专人负责多语言术语管理,确保每个术语都有明确的译文,并对其使用进行规范,这样关键词汇就不会出现翻译问题。
2. 过程中提供翻译参考:术语虽然包含核心词汇,但数量有限。针对本例中提到的 UI 与指南不一致的情况,我们推荐的第二种方法是提供参考。即在翻译指南内容时,将翻译过的 UI 内容提供给指南译者作为参考,这样就可以令两个译文保持较高的一致性。
3. 提疑问(Raise Query):这是本地化过程中的一个常见做法。当翻译人员在翻译过程中遇到一个词有多种可能的含义,且原文中的上下文不足以判定其确切含义时,应提出疑问。内容提供者随后会对这些疑问给出解答。这种方法可以在项目初期发现并解决问题,相比后期解决,成本会大大降低,从而减少后期可能产生的更高成本。
4. 进行语言测试(Linguistic Testing):将翻译完成的内容集成到系统中后,邀请懂当地语言的专业人员对本地化内容进行测试。这种测试方法叫做语言测试。在上下文环境中,测试人员能够轻松比对和发现译文的不一致之处以及其他显示问题。还可以针对 UI 与指南的一致性设计专门的测试用例,消除绝大部分翻译不一致的问题。
2
译文内容格式丢失或破坏
在 CMS 管理内容时,为了便于文档的输出和管理,在具体文件中不仅包括常规的文字内容,还包括内容的格式信息和其他控制信息。这些信息通常以标签(Tag)的形式与内容一起出现,一起导出给翻译人员进行翻译。
举个简单的例子:
• 用户在界面上看到的文字是:请在系统中创建问题,然后指派给相应负责人。
• 实际在后台原文件中的内容是:请在系统中<b>创建问题</b>,然后指派给相应负责人。其中的 <b></b> 是一对开始和结束标签,表示在显示时将标签包裹的部分显示为粗体。
然而,由于缺乏经验,译文中可能会出现以下几种情况,这些情况都将导致无法正常通过加粗显示需要强调的内容:
• 标签全部丢失:Please create an issue in the system and assign it to the appropriate person in charge.
• 标签部分丢失:Please <b>create an issue in the system and assign it to the appropriate person in charge.
• 标签顺序错误:Please </b>create an issue<b> in the system and assign it to the appropriate person in charge.
这个例子比较简单,一般的译员都能处理,不容易出错。但实际中的 CMS 内容的格式信息比较复杂,存在多种标签的情况,这增加了出错的可能性。因此,翻译后的内容与原文不匹配,导致译后的内容无法导入或导入后显示不正常的问题。
解决方法
这个问题通常源于翻译人员或企业自身的能力不足,对原文本格式的不熟悉、疏忽或错误操作,导致他们未能在译文中保持原始内容的格式。
解决这个问题的策略是确保翻译人员在翻译过程中熟悉原始文本的格式,并利用专业工具和流程来保证目标语言内容的格式与原文一致。在项目开始前选择翻译供应商时,除了考察其翻译能力外,还应了解其处理内容格式的能力。
具体的做法是提前选取一些具有代表性的样例文件,让翻译供应商进行试译。通过检查他们返回的译文,可以评估其是否能够保持格式不被破坏。如果译文的格式保持良好,这表明翻译供应商具备了所需的能力水平。相反,如果译文格式遭到破坏,则需要警惕,因为相同的问题很可能在整个项目中重复出现。这样的评估可以帮助选择更合适的翻译供应商,从而避免未来项目中出现格式相关的问题。
这里有几条技巧可供参考:
1. 选择样例文件时,应当选择最复杂的、标签种类和数量最多的文件作为代表;
2. 适当多提供文件个数,来发现少量文件没问题而数量多就处理不好的情况;
3. 在需求中不必特别强调格式问题,有经验的供应商自然会在译文中处理好格式信息。
3
国际化问题
翻译 CMS 内容的另一个坑是国际化问题。设想一下这个场景:当你把内容交给一家翻译公司去翻译,经历了持续多日的翻译工作之后,对方提交回来所需要的多种语言译文,经过语言质量检查和格式检查,都没有问题。然后你把译文交给软件团队,期待多语言版本明天可以按时上线。结果从开发团队传来各种问题,他们发现本地化后的版本:
• 有的无法导入系统
• 有的导入后出现乱码
• 有的文字看起来很奇怪
• 有的功能无法正常实现
内部团队需要耗费大量的时间和精力去排查问题,同时又需要翻译公司不断配合去检查与修改。常常耽误发布时间,导致项目延期。
原因分析
这是典型的国际化问题。国际化是在本地化之前的一项关键步骤,需要对系统进行适当的修改以支持多种语言并确保其正常运作。
目前市面上的 CMS 工具通常都提供了国际化支持,即它们本身就具备了多语言的能力。然而,当使用这些 CMS 工具构建组织内部系统或者定制内容时,通常还需要进行额外的国际化修改工作。这项任务在整个 CMS 内容本地化过程中至关重要,但由于缺乏足够的关注和经验,许多团队可能并不知道这个步骤的存在,因此在项目计划中未能给予相应的时间和资源。这导致了后期在导入翻译时出现各种问题。
解决方法
针对国际化问题,我们需要采取相应的规避策略。鉴于我们无法确定是否需要额外的国际化修改工作,可以通过国际化测试提前验证流程,及早发现可能出现的问题,并在项目初期解决这些问题。
我们将整个过程简化为导出内容、翻译内容和导入内容三个阶段。在这些阶段中,翻译过程耗时最长,也带来了最高的技术风险。因此,可以采用伪翻译或测试翻译的方法,快速使用目标语言的字符填充待翻译的内容,而无需考虑意思上的匹配。这样可以将原本耗时数天甚至数周的翻译工作缩短到几分钟内完成。伪翻译追求的是速度,而非翻译质量。例如,原文是注意事项,而伪翻译可能是 You are ready。
通过快速生成目标语言的文字,我们可以直接将其导入系统中。首先检查是否能正常导入,然后将系统切换至目标语言,观察内容是否正常显示,并报告任何发现的问题。这个过程称为国际化测试(I18n Testing)。
需要注意的是,这个测试过程是与正常翻译并行的,不会延缓项目进度。测试中发现的问题将由专人分析修复,因此在正常翻译完成后,基本上不会出现国际化问题。
此外,由于现在机器翻译的准确性较高,成本相对较低,伪翻译工作可以借助机器翻译完成。这样不仅可以测试国际化能力,还可以提前发现一些问题,如文字超出文本框等。
4
内容漏发翻译
在某些 CMS 内容本地化项目中,翻译完成并导入系统后,检查目标语言版本时发现部分内容未翻译。追溯原因发现,这些内容并非因国际化问题造成,而是在之前发给翻译供应商时漏掉了。
在处理这个问题时,需要考虑两个方面:
• 首先,需要重新发送内容给翻译供应商进行翻译,这将导致项目成本的增加,并需等待一段时间以获取译文,这可能导致项目进度延误。
• 其次,需要进行全面的排查,确保除了已发现的内容外,没有其他未翻译的内容被遗漏。
原因分析
这个问题的常见原因是版本管理混乱。虽然版本管理是 CMS 的核心功能之一,但在本地化过程中,需要跟踪多个语言的不同版本,尤其是当不同目标语言采用不同的原文版本时,容易出现问题。特别是在 CCMS 中,最终输出的文档由不同主题内容组合而成,复杂度更高。
解决方法
为解决这个问题,我们建议建立本地化多语言版本跟踪表,将每个组件或文件的每个版本作为一行进行跟踪。每种语言作为一列,各语言的组件状态至少包含无需翻译、已发出翻译、翻译完成、集成完成等几个状态。通过这个表格可以清晰地查看各组件在多语言状态下的情况,从而避免由于漏发而导致的后期问题。
以下是示例表格供您参考:
5
过度翻译的问题
在 CMS 中,并非所有内容都需要翻译。过度翻译指的是一些本来不需要翻译的内容被误翻译了。这不仅增加了翻译成本,还增加了出现功能问题的风险。
这类过度翻译的内容通常比较隐蔽,不经过仔细分析很难发现,往往只有在出现问题时才会追溯。因此,在统计工作量和报价时,甲乙双方很容易忽视这个问题,将过度翻译的内容算入工作量之中。
举个例子,我们之前处理过的一个项目中, CMS 导出的待翻译文件内容如下。
文件格式为 XML,如果直接通过 CAT 软件进行分析,这个文件中所需翻译的文字有 679 个字。然而,仔细观察就会发现,在文件中大 <text>...</text> 标签内的内容中,包含了一部分转义后的 HTML 代码。实际上,这是 CMS 中的一种常见处理方式,将负责格式的 HTML 代码转义后保存,以避免与原始的 XML 代码冲突。
例如,文件第 6 行内容 &It;h1 id="page-header" class="">在Windows中手动更新驱动程序&It;/h1>,转回原本的 HTML 代码为 <h1 id="page-header" class="">在Windows中手动更新驱动程序</h1>,其中的 h1 标签部分不需要翻译,不应计入翻译成本。需要注意的是,这些内嵌的 HTML 转义代码不仅不能翻译,而且在翻译过程中不能修改,必须保持原样,否则会影响最终显示。
针对这种情况,我们的操作是通过技术手段处理其中不需要翻译的 HTML 代码,保护其不受修改破坏,同时减少了翻译字数。处理后,所需翻译的文字减少至 465 个字,比原本的 679 个字减少了 32%。由于大部分原文件存在类似问题,我们帮助客户整体降低了约 30% 的成本,效果显著。
解决方法
我们建议在进行翻译之前,先挑选代表性的典型文件进行分析,检查是否存在类似不需要翻译的内容。如果存在,需要采取以下措施:
1. 与翻译供应商讨论:告知这部分内容不需要翻译,要求在统计字数时剔除这部分内容。
2. 双方商谈流程和工具:商讨如何处理这些内容,以避免在翻译过程中对其进行破坏。
3. 安排测试:使用典型文件进行测试,完整地走一遍流程,检查字数统计结果以及非翻译内容的保护情况。
6
翻译质量问题
翻译质量一直是翻译项目中永恒的话题。在有限的成本下,如何确保较好的质量是管理本地化过程中的一个重要任务。除了前述的经验外,建议通过以下方法帮助确保质量:
1. 选择母语译员:
虽然非母语译员有时也能提供不错的翻译,但我们发现绝大多数情况下,母语译员才能提供足够细致准确的表达并保证文化适应性,符合向用户传递准确信息的目标。
2. 安排合理的流程:
a) 翻译流程:按照本地化行业的规范,翻译流程至少包括翻译和审校两个步骤。
b) 质量检查流程:对译文进行翻译检查,并进行前文提及的国际化测试和本地化测试,这对保证质量至关重要。
3. 采用合理的技术:
a) 控制过度翻译技术是很好的选择,既保证了质量,又节约了成本。
b) 其他技术如机器翻译,虽然能降低成本,但是质量不满足要求。在使用前需要仔细评估,平衡成本和质量,并辅以其他流程来降低风险,如与人工翻译结合使用。
4. 选择靠谱的供应商:
全球翻译供应商众多,但合作意识强且质量好的供应商相对较少。如果对质量有较高期望,选择供应商时应仔细考虑,从各方面进行评估,既减少质量问题,又避免后期麻烦。
总结
在进行 CMS 内容的本地化过程中,遵循上述指南可以显著减少常见问题的发生,保证项目的顺利进行。通过合理的资源配置、细致的流程设计以及技术支持,可以在维持翻译质量的同时,有效控制成本和时间。对于任何希望通过 CMS 扩展其全球影响力的组织而言,这些策略是成功本地化的关键。


