同一个项目为什么统计的重复字数区别很大

同一个项目不同的人统计,重复字数区别却很大,为什么呢?

影响字数分析结果的原因包括 1) 翻译工具的分段规则、2) 字数分析规则(包括替换元素、罚分、项目和属性设置等)、3) 是否启用对文件中特定内容的处理、4) 文件格式信息、5) 翻译工具的差异等等。这些因素同样也会影响重复字数的统计结果。

在我们之前的帖子中 1、3、4、5点我们都有探讨,具体实践案例见下。

为什么同样的项目排重效果有很大差异?

Excel项目去掉重复翻译内容

Excel项目去掉网页标记和85万字重复

Trados怼MemoQ重复字数分析比较

今天我们重点探讨第二点字数分析规则中的替换元素,并以Trados为例。什么是替换元素呢?

替换元素或者称为非译元素,也就是指指数字、缩写、日期、时间等那些视作不翻译的字符。简单来说,如果多个句子,只有数字、缩写、日期、时间不同,那么会被直接当做完全相同的句子,也就是重复的句子。如果我们在Trados中设置自动替换非译元素,就可以提高匹配率,在匹配率为70%的情况下,如果句子中包含缩写,那么匹配率可能会达到75%。

是否启用以上选项,将直接影响字数分析结果。启用后,在某些项目中,重复字数会大幅增加,但是,启用这些选项,也有负面效果,因为在翻译过程过程中,Trados自动替换非译元素时会出现错误,例如数字替换错误。所以在后面的翻译过程中加强QA控制,避免出现一致性错误。