中文Office系列文件翻译之标记处理技巧

翻译公司常碰见的Office系列文件包括Word、Excel和Powerpoint等。在使用诸如SDL Trados、Dejavu和MemoQ之类的CAT处理它们时，往往会碰到标记非常多的情况。对此，该如何办呢？

Excel文件

一般的“普通”的Excel文件，在使用CAT翻译（转换）时，是没有任何标记的。翻译公司无论是排重还是派稿，都很方便，不用担心标记问题。但是，我们可能偶尔会碰到Excel文件转换后，出现很多标记的情况，如下图。

转换前

Excel

转换后（Trados中）

Trados

碰到这样的情况，该怎么解决呢？您可以尝试将当前文件转为高版本或低版本。如果不奏效，您可以选定所有内容，将文字字体设为Arial Unicode MS。如果您的系统上没有此字体，可以点击此处下载。

要安装Arial Unicode MS字体，您可以将所下载的字体直接拷贝到C:\Windows\Fonts下，系统会自动安装。

Fonts

还有一种情况是，即使采用了上述方法，标记也无法消除，其中的原因可能是生成Excel文件的软件的不正确行为导致。这种情况解决起来比较复杂，目前还无相关的解决方案。

Word文件

绝大多数情况下，在使用CAT翻译Word之前，可使用我们的标记消除器处理文件，这样可以大幅减少乃至彻底去掉所有标记。

Cleaner

但是在少数情况下，即使清理文件之后，CAT工具中仍然存在很多标记。其中的原因和CAT的解析器有很大关系。例如，SDL Trados。

SDL Trados 在解析Word文件时，实际上处理的是底层的XML。SDL Trados 2014（及早期版本）和SDL Trados 2015在解析该XML文件时，2015更加智能，因此能有效减少导入Word文件时产生的标记。例如，在下例中，SDL Trados 2014只会查看”run properties” (w:rPr)标记是否包含和前一”run properties”相同的属性，如果没有，则会插入标记。而SDL Trados 2015则更加“聪明”，会忽略w:hint属性中的差异。

<w:r w:rsidRPr=”00B43639″>
<w:rPr>
<w:rFonts w:ascii=”宋体” w:hAnsi=”宋体” w:cs=”Arial” w:hint=”eastAsia”/>
<w:caps/>
</w:rPr>
<w:t>”输入框内输入</w:t>
</w:r>

对此，我们可以使用更高和更新版本的CAT，以免大量标记产生。

PowerPoint文件

PowerPoint在翻译之前，建议人工检查下是否存在断行的情况，如果有很多中间断开的短语/句子，在CAT中，同样该短语或句子也会断开，并可能生成更多标记。

另外，若PowerPoint在CAT中标记很多，可转换PowerPoint的版本，例如，将高版本转为低版本。这种方法往往有奇效。

总结

除了上述方法和诀窍外，您还可以在locren.com上搜索Word、Excel等关键字查看更多的Office文件处理技巧。

另外，我们的标记清除器日前已发布了最新版本。该版本进行了进一步改进，解决了少数文件处理速度慢的问题。现在，在绝大不多情侣下，都可以极速大批量处理Word文件。

中文Office系列文件翻译之标记处理技巧

文章分类

Sign in to your account

初试SDL Trados 2017

翻译Word文件的几个秘诀

中文Office系列文件翻译之标记处理技巧

文章分类

Sign in to your account