字数Money
字数统计关系到费用核算,牵动着客户和供应商之间最敏感的神经。不同的程序字数统计会有所差异。
我们之前做过一项测试,发现Word 2010和Word 2007统计西文字符有明显差异,而中文字符统计基本一致,具体测试结果,请查看《Word 2007和Word 2010字数分析比较》一文。
一直以来,很多CAT统计中文和/或日文字数不准确,或根本没有“字数”统计这一项,例如,SDL Trados Studio。
说道SDL Trados Studio,我们关注到SDL官方现已能提供支持中文和日文字数统计的更新,这个更新目前一直迟迟未发布。笔者猜想字数统计牵扯到利益关系,发布之后,就会动到现有的“蛋糕”,再者中国正版用户不多,SDL没有及时更新的动力。不过,正版用户可以向SDL官方提申请,获取此项更新。
术语提取工具VS人工提取术语
业界有很多术语提取工具。多语杂志20160405篇首文章对比了九款术语提取工具,下图是各种工具之间的特性对比图。

虽然有这样的工具,但是中文分词一直是业界难题,是否推荐使用术语提取工具呢?我们来说说本地化行业的一些做法。如果项目是已完成的双语文件,则可在CAT工具中加载术语库,将所需的术语对人工添加到术语库中。以Trados为例,通过TermExcelerator插件,可直接使用Excel为术语库,并可将术语更新到Excel表中,这样术语编辑和维护非常简便。
对于单语言文件,那么通常可以在项目开始之前,事先由熟悉该项目及其题材的高级校审,花二小时乃至一天的时间,准备一个术语表。由于高级校审是在上下文环境下翻译术语,所以往往术语翻译较为准确。
开创翻译业务新模式
翻译界众多企业在青岛讨论未来翻译行业的方向,那么翻译行业的未来在哪里?番外的故事或许能给我们一些启示,在番外翻译行业,有一些外来者们虽然不懂翻译,但是凭借敏锐的眼光,利用新兴技术,提供速度更快、质量更佳、价格更低廉的翻译。他们通过创新,开辟了崭新的空间,取得了成功(完整故事见下文)。
这些外来者回答了以下四个问题:
- 哪些要素可以从传统翻译业务中剔除?
- 该如何为服务购买者降低成本结构,以实现差异化,提升竞争力?
- 应提出超越通行做法的哪些特色和服务?
- 应开创传统翻译服务未涵盖的哪些产品和服务?
下表就是外来者(企业)们以创新方式解决的问题。
PDF之Word翻译流程 – 标记的秘密
翻译PDF,我们的建议是不要用CAT直接处理PDF,以避免最终无法生成译稿等问题。最佳实践是将PDF转成Word,然后再使用CAT处理,但是使用CAT处理PDF转换的Word会有很多标记,出现这些标记的原因包括以下方面:

1. PDF转换工具/OCR软件为了和原始文件的字体保持一致,在生成的Word文件中通常会应用不同的字符间距,但是在正常文档中通常很少应用字符间距,这些字符间距在CAT中会产生标记
2. 通常情况下,Word文档使用Automatic字体显示,即默认系统文本颜色。不过,部分文本可能使用了黑色字体颜色,虽然Automatic和黑色字体颜色在大部分系统中看上去是一样的,但是CAT工具会将它们视为不同的字体颜色,并会生成标记。
eBay利用机器翻译大幅提升销售量
使用机器翻译,支持者和反对者皆有,但不可否认的是,eBay利用机器翻译取得了巨大成功,通过机器翻译的帮助,eBay实实在在地提升了销售量。

利用机器翻译,eBay将产品列表和产品说明翻译成不同国家的语言。这样,不同国家的用户,例如,俄罗斯的用户不仅可以查看eBay西班牙站点上的产品,而且可以购买产品。
除了产品名称和产品说明外,eBay上的买家和卖家之间还通过机器翻译沟通交流。我们都知道机器翻译质量仍有很大提升空间,但是这似乎并未困扰eBay客户,他们用自己的购买力证明了机器翻译质量是足够好的。eBay可能是利用机器翻译挣钱最多的公司,甚至超过了谷歌和微软。
翻译企业为什么要建立知识库?
在企业生产各个环节中,我们都会遇到各种各样的问题,尤其是新上岗的员工。
对于新员工,我们通常很难给他很长很长的时间去完全熟悉、消化公司的各项资料,比如项目流程、工具使用指南、客户指示等。在简短的培训完成后,后面他肯定会遇到问题,比如新来的一个项目,这些文件以前没见过,该怎么进行分析?这个项目有哪些特殊的规定?这个客户以前的项目有没有留下项目总结呢?
而对于老员工,对于常规项目及注意事项都非常熟悉,他们则通常是重复性的问题,比如电脑坏了,重装了系统和 CAT 工具,面对新装的系统,可能会不记得先前的一些设置,现在要到处找具体的设置,或者是如何设置。IT 问题还好,可以找网络工程师帮忙,如果不是 IT 问题,就只能看自己有没有记录文档,或者问同事有没有相关的记录文档,如果没有那就只有问谷歌了。
对于这些问题,第一次出现时,我们解决了,如果没有将解决问题的方法留存下来,并且让所有员工随时都能方便的查阅,那一定会不断重复,每一次重复,都是在浪费我们的成本。
让不翻译的内容消失
笔者是魔术爱好者,最喜欢玩凭空消失的魔术。在翻译行当,笔者也揭秘几个让文本内容消失的“魔术”诀窍。
首先说TransTools的免费Hide/Unhide Text工具,使用Hide/Unhide Text,我们可以令除高亮文本以外的所有选定文本“消失”掉,或者仅使高亮文本“消失”。

翻译企业从手工时代到信息技术时代的转型
可能有人会问,不用翻译技术的翻译公司未来几年会被淘汰吗?
笔者认为,技术的进步谁也挡不住,因循守旧只会被时代抛弃或边缘化。紧跟时代步伐,利用信息技术的翻译公司会变得更强,并逐渐会在竞争中占据主导地位。
翻译公司从传统手工时代进入信息技术时代,是一个大的进步,也会遭遇一些挑战。CAT的引入是其中的重要一环,但是随着CAT引入的,还有标准和规范化的翻译流程,包括文件管理、记忆库管理等等。从业已习惯的旧流程或工作方式到新流程,需要有一个磨合和熟悉的过程,期间,需要付诸大量的实践。
我们以文件管理为例。传统工作流程不使用CAT,最少可能只有2个文件,一个源文稿件,一个译文稿件。翻译公司派出稿件,然后回收译文稿件。过程十分简单。但是成本效益也很低下,也就是无法重用翻译资源。
引入CAT后的新流程,则可能会包含更多的文件,我们以Trados项目为例。一个项目,可能包括如下文件夹。
降低翻译成本粗暴方法
去掉项目中重复的内容,是降低翻译成本最粗暴但最有效的方法之一。我们的排重工具(Toolbox)经过多年的演化,如今变得更加成熟和强大,而且我们目前仍然是业界唯一一款支持按自定义匹配率排重的工具。

这次我们发布的排重工具新版本,主要新增了自动按文件名导出双语Word文件,也就是说,在将项目重复内容去掉之后,一次性按原始文件名生成对应的双语Word文件。在双语Word文件中完成翻译后,可一次性将所有双语Word文件更新回项目中。之前将整个项目导出为一个双语Word的功能仍保留。
翻译项目转不出译文,怎么拯救?
我们都知道使用CAT工具可以有效降低翻译成本,随着时间的流逝,翻译成本会呈阶梯形下降。

但是使用CAT工具也会有“副作用”。其中的一个最主要的副作用,就是无法将翻译的项目转出为译文版。那么碰到这样的问题,该怎么救呢?
这里我们以Trados为例。当翻译项目无法转出译文版时,可能的原因包括:
1. 文件转换器版本
2. 双语SDLXLFF文件损坏
3. 原始文件有问题
如果是第1种情况,我们可以使用不同的转换器,您可以参考我们的文章“Word翻译项目转不出译文怎么办?”。
