几千万字的项目如何快速统计字数

Locren最近发现多家公司碰到几千万字翻译项目的情形,他们需要尽快给客户报价,并且各家的文件形式不同,包括PDF、Word、Excel、Powerpoint等。如此庞大的数据量,要在短时间内快速且准确的统计字数,是非常巨大的挑战。

要准确和快速统计字数,可考虑使用翻译工具,例如SDL Trados,但是,任何CAT都无法一次性处理这么庞大的数据量,通行的做法是,分很多批次创建很多个项目,例如,4千万字的项目,你可能要创建上百个SDL Trados项目,逐个项目进行分析才能得出最终的总字数。显然这样统计分析字数会花很长的时间。报价时间很长,很费精力,而且客户那边未必就一定会将项目给你。那是否还有更快更省力计算字数的方法呢?

我们以其中的一位朋友的案例做分析。他们的文件全部为PDF形式,客户预估有几千万字。要统计字数,先需要将PDF转成Word形式。要大规模,大批量高速转换PDF文件,Locren推荐使用Solid Converter。Solid Converter可以一次性加载大批量的PDF文件,然后依次高速转换它们。

转换为Word之后,还必须高速且准确地统计全部Word文件的字数。对此,通过使用我们的字数统计工具,可以一次性大批量统计Word文件,正常情况下,平均统计每个文件的字数所花的时间还不到一秒!

由于我们的字数统计工具本身使用的就是Word统计功能,因此字数统计和Word完全一致。

在这个案例中,通过结合使用Solid Converter和我们的字数统计就可以很快统计出字数。

在另一个案例中,原始文件为Powerpoint和Excel文件,内容为中文,要准确统计它们,需要以Word字数统计为准。对此,可以先使用我们的字数统计工具,将PPT和Excel文件全部批量无损转换为PDF文件,再使用Solid Converter转为Word文件,最后,再使用我们的字数统计工具批量统计全部Word文件的字数。通过以上方法,可以在极短时间内算出整个项目的总字数。

要精确统计整个项目的重复情况,您可以参考以下方法。首先使用CAT分多个批次创建项目(如,SDL Trados),然后使用我们的去重工具加载不同批次的全部文件(如,SDXLIFF),然后一次性去重,即可轻松得出实际需要翻译的字数。

了解我们的字数统计工具