世界上发展最快、最隐秘的机器翻译公司DeepL

DeepL怎么一下子就在机器翻译界如日中天了呢?2017年夏末,DeepL的免费网络翻译器发布,提供七种欧洲语言,并声称在质量上胜过其他所有科技巨头,DeepL的强势表现赢得了欧洲媒体界的认可,并很快在市场上站稳了脚跟。

虽然语言行业对DeepL的翻译质量反应比较谨慎,但数据说明了一切,DeepL的访问量一直窜窜地高速提升。截止2021年9月份为止,根据Alexa的数据,在全球访问量最大的网站排名中,DeepL位居第146位,超过10亿人次使用过其服务。

DeepL在日本的成功尤其迅速,从发布到成为该国最受欢迎的网站,只用了不到17个月。DeepL在欧洲最受欢迎网站榜单中也一路高歌,分别在瑞士和德国排名第9和第66位。

从成立之初,DeepL 的创始人就一直想挑战其他科技巨头。首席执行官Kutylowski在2017年的一次采访中向Slator透露:”我们是一家德国公司,竞争对手是美国公司”。

DeepL在发布四年后,确实已与谷歌、微软、Facebook和亚马逊并驾齐驱,成为行业领先的机器翻译供应商。那么他们是如何做到的呢?

时机

DeepL于2009年在德国科隆成立,当时名为Linguee,是一个在线词典。Linguee本质上是一个翻译数据库/翻译记忆库。它由数百万个双语句段组成。Linguee使用网络爬虫从互联网上爬取双语文本,然后应用机器学习算法来评估质量。

当神经机器翻译(NMT)在2016年成为最先进技术,轻松超越了基于统计机器翻译(SMT)的模型时,Linguee看到了机会。

“机器学习一直是Linguee的核心,所以当神经网络成为机器翻译的一个选项时,我们看到了机会,Kutylowski表示,”在神经机器翻译成为一种选择之前,我们一直认为,科技巨头们已在统计机器翻译模型投入了大量资源,我们将无法缩小差距。”

语料质量高、数据量大、适用于所应用的领域,即可训练高质量的NMT,而Linguee所拥有的语料正好符合这三个条件。

现在,唯一缺少的是运行NMT所需的数十亿次运算的计算能力。Linguee求助于Verne Global,一家专门从事密集人工智能支持的公司。我们的目标是在冰岛建立一个数据中心,那里气候凉爽,能源丰富,电力成本低廉。根据DeepL新闻资料,其使用的超级计算机是世界上第23大计算机,能够在一秒钟内翻译一百万字。

Linguee完美抓住了改变机器翻译格局的NMT浪潮。

资金和发展

DeepL公司先后快速推出了机器翻译专业版DeepL Pro和基于订阅的机器翻译服务,后者采行了更严格的数据安全措施,并提供CAT工具集成和API访问

DeepL Pro的发布标志着该公司的商业模式从广告收益(来自Linguee和免费网络翻译)转向来自企业订阅客户的经常性收入(即从B2C转向B2B),罗氏、富士通、安盛、百思买、诺基亚、乐天、西门子和Elsevier等在业务流程中深度整合了DeepL。

对于译员和语言服务提供商来说,专业版工具更便于将DeepL嵌入日常流程中,开发人员则可以使用API建立语言工具,例如,翻译耳机,双向手持翻译设备。

2018年,DeepL吸引了硅谷风头最盛的风投公司之一Benchmark Capital的投资。Benchmark Capital持有DeepL13.6%的股份,其他投资者包括btov(一家在德国、瑞士和卢森堡设有办事处的欧洲风险投资公司)。

DeepL全职员工的数量在2019年和2020年之间翻了一番;根据监管文件,从43人增至86人。今年招聘活动进一步加速,尤其是在过去三个月,全职员工的数量很可能已经超过150人。

德国不要求公司公开完整的财务账目,因此尚没有DeepL的公开财务数据。然而,据有限的信息表明,DeepL 2020年的收入尚未超过4000万欧元。这是一个关键的监管门槛。DeepL 报告2020年的年度利润为14.2万欧元。

DeepL 似乎正在经历一个增长和变化的高峰期,招聘活动表明该公司正在扩大其工程、产品开发和客户/客户支持功能,并对当前的业务扩张保持一贯的低调。

机密技术

许多人都对DeepL背后的技术感到好奇。DeepL也对他们的技术保持缄默,也不愿意参加会议或发布研究论文。这并不奇怪,因为技术机密是保持竞争优势的关键。

相比之下,谷歌、微软和Facebook虽然也保持一定程度的机密性,但更积极地参与到学术界。例如,谷歌已发表了107篇关于机器翻译的论文,包括2021年的8篇。

DeepL早期营销材料提供了一些暗示,DeepL是建立在卷积神经网络(Convolutional Neural Network, 英文缩写CNN)之上的。

此后,MT技术有了很大发展,Transformer模型被广泛认为可以输出上佳结果,是当下的主导范式,业内人士认为DeepL应不太可能使用CNN了。

根据LinkedIn的数据,工程是该公司最大的职能部门(占员工总数的28%),该公司有大约十几名研究科学家,大部分位于德国。DeepL将该团队描述为 “一个小型的、有效的、极其优秀的团队,决策过程非常短,决策者本身就是研究/开发人员”。

相比之下,谷歌目前有超过91名专门从事机器翻译的研究科学家,以及400多名NLP专家和1000多名机器智能专家。谷歌还得益于大规模的计算基础设施,使其能够迅速试验在网络规模数据上训练的新模型,以显著提高翻译质量。

Lionbridge几年来一直在跟踪各供应商的MT质量,并发现,截至2021年1月,谷歌翻译在整体性能方面优于DeepL。然而,DeepL在德语方面表现出色,并在西班牙语和俄语方面取得了进步,而在中文方面则落后了。许多人认为与其他MT供应商相比,DeepL =的输出更加自然和流畅。Locren的实践也验证了这一点,DeepL在英中翻译方面,语言灵活性、可读性上往往会强于谷歌,谷歌在准确性上往往会比DeepL要更好。

作者 Anna WyndhamOn,来源Slator.com,locern.com编译

locren.com提供无限制、大规模获取DeepL、谷歌等机器翻译的独有工具,能无缝结合CAT使用,更多信息,请点击此处