“亿级翻译需求”存在吗？

发布时间：2017-01-04 16:38 所属栏目：17 来源：Donews

导读：2013年底我和搭档魏勇鹏创办公司的时候，他说了两件事：一是，谷歌机器翻译几乎不再聘请语言学专家了，由懂得统计、计算的计算机专家主理开发。二是，谷歌有世界上最丰富的多语言语料数据，但对这种基于数据统计训练而成的翻译引擎来说现状有点尴尬，更多

2013年底我和搭档魏勇鹏创办公司的时候，他说了两件事：一是，谷歌机器翻译几乎不再聘请语言学专家了，由懂得统计、计算的计算机专家主理开发。二是，谷歌有世界上最丰富的多语言语料数据，但对这种基于数据统计训练而成的翻译引擎来说现状有点尴尬，更多语料能带来效果不再明显了，尽管谷歌的语料、用户量和使用量都在日益增多。

在我们运营公司的两年多时间里，遇到了很多客户和投资人，他们问的第一句话是：“你们机器翻译能达到什么样的准确度?”这个问题意味深长，我一般只能回答说：“在某些垂直领域，我们比谷歌翻译要好。”这句带有挑衅意味的话让听者将信将疑却无从反驳，因为Ta从未得到过无瑕的机器翻译体验——像科幻影视文学、类似《星际迷航》里展现的，那边阿凡达星语说出来，这边火星人听进去，毫无停顿卡带的痕迹。

行内人用专业尺度评价机器翻译的现实是这样：美国商务部下属的国家标准与技术研究所NIST举办的一项机器翻译研究水平评测，采用BLEU(Bilingual Evaluation Understudy)标准。其原理是比较机译结果和人译结果的相似度，完全一致得分为1(当然不同的人的翻译很难“完全一致”，所以得分1为理想值)。2008年NIST的英文-中文的机器翻译评测结果，谷歌翻译得分0.4142，微软亚洲研究院提交的测评是0.4099，厦门大学得分0.2502;谷歌和微软亚洲的中文-英文机翻得分分别是0.2999和0.2901，中科院自动化所的得分是0.2407。

2015年9月第十一届全国机器翻译研讨会(CWMT 2015)上，中国超过10所科研所和大学参加了机器翻译的评测。同样以BLEU值为标准，英汉新闻平均得分接近0.35，汉英新闻则接近0.25，日汉新闻质量最好——高分超过0.5;英汉科技则普遍超过0.35，高分0.43。国内语种的机翻效果更好，藏汉政府文献的最高分0.61，维汉新闻的最高分0.54。

囿于测试所选文档和评测方法，该数值结果和普通人阅读体验有可能偏差很大。权当参考：机器翻译中有40%左右的结果，用户可以较为容易理解使用。和阿凡达电影场景的效果，和此时此刻用户/投资人对人工智能产业的期待相比，还是弱爆了。不过，2013年谷歌翻译每天的用户量超过2亿人、翻译10亿次，每天翻译的文字相当于100万册图书，超过全球专业翻译一年的工作量，他们用的就是BLEU值40%左右的机器翻译。

逻辑计算的问题?

“人工智能领域没有取得任何进展，”英国理论物理学家戴维·多伊奇在其著作《无穷的开始》里说：“因为在其核心里有一个悬而未决的哲学问题：我们还不了解创造性如何运作。一旦解决了这个问题，编程实现人工智能将不是难事。图灵发明了图灵测试，希望绕开这个哲学问题。换句话说，他希望在解释这项功能之前就实现这项功能。不幸的是，类似这样的情形极为罕见。”(图灵测试由计算机科学和密码学的先驱阿兰·图灵于1950年设计：如果电脑能在5分钟内回答由人类测试者提出的一系列问题，且其超过30%的回答让测试者误认为是人类所答，则电脑通过测试，它被认为具有智能。)

“现在我们谈的比较多的是人机链接，就是把大脑和计算机相连，用机器扩展人类的思维能力。我觉得这一点利用目前的老式计算机是无法实现的，因为人脑在我看来更接近于量子计算机，我们人类与电脑的区别在于，电脑你输入什么，它输出什么，唯一的例外是它死机了。而输入相同的信息，人类的输出是不可预知的，这就是人类的自由意志。我认为人类的自由意志是以量子计算为基础，是一种模糊的计算而不是逻辑计算。”中山大学天文与空间科学研究院院长李淼说。

按照中国人工智能泰斗、中科院院士张钹教授的分析，人工制造的智能机器即使有了自主意识，也是机器的意识，比如“有一个机器人会做勺子，而且它像人一样‘有意识’自主工作，这个机器人可能耗尽地球的资源来生产勺子，因而对人类产生威胁”。

虽然数据在增加，但是主要基于统计计算的人工智能不能满足人的意志和情绪需求。至少在基于逻辑计算的机器翻译领域，语料数据的增长与翻译准确度不再成正比，让机器理解人的努力尝试卡在半山腰。

在用户和投资人对人工智能有爱有期待的时候，这个梦醒得有点残酷。不管所谓机器智能是否是真正的智能，在某些场景下，它已经开始发挥价值。我的一个朋友、中科院自动化所的博士生黄国平讲的话很有力量：“即使是现在的机器翻译，用好了照样震爆世界。”他的意思是：机器已经做了40%、垂直领域的引擎能提供超过50%的有效结果，理论上最好的翻译项目能提高50%的效率，机器的生产能力同样令人乍舌。

可预见的时间里，机器翻译一直都会不完美有遗憾。其实这也是一个好消息，它给人留了尊严和安全感，保留了翻译职业，甚至为译员提供了更多的商业需求和更多的工作岗位。

不人性的一面

我在翻译生产中遇到了三个译员(以下用化名)，三个案例和机器翻译的关系层次分野清晰。

23岁天秤座张林林姑娘，南京某大学英语系大四学生，参加译后编辑(基于机器翻译结果作人工优化)培训2个月，她的感受是“译后编辑很大程度上提高了翻译的效率，但是会对译者的翻译的风格和思维有一定影响和改变”，工作效率从最初每小时完成2件任务提高到了3-4件，兼职月收入达到了3500元。

24岁水瓶座孙青青姑娘，河北某大学商务日语系毕业，对译后编辑的感受是“比如有些句子比较难懂，句子结构组织起来比较困难，机器译文起到了好的提示作用”，培训半年后转为全职译员，一小时稳定完成4件，月收入超过1万。

第三位是25岁的白羊座小伙子小韩，大连外语大学日语毕业生，他说“有的机器翻译只需调整语序即可，跟纯手动翻译相比，极大地提高了翻译效率和准确性”。他的效率是一小时完成5件，兼职做翻译月收入9千元。

从受机翻结果影响，逐渐到以机翻结果为主做优化，译后编辑的译员的工作方式和传统人脑翻译、词典辅助的模式有很大区别。他们的工作流程发生了明显变化，从90%的时间进行逐字逐句翻译，转变为超过一半的时间来理解术语和机翻结果，真正动手“翻译”句子段落的时间仅为过去的小一半。结果是“翻译”时间越少的译员，效率最高，收入也最高。

2015年第四季度，麦肯锡全球研究院发表报告《如何利用AI重新定义工作》，开篇的第一句话就是“随着体力工作和知识工作自动化的进步，许多工作至少在短期内，会被重新定义而不是被消除”。我们在译后编辑译员身上看到的是机器翻译并没有改变翻译职业，但是新的流程却改变了译员。译员在工作中术语的选择、词句段落编排等过程在系统中都被记录下来供机器学习，译员是语言数据和系统的使用者，也是数据生产者。最有效的状况可以被描述为：译员是机器翻译的研发和生产的延伸，其思维和行为被技术化了。

（编辑：ASP站长网）