设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 数据 创业者 手机
当前位置: 首页 > 站长资讯 > 评论 > 正文

“亿级翻译需求”存在吗?

发布时间:2017-01-04 16:38 所属栏目:17 来源:Donews
导读:2013年底我和搭档魏勇鹏创办公司的时候,他说了两件事:一是,谷歌机器翻译几乎不再聘请语言学专家了,由懂得统计、计算的计算机专家主理开发。二是,谷歌有世界上最丰富的多语言语料数据,但对这种基于数据统计训练而成的翻译引擎来说现状有点尴尬,更多

2013年底我和搭档魏勇鹏创办公司的时候,他说了两件事:一是,谷歌机器翻译几乎不再聘请语言学专家了,由懂得统计、计算的计算机专家主理开发。二是,谷歌有世界上最丰富的多语言语料数据,但对这种基于数据统计训练而成的翻译引擎来说现状有点尴尬,更多语料能带来效果不再明显了,尽管谷歌的语料、用户量和使用量都在日益增多。

W020160629304952323896.jpg

在我们运营公司的两年多时间里,遇到了很多客户和投资人,他们问的第一句话是:“你们机器翻译能达到什么样的准确度?”这个问题意味深长,我一般只能回答说:“在某些垂直领域,我们比谷歌翻译要好。”这句带有挑衅意味的话让听者将信将疑却无从反驳,因为Ta从未得到过无瑕的机器翻译体验——像科幻影视文学、类似《星际迷航》里展现的,那边阿凡达星语说出来,这边火星人听进去,毫无停顿卡带的痕迹。

行内人用专业尺度评价机器翻译的现实是这样:美国商务部下属的国家标准与技术研究所NIST举办的一项机器翻译研究水平评测,采用BLEU(Bilingual Evaluation Understudy)标准。 其原理是比较机译结果和人译结果的相似度,完全一致得分为1(当然不同的人的翻译很难“完全一致”,所以得分1为理想值)。2008年NIST的英文-中文的机器翻译评测结果,谷歌翻译得分0.4142,微软亚洲研究院提交的测评是0.4099,厦门大学得分0.2502;谷歌和微软亚洲的中文-英文机翻得分分别是0.2999和0.2901,中科院自动化所的得分是0.2407。

2015年9月第十一届全国机器翻译研讨会(CWMT 2015)上,中国超过10所科研所和大学参加了机器翻译的评测。同样以BLEU值为标准,英汉新闻平均得分接近0.35,汉英新闻则接近0.25,日汉新闻质量最好——高分超过0.5;英汉科技则普遍超过0.35,高分0.43。国内语种的机翻效果更好,藏汉政府文献的最高分0.61,维汉新闻的最高分0.54。

囿于测试所选文档和评测方法,该数值结果和普通人阅读体验有可能偏差很大。权当参考:机器翻译中有40%左右的结果,用户可以较为容易理解使用。和阿凡达电影场景的效果,和此时此刻用户/投资人对人工智能产业的期待相比,还是弱爆了。不过,2013年谷歌翻译每天的用户量超过2亿人、翻译10亿次,每天翻译的文字相当于100万册图书,超过全球专业翻译一年的工作量,他们用的就是BLEU值40%左右的机器翻译。

逻辑计算的问题?

“人工智能领域没有取得任何进展,”英国理论物理学家戴维·多伊奇在其著作《无穷的开始》里说:“因为在其核心里有一个悬而未决的哲学问题:我们还不了解创造性如何运作。一旦解决了这个问题,编程实现人工智能将不是难事。图灵发明了图灵测试,希望绕开这个哲学问题。换句话说,他希望在解释这项功能之前就实现这项功能。不幸的是,类似这样的情形极为罕见。”(图灵测试由计算机科学和密码学的先驱阿兰·图灵于1950年设计:如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试,它被认为具有智能。)

“现在我们谈的比较多的是人机链接,就是把大脑和计算机相连,用机器扩展人类的思维能力。我觉得这一点利用目前的老式计算机是无法实现的,因为人脑在我看来更接近于量子计算机,我们人类与电脑的区别在于,电脑你输入什么,它输出什么,唯一的例外是它死机了。而输入相同的信息,人类的输出是不可预知的,这就是人类的自由意志。我认为人类的自由意志是以量子计算为基础,是一种模糊的计算而不是逻辑计算。”中山大学天文与空间科学研究院院长李淼说。

按照中国人工智能泰斗、中科院院士张钹教授的分析,人工制造的智能机器即使有了自主意识,也是机器的意识,比如“有一个机器人会做勺子,而且它像人一样‘有意识’自主工作,这个机器人可能耗尽地球的资源来生产勺子,因而对人类产生威胁”。

虽然数据在增加,但是主要基于统计计算的人工智能不能满足人的意志和情绪需求。至少在基于逻辑计算的机器翻译领域,语料数据的增长与翻译准确度不再成正比,让机器理解人的努力尝试卡在半山腰。

在用户和投资人对人工智能有爱有期待的时候,这个梦醒得有点残酷。不管所谓机器智能是否是真正的智能,在某些场景下,它已经开始发挥价值。我的一个朋友、中科院自动化所的博士生黄国平讲的话很有力量:“即使是现在的机器翻译,用好了照样震爆世界。”他的意思是:机器已经做了40%、垂直领域的引擎能提供超过50%的有效结果,理论上最好的翻译项目能提高50%的效率,机器的生产能力同样令人乍舌。

可预见的时间里,机器翻译一直都会不完美有遗憾。其实这也是一个好消息,它给人留了尊严和安全感,保留了翻译职业,甚至为译员提供了更多的商业需求和更多的工作岗位。

不人性的一面

我在翻译生产中遇到了三个译员(以下用化名),三个案例和机器翻译的关系层次分野清晰。

23岁天秤座张林林姑娘,南京某大学英语系大四学生,参加译后编辑(基于机器翻译结果作人工优化)培训2个月,她的感受是“译后编辑很大程度上提高了翻译的效率,但是会对译者的翻译的风格和思维有一定影响和改变”,工作效率从最初每小时完成2件任务提高到了3-4件,兼职月收入达到了3500元。

24岁水瓶座孙青青姑娘,河北某大学商务日语系毕业,对译后编辑的感受是“比如有些句子比较难懂,句子结构组织起来比较困难,机器译文起到了好的提示作用”,培训半年后转为全职译员,一小时稳定完成4件,月收入超过1万。

第三位是25岁的白羊座小伙子小韩,大连外语大学日语毕业生,他说“有的机器翻译只需调整语序即可,跟纯手动翻译相比,极大地提高了翻译效率和准确性”。他的效率是一小时完成5件,兼职做翻译月收入9千元。

从受机翻结果影响,逐渐到以机翻结果为主做优化,译后编辑的译员的工作方式和传统人脑翻译、词典辅助的模式有很大区别。他们的工作流程发生了明显变化,从90%的时间进行逐字逐句翻译,转变为超过一半的时间来理解术语和机翻结果,真正动手“翻译”句子段落的时间仅为过去的小一半。结果是“翻译”时间越少的译员,效率最高,收入也最高。

2015年第四季度,麦肯锡全球研究院发表报告《如何利用AI重新定义工作》,开篇的第一句话就是“随着体力工作和知识工作自动化的进步,许多工作至少在短期内,会被重新定义而不是被消除”。我们在译后编辑译员身上看到的是机器翻译并没有改变翻译职业,但是新的流程却改变了译员。译员在工作中术语的选择、词句段落编排等过程在系统中都被记录下来供机器学习,译员是语言数据和系统的使用者,也是数据生产者。最有效的状况可以被描述为:译员是机器翻译的研发和生产的延伸,其思维和行为被技术化了。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读