• 30
AI界巴别塔,机器“谋杀”人类同传了解一下?
统计 阅读时间大约8分钟(2951字)

2018-04-11 AI界巴别塔,机器“谋杀”人类同传了解一下?

日进千金的同声传译也要被替代了吗?

猎云注:在为期三天的博鳌亚洲论坛中,腾讯AI同声传译“腾讯翻译君”高调亮相。但乌龙事件频频传出,例如出现大面积单词无意义重复、大小写字符乱码等情况,最终还需要人工同传赶来“救场”。在人工智能发展愈演愈烈的当下,AI同传真的能剥夺人工同传的工作吗?还是企业营销过分夸大,导致预期和结果不符?文章来源:AI星球(微信:ai_xingqiu),作者:吕梦。

说到同声传译,很多人第一印象是“高收入”,当然,时间紧任务重,口译员需要在不打断讲话者的情况下,几乎同步将内容准确、完整地翻译给听众,这种高难度操作“日进千金”也无可厚非。

有业内价目表显示,一个同声传译组一般需要2~3个译员,英语类一天1.2~2.1万,非英语类1.8万(具体业务能力具体分析),这样算下来一个同传一天至少会有4000元的收入。

同声传译最早亮相,是在二战后德国的纽伦堡军事法庭中,从此,这个帮助排除语音障碍和实现实时沟通的工作被用于95%的国际高端会。

在为期三天的博鳌亚洲论坛中,腾讯AI同声传译“腾讯翻译君”高调亮相。

但这位2018年博鳌亚洲论坛官方指定的独家人工智能(AI)同声传译合作伙伴,发挥似乎并不稳定,才上岗就闹出了乌龙,在分论坛中出现了大面积单词无意义重复、大小写字符乱码,最终,还是搬来了人工同传赶来“救场”。

其实,在2018年年初的腾讯年会中,马化腾就临时使用了没有提前准备的同传,当时看来效果还不错。有了这波底气后,腾讯同传就被带到了博鳌论坛中加以试练。

根据官方公开的信息,腾讯翻译君目前可以支持15个语种,83种语言对的翻译能力,其中中英互译引擎已经在新闻、学习和部分科技领域达到业界领先水平。

而根据以往数据,腾讯同传服务在会议现场的平均语音识别准确率可达97%,翻译可接受度超过93%。

但博鳌论坛中出现的乌龙似乎和官方给出的准确率和翻译可接受度相去甚远。事后,腾讯翻译君就微博上盛传需要人工同传“救场”一事,在官方微博上辟谣,“外界提及的邀请人工同传,并非“腾讯同传”团队用于此次海南博鳌的现场AI同传,而是用于服务腾讯新闻团队北京直播间的专业报道

而对于翻译中屡次出现的错误,腾讯翻译官也在微博给出了解释:这是“腾讯同传”第一次参加大型国际讨论型会议,也学到了各种“新奇”的语料知识,比如高大上的专业名词、还有来自五湖四海的英语流派,以及话筒里的噪音和回声“whenwhenwhen”

毕竟,同声传译对人类来说都不是一件容易的事情。每场几十分钟翻译背后是会议前几十个小时的准备和几百个小时的积累。

机器同声传译是如何做到的?

区别于单主讲人会议,此次也是AI同传类产品首次公开支持讨论型会议。这类会议语音环境非常复杂,一般来说,即使是双语运用自如的专业人士在实战前也要学习厚厚的会议资料,此外还有随机应变能力,因为意外总是来得那么突然。

曾在网络走红的翻译员张璐,在2010年的两会上,将总理的“亦余心之所善兮,虽九死其犹未悔”,来表达自己对祖国和工作的热爱。

这句楚辞让现场所有人都捏了把汗,而张璐经过短暂思考后,将总理的本意表达地准确无误铿锵有力,令在场的所有人起立鼓掌:“For the ideal that I hold dear to my heart,I will not regret a thousand depth to die(我遵从我内心的想法,即使要死千万次我也不会后悔)。”

除了临时可能出现的各种“疑难杂句”,不同地域的口音也是个问题。

当你自信满满坐在话筒前准备材料时,你或许并不知道,面对你的是一位带着浓重印度口音的大哥,说着“印式英语”(Hinglish),或是发音不好辨别的韩国或日本口音英语。即便如此,同传也要200%的集中注意力,不失偏颇地翻译出每一位发言者的话语。

在去年11月腾讯全球合作伙伴大会上,腾讯AI Lab就现场展示了机器同声传译功能,并向外界展示了机器传译的过程:

1、机器要先“听”明白你在说什么,才能翻译出来。

越是人多的场合,这一步越是关键。机器会将麦克风收录的声音进行检测、降噪等处理,再输入语音识别系统。

2、每个人讲话都自带语气,怎么办?

系统会对识别出的文本进行标点和口语化文字等处理,什么说话大喘气、句末加语气“ho”,通通打回原型,再输入到翻译系统。最后,翻译过的文本才会被投影到屏幕上。

3、怎样让译文更加忠实?

识别完声音,就需要翻译的信、达、雅了——精准的翻译是实现高质量同传的关键因素。这块就由腾讯翻译君承担。

AI Lab 的科学家们使用了多种模型加强机器翻译学习,提升低频困难词的精准度,并加入了深层网络、残差网络和模型融合等技术,选取更优的译文。

这一切,都必须在短短一两秒内发生,不然屏幕显示就会出现明显的滞后,极大影响使用体验。

为了提升解码速度,AI Lab采取了包括在GPU上解码、并行解码、选取优先队列等多种方法,最终做到像视频里那样,译文和讲话者说的内容同步出现在屏幕上

也就是说,机器同传是语音识别+机器翻译的过程,目前在业内语音识别领域就存在难以解决的问题,包括如何指定麦克风,比如有多个人说话、多个说话声混在一起时,在机器系统里面就会默认是人声嘈杂的环境,没有主说话人;另外还有包括噪声、口音和距离造成的识别准确度等问题。

而同传要做好必然会受到两个方面的能力影响,一是识别的能力,二是翻译的能力,这两个能力一般的错误是乘的关系,识别的错误会累加到翻译的错误上。

这就意味着,要做好机器同传,在识别和翻译上每一块都要足够强,不然最后叠加出来的效果就惨不忍睹了

腾讯夸大营销?

为了实现机器翻译的梦想,以IBM、谷歌、微软为代表的国外科研机构和企业均相继成立机器翻译团队,借以AI打破语言的巴别塔。

2014年到2016年,以神经网络作为基础的机器翻译,开始在全面超越此前以统计模型为基础的统计机器翻译(SMT),并快速成为在线翻译系统的主流标配。这场革命之后,机器翻译彻底进入了Neural Machine Translation,即NMT神经机器翻译时代。

2016年9月,谷歌发布了翻译技术的突破性研究——神经网络机器翻译系统(GNMT)。当时网上有一句广为流传的话:“作为翻译,看到这个新闻的时候,我理解了18世纪纺织工人看到蒸汽机时的忧虑与恐惧。”

但就目前的情况来看,同传界的许多朋友都表示,几十年内不用担心失业了。

不过,也有网友认为,腾讯事后的态度只是营销策略而已。

事实上,在腾讯AI同传正式亮相前,腾讯翻译君的项目负责人李学朝就曾信心满满地表示,腾讯的风格就是这样,在产品有成果之前尽量保持低调,“我们之所以敢承接这么大的会议,是因为我们有方法解决这样的问题,可以在快速迭代的情况下,把特定领域公司的名字或者生僻词或者歧义词翻译得更加准确”

But,打脸来得如此之快......

 

事后,腾讯翻译君透过微博承认,“腾讯同传”还在学习和成长中,对于一些专有名词倒装句,以及中英文流利切换的嘉宾演讲,还需要继续加强学习。

难怪会遭到网友破斥:“首次登台,脸丢出去了就宣传成译员的辅助;之前后台蓄力信心满满时就断言是译员的替代。这就是腾讯AI的营销宣传策略。何为敬畏何为尊重,唯有成败唯有逐利,仅此而已。如果AI这次有成无败、大放异彩,那么,脸变得绝对不会如此谦和,肯定依然是招摇过市,一幅亡译员心不死的架势”。

从翻译角度,中国翻译协会理事韦忠和在微博上发表了自己对新技术的看法:

1. 翻译是很传统的职业,需要有变革和创新,期待有更好用的辅助工具,但更需要更多的踏踏实实和精益求精的工匠;

2.技术进步很惊人,期待技术能代替繁重、重复单调的工作,帮助翻译们进行更富有创造性和更高效率的工作。

3. 期待技术公司和AI大牛们有点对传统职业的尊重和敬畏之心,资本、技术和媒体的力量巨大,不当宣传,会对传统职业和教育带来伤害。

4. 语言学习和翻译实践不应受到这些干扰,高水平的翻译人才不但现在供不应求,我相信二三十年后仍有巨大需求。

翻译不是神秘职业,就是一个很传统的职业。绝大多数好翻译其实就是好工匠,既要技艺高超,还要善用工具。希望AI发展给我们人类译员带来更好的辅助工具。

似乎现在中国人更热衷于技术应用和走捷径,缺乏德国人和日本人对传统职业的工匠精神和技艺。对此,在积极拥抱技术、享受技术发展成果的同时,我们应保持冷静。

AI同传还是个标准的新生事物,并不会一出手就秒杀众生,达到了取代人类同行的地步。任何新兴技术的发展、迭代都需要给予足够的耐心,在减少夸大技术的同时,也要用“匠心”打磨产品。

 

 

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×