人工智能技能在近年来的飞速发展无疑为人们展现了一幅前所未有的未来图景,人们在欢呼雀跃的同时,也开始担心被科技加持的主流文化会逐渐拉大与其他人类文化的差距。
“科技霸权”不单存在于经济领域,也在逐渐向诸如措辞、艺术创作等人文领域渗透。
而一旦分开主流技能发展体系,这些小众人类文化所面临的结局很可能是逐渐消亡。

以 AI 为代表的新兴技能会将重修人类文明的“巴别塔”,还是加速其崩塌?

图丨《圣经》中的巴别塔

人类目前利用大约6900种不同的措辞。
但利用汉语、英语、北印度语、西班牙语和俄语这5种措辞的人占了环球人口的一半以上。
事实上,95%的人只利用100多种措辞进行互换。

AI措辞翻译新打破全球各类措辞无障碍交流终将不是梦

其余一个不为人知的事实是,根据措辞学家估计,天下上约有三分之一的措辞仅由不到1000人利用,而且在未来一个世纪这些措辞面临失落传的危险。
这些小众措辞所表示的独特的文化遗产,像传统故事、短语、笑话、传统草药,乃至独特的情绪也会随着措辞的失落传而消逝。

图丨天下措辞树

在这个处处连接的互联网天下里,人与人之间的沟通和互换变得无比的方便快捷。
但现在的问题是,措辞的差异仍旧像是一道深不可测的鸿沟摆在拥有不同文化背景的人们面前。

作为环球最大的社交巨子,Facebook自出身起就在血脉深处蕴藏着开放和连接的基因,他们的义务便是冲破藩篱、重构起互通互联的“巴别塔”,使每个人都可以以最准确、最快速的办法打仗到环球范围内的信息。

而要实现这一目标,第一步便是办理不同措辞之间的转换问题。
人工翻译已经远远不可能知足当现代界所产生的海量信息流,那么,是否能有一种快速而准确的技能断交方案,能替代人类去完身分歧措辞间的转换?

就在本日,Facebook人工智能研究中央(FAIR)发布了利用全新的卷积神经网络(CNN)进行措辞翻译的研究结果。
据悉,这种新方法能够以现有的循环神经网络系统9倍的速率进行翻译,而且翻译的准确性还会得到大幅的提高。

卷积神经网络(CNN)最早是由深度学习领域的威信人物Yann LeCun在几十年前所发明的,在以图像处理为代表的的机器学习运用中表现的非常成功。
但在措辞翻译方面,由于对准确性的追求,每每会将循环神经网络(RNN)作为首选的技能。

图丨Facebook人工智能研究院院长、纽约大学终生教授Yann LeCun

但只管如此,RNN在设计上所固有的局限性还是制约了它在措辞翻译和文本处理上的进一步运用。

举例来讲,打算机在进行文本翻译的时候,常日是根据一种措辞的句子来判断在另一种措辞里同义单词的排列顺序。
但循环神经网络只能以从左到右(或从右到左)的顺序逐字进行翻译,这就和深度学习中多GPU并行的打算模式十分不契合,必须要等到上一个词翻译完之后,下一个词才可以连续,实际上也就相称于造成了神经网络打算能力的摧残浪费蹂躏。

与之比拟,CNN就表现出很大的上风,它可以充分利用多GPU并行打算的能力,同时处理多个措辞片段,显然效率会得到大大提升。
除此以外,CNN的另一个上风便是其所具备的信息分层处理能力,这对付海量信息中的繁芜关系归纳汇总十分有利。

图丨CNN与RNN差异简明图示

在以往的研究中,CNN在翻译上的运用并没有引起Facebook的重视。
不过,FAIR团队意识到了这一技能的潜力,他们通过搭建翻译模型验证了CNN极佳的翻译表现,如果在未来这一能力可以得到开释的话,那么精准、高效翻译环球6900余种措辞将不再是梦想,人类文化的“巴别塔”将在技能的基石之上重修。

Facebook的全新翻译系统到底表现如何?

在由机器翻译大会(WMT)供应的公开标准数据包上的测试表现来看,Facebook全新的翻译系统的性能要远超RNNs2。
尤其是在CNN模式下的WMT 2014 英语-法语测试中,要比之前的最佳记录提高了1.5个BLEU值。
BLEU(Bilingual Evaluation Understudy)是利用最广泛的机器翻译准确度评判标准,系统认为,机器翻译结果越靠近人工翻译,那么翻译质量就越高。

图丨机器翻译评判标准之一的BLEU

此外,Facebook全新的翻译系统在WMT 2014 英语-德语测试中,将此前的记录提高了0.5个BLEU值,在WMT 英语-罗马尼亚语测试中,也将最好成绩提高了1.8个BLEU值。

神经网络在机器翻译这种实际运用中表现的衡量标准还包括,系统吸收到一个句子后,会花多永劫光翻译出来。
Facebook全新的CNN模型拥有非常高效的打算能力,比已经很强大的RNN系统还要快9倍。
Facebook的研究团队紧张将精力放在了通过量化权重和蒸馏等方法来加速神经网络,这些方法实在潜力极大,在未来还将进一步大幅提高CNN模型的速率。

Facebook全新架构中的一个显著特色在于multi-hop把稳力机制。
这种机制类似于人类在从事翻译事情时,会将句子进行分解,而不是一次将句子看完,然背面也不回的直接进行翻译。
这个神经网络也会在翻译过程中不断的转头看句子,并选择接下来要翻译的词语。

这一点与人类在翻译过程中会常常回顾句中的关键词的行为非常类似,比如,首次回顾关注的是动词,那么第二次回顾时就会关注干系的助动词。

图丨One-Hop与Multi-Hop比拟

该系统的另一个重点是“门控”(Gating),它掌握神经网络中的信息的详细流向,给它们指定最佳的处理单元,从而得到最好的翻译结果。
打个比方,如果说神经网络会要做的是搜集所有已经完成的翻译结果,那么门控要做的便是进行精确地筛选,使它最适宜当前的语境。

但是,也开始有越来越多的人担忧,常常利用机器去翻译某些常用的特定措辞,会使得那些不常利用的措辞被进一步边缘化。
这便是为什么机器翻译实在有可能会加速濒危措辞、乃至文化的消亡。

措辞学家们举了一个普通的例子,比如卫星电视做事,那些常常被电视台利用的措辞会逐渐变得更盛行更受欢迎,而不常常涌现的措辞则会逐渐被人们遗忘。

技能的进步是否会进一步加速小众措辞、乃至文化的消亡?

Google、Facebook等科技巨子们正在研发的机器学习技能将极大加快不同主流语种间的转换效率,这个已经没有疑问了,但它是否能成为保护小众措辞的利器?

图丨措辞学家Sebastian Drude 在研究巴西的印第安措辞Awetí

这是一个很有远见的设想,但问题是机器翻译依赖于大量被标记的数据。
这些数据集是由人工翻译的各种措辞的大量书本、文章和网站组成。
机器学习算法就像罗塞达石碑(石碑上用希腊笔墨、古埃及笔墨和当时的普通体笔墨刻了同样的内容)一样,数据集越大,学习效果越好。

然而对付大多数措辞来说,这种弘大的数据集根本不存在。
这便是为什么目前机器翻译只能够翻译最常见的几种措辞。
例如,Google翻译只能处理90种措辞。

图丨谷歌翻译

因此措辞学家面临的一个主要寻衅便是须要找到一种方法,可以自动剖析那些小众措辞,以便让打算机更好地理解它们。

最近,德国慕尼黑大学的Ehsaneddin Asgari和Hinrich Schutze表示他们已经在这方面取得了关键性打破。
他们展示的新方法揭示了险些适用于任何措辞的主要元素,这些元素可以很好地帮助机器翻译。

这个新技能是基于一个已被翻译成至少2000种不同的措辞的单一文本:《圣经》,措辞学家早已认识到它的主要性。

因此,他们创建了一个名为“平行《圣经》语料库”的数据库,这个中包含了用1169种措辞翻译的《新约》。
然而这个数据集还不敷以用于Google和其他商用机器翻译系统。
以是,Asgari和Schutze提出了另一种方法:剖析不同措辞中,各种时态的表达办法。

大多数措辞都会利用特定的单词或字母组合来表示时态。
以是这个新方法的小技巧是利用人工去识别一些措辞中时态涌现的旗子暗记,然后采取数据挖掘来搜索其他措辞,找到扮演相同角色的单词或字符串。

例如,在英文中,进行时是用“is”来表示,将来时态用“will”,而过去时用“was”。
当然这些词也有其他含义。

Asgari和Schutze的想法是在《圣经》的英文翻译中找到所有这些词,以及其他措辞中相对应的例子。
然后查找在其他措辞中扮演相同角色的单词或字母串。
例如,字母“-ed”在英语中也表示过去时态。

值得把稳的是,Asgari和Schutze不因此英语作为一开始的基准。
由于英语是一种比较古老的措辞,有许多例外的情形,这会使得机器很难学习。

图丨古英语写成的文章

相反,他们从根据其他措辞稠浊发展而成的克里奥尔语系(Creole Language)开始。
由于这种措辞涌现得较晚,它还没有足够长的韶光来发展出丰富的措辞特质。
这意味着它们常日包含更明显的措辞特色标记,譬如时态。

两位德国学者表示:“我们的依据是,克里奥尔语比其他措辞更为规范,由于这个语系很年轻,并没有积累那些随意马虎让打算剖析更繁芜的‘历史包袱’。

图丨克里奥尔语于17-18世纪涌现于北美和加勒比海地区,用于欧洲殖民者与奴隶的互换

这个中之一是塞舌尔(Seychelles)克里奥尔语,它利用“ti”这个词来表示过去时。
例如,“mon travay”是指“I work”,而“mon ti travay”意味着“I worked”,“mon ti pe travay”意思是“I was working”。
以是对付判断过去时来说,“ti”是一个很好的指示符列表。

Asgari和Schutze编译了10种其他措辞的过去时态指示符列表,然后在“平行《圣经》语料库”中,把用于实行相同功能的其他措辞的单词和字符串挖掘出来。
对付现在进行时和一样平常将来时他们也采取了相同的方法。

实验的结果非常有趣,这项技能揭示了与一样平常常用措辞有关的措辞学构造,并创建一张关联图,显示利用相似时态构造的措辞是如何联系的(如下图)。

图丨上图显示了100种措辞的过去时态指示符是如何聚类在一起的

Asgari和Schutze开拓的机器学习算法可用来剖析人们在超过1000种措辞中利用过去、现在和未来时态的办法。
这是迄今为止最大的跨措辞打算研究,所涉及的措辞数量比其他类型的研究乃至大一个数量级。

这项事情有很主要的运用代价。
措辞时态关联图许可研究职员快速找出不同措辞之间的关系以及它们是如何联系的,这可以用来更好地理解措辞的进化与演化。
Asgari和Schutze表示:“我们所需的只是几千种措辞的措辞特色,而不是哀求这几千种措辞被完备标记。

机器学习在措辞学领域的运用,对我们理解措辞本身、天下变革的办法,以及“机器如何理解措辞”将产生深远的影响。
这个新兴的学科使得许多措辞能够直接以笔墨和语音的形式翻译成其他措辞。

事实上,这个新兴学科的目的便是通过人工智能技能,来实现机器的即时翻译,终极赛过人类的同声传译,乃至更进一步帮助环球各种措辞利用者们实现无障碍互换。