Facebook提出全新CNN机器翻译
发布时间:2017-05-15Facebook人工智能研究中心(FAIR)发布了使用全新的卷积神经网络(CNN)进行语言翻译的研究结果。据悉,这种新方法能够以现有的循环神经网络系统9倍的速度进行翻译,而且翻译的准确性还会得到大幅的提高。
在由机器翻译大会(WMT)提供的公开标准数据包上的测试表现来看,Facebook全新的翻译系统的性能要远超RNNs2。尤其是在CNN模式下的WMT 2014 英语-法语测试中,要比之前的最佳纪录提高了1.5个BLEU值。BLEU(Bilingual Evaluation Understudy)是运用最广泛的机器翻译准确度评判标准,系统认为,机器翻译结果越接近人工翻译,那么翻译质量就越高。
此外,Facebook全新的翻译系统在WMT 2014 英语-德语测试中,将此前的纪录提高了0.5个BLEU值,在WMT 英语-罗马尼亚语测试中,也将最好成绩提高了1.8个BLEU值。
论文摘要:序列到序列学习(sequence to sequence learning)的普遍方法是通过循环神经网络将一个输入序列映射到一个可变长度的输出序列。我们引入了一种完全基于卷积神经网络的架构。相比于循环模型,其在训练阶段中所有元素上的计算都是完全并行的,且其优化更简单,因为非线性的数量是固定的且独立于输入的长度。我们使用门控线性单元简化了梯度传播(gradient propagation),而且我们为每个解码器层都装备了一个单独的注意模块(attention module)。我们在WMT’‘14 英语-德语翻译和WMT’‘14 英语-法语翻译上的准确度表现都超过了Wu et al. (2016) 的深度LSTM 设置,且在GPU 和CPU 上的速度都实现了一个数量级的提升。
目前这项翻译项目仅仅处于研究阶段,暂时不会部署到任何Facebook产品中。不过Facebook的人工智能工程师Michael Auli和David Grangier表示这项技术迟早会融入到现有产品中。事实上,这家社交网络巨头已经使用人工智能自动翻译状态更新至其他语言,但是要从实验室孵化至商用还需要很长的路要走。
Grangier表示:"我们目前正在和产品团队进行交流,从而希望将其融入到Facebook的环境中。将学术数据迁移到真实环境中还是存在巨大差别的。学术数据是新闻型的数据,而在Facebook上交流是非常口语化的。"
来源:MIT科技评论、cnbeta、机器之心
源代码:https://code.facebook.com/posts/1978007565818999/a-novel-approach-to-neural-machine-translation/
相关论文:Convolutional Sequence to Sequence Learning. Jonas Gehring, Michael Auli, David Grangier, Denis Yarats, Yann N. Dauphin. (发表时间:2017.5.8)