Projects:semi mt

From IIIS-Systems
Jump to: navigation, search

项目名称

神经机器的半监督学习

项目介绍

神经机器翻译是一种全新的基于神经网络的机器翻译框架,在近几年来取得了巨大发展,已成为主流的翻译框架之一。神经机器翻译依赖于端到端的训练框架,直接对双语数据的翻译概率进行建模,使得其不像传统的通机器翻译需要依赖于各种子模型。然而,这种端到端的模型也导致他无法像传统的机器翻译轻松的加入单语数据。与单语数据相比,双语数据受限于其覆盖度,质量与数量,因此,如何将单语数据加入神经机器翻译中是一个重要的研究方向。本项目针对此问题提出自己的基于autoencoder的半监督学习,在翻译质量上取得了显著性的提高。

参与人员

程勇

徐葳

何中军

何为

吴华

孙茂松

刘洋

相关资料

项目进展

已在ACL上发表论文一篇,并继续针对其他稀疏语言对缺少训练语料展开研究。