《数据驱动的机器翻译技术》-黄河燕
机器翻译(Machine Translation,MT)是指利用计算机实现从一种自然语言(称为源语言)到另一种自然语言(称为目标语言)的自动翻译的过程和技术,是人工智能(Artificial Intelligence,AI)和自然语言处理(Natural Language Processing,NLP)领域的重要应用和热点问题之一。
本书从数据驱动的机器翻译角度介绍了统计机器翻译和神经机器翻译的基本模型和技术,机器翻译的评价方法及领域内相关会议。在此基础上,本书首先梳理了句法、语义等语言学知识在数据驱动机器翻译中的应用,包含了统计机器翻译、神经机器翻译及句法知识与神经机器翻译的联合学习模型。接下来,本书介绍了其他语言学知识在数据驱动机器翻译中的应用,如句对齐、翻译记忆、词形等。此外,本书介绍了数据驱动机器翻译中常见的的零代词问题以及多语言训练问题。最后,本书对数据驱动的机器翻译研究内容进行了总结,并展望未来研究方向。