信息处理

 翻译样例中心 >> 电信翻译样例 >> 信息处理

翻译样例: 树到串统计翻译模型研究
版权信息   版权信息

词语对齐对统计机器翻译而言至关重要,因为经过词语对齐的语料是极有价值的翻译知识源。本文为词语对齐提出对数线性模型框架。在此框架下,所有的知识源被视作依赖于源语言句子、目标语言句子以及可能的其他变量的特征函数。对数线性模型使统计对齐模型易于扩展,方便加入更多的语言学信息,从而能同时处理与具体语言相关和不相关的语言现象。本文讨论了框架的形式化定义、特征函数、最小错误率训练、搜索算法以及n-best 列表生成等问题。

1. 嵌入句法树的基于短语的翻译模型,简称模型 1。此模型在传统的基于短语的模型的基础上以隐变量的方式嵌入句法树,从而可以利用句法信息指导短语的切分、重排序和翻译。模型1 只使用句法双语短语,搜索空间比传统模型小。我们的主要创新点是提出了树节点重排序,实现了利用句法信息指导短语重排序。

2. 基于树到串对齐模板的翻译模型,简称模型2。此模型在模型1 的基础上提出了树到串对齐模板。树到串对齐模板描述了源语言句法树和目标语言串之间的对齐关系。它既能生成终结符又能生成非终结符,既能执行局部的重排序又能执行全局的重排序。

3. 融入森林到串规则的树到串翻译模型,简称模型 3。此模型对模型2 进行扩充,引入森林到串翻译规则,通过描述森林和串之间的对齐关系来捕获非句法短语,使表达能力得到进一步提升。为了将森林到串翻译规则融入到树到串翻译模型中,我们引入辅助规则来提供泛化层。

收稿邮箱: sotrans@126.com
QQ: 1169561052    MSN: jesczhao@hotmail. com

最新翻译样例

相关翻译样例

专业英语词汇频道