信息处理

 翻译样例中心 >> 电信翻译样例 >> 信息处理

翻译样例: 基于统计方法的汉语依存句法分析研究1
版权信息   版权信息

书写描述各种语言现象的句法规则是十分困难的,但人工对一个具体的句子进行句法分析相对要容易一些。当前最著名的树库是Penn Treebank,是目前使用最为广泛的英文树库。Penn treebank 前身为ATIS 和华尔街日报(WSJ)树库,它的第一版出现于1991 年中期, 第二版出现于1994[15]。从第一版出现到现在Penn treebank 已发展了十几年,整个过程一直都在维护、修正。Penn Treebank 具有较高的一致性和标注准确性,已经成为当前研究英语句法分析所公认的训练集和测试集。

随着Penn Treebank 的成功,其他语言的树库标注工作也纷纷展开,德语、希伯来语、日语、西班牙语等语言都建立了自己的树库,开展句法分析的研究工作[16-19]。汉语方面,相应的树库建设工作也已经开始展开,较早的是台湾中央研究院标注的Sinica 树库[20]、美国宾夕法尼亚大学Penn Chinesetreebank 树库[21],以及清华大学的汉语树库[22]。这些树库多采用短语结构的标注形式。除了短语结构之外,基于依存的树库建设工作,在国外的一些语言中也已经开始展开。比较著名的依存树库有捷克语的布拉格树库[23],英语的PARC树库[24],以及俄语、意大利语等语言的树库。在汉语的依存树库建设方面,Lai 等人开展了依存语法的分析和标注工作,但其标注语料的规模较小,有5000 词左右[27]。

收稿邮箱: sotrans@126.com
QQ: 1169561052    MSN: jesczhao@hotmail. com

最新翻译样例

相关翻译样例

专业英语词汇频道