信息处理

 翻译样例中心 >> 电信翻译样例 >> 信息处理

翻译样例: 基于关键词语义扩展的检索策略
版权信息   版权信息

由于词不匹配问题的存在,用户有时不得不变换查询词才能找到所需要的信息。减轻这种用户负担的一种方法是由检索系统自动选择一些与查询词相关的其他词项来辅助查询,即查询扩展技术。简单的说来,查询扩展就是检索系统在进行检索之前,先根据扩展词表,自动把用户查询中的关键词的同义或者近义词扩展进来形成新的查询,然后再进行检索。

容易知道,查询扩展中最关键的技术之一就在于扩展词表的构造。目前扩展词表的构造通常有三种方式:第一种是根据语言学知识基于语义的查询扩展词表构造方法,并构建了一些大规模的手工词典例如WordNet、HowNet等;第二种是基于大规模通用语料库的统计信息例如同现概率、互信息等构造扩展词表;第三种是结合语言知识和统计信息的扩展词表构造方法,例如基于依存关系统计信息的扩展词表。

在基于语义的查询扩展研究中,人们经常利用WordNet 里提供的同义词集合和is-a 关系(上/下义关系)来选取新词扩展查询。但是从查询词出发扩展多层下义词时,扩展词的数量会随着层数的增加而快速增长,同时扩展词中无用词的数量也极大增加。因此扩展的层数确定是一个尚未解决的问题。怎样使用扩展词也是一个问题,一般认为原始查询词最能反映用户的需要,而扩展词的准确性值得怀疑,因此在使用扩展后的查询时会对原始查询词赋予较高的权重,对扩展词赋予较低的权重。但是究竟应该设为什么权值则一直没有很好的方法,通常依靠经验值给出。

收稿邮箱: sotrans@126.com
QQ: 1169561052    MSN: jesczhao@hotmail. com

最新翻译样例

相关翻译样例

专业英语词汇频道