博士生徐博的论文被《计算机学报》录用
新闻来源:IR实验室       发布时间:2017/7/3 8:59:23

近日接到通知,博士生徐博的论文“一种融合语义资源的生物医学查询理解方法”被计算机领域权威性学术期刊《计算机学报》录用。

该文摘要如下:

近年来,随着生物医学相关研究的快速发展,生物医学文献的数量与日俱增,相关人员从海量文献中获取所需信息变得越来越困难,信息检索技术能够为用户提供所需信息,但由于领域专业度高,术语庞杂,传统通用领域的检索技术往往很难胜任这项任务,而生物医学领域存在丰富的语义资源,这些资源涵盖该领域专业术语,可以对文献检索起到辅助和提升作用。因此,为进一步提升生物医学文献检索的性能,本文尝试基于词共现查询扩展模型,结合生物医学领域特征,利用医学主题词表衡量扩展词的重要性,综合权衡扩展词与查询词的共现关系和扩展词在医学主题词表中的分布情况,选择优质扩展词;并在此基础上提出一种基于组排序学习的监督式查询扩展方法,该方法根据候选扩展词对检索性能的影响和候选扩展词能否反映查询的主题信息两个方面对扩展词进行相关性标注,提取与扩展词相关的上下文特征和领域语义特征对扩展词进行向量化表示,最后采用组排序学习方法训练扩展词选择模型,完成查询扩展。在TREC基因任务数据集上的实验结果表明,本文方法能够有效提升查询扩展性能,相比于基于排序学习方法ListMLE的监督式查询扩展方法在文档平均准确率方面分别提升4.41%11.35%,有效提升了生物医学文献检索的综合性能。