实验室参加BioCreative VI评测并取得优异成绩
新闻来源:IR实验室       发布时间:2017/10/24 9:25:20

近日,实验室罗凌同学参加了国际著名BioCreative VI评测(http://www.biocreative.org/),并在Track4中的生物医学文本分类任务中获得好成绩。本届BioCreative评测由美国国立生物技术信息中心National Center for Biotechnology Information, NCBI)和美国特拉华大学(University of Delaware)等主办,吸引了来自全球相关科研机构和高校的广泛关注和参与,本次评测总共包含5Track

我们参加了Track4Mining protein interactions and mutations for precision medicine)。该部分包含两个任务:文本分类任务(Document Triage Task):识别描述由基因变异影响的蛋白质交互关系的相关文献和关系抽取任务(Relation Extraction Task):从文献中抽取出基因变异影响的蛋白质交互关系对。我们参加了其中的文本分类任务,该任务有来自世界范围的10支参赛队伍,总共提交了22个结果;我们提交的最好结果在在所有队伍中F1值指标取得了第三名;在平均准确率指标上获得了第一名。官方结果如下:

 

20171024-1.png

 

在评测中,我们使用了多个神经网络模型集成的方法,整体流程如下图所示:

20171024-2.png

 

在我们的方法中,输入层使用了词向量和一些额外特征(词性POS和实体识别NER信息);然后训练了长短期记忆网络(LSTM)、卷积神经网络(CNN)、双向LSTM结合卷积层网络(BiLSTM-CNN)、循环卷积网络(RCNN)和层次长短期记忆网络(Hie-LSTM)五个模型;最后通过加权多数投票的方法对这些模型的结果进行集成。

该评测的专题讨论会(BC VI Workshop)最近于201710月在美国召开,会议论文集可在http://www.biocreative.org/media/store/files/2017/ProceedingsBCVI.pdf下载。我们系统的相关评测论文题目为《DUTIR at the BioCreative VI Precision Medicine Track: Document Triage for Identifying PPIs Affected by Genetic Mutations》。