IR实验室在CCKS2018中文电子病历实体识别评测中取得佳绩
新闻来源:IR实验室       发布时间:2018/8/22 16:27:43

  近日,在国内知识图谱、语义技术、链接数据等领域的核心会议——全国知识图谱与语义计算大会CCKS2018举办的面向中文电子病历的命名实体识别评测中,由实验室杨志豪老师指导,罗凌、李楠、李帅驰组成的DUTIR队伍获得第三名(共69个队伍参加),并且与前两名的成绩差距均在1%以内,这表明我们的命名实体识别技术在中文医学文本处理上也处于一流水平。

1.jpg

  CCKS是由中国中文信息学会语言与知识计算专委会定期举办的全国年度学术会议。致力于促进国内知识图谱领域的技术发展,为从事相关领域理论和应用研究的学者、机构和企业提供广泛交流的平台,已经成为国内知识图谱、语义技术和知识计算等领域的核心会议。

2.jpg

本评测任务为面向中文电子病历的命名实体识别,即对于给定的一组中文电子病历纯文本文档,识别并抽取出相关的实体,并将其归类到预先定义好的类别,主要包含解剖部位、症状描述、独立症状、药物与手术五种类别。数据集分为训练集和测试集,组委会分别提供了600份现病史文档作为训练集,400份作为测试集。

3.png