2021年12月4-5日,第七届中国健康信息处理大会(CHIP2021)因疫情改为线上举行,由中国中文信息学会医疗健康与生物信息处理专业委员会主办,西南医科大学和哈尔滨工业大学(深圳)承办。是 “以信息处理技术助力探索生命之奥秘、提高健康之质量、提升医疗之水平”为主旨的年度会议。 CHIP 是中国健康信息处理领域的重要会议,是世界各地学术界、企业界和政府部门的研究人员和从业人士分享创意,进一步推广领域研究成果和经验的重要平台。 健康信息处理是生命健康、临床医疗领域的核心内容,长期以来受到广泛关注。
林鸿飞老师担任本次会议的程序委员会联合主席,并在开幕式做程序委员会工作报告,闭幕式颁发CHIP2021最佳论文。
林鸿飞老师担任医疗健康与生物信息处理专业委员会副主任,杨志豪、张益嘉老师为专委会委员。
实验室在此次会议发表论文4篇,并做了口头报告。主要体现了实验室在面向生物医学领域的文本挖掘和知识发现的研究成果。
[1] 汤文泰, 王健, 林鸿飞, 赵迪, 徐博, 张益嘉, 杨志豪. Structure Guided Syntactic Enhancement for Medical Relationship Extraction.(医学关系抽取中结构引导的句法增强方法)
医学关系提取是当前医学诊断的一个重要辅助手段,它可以利用医学文本快速确定医学关系。句法特征的增强是这项医学任务中的一个重要挑战。然而,以前获取句法特征的模型通常忽略了浅层的句法信息,如句法结构。本文提出了一个模型,将句法结构引入卷积神经网络模型,以增强非局部的句法依赖性。此外,我们采用了一种跨领域的剪枝方法来平衡本地和非本地的句法依赖。在跨句子n-ary关系提取和大规模句子级关系提取方面的大量结果表明,我们的模型明显优于以前的方法的结果。此外,通过消减实验,证明了句法结构和剪枝方法对句法特征的增强是有效的。这种引入句法结构的句法强化方法有助于获得句子中的非局部互动,有效地强化了句法特征。并为今后的研究方向提供了新的思路
[2] 崔宾, 王健, 林鸿飞, 张益嘉, 杨亮, 徐博. Emotion-Based Reinforcement Attention Network for Depression Detection on Social Media.(基于情感的强化注意网络在社交媒体抑郁症检测中的应用)
随着深度学习的发展,抑郁症检测最近在自然语言处理中受到关注。这项任务的目的是根据用户在社交媒体上的历史帖子来检测用户的抑郁倾向。现有的工作主要分为两类。使用所有历史帖子和选择抑郁症指标帖子。然而,这些方法不能有效地提取深层次的情感语义信息。为了克服这个为了克服这个问题,我们提出了一个模型来提取深层情感语义特征,并根据情感状态来选择指标帖子。
在本文中,我们提出了一个基于情感的强化注意力模型,用于社交媒体上用户的抑郁症检测。该模型由两部分组成:用于捕获深层的情感语义信息的情感提取网络,以及用于选择抑郁症指标帖子的RL注意力网络。最后我们将这两部分的输出融合进行抑郁症检测。
在MDDL数据集上的实验结果表明,本文所提出的模型优于最优模型。具体来说,所提出的模型在准确性、精确性、召回率和F1分数分别为90.6%、91.2%、89.7%和90.4%。
本文所提出的模型利用用户的历史帖子进行抑郁症检测,可以有效地识别用户的抑郁症倾向。实验结果表明,情感提取网络和基于情感状态的RL选择层可以显著提高模型的性能。此外,句子级的注意力可以捕获核心帖子。
[3] 王琰,王健,林鸿飞,吕慧怡,徐冰,张益嘉. CPJE: Conditional Probability Joint Extraction of Nested Biomedical Events.(CPJE:基于条件概率联合抽取生物医学嵌套事件)
事件抽取在自然语言处理中具有非常实用的价值。在生物医学领域,事件嵌套现象(即事件A是事件B的参与角色)使得提取此类事件比提取单个事件更加困难。因此,抽取嵌套生物医学事件的性能总是差强人意。此外,先前的工作依赖于管道方式来构建事件抽取模型,该模型忽略了触发词识别和事件元素检测任务之间的依赖性,并产生了大量的级联误差。鉴于上述事实,我们提出了一种端到端的联合抽取模型,该模型考虑了触发词的概率分布,以缓解级联误差。此外,我们将句法结构集成到基于注意力机制的图卷积神经网络中,以捕获触发词和相关实体之间的潜在依赖关系,从而提高嵌套生物医学事件的抽取性能。实验结果表明,我们提出的方法在MLEE生物医学事件抽取语料库中取得了最好的F1值,并在BioNLP-ST 2011 GE语料库中取得了良好的性能。
[4] 王鑫, 王健, 徐博, 林鸿飞, 张博, 杨志豪. Exploiting Inter-sentence Information for Better Question-driven Abstractive Summarization.(利用句间信息实现更好的问题驱动的生成式文本摘要)
问题驱动的文本摘要可以对源文档进行总结,并为非事实类问题生成简洁一致的摘要,。然而现有方法不能充分利用文档上的问题信息和句子之间的依赖关系。此外,大多数现有的摘要评估工具(如ROUGE)计算生成的摘要和参考摘要之间的N-gram重叠,而无法评估事实一致性问题。在本文中,我们提出了一种新的基于Transformer的模型,名为Trans-Att,用于生成简明一致的非事实类QA的答案摘要。具体来说,本文提出了一种两步注意机制,利用问题与上下文和句子之间的相互信息。此外,我们还引入了一个整体集成机制用于信息集成和一个多视角的指针网络。在评价方式上,我们进行问答任务,以评估生成的摘要和参考摘要之间的事实一致性。在PubMedQA数据集上进行的问题驱动的文本摘要的实验结果表明,我们的模型与最先进的方法性能相当,在ROUGE-2分数上的提高了0.79。问答任务表明,我们的模型生成的摘要具有更好的事实一致性。