>>最受欢迎的情感词典,欢迎点击下载!<<
研究方向
学术报告
资源下载
当前位置: 首页>>新闻动态>>正文
    实验室关于生物医学文本挖掘研究成果被期刊JBI和JBHI录用
    2023-06-20 13:41 张晓堃 

    近日,实验室关于生物医学文本挖掘研究成果发表在生物信息学重要期刊JBI和JBHI。

    实验室博士生杨雨濛关于生物医学命名实体识别的研究成果被多被生物信息学领域领期刊Journal of Biomedical Informatics (JBI)录用。JBI属于JCR一区、CCF推荐C类、清华计算机学科推荐B类期刊。

    题目: ADPG: Biomedical Entity Recognition Based on Automatic Dependency Parsing Graph

    简介:命名实体识别是文本挖掘中的一项关键任务。在生物医学领域,实体识别的重点是从大规模生物医学文本中提取关键信息,用于后续的信息提取任务。生物医学文献中包含大量的长依赖文本,以往的研究利用外部句法解析工具捕获句子中的词依赖,实现嵌套的生物医学实体识别。然而,外部解析工具的加入往往会给当前的辅助任务引入不必要的噪声,并且不能以端到端的方式提高实体识别的性能。为此,本文提出一种新的自动依赖解析方法,即ADPG模型,以端到端的方式融合句法结构信息,实现生物医学实体的识别。该方法基于多层Tree-Transformer结构自动提取长依赖句的语义表示和句法结构,然后结合多层图注意力神经网络(GAT)提取句法结构中词间的依赖路径,以提高生物医学实体识别的性能。我们在三个生物医学领域和一个新闻领域的数据集上对ADPG模型进行了评估,实验结果表明,我们的模型在这四个数据集上取得了最先进的结果,具有一定的泛化性能。


    实验室博士生赵颖闻关于蛋白质功能预测的研究成果被期刊IEEE Journal of Biomedical Health Informatics(JBHI)录用。JBHI属于中科院一区、CCF推荐C类期刊,影响因子为7.021。

    题目:Improving protein function prediction by adaptively fusing information from protein sequences and biomedical literature

    简介:蛋白质是生命活动的主要承担者,准确预测其生物功能可以帮助人类更好地理解生命机理,促进自身的发展。随着高通量技术的快速发展,大量的蛋白质被发现。然而,蛋白质与功能注释之间的差距仍然很大。为了加快蛋白质功能预测的进程,人们提出了多种利用蛋白质组数据的计算方法。在这些方法中,基于深度学习的方法是目前最流行的,因为它们能够从原始数据中自动学习信息。然而,由于数据之间的多样性和规模差异,现有的深度学习方法要有效地从不同的数据中获取相关信息是很有挑战性的。在本文中,我们介绍了一种能够从蛋白质序列和生物医学文献中自适应学习信息的深度学习方法,即DeepAF。DeepAF首先通过使用不同的特征提取器来提取这两种信息,这些特征提取器是基于预训练语言模型建立的,可以捕获初级的生物知识。然后,为了整合这些信息,它基于Cross-attention机制实施一个自适应融合层,可以考虑到两种信息之间的知识交互。最后,基于混合信息,DeepAF利用逻辑回归来获得预测得分。在两个物种(即人类和酵母)上的实验结果表明,DeepAF优于其他先进的方法。

    关闭窗口