>>最受欢迎的情感词典,欢迎点击下载!<<
研究方向
学术报告
资源下载
当前位置: 首页>>新闻动态>>正文
    生物医学文本挖掘领域多项研究成果被Knowledge-Based Systems等期刊录用
    2021-08-05 09:14 张晓堃 

    近日,博士生赵迪分别收到Neurocomputing、Knowledge-Based Systems和Applied Soft Computing期刊的论文录用通知,论文研究内容包括生物医学文本表示和生物医学关系抽取。

    题目1:Improving biomedical word representation with locally linear embedding

    摘要:分布式表示能够有效表示文本的语义信息,在生物医学文本表示中得到了广泛的应用。然而,分布式表示从大规模的语料库中通过计算得到,在这个过程中,分布式表示忽略了文本向量的几何结构对文本语义整体信息的影响。因此,本文提出基于流形学习的生物医学文本嵌入框架。首先使用分布式词表示模型得到单词预训练词向量,然后使用流形学习方法对预训练词向量进行再嵌入。为了验证本章所提框架在生物医学文本领域的有效性,使用电子病历数据对算法进行评估。实验结果表明,本章提出的模型能够有效提升电子病历数据的分类结果和词相似度结果。

    题目2:Sentence representation with manifold learning for biomedical texts

    摘要:本文使用流形学习对生物医学文本句子表示进行重新嵌入表示。从而有效刻画句子表示之间的几何结构关系,使得句子表示能够准确表示句子之间的关系,改善生物医学文本下游任务效果。通过在生物医学文本数据上进行聚类和分类实验,实验结果表明,本文方法显著改善了神经网络模型句子嵌入效果。

    题目3:Biomedical cross-sentence relation extraction via multihead attention and graph convolutional networks

    摘要:现有的关系抽取方法只考虑使用独立序列或依存关系的端到端方法。一方面,基于序列的模型在捕捉长距离依赖关系方面的效率较低。另一方面,基于依存关系的模型在生物医学领域面临较低的解析精度,这会降低生物医学关系提取性能。为了缓解这些问题对跨句关系抽取性能的影响,本文探索了基于多头注意机制和图卷积网络结合的神经网络模型。本文的模型依赖于直接绘制句子整体依存关系的自注意力机制。与基于依存关系的方法相比,自注意机制的一个主要优点是它实现了两个词之间的直接联系,而不考虑它们在句子中的句法关系。此外,为了保存两个词之间的实际依存关系信息,使用图神经网络对依存关系图信息编码,以引导多头注意力学习实际的依存关系信息。此外,实体的位置信息在关系抽取中起着重要的作用。由于交叉句比单句长,定义实体位置信息有助于模型的分类,通过上述设计,本文模型可以很好地集成序列和图形信息,有助于生物医学跨句关系提取。

    关闭窗口