近日,实验室举行了博士生李楠的博士学位论文答辩会,李楠博士顺利通过博士答辩,获得了博士学位。李楠博士的多项研究成果发表在国内外知名期刊上。李楠博士的论文题目是《面向生物医学知识图谱的表示学习算法研究》,其指导教师为杨志豪教授。论文摘要如下:
生物医学知识图谱作为推动生物医学领域发展的核心驱动之一,被广泛应用于智能医疗、辅助诊断等任务。利用知识图谱推理技术挖掘生物医学知识图谱中的隐含知识关联,对生物医学领域的发展有着重要意义。近年,随着基于知识图谱表示学习研究兴起,在知识表示、知识推理等方面都取得了突破性的进展,表现出了极大的潜力。具体来说,本文的主要研究内容如下:
(1) 针对现有基于欧式空间的生物医学知识图谱嵌入方法无法在低维情况下对层次信息进行充分建模的问题,本文将生物医学知识图谱嵌入到双曲空间中。该方法借助切空间到双曲空间的映射,将知识图谱嵌入到双曲空间。相较于欧式空间,双曲空间更容易捕获和恢复层次特征,可以以相对较低的维数和较少的参数对知识图谱建模。此外,提出同时考虑实体与关系的可训练曲率。实验结果表示该方法能够在低维情况下获取更好的性能。
(2) 针对现有生物医学知识图谱嵌入方法只关注于知识图谱的拓扑特征,未充分利用知识图谱中隐含的类信息,导致获取的表示不准确的问题。本文提出了融合类信息的自监督学习框架。该框架首先采用知识图谱嵌入模型获取拓扑特征,然后利用聚类模块获取生物实体的类标签,最后采用自监督学习机制将类特征与拓扑特征进行有效结合。在多项生物关系预测任务上实验表明,融入类信息能够有效提升知识图谱嵌入模型的性能。
(3) 针对现有的小样本知识图谱补全方法背景图利用不充分以及关系语义差距大的问题,本文提出基于背景图增强的小样本知识图谱补全方法。该方法首先通过背景图知识蒸馏器将背景图知识迁移到小样本学习器中,然后利用注意力原型聚合器,缓解支持集与查询集语义差异过大的问题。在不同领域的数据集上进行链接预测的实验结果表明,该模型相较于对比方法能够获取更好的性能。