>>最受欢迎的情感词典,欢迎点击下载!<<
研究方向
学术报告
资源下载
当前位置: 首页>>新闻动态>>正文
    实验室王治政博士通过博士学位论文答辩
    2023-05-12 14:12  

      2023510日实验室举行了博士生王治政的线下博士学位论文答辩会,王治政博士顺利通过博士答辩,获得了博士学位。王治政博士的多项研究成果发表于国内外知名期刊和会议上,并获得了大连理工大学优秀博士论文特别奖学金的资助。王治政博士的论文题目是《多元特征增强的网络表示学习算法研究及应用》,其指导教师为孙媛媛教授。论文摘要如下:

      近年来,随着信息网络的崛起,网络数据逐渐成为工业生产中的重要资源。基于特征学习的数据挖掘技术伴随着表示学习和图神经网络技术的研究取得了突破性进展。然而,现有方法在网络数据的多元特征增强和特定领域的应用性研究等方面面临着巨大的挑战。为此,围绕基于特征学习的数据挖掘关键技术,本文按照从多元静态特征到多元动态特征、从通用算法研发到特定领域应用的技术路线开展了面向网络数据的知识表示算法与应用研究。本文的主要工作有,

      首先,在面向多元静态特征的符号化网络表示算法研究中,本文以具有文本属性的语义网络为研究对象,提出了一种基于属性特征融合的语义网络编码器SemNE,旨在解决语义网络嵌入中的属性信息丢失问题。该编码器首先使用分层优化算法整合网络嵌入模型和语言模型来学习事实的拓扑特征和语义特征,然后通过设计递归式的词自组织方法来统一多属性特征的表示粒度,从而实现多属性特征的有机融合,最后本文提出了一种扩展方案将SemNE作为预训练模型应用于知识图谱的表示学习研究中。在二元语义网络和知识图谱上的关联事实预测实验表明,SemNE不仅能够实现性能上的提升,而且能够发现潜在的关联知识,从而推动了语义网络上的隐含知识发现。

      其次,在面向多元动态特征的结构化网络表示算法研究中,本文以具有历史和增量信息的动态网络为研究对象,提出了一种基于历史特征回放的动态网络表示模型CLDNE,旨在解决网络嵌入模型在学习增量知识时面临的历史知识遗忘问题。该模型首先通过经验回放模块采样历史数据以减小训练数据的规模,提升模型的训练效率,然后设计一种流式的图自编码器在增量数据和回放数据上学习新模型,保留增量数据的全局拓扑特征,最后采用增量正则化模块将历史模型中的知识蒸馏到新模型中,从而缓解动态网络表示模型的稳定性-可塑性困境。在多个动态网络上的链路预测实验表明,CLDNE在保持旧知识和适应新知识之间实现了更好的平衡,在训练时间上相较于模型重训策略减少了80%,并且在不同的网络挖掘任务和动态增量模式中均具有良好的适应性。

      然后,在面向时序演化特征的结构化网络表示算法研究中,本文以具有时间约束的动态网络为研究对象,提出了一种基于长距离拓扑特征增强的时序网络表示算法LongTNE,旨在解决时序网络嵌入中多元特征的低耦合问题。该算法首先通过构建网络的层次结构来学习节点的长距离动态拓扑特征,然后使用自监督学习机制来构建无标注网络的伪监督信号,以提升数据优化的效率,最后配置前向累积更新模块来充分耦合网络的拓扑特征和全局时序特征,从而获得时序网络的增强表示。同时,该算法通过使用微调预训练节点向量的两阶段策略来提升模型的泛化性和扩展性。在多个时序网络上的实验结果表明,LongTNE在探索时序网络的增强表示时,具有发现深层知识和捕捉演化知识的能力,并且表现出了很强的适应性和泛化能力。

      最后,在基于领域特征的网络嵌入算法应用研究中,本文在司法领域和公共卫生领域开展了依托领域内容指导的知识图谱构建和领域业务应用。在司法领域中,本文设计了领域知识本体来构建涉毒类刑事案件的司法知识图谱,并将本文提出的语义网络编码器应用于司法知识图谱的表示来开展量刑预测研究,以提升司法判决规则的可解释性。基于知识本体,本文面向涉毒类刑事案件构建了四个涉毒知识图谱,并且证明了SemNE方法在量刑预测任务中的有效性。在公共卫生领域中,本文开发了病例信息提取系统来构建COVID-19感染病例的新冠知识图谱,并将本文提出的时序网络表示算法应用于病毒传播网络的增强表示来开展基于知识图谱的传播链路预测研究,以排查感染病例间的潜在传播路径。基于病例信息提取系统,本文面向中国大陆发布的感染病例构建了九个新冠知识图谱,并且证明了LongTNE算法在传播链路预测研究中的可行性。


    关闭窗口