实验室关于疾病诊断和视觉推理的两篇论文被 IJCAI 2026 录用-信息检索研究室

研究方向

学术报告

资源下载

当前位置：首页>>新闻动态>>正文

实验室关于疾病诊断和视觉推理的两篇论文被 IJCAI 2026 录用

2026-05-07 20:38

近日，IJCAI 2026 公布了录用论文列表，实验室两篇长文被录用。IJCAI 是机器学习领域的顶级会议，在 CCF 推荐列表中认定为 B 类国际学术会议。

1. BrainCGT：一种用于神经系统疾病诊断中因果连接建模的脑图 Transformer

标题：BrainCGT: A Brain Graph Transformer for Modeling Causal Connectivity in Neurological Disorder Diagnosis

作者：张冬瑜老师，博士生 Shehzad Hafiz Muhammad Ahsan 等

摘要：脑连接模式分析对于发现生物标志物和理解神经系统疾病的病理生理机制具有重要意义。现有先进方法主要基于无向功能连接指标，并采用图 Transformer 进行建模。然而，这种对对称的、基于相关性的连接指标的依赖，忽略了脑区之间具有方向性的因果信息流，即有效连接。因此，这些模型可能遗漏关键的方向特异性生物标志物，从而导致潜在的误诊，并且缺乏机制层面的可解释性。为了解决上述局限，本文提出了因果脑图 Transformer（Causal Brain Graph Transformer, BrainCGT），这是一种将从 fMRI 时间序列中推断得到的模块化有效连接纳入建模的新框架。该架构引入了方向感知输入嵌入和方向偏置注意力机制，以显式学习图中非对称、有向结构的特征。我们在三个大规模 fMRI 数据集 ADNI、PPMI 和 ABIDE 上验证了 BrainCGT。实验结果表明，BrainCGT 在诊断准确率方面持续优于现有先进基线方法。研究结果进一步证明，利用模块化因果连接能够提升神经系统疾病分类的稳健性与可解释性，并具有重要的临床应用价值。

2. MedVCoT：通过潜在视觉推理弥合医学视觉质量评估中的模态差距

标题：MedVCoT: Bridging the Modality Gap in Medical VQA through Latent Visual Reasoning

作者：徐博老师等

摘要：随着临床实践中对可信赖人工智能的需求日益增长，可解释性与准确性同样至关重要。然而，当连续的视觉信号被强制转换为离散的文本空间进行推理时，医学视觉问答的模态差距十分显著，必要的诊断信息丢失会导致精度低下和“黑箱”式的不透明性。为了解决这个问题，我们提出了MedVCoT，它将潜在视觉推理融入到医学视觉问答领域。MedVCoT并非简单地集成模块，而是利用MedSAM的专业知识训练一个大型视觉语言模型，使其能够在“视觉思维链”中自主生成一致且连续的潜在视觉标记。这种机制迫使模型在形成文本诊断之前，在潜在空间中明确地“看到”病变，从而确保答案基于可验证的视觉证据，而非统计上的臆想。我们通过一个循序渐进的三阶段训练流程来实现这一目标：医学特征对齐、利用生成的潜在标记进行视觉推理学习，以及针对复杂临床场景的指令调优。大量实验表明，MedVCoT 在多个基准测试中均取得了最先进的性能，显著优于其他方法。同时，它还提供了像素级分割掩码来验证其诊断推理能力。

【关闭窗口】