近日, EMNLP2023程序委员会发布了录用消息,张冬瑜老师与硕士生于靖薇、靳森源的论文“MultiCMET: A Novel Chinese Benchmark for Understanding Multim odal Metaphor”被findings of EMNLP 2023录取为长文。
标题:汉语多模态隐喻理解的新基准
摘要:隐喻是人类交际中一个普遍存在的方面,随着大众传媒的发展,隐喻常常以多模态的形式出现。然而,对英语以外的多模态隐喻资源的研究却非常有限。此外,现有的自然语言处理工作并没有涉及对隐喻中的源域和目标域进行分类的探索。考虑到认知语言学领域进行的广泛研究,这类研究的缺失意义重大。认知语言学领域强调,对隐喻的深刻理解依赖于识别领域类别之间的差异和相似性。因此,我们介绍了MultiCMET,这是一个多模态汉语隐喻数据集,由13820对广告文本图像对组成,其中手动注释了隐喻的出现、领域类别和隐喻传达的情感。我们还构建了一个包含隐喻源域和目标域分类的领域词典,并提出了一个级联领域知识集成(CDKI)基准,通过引入特定领域的词汇特征来检测隐喻。实验结果证明了CDKI的有效性。数据集和代码是公开的。