简介:
传统的情感对话系统更加侧重于生成较为丰富的回复,专注于句子粗粒度而忽略词细粒度容易导致生成的内容缺乏细腻的情绪感知,依赖于对话历史忽略用户反馈也会进一步导致情绪感知能力的不足。为此,本文中提出了一种多分辨对抗empGAN模型,同时考虑粒度和引入一个对抗学习框架来生成更恰当和善解人意的回复。实验表明,该模型在内容质量和情感感知方面都优于最先进的方法。
引言:
任务背景:
现有的情感对话生成更侧重于产生丰富的情感响应,缺少对情绪的感知研究,可能导致情感不一致问题。
任务定义:
建立一个具有同情感知心理模型
同时考虑句子级粒度和词级粒度,更加准确的捕捉情感的细微差别
将用户对话历史和用户生成的响应反馈进行建模
主要贡献:
提出了一个多分辨率情感生成网络,主要有两个部分组成,一个是情感生成器,一个是交互式对抗网络。情感生成器又包含了三个部分,分别是对语义上下文的编码,粒度级别的建模和对上下文以及情感词情感标签的解码器。
相关工作:Seq2SeqGAN已经在情感生成方面取得了不错的效果,但是该模型中的对抗网络容易产生鉴别器饱和的现象,会造成梯度消失,进而会导致模型的崩溃。有些相关的工作对情感生成方便有了很大的兴趣,但只是对单一的粒度级别去进行建模,导致生成的情感对话不够准确,该篇文章中提出的模型恰好解决了这一项困难的工作。
问题阐述:
语义上下文用一下表示:
情感词用一下表示:
生成的响应表示方式:
情感词表的表示方式:
最大化生成的概率表示公式:
该模型用到的数据集表示:
Emotion text:
{ 0: no emotion, 1: anger, 2: disgust, 3: fear, 4: happiness, 5: sadness, 6: surprise}
模型总览:
第一部分:
第二部分:
第三部分:
解码器的Attention机制:
对抗网络部分:
实验部分:
l EmpG: Empathetic generator
l EmpD: EmpG with Vanilla GAN
l EmpWD-next: EmpG with semantic discriminator without user feedback
l EmpWD: EmpG without emotional discriminator
可以看出来,我们的模型在三个指标上都取得了不错的分数,明显的优于所选取的baseline,EmpG与EMO-HRED相比的实验结果表明,除了在BLUE值上的分数相差不大之外,其他指标的分数都明显优于所选取的基线模型,这也表明我们模型在不同的粒度建模是是有这明显的作用的,EmpD与EmpG相比可以看出来在添加了对抗网络之后,模型的效果也是有提升的,其次是用户的反馈也起到了一定的作用。
总结:
该篇文章提出了一个EmpGAN模型,模型中对不同粒度级去进行建模,还有添加了一个对抗网络使生成的内容更加的丰富,更加的准确,通过之后的实验结果比较我们的模型也是非常的可靠。