2020年10月30日-11月1日,实验室师生参加了线上举行的,由中国中文信息学会主办海南大学承办的第十九届全国计算语言学会议CCL2020,会议是国内自然语言处理的旗舰会议,历史悠久,特色鲜明。CCL着重于中国境内各类语言的计算处理,为传播计算语言学最新的学术和技术成果提供了广泛的交流平台。
此次大会研究室承办并主持了“小牛杯”幽默计算评测,幽默计算近年来已成为自然语言处理领域的新兴热点之一,主要研究如何基于计算机技术进行幽默的识别、分类与生成。幽默的产生往往依赖于上下文信息,如对话中的幽默通常需要一个铺垫过程。在情景喜剧中,部分话语承担了引人发笑的作用,通常称其为笑点(Punchline)。本年度幽默计算任务以情景喜剧为载体,要求参赛者从剧情对话中识别笑点。本次评测选取了两部不同语种的情景喜剧(英文为《老友记》,中文为《我爱我家》)作为数据来源。根据场景和剧情的变化,情景喜剧被划分成对话(Dialogue)及连续的对白(Utterance)。参赛者需要结合上下文语境内容对对白是否幽默作出判断,识别出情景喜剧中的笑点。在数据规模方面,英文数据约包含700个对话,10000个对白;中文数据包含约500个对话,18000个对白。
在此次大会上研究室发表论文2篇,相关同学进行了口头报告。论文题目分别是“基于多粒度语义交互理解网络的幽默等级识别”(张瑾晖等)和“基于预训练语言模型的案件要素识别方法”(刘海顺等)。