9月22-26日,第十一届自然语言处理与中文计算国际会议(NLPCC2022)在桂林举办。期间,组委会揭晓了今年NLPCC的评测结果,实验室两支参赛队伍分别在‘对话文本分析’任务及‘面向科学文献的多标签分类’任务中取得第一名和第二名的成绩!
NLPCC由中国计算机学会主办,是自然语言处理(NLP)和中文计算(CC)领域的顶级国际前沿会议,每年会议都秉承国际化和一流化的严格标准来进行自然语言处理任务的开放评测,推动相关任务的研究和发展。今年实验室参加的评测具体情况如下:
赛道:NLPCC2022Task6Track1
评测题目(中文):对话文本分析
评测题目(英文):Dialogue Text Analysis, Topic Extraction and Dialogue Summary
名次:1/50
参赛人员:潘丁豪、谭海鑫、吴江铭
评测论文题目:Dialogue Topic Extraction as Sentence Sequence Labeling
任务背景:随着语音和对话技术的发展,产生了大量的语音对话数据,这些数据包含了许多有价值的信息,例如对话参与者讨论的主题和对话摘要。通过分析对话文本数据,我们可以提高销售现场的服务质量,并评估消费者的购买意图和兴趣点。因此,我们提出了对话文本分析任务,旨在探索对话文本数据中包含的主题并生成对话摘要。该评估将帮助研究人员和开发人员更加关注主题提取和摘要生成,并为大家提供一个学术交流平台,从而进一步提高自然语言处理的研究水平,促进相关技术的应用和发展
赛道:NLPCC2022Task5Track1
评测题目(中文):面向科学文献的多标签分类
评测题目(英文):Multi-label Classification for Scientific Literature
名次:2/45
参赛人员:卢俊宇、张浩、沈哲旭、史凯元
评测论文题目:Multi-task Hierarchical Cross-Attention Network for Multi-label Text Classification
任务背景:随着科学出版物数量的不断增加,为这些文献编排层次化的索引变得至关重要。本评测要求参与者为化学领域的文献摘要建立多标签文本分类模型,该任务的难点在于解决标签的长尾分布问题和捕捉不同层次标签之间的相关性。