>>最受欢迎的情感词典,欢迎点击下载!<<
研究方向
学术报告
资源下载
当前位置: 首页>>新闻动态>>正文
    研究室获批“大连市多模态数据智慧治理技术创新中心”平台支持
    2024-03-25 12:35 卢俊宇 

      近日,以信息检索研究室(DUTIR)为主要依托团队的技术平台获批为大连市技术创新中心-“大连市多模态数据智慧治理技术创新中心”。该中心原名 “大连市智能制造系统控制工程技术研究中心”,2022年更名为“大连市多模态数据智慧治理技术创新中心”。杨志豪教授担任创新中心主任,林鸿飞教授担任创新中心技术委员会主任。

      当前,海量多模态数据广泛存在,如何从这些数据中挖掘出隐藏的巨大价值,是现阶段大数据研究和人工智能领域关注的主要问题。大数据的数据来源广泛、形式多样,其每一种来源或形式都可以看作是一种模态,例如文本、视频、图片、语音以及工业场景下的传感数据红外、声谱等。本中心的研究目的是通过提升多模态数据的语义理解与知识表示让智能体能更深入地感知、理解真实的数据场景,更能进一步对所感知的知识进行推理,以智慧治理技术更好的支撑行业应用。

      随着人工智能技术的飞速发展,以ChatGPT为代表的大语言模型已经成为自然语言处理领域的一个关键研究方向,并且引起人们的广泛关注。本中心基于多年来的自然语言处理技术积累在垂直领域研发了三个大语言模型。 

      在生物医学领域,本中心研发了用于各种生物医学任务的双语(英语和汉语)微调的大语言模型 “太一”。在13个生物自然语言处理(BioNLP)任务上的评价结果表明,“太一”在双语多任务学习中有着巨大的潜力,与普通大模型相比,它在特定领域的任务中实现了卓越的性能。可以应用于多个下游任务,如检索增强、大模型知识图谱推理能力、多模态能力、自动问答、自动摘要生成以及信息抽取等。

    “太一”生物医学大模型

      在司法领域,本中心研发了可服务多项司法业务的大模型 - 太令。“太令”训练基础是庞大的通用中文语料库,并结合了裁判文书、合同、司法考试材料以及司法问答等专业司法数据进行深度训练。该模型可为司法业务提供全面的支持,能够自动检测并纠正司法文件中的语法、拼写和事实错误,精确提取关键信息,并提供基于历史案例的罪名预测及量刑建议等。

    “太令”司法大模型

      面对大学校园的应用场景,本中心研发了“太学”校园大模型,主要服务于学生在学习和生活中面临的各类问题咨询和服务。涵盖招生、就业、选课、成绩、保研、课外活动等方面。采取向量知识库,对校园文件、生活问答等非结构化数据进行结构化存储。采取检索增强技术:提升回复内容的真实性,减轻大模型的“幻觉”。

    “太学”校园大模型

      本中心依托大连理工大学信息检索研究室,与中国人民解放军军事科学院军事医学研究院、东软集团股份有限公司、国投智能(厦门)信息股份有限公司(曾用名:厦门市美亚柏科信息股份有限公司)、大连爱智控制系统有限公司等组成共建单位,进行多模态数据智慧治理技术的理论研究和应用探索,并将研究成果与智慧政务、智慧医疗、智慧司法、智能制造等国家经济建设发展重要领域的实际需求相结合,加快知识成果落地转化,推进产学研深度融合。

      今后,本中心将针对文本、视频、图片、语音以及工业场景下的传感数据红外、声谱等多模态数据,采用人工智能、自然语言处理技术,尤其是当前流行的大语言模型技术,面向智能制造、智慧政务、智慧医疗、智慧司法业务等实际需求,解决行业中遇到的实际问题与业务痛点,对多模态数据智慧治理技术在垂直领域的深度应用进行重要探索和实践。相关研究将突破该领域多项关键技术,并形成具有自主知识产权的一系列科研成果。同时与行业保持密切合作,进一步推进成果应用和产学研合作。

    关闭窗口