买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于超图神经网络的多模态对话情绪识别方法及系统_南京信息工程大学_202410296410.9 

申请/专利权人:南京信息工程大学

申请日:2024-03-15

公开(公告)日:2024-04-16

公开(公告)号:CN117892237A

主分类号:G06F18/2431

分类号:G06F18/2431;G06F18/2415;G06F18/25;G06N3/042;G06N3/0464;G06N3/0455;G06N3/0442;G06N3/048

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.03#实质审查的生效;2024.04.16#公开

摘要:本发明提供一种基于超图神经网络的多模态对话情绪识别方法及系统,涉及对话情绪识别领域。该基于超图神经网络的多模态对话情绪识别方法,包括以下步骤:以对话中的话语为节点,分别构建上下文文本、图像、语音模态内超图及模态间超图,使用超图卷积神经网络对超图进行聚合得到模态内和模态间节点特征表示,将节点特征表示拼接得到最终特征表示,将特征表示输入到情感分类器中,得到该话语的情绪类别。本方法采用超图神经网络来建模对话上下文和模态之间的关系,以弥补图神经网络只能捕获成对关系致使高阶信息丢失的缺陷,同时使用超边融合自适应策略和超图卷积神经网络以融合模态信息使得它们能够互相补充,从而提高整体的性能和准确性。

主权项:1.一种基于超图神经网络的多模态对话情绪识别方法,其特征在于,包括:获取说话者信息和对话中的多模态话语,其中,所述多模态话语包括文本、语音、图像;分别对多模态话语进行编码,分别提取单模态特征,所述单模态特征文本模态的特征、语音模态的特征和图像模态的特征;对说话者信息进行编码,将编码后的对话者信息嵌入单模态特征中,获得涵盖说话人信息的话语融合表示,所述涵盖说话人信息的话语融合表示包括文本模态特征表示、语音模态特征表示和图像模态特征表示;结合涵盖说话人信息的话语融合表示并使用超图神经网络构建模态内超图和模态间超图;分别对模态内超图和模态间超图引入超图卷积神经网络在超图结构中传递信息,以进行模态内和模态间特征融合,分别得到模态内超图和模态间超图聚合后的节点特征表示;将模态内超图和模态间超图聚合后的节点特征表示进行拼接,得到最终的特征表示;将最终的特征表示输入到情绪分类器中,得到情绪类别。

全文数据:

权利要求:

百度查询: 南京信息工程大学 一种基于超图神经网络的多模态对话情绪识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。