【发明授权】基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质_哈尔滨工业大学_202111255353.2

申请/专利权人：哈尔滨工业大学

申请日：2021-10-27

公开（公告）日：2024-03-22

公开（公告）号：CN113987179B

主分类号：G06F16/35

分类号：G06F16/35;G06F18/214;G06N3/0455;G06N3/0985;G06F18/24

优先权：

专利状态码：有效-授权

法律状态：2024.03.22#授权;2022.02.18#实质审查的生效;2022.01.28#公开

摘要：本申请公开了一种基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质，属于自然语言处理技术领域。本申请首先利用编码器，通过设计不同的掩码矩阵以实现对话中各方的交互，同时引入对话历史信息，仅在词编码阶段就考虑了情感动力学的影响。然后，本申请通过利用图注意力网络实现对外部结构化情感知识的利用，从而扩充了话语的语义信息，弥补了词编码器模块在某些特定维度上知识的缺失。最终，在任务损失函数的基础上又加入了一个回溯损失以达到在训练过程中利用过去模型状态的先验经验的效果。旨在利用先前的训练经验来指导权重更新，确保模型决策更接近真实值，而不是前一个训练步骤中表现相对较差的预测。

主权项：1.基于知识增强和回溯损失的对话情绪识别网络模型，其特征在于，包括：语境和情感动态感知模块、外部知识交互模块和回溯历史状态模块；语境和情感动态感知模块，利用transformer结构作为最底层的词编码器，通过当前话语及其对应的说话人设计不同的注意力掩码矩阵，达到同时引入情感动力学以及语境影响的效果；假定一组对话集合其中L代表对话的个数，在每段对话中包含一系列Ni个话语，其中带有预定义情感标签的话语ui由说话者发出，所有的说话者组成集合所有预定义的情绪标签组成集合对于对话Dj中的第i句话语wk表示话语ui中的第k个词，Nk表示话语ui中的单词数目；在每个目标话语前预置一个特殊的标记“[CLS]”： xi表示预置特殊标记的目标话语集合，然后xi被输入到嵌入层：其中表示单词嵌入序列，Dh代表XLNet-base的输入维数，相应的单词嵌入序列被当作Transformer第一层的隐状态输入，同时也被用于知识引入模块的概念嵌入层；在transformer的最后一层输出之上又加了一层BiGRU来强调话语位置信息，具体地：采用记忆更新机制，将记忆m与l-1层的隐状态hi进行级联操作获得其中代表l-1层的记忆，记忆的工作方式类似于一个栈；L代表transformer的层数，是一个超参数；Dm是预定义的最大记忆长度；“||”类似栈中的“PUSH”操作并不改变ml-1的维数,即假定为“问询query”，为“键key”和“值value”执行多头注意力机制操作；首先在问询、键和值上进行M个不同的线性映射操作，M代表头数，对于Transformer第l层的每个注意力头：其中表示问询的线性变换结果，表示为键的线性变换结果，表示为值的线性变换结果，是每个注意力头的训练参数；然后进行相对位置注意操作：其中表示问询和键经过相对位置注意操作后的结果，表示矩阵经过掩码操作后的结果，s是一个掩码矩阵且维数与相同，在进行注意力操作时，当的第i个元素与的第j个元素之间需要掩码掉时，sij置为正无穷，其余情况置为0；最终，注意力操作的输出为：公式3到9合并为函数f·：其中表示为多头注意力机制的某个单头输出；给定目标话语和历史对话信息后，通过设计不同的掩码矩阵在编码时引入语境和情绪动力学的影响，使用四种不同的transformer块：用于全局语境建模的全局块GlobalBlock、局部语境建模的局部块LocalBlock；情感惯性建模的说话者内部块Intra-SpeakerBlock和情绪传染建模的说话者之间块Inter-SpeakerBlock；将四种不同的transformer块的输出分别标记为使用注意力机制来学习权衡：其中表示综合的结果且维数与相同，α表示为不同的transformer块实际的影响比重，表示模型习得的线性变换矩阵；同时考虑到词编码阶段的自注意力机制强调的是话语中词的相对位置而弱化了对话中的话语序列信息，在transformer的最后一层输出后加了一层BiGRU捕捉这个话语位置信息并得到最终话语表示语境和情绪动态感知模块可视为一个编码器：表示为编码器的输出；外部知识交互模块，通过利用图注意力网络实现对外部结构化情感知识的利用，从而扩充了话语的语义信息，弥补了词编码器模块在某些特定维度上知识的缺失；使用ConceptNet作为外部的知识源，对于话语xi中的每个非停用词wd，获取其在ConceptNet的相关知识子图Gwd，对于每一个子图Gwd，移去停用词或超出语境和情绪动态感知编码词表的邻居节点，进一步删除置信度小于1的声明，最终得到：其中ni代表词wd的关联概念表示；gi代表相应的置信度分数；Nn代表子图Gwd中的声明数；对于话语xi中的每个非停用词wd和其概念子图Gwd中的关联概念np，通过话语读入模块获取其表示，并分别标记为和知识表示Kd计算方式如下：其中表示和的内积，表示为不同邻居节点所具有的影响程度，和“·”表示点积操作；若Nn＝0，则Kd设置为所有节点向量的均值；至此已获得话语xi的语境和情绪动态感知表示和相应知识表示K；对于语xi中的每个非停用词wd，其相应的语境和情绪动态感知表示为知识表示Kd为K中的第d个元素；级联获得词wd的知识增强表示其中则话语的知识增强表示回溯历史状态模块，在任务损失函数的基础上加入了一个回溯损失，旨在利用先前的训练经验来指导权重更新，确保模型决策更接近真实值，以达到在训练过程中利用过去模型状态的先验经验的效果；对于目标话语ui获得其词级别话语表示Ui，再通过最大池化操作获得其话语级别表示其中是模型参数，最终的预测分布计算如下：其中We∈he×hc,是模型参数，he代表预定义的情绪数；使用交叉熵作为ERC任务的损失函数：其中表示话语ui对应的真实情绪e；1到21视为一个映射θ·，即此时若保存过去的模型参数得到另外一个映射θp·；回溯损失函数由以上两个映射刻画：lossretro＝β+1||θui-yi||-β||θui-θpui||23其中β是一个超参数，||·||表示L1范数；回溯损失函数有两个额外的超参数，预热期P和更新频率F，P指的是模型被认为可以稳定加入使用这种回溯更新的时期，F指的是使用回溯损失的间隔时期数，得到最终的损失函数：L＝losserc+lossretro24。

全文数据：

权利要求：

百度查询：哈尔滨工业大学基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

下一篇：一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

相关技术

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

一种散热户外路灯灯头_中山市澳斯朗电控科技有限公司_202322819842.7

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种户外交流高压封闭式隔离开关_瑞芯科技(河北雄安)有限公司_202322554260.0

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

对话相关技术

基于自然语言对话的表数据处理方法_无锡容智技术有限公司_202310935795.4

显示设备及多轮对话方法_VIDAA国际控股(荷兰)公司_202311700475.7

人机对话方法和装置_北京京东尚科信息技术有限公司_201810553360.2

对话式大语言模型监督训练评价系统_南京大经中医药信息技术有限公司_202410121885.4

一种任务对话方法及装置_北京声智科技有限公司_202010436281.0

一种基于超图神经网络的对话推荐方法_重庆理工大学_202410075854.X

一种对话生成方法、装置、系统以及存储介质_桂林电子科技大学_202311741565.0

对话响应处理方法、装置、电子设备及存储介质_科大讯飞股份有限公司_202311707818.2

基于情境感知与情绪推理的共情对话生成方法_华中师范大学_202311852964.4

基于优先级筛选的可视化对话方法及系统_广州视声智能科技有限公司_202311484856.6

构建相关技术

主动安全网络及构建方法_北京北信源软件股份有限公司_202210505613.5

索引构建方法、装置、电子设备和介质_中国工商银行股份有限公司_202010939115.2

数据库应用界面自动构建方法_慧新全智工业互联科技(青岛)有限公司_202410022812.X

虚拟形象构建方法、装置、设备和存储介质_北京百度网讯科技有限公司_202310233774.8

一种卫星管理任务的构建方法及相关设备_北京航天驭星科技有限公司_202310124807.5

一种北方寒冷地区建筑屋顶水池防冻系统及其构建方法_中国建筑设计研究院有限公司_202311478224.9

一种乳腺癌模型猪的构建方法及应用_南京启真基因工程有限公司_202110187956.7

一种数字化环境下可靠性构建方法_北京机电工程研究所_202011617960.4

一种慢性病临床决策支持系统及构建方法_盐城市第三人民医院_202311426483.7

一种构建植物miRNA遗传调控通路的方法_北京林业大学_202311097229.7

模型相关技术

结构识别模型训练、模型结构识别方法、设备及介质_北京燧原智能科技有限公司_202410090059.8

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

用于模型蒸馏的方法和装置_北京百度网讯科技有限公司_202011473804.5

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种手板模型用打磨设备_青岛诚品模型有限公司_202322254282.5

基于ARIMA模型的容量预测装置及其控制方法_上海新炬网络信息技术股份有限公司_202010209101.5

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

模型处理方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202011056384.0

利用模型增强的自监督学习_硕动力公司_202280060208.5

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

龙图腾网&IPTOP

【发明授权】基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质_哈尔滨工业大学_202111255353.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务