【发明公布】一种基于低级语音特征融合的语音情感识别方法_电子科技大学_202311190579.8

导航：龙图腾网> 最新专利技术> 一种基于低级语音特征融合的语音情感识别方法_电子科技大学_202311190579.8

申请/专利权人：电子科技大学

申请日：2023-09-14

公开（公告）日：2023-12-05

公开（公告）号：CN117174110A

主分类号：G10L25/30

分类号：G10L25/30;G10L25/63;G10L25/03

优先权：

专利状态码：在审-实质审查的生效

法律状态：2023.12.22#实质审查的生效;2023.12.05#公开

摘要：本发明公开了一种基于低级语音特征融合的语音情感识别方法，在语音情感识别的基础上，提出了一个双流池化通道注意力模块学习隐藏在低级语音特征中的情感特征，并设计了一个简洁有效的双视图特征融合策略对语音预训练模型提取的高级语音特征和从低级语音特征中学习到的情感特征进行联合学习并完成情感识别，明显的提升了语音情感识别的准确度。同时，本发明仅使用两种语音特征的语音情感识别方法，避免了使用大量的语音特征，采用双流池化通道注意力模块来学习隐藏在低级语音特征中的情感特征，避免了过度依赖对预训练模型的微调，采用简洁的语音特征融合策略，避免了过于复杂的特征视图融合过程。

主权项：1.一种基于低级语音特征融合的语音情感识别方法，其特征在于，包括以下步骤：1、提取低级语音特征以及高级语音特征1.1、将每一个语音信号按照相同时间长度t分成多个语音片段，其中，对于语音信号不是时间长度t整数倍的情况下，在语音信号前或后，使用0进行填充，确保每个语音片段具有时间长度，分出的每个语音片段与其对应的语音信号具有相同的情感标签；1.2、对于每一个语音片段vi，分别提取出低级语音特征fiL以及高级语音特征fiH，i为语音片段的序号，高级语音特征R表示实数空间，2、从低级语音特征中提取多尺度特征2.1、对低级语音特征fiL进行L2正则化，得到低级语音特征fiL_L2；2.2、使用双向LSTM从低级语音特征fiL_L2中学习得到情感相关序列特征fiL_LSTM；2.3、使用三个有着不同尺度卷积核的二维卷积从情感相关序列特征fiL_LSTM中学习得到不同侧重的三个尺度的特征fiL_S1、fiL_S2、fiL_S3；2.4、三个尺度的特征fiL_S1、fiL_S2、fiL_S3分别送入三个平行的二维卷积中学习重要的局部特征，得到三个局部特征fiL_LC1、fiL_LC2、fiL_LC3；2.5、三个局部特征fiL_LC1、fiL_LC2、fiL_LC3拼接起来，得到特征并输出到双流池化通道注意力模块，其中，特征C为通道维度，H为高度维度，W宽度维度；3、构建双流池化通道注意力模块所述双流池化通道注意力模块包含两个有着相同实现机制的分支，分别为GAP流通道注意力分支和GMP流通道注意力分支；3.1、构建GAP流通道注意力分支3.1.1、使用二维全局平均池化即2d-GAP将输入双流池化通道注意力模块的特征的高度维度H和宽度维度W压缩为1，仅保留通道维度C，得到的输出为特征3.1.2、对特征使用一维卷积实现跨通道的交互以及避免通道维度的减少，捕获通道间的有效区域，一维卷积得到的输出为特征特征为3.1.3、对特征使用双向LSTM从两个方向捕获语音片段中与情感相关的序列信息，双向LSTM得到的输出为特征特征为3.1.4、使用矩阵乘法算子来融合特征和特征得到融合特征fiL_cs：其中，为矩阵乘法操作；3.1.5、对融合特征fiL_cs使用一维全局平均池化即1d-GAP沿着通道维度聚合，生成特征fiL_gap，特征fiL_gap∈RC×1；3.1.6、使用一个瓶颈结构层来学习特征fiL_gap中的通道权重wi，该瓶颈结构层由结合了ReLU和Sigmoid激活函数的两个完全连接层组成，其公式定义如下：wi＝σW2δW1fiL_gap2在公式2中，σ指的是Sigmoid函数，δ指的是ReLU函数，和是可学习参数矩阵；3.1.7、设定GAP流通道注意力分支的输出为特征表示为其中，第n个元素为：其中，wi_n为通道权重wi的第n个元素，为特征的第n个元素；3.2、构建GMP流通道注意力分支3.2.1、使用二维全局最大池化即2d-GMP将输入双流池化通道注意力模块的特征的高度维度H和宽度维度W压缩为1，仅保留通道维度C，得到的输出为特征3.2.2、将步骤3.1.5中的一维全局平均池化即1d-GAP替换为一维全局最大池化即1d-GMP，然后采用步骤3.1.2到3.1.7的方法，对特征进行处理，得到GMP流通道注意力分支的输出3.3、将特征与特征逐元素相加，得到双流池化通道注意力的输出即特征4、获取情感相关特征首先使用二维全局平均池化即2d-GAP将特征的高度维度H和宽度维度W压缩为1，仅保留通道维度C，得到的输出为特征然后使用一个完全连接层将维度转换为d1，并做转置得到情感相关特征5、构建简洁的特征融合策略进行情感状态识别首先使用基于矩阵乘法算子的方法融合高级语音特征fiH与情感相关特征fiSE，得到融合后的语音特征fiunite：在公式4中，为可学习参数矩阵，d3表示维度，r为需要识别的情感状态的数量；然后，采用多个完全连接层构成的分类器，对语音特征fiunite进行情感分类，从而识别出相应的情感状态；6、训练对带有情感标签的语音信号，按照步骤1-5的方法进行处理，并使用交叉熵损失函数Lce与多分类合页损失函数Lmml的和作为损失整个学习训练的损失函数Lco对处理过程中的可学习参数进行更新，直到满足要求；7、语音情感识别当可学习参数进行更新即训练完成后，对一段需要进行情感识别的语音信号截取时间长度t的一个语音片段，然后按照步骤1.2至步骤5的方法进行情感状态识别，得到该段语音信号的情感状态。

全文数据：

权利要求：

百度查询：电子科技大学一种基于低级语音特征融合的语音情感识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

下一篇：一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

相关技术

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种园林绿化便携铲_马丽丽_202322375183.2

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

一种纸箱生产用贴标机_浙江华信科技发展有限公司_202322178698.3

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

语音相关技术

一种语音降噪会议终端_海智合芯科技(深圳)有限公司_202322457355.0

语音识别歧义消除方法及装置_青岛海尔电冰箱有限公司_202211290249.1

一种语音控制风扇_海智合芯科技(深圳)有限公司_202322447146.8

一种语音控制应急广播方法和系统_上海数字电视国家工程研究中心有限公司_201910074869.3

语音交互方法、介质和电子设备_华为技术有限公司_202211293892.X

语音设备及其唤醒方法、装置以及存储介质_佛山市顺德区美的电子科技有限公司_202011222715.3

一种可语音留言互动的显示设备_上海风语筑文化科技股份有限公司_202322391219.6

语音转换方法及装置、存储介质、电子装置_南京硅基智能科技有限公司_202311826046.4

一种语音处理方法及装置_联想(北京)有限公司_202110645953.3

一种语音交互方法，设备和系统_华为技术有限公司_201811644940.9

融合相关技术

一种塑料件高温融合设备_河源艺昇精密科技有限公司_202322688573.5

抗体融合蛋白及其制备和应用_北京诺诚健华医药科技有限公司_202211293426.1

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

一种多特征融合的行人跟踪方法_杭州锐颖科技有限公司_202311346658.3

一种基于多路口多传感器的航迹融合方法及系统_超级视线科技有限公司_202111569137.5

一种致癌性融合激酶抑制剂的晶型及其应用_南京再明医药有限公司_202080058668.5

轨道几何参数与车辆动力学融合影响分析方法及系统_南京地铁运营咨询科技发展有限公司_202410172454.0

一种全领域产品节点体系动态融合与生长方法_杭州量知数据科技有限公司_202111166990.2

一种岩溶古河道多信息融合体的识别方法及装置_中国石油化工股份有限公司_202211295813.9

一种多特征优化融合的高压断路器故障诊断方法_国网青海省电力公司海西供电公司_202011096134.X

特征相关技术

一种多特征融合的行人跟踪方法_杭州锐颖科技有限公司_202311346658.3

包括自动特征检测和分类的检查工具_米沃奇电动工具公司_202280047516.4

一种基于改进的形状特征匹配的书法书写质量评价方法_广东新裕信息科技有限公司_202311480424.8

稀疏2D点集的深度特征提取方法及装置_三星(中国)半导体有限公司_202010006265.8

模型训练和特征提取方法、装置、电子设备及存储介质_北京旷视科技有限公司_202110791892.1

一种特征初始化的非均匀校正方法及其系统_中国科学院长春光学精密机械与物理研究所_202210650466.0

一种钻探岩芯特征的智能识别描述方法、系统及存储介质_北京建工环境修复股份有限公司_202310969059.0

一种基于多尺度边缘特征检测的隧道识别模型及方法_清华大学苏州汽车研究院(相城)_202011007456.2

填充衬底上的凹陷特征的方法及相关结构_ASMIP私人控股有限公司_202311352654.6

应用于OCT图像中目标特征分割的模型训练方法及装置_唯智医疗科技(佛山)有限公司_202110885125.7

龙图腾网&IPTOP

【发明公布】一种基于低级语音特征融合的语音情感识别方法_电子科技大学_202311190579.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务