【发明授权】基于多尺度差异对抗的跨数据库语音情感识别方法及装置_东南大学_202011376020.0

导航：龙图腾网> 最新专利技术> 基于多尺度差异对抗的跨数据库语音情感识别方法及装置_东南大学_202011376020.0

申请/专利权人：东南大学

申请日：2020-11-30

公开（公告）日：2024-04-30

公开（公告）号：CN112489689B

主分类号：G10L25/63

分类号：G10L25/63;G10L25/30;G06F16/65;G06F16/683;G06N3/0464;G06N3/049;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.30#授权;2021.03.30#实质审查的生效;2021.03.12#公开

摘要：本发明公开了一种基于多尺度差异对抗的跨数据库语音情感识别方法，方法包括：（1）获取多个语音情感数据库；（2）提取每一语音信号的全局IS10特征，提取全局特征；（3）将语音信号分成前后重叠50%的五段短片段并分别提取其IS10特征；（4）输入双向长短时间记忆模型，再输入注意力机制模型，输出作为局部特征；（5）将全局IS10特征和局部特征并联，提取联合特征；（6）建立神经网络，包括对应于上述三种尺度的三个领域判别器，和情感分类器；（7）训练神经网络，网络总损失为情感分类器损失减去三个领域判别器损失；（8）获取待识别语音信号的三种尺度特征，输入训练好的神经网络，得到预测的情感类别。本发明识别结果更准确。

主权项：1.一种基于多尺度差异对抗的跨数据库语音情感识别方法，其特征在于，该方法包括：1获取存储有若干语音信号和对应情感类别标签的语音情感数据库，并划分为源域数据库和目标域数据库；2对于源域数据库和目标域数据库中的每个语音信号，提取IS10low-level特征，然后利用卷积神经网络做为全局特征提取器提取深度特征，作为全局特征，特征提取器包括三层卷积层；3对于源域数据库和目标域数据库的每个语音信号，将其按照时间顺序分成前后重叠50％的若干短片段，并提取每个短片段的IS10特征；4将每个语音信号的所有短片段的IS10特征输入双向长短时间记忆模型，随后再输入进注意力机制模型，输出作为对应语音信号的局部特征；5对于源域数据库和目标域数据库中的每个语音信号，将全局特征和局部特征并联，输入另一个卷积神经网络做为联合特征提取器提取深度特征，作为联合特征，特征提取器包括三层卷积层；6建立神经网络，所述神经网络包括对应于全局特征、局部特征和联合特征的三个领域判别器，和情感分类器，所述领域判别器包括两层全连接层，输出为预测的语音信号所属领域类别，所述情感分类器包括两层全连接层，输出为预测的语音信号的情感类别；7对所述神经网络进行训练，训练时，将源域数据库和目标域数据库中每一语音信号的局部特征，全局特征和联合特征分别混合起来作为三个样本，输入对应尺度的领域判别器，将源域数据库中每一语音信号的联合特征作为一个样本，输入情感分类器，网络总损失为情感分类器损失减去三个领域判别器损失，通过反向传播算法更新网络参数，完成网络训练；8获取待识别语音信号的三种尺度特征，输入训练好的神经网络，得到预测的情感类别；步骤7中所述网络总损失为：式中，表示网络总损失，λ为正则化乘数，其中：形如表示领域判别器的交叉熵损失函数，分别表示局部尺度、全局尺度、联合尺度上的领域判别器的交叉熵损失函数，表示情感分类器交叉熵损失函数，di表示源域和目标域数据库中的语音信号的领域类别标签，分别是0和1；表示源域数据库中语音信号的情感类别标签，表示源域、目标域数据库中语音信号的全局特征，表示源域、目标域数据库中语音信号的局部特征，表示源域、目标域数据库中语音信号的联合特征；Fg、Fl、Fh表示三种尺度上的特征提取器；Dg、Dl、Dh表示三种尺度上的领域判别器；网络训练目的是最小化网络总损失函数。

全文数据：

权利要求：

百度查询：东南大学基于多尺度差异对抗的跨数据库语音情感识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种焊剂片约束电弧焊焊接T型接头的夹具_兰州理工大学_201910643137.1

下一篇：移动式组合盐水分离系统_大连盐化集团有限公司_202111204431.6

相关技术

一种焊剂片约束电弧焊焊接T型接头的夹具_兰州理工大学_201910643137.1

移动式组合盐水分离系统_大连盐化集团有限公司_202111204431.6

一种外导体压接装置_江苏博之旺自动化设备有限公司_202111235070.1

一种基于数字孪生的加工过程自适应控制方法_东华大学_202111238057.1

消息的发送方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202210060996.X

一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

一种风机通风量检测方法及装置_北京农业信息技术研究中心_202110665511.5

一种基于计算机视觉的肺区区域分割系统_东莞理工学院_202210022595.5

基于对抗样本的人体康复运动数据增强方法_大连海事大学_202110864746.7

一种全自动样品混合缩分装置及方法_青岛海关技术中心_201910859073.9

一种直径与中继协作的信号空间分集传输方法_山东交通学院_202110011021.3

语音相关技术

语音识别模型的训练、语音识别方法、装置及设备_北京捷通华声科技股份有限公司_202110865009.9

语音活动检测方法及装置_展讯通信(上海)有限公司_202410340960.6

燃气自闭阀语音报警器_林鹏达_202410256707.2

语音唤醒方法、装置和设备_阿里巴巴集团控股有限公司_201910295356.5

语音数据的处理方法及装置_海信视像科技股份有限公司_202280063346.9

一种快速布放语音警戒伸缩栅栏_江苏宁沪高速公路股份有限公司_202321739748.4

语音交互方法、装置、设备和存储介质_北京声智科技有限公司_202311825913.2

语音合成方法、装置及电子设备_北京捷通华声科技股份有限公司_202110071250.4

一种语音合成方法和装置_北京搜狗科技发展有限公司_202110769530.2

一种智能语音转写方法及系统_广州市艾索技术有限公司_202410405996.8

数据库相关技术

PostgreSQL数据库自动创建的二级分区方法、数据库系统及介质_瀚高基础软件股份有限公司_202311709916.X

数据库实例的调度方法、装置及设备_中移(苏州)软件技术有限公司_202410234016.2

面向计费多中心内存数据库的数据同步方法及系统_浩鲸云计算科技股份有限公司_202410196438.5

数据库数据资产保护方法、装置、计算机设备及存储介质_杭州美创科技股份有限公司_202410415534.4

基于时序数据库的能源监测数据存储方法、设备及介质_山东浪潮科学研究院有限公司_202111425820.1

数据库间数据的传输方法、装置、设备以及存储介质_中国人民财产保险股份有限公司_202410251908.3

数据库的表数据文件的迁移方法和系统_深圳市法本信息技术股份有限公司_202010554112.7

一种redis数据库的数据展示方法和装置_北京奇虎科技有限公司_201711407301.6

一种基于webspoon的数据库整库同步方法、装置、设备及存储介质_山东浪潮智水数字科技有限公司_202410111619.3

基于区块链关系数据库的预言机及其实现方法_深圳市大中华区块链科技有限公司_202110038622.3

跨相关技术

数据要素多中心跨链标识方法_成都边界元科技有限公司_202410414905.7

一种跨水气界面运动的航行器_山东省科学院海洋仪器仪表研究所_202410410862.5

一种跨路母线金具_中国电建集团青海省电力设计院有限公司_202322246790.9

历史建筑跨模态检索方法、系统及介质_华中科技大学_202410115258.X

用于跨群组沟通的通信方法及系统_北京鼎诚世通科技有限公司_202410109377.4

制动液压控制装置及跨乘型车辆_罗伯特·博世有限公司_202280065972.1

无监督跨模态行人检索方法和装置_中国地质大学(武汉)_202410083022.2

基于跨频耦合的多频段自适应同步调制刺激系统和方法_首都医科大学宣武医院_202410073893.6

亚跨声速进发直连风洞试验模型支撑装置及设计方法_中国空气动力研究与发展中心高速空气动力研究所_202410420409.2

一种跨桥式钢拱安装施工吊装设备及吊装方法_珠海十字门中央商务区建设控股有限公司_202311852577.0

龙图腾网&IPTOP

【发明授权】基于多尺度差异对抗的跨数据库语音情感识别方法及装置_东南大学_202011376020.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务