首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于闭环语音链和深度学习的抑郁症自动诊断系统_天津大学_202210048445.1 

申请/专利权人:天津大学

申请日:2022-01-17

公开(公告)日:2024-05-14

公开(公告)号:CN114496221B

主分类号:G16H50/20

分类号:G16H50/20;G06N3/0464;G06N3/0442;G06N3/09;G06F18/25;G06F18/24;G10L25/24;G10L25/30;G10L25/63

优先权:

专利状态码:有效-授权

法律状态:2024.05.14#授权;2022.05.31#实质审查的生效;2022.05.13#公开

摘要:本发明公开了一种基于闭环语音链和深度学习的抑郁症自动诊断系统,包括:语音链特征提取模块用于对片段语音提取语音链特征,建立声道、耳道模型,根据耳道模型提取预设维度梅尔倒谱系数特征以及根据声道模型提取另一预设维度线性预测系数特征;片段内特征提取模块用于建立一维卷积神经网络对各语音片段的MFCC特征和LPC特征提取抑郁相关特征,每个语音片段所对应的MFCC特征和LPC特征经提取后分别输出多维度抑郁症特征;特征级融合模块用于对每个片段对应的多维度抑郁症特征进行融合,对每名被试对应的所有片段特征进行融合;片段间特征提取及分类输出模块用于建立长短期记忆网络提取片段间的抑郁特征并实现抑郁症和非抑郁症的分类输出。

主权项:1.一种基于闭环语音链和深度学习的抑郁症自动诊断系统,其特征在于,所述系统基于闭环语音链提取语音感知和语音生成过程中的语音特征,并融合了具有自适应能力的深度学习技术调整其权重系数,依次提取语音片段内的以及语音片段间的抑郁特征,继而实现抑郁症的诊断,系统包括:语音预处理模块,用于对输入的原始语音信号进行预处理;语音链特征提取模块,用于对片段语音提取语音链特征,建立声道、耳道模型,根据耳道模型提取39维度梅尔倒谱系数特征以及根据声道模型提取40维度线性预测系数特征;片段内特征提取模块,用于建立一维卷积神经网络对各语音片段的MFCC特征和LPC特征提取抑郁相关特征,每个语音片段所对应的MFCC特征和LPC特征经提取后分别输出多维度抑郁症特征;特征级融合模块,用于对每个片段对应的多维度抑郁症特征进行融合,对每名被试对应的所有片段特征进行融合;片段间特征提取及分类输出模块,用于建立长短期记忆网络提取片段间的抑郁特征并实现抑郁症和非抑郁症的分类输出;其中,所述片段内特征提取模块基于深度学习技术建立一维卷积神经网络提取其中的抑郁信息,采用一维卷积层对全频段进行卷积提取频域信息,采用最大池化层整合提取信息,采用批归一化和随机失活操作,并采用全连接层提取特征并进行降维;训练过程中加上单元数为2的全连接层作为输出层调整网络权重,损失函数选择交叉熵函数,采用学习率动态调整策略,对于输入的MFCC特征和LPC特征分别保留16维度的全连接输出作为下一流程的输入;所述特征级融合模块将各片段对应的16维度抑郁特征拼接成32维度,按照语音预处理模块中所记录的原始片段顺序对所有片段特征进行融合,融合结果作为下一阶段的输入;所述片段间特征提取及分类输出模块采用1层LSTM网络提取抑郁信息,采用2个全连接层进行降维并完成抑郁症和非抑郁症的诊断,在训练过程中同样选择交叉熵函数作为损失函数,采用学习率动态调整策略,采用单元数为2的全连接层作为输出层对被试做出抑郁或非抑郁的判断;其中,提取39维度梅尔倒谱系数特征,将语音信号经过高通滤波器进行预加重,提升高频部分,消除发声过程中声带和嘴唇的效应,补偿语音信号受到发音系统所抑制的高频部分;其中,高频滤波器的系统函数为: 按照25ms长度以及10ms步长进行分帧,并使用汉明窗增加帧端点间的连续性,分帧后的信号为Sn,加窗后的信号为S′n=Sn·wn,其中: 对加窗后的每帧语音信号进行快速傅里叶变换得到频谱的能量分布,将能量谱通过一组Mel尺度的三角形滤波器组,设置滤波器数量为24个,其中涉及Mel频率与Hz频率的转化关系为: 计算每个滤波器组输出的对数能量,并经离散余弦变换得到13阶MFCC特征,其中第n阶参数Cn: 这里sm为滤波器组中第m个滤波器所求得的对数能量,对于求得13阶MFCC特征,计算其一阶差分和二阶差分并且融合得到39维度MFCC特征;其中,利用一个20阶的时变全极点滤波器建立声道模型,生成语音信号sn表示为: 其中,P是滤波器的阶数,ap是滤波器的系数,en为预测误差,通过最小化真实信号与预测信号之间的均方误差E[e2n],得到滤波器系数的解ap’通过计算滤波器系数ap的一阶差分得到其动态参数,并将二者融合得到40维度LPC特征。

全文数据:

权利要求:

百度查询: 天津大学 基于闭环语音链和深度学习的抑郁症自动诊断系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。