买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于数据不确定性学习的咳嗽检测方法_赵永源;谷成明;广州捷智信科技有限公司_202111492741.2 

申请/专利权人:赵永源;谷成明;广州捷智信科技有限公司

申请日:2021-12-08

公开(公告)日:2024-03-26

公开(公告)号:CN114209302B

主分类号:A61B5/08

分类号:A61B5/08;A61B5/00

优先权:

专利状态码:有效-授权

法律状态:2024.03.26#授权;2022.04.08#实质审查的生效;2022.03.22#公开

摘要:本发明公开了一种基于数据不确定学习的咳嗽检测方法。主要解决现有技术在真实环境下咳嗽检测准确率低的问题。其实现方案是:从不同的公开数据集选取语音数据并进行预处理,将其划分训练集和测试集;构建由噪声生成模块、梅尔图谱生成模块、特征预测模块、均值和方差预测模块、全连接模块依次级联组成的检测器网络;设置检测器网络的目标函数;设置学习率和最大迭代次数,通过训练集采用随机梯度下降法对目标函数进行更新,得到训练好的检测器网络;将测试数据集输入到训练后的检测器网络中,得到咳嗽检测结果。本发明不仅在无噪环境下能得到高的准确率,而且在模拟真实噪声状况下也有较好的表现,可用于咳嗽声音的智能检测和咳嗽样本的收集。

主权项:1.一种基于数据不确定学习的咳嗽检测方法,其特征在于,包括:1构建咳嗽检测数据集,从不同的公开数据集中分别选取15000个咳嗽语音数据和15000个非咳嗽语音数据,并对其进行预处理,再按照9:1的比例划分为训练集和测试集,数据集中均含有是否包含咳嗽的标注;2构建由噪声生成模块、梅尔图谱生成模块、特征预测模块、均值和方差预测模块、全连接模块依次级联组成的检测器网络;该特征预测模块、均值和方差预测模块和全连接模块构成分类器,其中,均值和方差预测模块,由输入层、第Ⅰ归一化层、Dropout层、Flatten层、第Ⅰ全连接层、第Ⅰ激活函数层、第II全连接层、第II激活函数层、第II归一化层、预测输出层、不确定向量生成器级联组成,该不确定向量生成器以预测输出层输出的预测均值和预测方差为参数,为特征向量添加不确定性成分,生成不确定性特征向量,使得输入网络的特征向量具有的随机性和不确定性,从而增强网络对含噪数据分类的稳定性,进而提升网络对真实含噪数据的检测准确率;3设置检测器网络的目标函数LG:LG=Lcross+λLkl,其中:λ1,Lcross为交叉熵损失函数,μi、σi为均值和方差预测模块输出的预测均值和方差;4对检测器网络进行训练:4a设定学习率L和最大迭代训练次数T;4b将训练数据集输入到检测器网络中,通过噪声生成模块,得到含噪的数据集;含噪的数据通过梅尔谱图生成模块,得到含有时频信息的二维梅尔谱图;二维梅尔谱图通过分类器,得到的咳嗽和非咳嗽的概率向量;4c将咳嗽和非咳嗽的概率向量与训练集的标注代入交叉熵损失函数Lcross得到交叉熵结果,将检测器网络中均值和方差预测模块输出的预测均值μi和方差σi代入Lkl散度函数,求得一次训练后的损失值,根据每次训练得到的损失值的变化采用随机梯度下降的方法迭代网络,更新网络参数,直到达到设定的网络训练次数T后,完成对检测器网络的训练;5将测试集输入到训练后的检测器网络中,测试集先通过噪声生成模块生成含噪的测试集,含噪的测试集再通过梅尔谱图生成模块得到二维梅尔谱图,二维梅尔谱图输入到分类器中,输出长度为2的概率向量[a,b],a代表是咳嗽的概率,b代表不是咳嗽的概率。

全文数据:

权利要求:

百度查询: 赵永源;谷成明;广州捷智信科技有限公司 基于数据不确定性学习的咳嗽检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。