买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于人类听觉反馈机制的声音活体检测方法及系统_武汉大学_202311867810.2 

申请/专利权人:武汉大学

申请日:2023-12-29

公开(公告)日:2024-04-09

公开(公告)号:CN117854539A

主分类号:G10L25/30

分类号:G10L25/30;G10L25/51

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明公开了一种基于人类听觉反馈机制的声音活体检测方法及系统,为了保护说话人验证系统免受伪造语音的欺骗,本发明首次将活体说话人在嘈杂环境下会不由自主地改变自己说话模式的Lombard效应引入声音活体检测,并提出了基于Lombard效应的声音活体检测框架Lombard‑VLD。为了改善Lombard‑VLD的鲁棒性和泛化性,本发明设计了基于参考的双输入模式和差分增强网络,以普通语音的特征为参考,对Lombard语音与普通语音之间的差异性特征进行提取和增强。本发明利用Lombard效应所导致的活体说话人发声模式的差异实现了低成本、高准确率、鲁棒性强、泛化性强的声音活体检测,可以方便地应用到各种类型的移动设备中以实现高效的说话人验证系统的反欺骗前置防护上。

主权项:1.一种基于人类听觉反馈机制的声音活体检测方法,其特征在于,包括以下步骤:步骤1:采集用户普通语音和Lombard语音;步骤2:利用特征提取网络,提取普通语音和Lombard语音的语音特征;步骤3:利用差分增强网络,以普通语音的特征为参考,对Lombard语音与普通语音之间的差异性特征进行提取和增强;步骤4:利用特征融合和归一化网络,对增强后的差异性特征进行处理,得到固定长度的差分向量;步骤5:差分向量通过一个全连接网络输出检测结果。

全文数据:

权利要求:

百度查询: 武汉大学 一种基于人类听觉反馈机制的声音活体检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。