【发明公布】一种基于自适应类边界间隔的说话人识别方法、系统及存储介质_东北林业大学_202311867976.4

申请/专利权人：东北林业大学

申请日：2023-12-29

公开（公告）日：2024-04-12

公开（公告）号：CN117877493A

主分类号：G10L17/04

分类号：G10L17/04;G10L17/02;G10L17/18

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.30#实质审查的生效;2024.04.12#公开

摘要：本发明一种基于自适应类边界间隔的说话人识别方法、系统及存储介质，涉及说话人识别技术领域，为解决现方法假设不同说话人之间不存在差异性，调整类边界间隔的方式是固定且一致的，导致无法区分差异性较小的说话人的问题。包括：步骤1、获取说话人音频数据集，将添加音频数据添加标签；步骤2、对音频数据进行预处理，对预处理的音频数据中提取FBank特征作为声学特征；步骤3、构建基于深度学习的说话人识别模型，将说话人音频样本分为正确分类和错误分类，以样本属于某个说话人的概率为先验信息，自适应地调整类边界间隔，构建损失函数对模型进行训练；步骤4、将待测说话人音频数据输入训练后的说话人识别模型，判断是否为同一个人的音频数据。

主权项：1.一种基于自适应类边界间隔的说话人识别方法，其特征在于：所述方法包括如下步骤：步骤1、获取说话人音频数据集，将说话人音频数据添加标签；步骤2、对音频数据进行预处理，对预处理的音频数据中提取FBank特征作为声学特征；步骤3、构建基于深度学习的说话人识别模型，将说话人音频样本分为正确分类和错误分类，以样本属于某个说话人的概率为先验信息，自适应地调整类边界间隔，构建损失函数对所述说话人识别模型进行训练；步骤4、将待测说话人音频数据输入训练后的说话人识别模型，判断是否为同一个人的音频数据。

全文数据：

权利要求：

百度查询：东北林业大学一种基于自适应类边界间隔的说话人识别方法、系统及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

下一篇：一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

相关技术

无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

一种点火线圈密封结构_一汽解放汽车有限公司_202322812056.4

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

一种抑菌保暖女式羊绒大衣_安庆初颖数字科技有限公司_202322077610.9

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

龙图腾网&IPTOP

【发明公布】一种基于自适应类边界间隔的说话人识别方法、系统及存储介质_东北林业大学_202311867976.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务