【发明公布】一种耳语说话人识别模型训练方法和装置_北京建筑大学_202410250740.4

导航：龙图腾网> 最新专利技术> 一种耳语说话人识别模型训练方法和装置_北京建筑大学_202410250740.4

申请/专利权人：北京建筑大学

申请日：2024-03-05

公开（公告）日：2024-04-09

公开（公告）号：CN117854509A

主分类号：G10L17/04

分类号：G10L17/04;G10L17/18;G10L17/02;G10L25/24

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.26#实质审查的生效;2024.04.09#公开

摘要：本申请提供一种耳语说话人识别模型训练方法和装置。本申请提供的耳语说话人识别模型训练方法，包括：基于迁移学习构建初始耳语说话人识别模型，所述迁移学习对象至少包括由正常语音音频预训练好的TDNN模型；建立第一耳语数据集，第一耳语数据集中至少包括多个第一耳语样本，每个第一耳语样本中至少包括耳语语音音频、与耳语语音音频为同一说话人的正常语音音频和耳语语音音频对应的说话人标识；对第一耳语数据集进行数据增强，获得第二耳语数据集；混合第一耳语数据集和第二耳语数据集，构建第三耳语数据集，利用第三耳语数据集训练初始耳语说话人识别模型，得到最终的耳语说话人识别模型。本申请提供的耳语说话人识别模型训练方法和装置，可提高耳语说话人识别准确性和鲁棒性。

主权项：1.一种耳语说话人识别模型训练方法，其特征在于，所述方法包括：基于迁移学习构建初始耳语说话人识别模型，其中，正常语音音频为口语语音音频，所述迁移学习对象至少包括由正常语音音频预训练好的TDNN模型；建立第一耳语数据集，所述第一耳语数据集中至少包括多个第一耳语样本，每个第一耳语样本中至少包括耳语语音音频、与耳语语音音频为同一说话人的正常语音音频和耳语语音音频对应的说话人标识；对所述第一耳语数据集进行数据增强，获得第二耳语数据集；其中，所述数据增强的方式至少包括音频倒放；所述数据增强的对象至少包括正常语音音频和耳语语音音频；混合所述第一耳语数据集和所述第二耳语数据集，构建第三耳语数据集，利用所述第三耳语数据集训练所述初始耳语说话人识别模型，得到最终的耳语说话人识别模型。

全文数据：

权利要求：

百度查询：北京建筑大学一种耳语说话人识别模型训练方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：夹具_新疆蓝晶新材料科技有限公司_202322100063.1

下一篇：电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

相关技术

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

一种环形导轨间歇循环通电装置_东莞市臻域自动化设备有限公司_202322566793.0

一种高效散热电源_广州市力为电子有限公司_202322175013.X

一种具有服药求助警报功能的药丸储存项链_杨洁_202322091839.8

一种玉米种植用病虫害防治装置_黄金双_202322446508.1

一种耐泥沙高密封性水泵控制阀_国电龙达电力设备(天津)有限责任公司_202322437322.X

双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

龙图腾网&IPTOP

【发明公布】一种耳语说话人识别模型训练方法和装置_北京建筑大学_202410250740.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务