【发明授权】说话人识别方法、装置、计算机设备及存储介质_平安科技(深圳)有限公司_202110735212.4

导航：龙图腾网> 最新专利技术> 说话人识别方法、装置、计算机设备及存储介质_平安科技(深圳)有限公司_202110735212.4

申请/专利权人：平安科技(深圳)有限公司

申请日：2021-06-30

公开（公告）日：2024-03-12

公开（公告）号：CN113436633B

主分类号：G10L17/02

分类号：G10L17/02;G10L17/04;G10L17/12

优先权：

专利状态码：有效-授权

法律状态：2024.03.12#授权;2021.11.16#实质审查的生效;2021.09.24#公开

摘要：本申请实施例属于人工智能领域，涉及一种说话人识别方法、装置、计算机设备及存储介质，应用于智慧城市领域中，方法包括：获取混合语音以及目标说话人的参考语音；从参考语音中提取参考语音表征；将参考语音表征输入混合提取模型，以根据参考语音表征，从混合语音中获取目标说话人的估计掩膜，估计掩膜中的掩码与混合语音中的语音信号点一一对应；将掩码和语音信号点对应相乘，得到目标说话人的预测语音；计算预测语音和参考语音的概率线性判断得分；当概率线性判断得分处于预设的分值区间时，确定混合语音中包含目标说话人的语音。此外，本申请还涉及区块链技术，参考语音表征可存储于区块链中。本申请提高了说话人识别的准确性。

主权项：1.一种说话人识别方法，其特征在于，包括下述步骤：获取混合语音以及目标说话人的参考语音；通过参考提取模型从所述参考语音中提取参考语音表征；将所述参考语音表征输入混合提取模型，以指示所述混合提取模型根据所述参考语音表征，从所述混合语音中获取所述目标说话人的估计掩膜，所述估计掩膜中的掩码与所述混合语音中的语音信号点一一对应；将所述估计掩膜中的掩码和所述混合语音中的语音信号点对应相乘，得到所述目标说话人的预测语音；计算所述预测语音和所述参考语音的概率线性判断得分；当所述概率线性判断得分处于预设的分值区间时，确定所述混合语音中包含所述目标说话人的语音；所述获取混合语音以及目标说话人的参考语音的步骤之前，还包括：获取针对目标说话人的训练标准语音、训练参考语音和训练混合语音，所述训练混合语音是在所述训练标准语音中添加干扰语音得到的；通过初始参考提取模型从所述训练参考语音中提取参考语音表征；将所述参考语音表征输入初始混合提取模型，以指示所述初始混合提取模型将所述参考语音表征作为先验信息，从所述训练混合语音中提取所述目标说话人的预测表征；将所述预测表征输入所述初始混合提取模型中的掩膜计算层，得到估计掩膜，所述估计掩膜中的掩码与所述训练混合语音中的语音信号点一一对应；将所述估计掩膜中的掩码和所述训练混合语音中的语音信号点进行对应点乘，得到所述目标说话人的预测语音；基于所述估计掩膜、所述预测语音、所述训练标准语音和所述训练混合语音计算联合损失；根据所述联合损失对所述初始参考提取模型和所述初始混合提取模型进行调整，直至所述联合损失满足训练停止条件，得到参考提取模型和混合提取模型；所述初始混合提取模型包括若干层顺序相连的预测表征提取层；所述将所述参考语音表征输入初始混合提取模型，以指示所述初始混合提取模型将所述参考语音表征作为先验信息，从所述训练混合语音中提取所述目标说话人的预测表征的步骤包括：将所述参考语音表征和所述训练混合语音进行拼接，并输入第一层预测表征提取层，所述参考语音表征为先验信息，所述训练混合语音为来源信息，所述先验信息用于指示预测表征提取层从所述来源信息中提取预测表征；对于第一层以后的预测表征提取层，将所述参考语音表征和所述预测表征进行拼接，并输入下一层预测表征提取层进行迭代，直至最后一层预测表征提取层，所述参考语音表征为先验信息，所述预测表征为来源信息，所述先验信息用于指示预测表征提取层从所述来源信息中提取预测表征；将所述最后一层预测表征提取层输出的预测表征确定为所述目标说话人的预测表征。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司说话人识别方法、装置、计算机设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

下一篇：一种方便拆装的瓦楞机用瓦楞辊_浙江永暉瓦楞辊有限公司_202322675014.0

相关技术

一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

一种方便拆装的瓦楞机用瓦楞辊_浙江永暉瓦楞辊有限公司_202322675014.0

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

磨豆压力咖啡机自动压粉机构_浙江比依电器股份有限公司_202322521989.8

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

装置相关技术

发热装置及电子雾化装置_深圳市基克纳科技有限公司_202322129414.1

液体试剂供应装置及分析装置_东亚DKK株式会社_202010736498.3

操控装置、显示装置及车辆_小米汽车科技有限公司_202320552919.6

基板处理装置和流体加热装置_东京毅力科创株式会社_202311318777.8

定影装置及图像形成装置_富士胶片商业创新有限公司_202310510018.5

输入装置_欧姆龙株式会社_201980039113.3

台架装置_北京车和家汽车科技有限公司_202322479605.0

蓄电装置_丰田自动车株式会社_202210313089.1

过滤装置_合肥学院_201910547672.7

景观装置_万达商业规划研究院有限公司_202322576816.6

计算机相关技术

多计算机切换装置_锋厚科技股份有限公司_202321845368.9

颜色映射方法、系统、计算机设备及计算机可读存储介质_佛山市青松科技股份有限公司_202211362820.6

温度估计装置、温度估计方法、计算机可读存储介质和计算机程序产品_索尼集团公司_201980071606.5

将规范变换为计算机程序的方法、计算机系统和存储设备_起元技术有限责任公司_201880070092.7

碳刷支架和计算机断层扫描设备_上海西门子医疗器械有限公司_202322000774.1

一种多功能计算机机箱_宿迁学院产业技术研究院_202322543525.7

一种计算机通信设备防护装置_上海工商职业技术学院_202420577209.3

一种计算机机箱外壳_深圳市丰翼高精密五金有限公司_202322585533.8

一种AI头戴式计算机_瑞欧威尔(上海)智能科技有限公司_202110992003.8

一种计算机CPU散热装置_付茜茜_202321650635.7

设备相关技术

显示设备_三星显示有限公司_202110188056.4

定位设备_广州五所环境仪器有限公司_202311565624.3

显示设备_三星显示有限公司_202010327240.8

镀膜设备_拉普拉斯(西安)科技有限责任公司_202322657883.0

设备柜_山东核电有限公司_202322345415.X

天线设备_三星电机株式会社_202010074104.2

加工设备_青岛高测科技股份有限公司_202322713800.5

制冷设备_合肥美的电冰箱有限公司_202322680406.6

饮水设备_浙江绍兴苏泊尔生活电器有限公司_202322627571.5

成像设备_佳能株式会社_202110689991.9

龙图腾网&IPTOP

【发明授权】说话人识别方法、装置、计算机设备及存储介质_平安科技(深圳)有限公司_202110735212.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务