【发明授权】语种识别方法、装置、设备及存储介质_平安科技(深圳)有限公司_202110593396.5

导航：龙图腾网> 最新专利技术> 语种识别方法、装置、设备及存储介质_平安科技(深圳)有限公司_202110593396.5

申请/专利权人：平安科技(深圳)有限公司

申请日：2021-05-28

公开（公告）日：2024-02-27

公开（公告）号：CN113327584B

主分类号：G10L15/00

分类号：G10L15/00;G10L15/16;G10L15/06;G10L15/02

优先权：

专利状态码：有效-授权

法律状态：2024.02.27#授权;2021.11.16#实质审查的生效;2021.08.31#公开

摘要：本申请涉及人工智能和语音识别领域，具体公开了一种语种识别方法、装置、设备及存储介质，所述方法包括：获取样本音频和样本音频对应的音频标签；对样本音频进行数据处理，得到样本音频对应的特征矩阵；将特征矩阵输入第一神经网络，得到特征矩阵对应的帧内特征；将特征矩阵输入第二神经网络，得到特征矩阵对应的帧间特征；根据帧内特征和帧间特征进行逻辑回归，以对样本音频进行语种识别，得到样本音频的预测类别；基于样本音频的预测类别和音频标签对第一神经网络和第二神经网络进行迭代训练，并将训练完成的第一神经网络和训练完成的第二神经网络合并得到语种识别模型，并基于语种识别模型对待识别语音进行语种识别。提高了语种识别的准确率。

主权项：1.一种语种识别方法，其特征在于，包括：获取样本音频和所述样本音频对应的音频标签；对所述样本音频进行数据处理，得到所述样本音频对应的特征矩阵；将所述特征矩阵输入第一神经网络，得到所述特征矩阵对应的帧内特征；所述帧内特征用于表征语种的发音特性，所述第一神经网络包括使用一维空洞卷积神经网络构建的五层编码器；所述将所述特征矩阵输入第一神经网络，得到所述特征矩阵对应的帧内特征，包括：将所述特征矩阵输入第一神经网络，得到多个输出特征，对多个所述输出特征进行平均，得到帧内特征；或者将所述特征矩阵输入第一神经网络，得到多个输出特征，将多个所述输出特征作为帧内特征；将所述特征矩阵输入第二神经网络，得到所述特征矩阵对应的帧间特征；所述帧间特征用于表征语种的时序依赖信息，所述第二神经网络包括使用一维空洞卷积神经网络构建的五层编码器和自回归模型；根据所述帧内特征和所述帧间特征进行逻辑回归，以对所述样本音频进行语种识别，得到所述样本音频的预测类别；所述根据所述帧内特征和所述帧间特征进行逻辑回归，以对所述样本音频进行语种识别，得到所述样本音频的预测类别，包括：对所述帧内特征和所述帧间特征进行拼接融合，得到拼接特征；基于所述拼接特征进行逻辑回归，对所述拼接特征对应的样本音频进行打分，以根据所述样本音频的得分确定所述样本音频的预测类别；基于所述样本音频的预测类别和所述音频标签对所述第一神经网络和所述第二神经网络进行迭代训练，将训练完成的第一神经网络和训练完成的第二神经网络合并得到语种识别模型，并基于所述语种识别模型对待识别语音进行语种识别；所述方法还包括：统计所述样本音频的识别正确的正确数量和所述样本音频的总数量，并给予所述正确数量和所述总数量计算所述样本音频的识别准确率；若所述识别准确率大于或等于预设阈值，则完成对所述第一神经网络和所述第二神经网络的训练；其中，若所述样本音频的预测类别和所述样本音频的音频标签相同，则确定对所述样本音频的识别结果为识别正确。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司语种识别方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

下一篇：一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

相关技术

双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

一种耐泥沙高密封性水泵控制阀_国电龙达电力设备(天津)有限责任公司_202322437322.X

一种电池叠放平台_济源市万洋绿色能源有限公司_202322480402.3

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

方法相关技术

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

通信方法及装置_华为技术有限公司_202010617172.9

信息处理方法_丰田自动车株式会社_202311358127.6

通信方法及装置_华为技术有限公司_202311024020.8

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

冰箱及其控制方法_LG电子株式会社_202080061858.2

设备相关技术

定位设备_广州五所环境仪器有限公司_202311565624.3

显示设备_三星显示有限公司_202010327240.8

镀膜设备_拉普拉斯(西安)科技有限责任公司_202322657883.0

显示设备_三星显示有限公司_202110188056.4

通信设备_索尼公司_201880061066.8

显示设备_三星显示有限公司_202322240461.3

显示设备_联想(北京)有限公司_202322360525.3

设备柜_山东核电有限公司_202322345415.X

天线设备_三星电机株式会社_202010074104.2

加工设备_青岛高测科技股份有限公司_202322713800.5

装置相关技术

定影装置及图像形成装置_富士胶片商业创新有限公司_202310510018.5

发热装置及电子雾化装置_深圳市基克纳科技有限公司_202322129414.1

液体试剂供应装置及分析装置_东亚DKK株式会社_202010736498.3

操控装置、显示装置及车辆_小米汽车科技有限公司_202320552919.6

基板处理装置和流体加热装置_东京毅力科创株式会社_202311318777.8

输入装置_欧姆龙株式会社_201980039113.3

台架装置_北京车和家汽车科技有限公司_202322479605.0

蓄电装置_丰田自动车株式会社_202210313089.1

过滤装置_合肥学院_201910547672.7

景观装置_万达商业规划研究院有限公司_202322576816.6

龙图腾网&IPTOP

【发明授权】语种识别方法、装置、设备及存储介质_平安科技(深圳)有限公司_202110593396.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务