买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】语种特征提取模型训练方法、装置、设备及存储介质_平安科技(深圳)有限公司_202110467103.9 

申请/专利权人:平安科技(深圳)有限公司

申请日:2021-04-28

公开(公告)日:2024-03-05

公开(公告)号:CN113160795B

主分类号:G10L15/00

分类号:G10L15/00;G10L15/16;G10L15/02;G06F40/211;G06F18/213

优先权:

专利状态码:有效-授权

法律状态:2024.03.05#授权;2021.11.16#实质审查的生效;2021.07.23#公开

摘要:本申请涉及人工智能技术领域,并公开了一种语种特征提取模型训练方法、装置、设备及存储介质,所述方法包括:在降维层对语音样本的特征向量进行降维处理,得到降维特征向量;根据降维特征向量确定上下文特征;重新定义语音样本的正例和反例,根据所述上下文特征预测每个所述语音样本包括的正例和反例;通过预设的特征提取模型的损失函数,对正例和反例的预测结果计算误差;根据所述误差更新语种特征提取模型的模型参数。实现了将上下文对比预测编码用于语种特征的提取,且用语音样本的特征向量均值表征语种特征,稀释掉了和语种无关的特征,提高语种特征提取模型训练的效率及准确性。

主权项:1.一种语种特征提取模型训练方法,其特征在于,所述方法包括:在预设语种特征提取模型的降维层对语音样本的特征向量进行降维处理,得到降维特征向量;将所述降维特征向量输入时序模型,获取上文特征和下文特征;其中,所述时序模型包括自回归模型和反向的自回归模型;所述将所述降维特征向量输入时序模型,获取上文特征和下文特征,包括:将前t帧语音样本对应的降维特征向量输入自回归模型,获取上文特征;将最后一帧到第t+1帧语音样本对应的降维特征向量输入反向的自回归模型,获取下文特征;合并所述上文特征和所述下文特征,得到上下文特征;重新定义语音样本的正例和反例,根据所述上下文特征预测每个所述语音样本为正例或反例,其中,正例的特征向量为与所述语音样本的语种相同的所有语音样本的特征向量的平均值,反例的特征向量为与所述语音样本的语种不同的所有语音样本的特征向量的平均值;所述重新定义语音样本的正例和反例,包括:确定语音样本的目标语种;将每一批量的语音样本中,语种与所述目标语种相同的语音样本定义为正例;将每一批量的语音样本中,语种与所述目标语种不相同的语音样本定义为反例;所述根据所述上下文特征预测每个所述语音样本包括的正例和反例,包括:计算所述上下文特征与每帧语音样本的降维特征向量的内积;根据计算得到的内积结果和预设相关度,预测每帧语音样本为正例或反例;通过预设的特征提取模型的损失函数,确定预测的正例和反例的误差,根据所述误差更新语种特征提取模型的模型参数;其中,所述预设特征提取模型的损失函数包括对抗噪声损失函数,所述通过所述预设特征提取模型的损失函数,确定预测的正例和反例的误差,包括:通过所述对抗噪声损失函数,将预测的正例和反例与实际的正例和反例进行拟合,通过拟合结果确定预测的正例和反例的误差。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 语种特征提取模型训练方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。