【发明授权】语种特征提取模型训练方法、装置、设备及存储介质_平安科技(深圳)有限公司_202110467103.9

申请/专利权人：平安科技(深圳)有限公司

申请日：2021-04-28

公开（公告）日：2024-03-05

公开（公告）号：CN113160795B

主分类号：G10L15/00

分类号：G10L15/00;G10L15/16;G10L15/02;G06F40/211;G06F18/213

优先权：

专利状态码：有效-授权

法律状态：2024.03.05#授权;2021.11.16#实质审查的生效;2021.07.23#公开

摘要：本申请涉及人工智能技术领域，并公开了一种语种特征提取模型训练方法、装置、设备及存储介质，所述方法包括：在降维层对语音样本的特征向量进行降维处理，得到降维特征向量；根据降维特征向量确定上下文特征；重新定义语音样本的正例和反例，根据所述上下文特征预测每个所述语音样本包括的正例和反例；通过预设的特征提取模型的损失函数，对正例和反例的预测结果计算误差；根据所述误差更新语种特征提取模型的模型参数。实现了将上下文对比预测编码用于语种特征的提取，且用语音样本的特征向量均值表征语种特征，稀释掉了和语种无关的特征，提高语种特征提取模型训练的效率及准确性。

主权项：1.一种语种特征提取模型训练方法，其特征在于，所述方法包括：在预设语种特征提取模型的降维层对语音样本的特征向量进行降维处理，得到降维特征向量；将所述降维特征向量输入时序模型，获取上文特征和下文特征；其中，所述时序模型包括自回归模型和反向的自回归模型；所述将所述降维特征向量输入时序模型，获取上文特征和下文特征，包括：将前t帧语音样本对应的降维特征向量输入自回归模型，获取上文特征；将最后一帧到第t+1帧语音样本对应的降维特征向量输入反向的自回归模型，获取下文特征；合并所述上文特征和所述下文特征，得到上下文特征；重新定义语音样本的正例和反例，根据所述上下文特征预测每个所述语音样本为正例或反例，其中，正例的特征向量为与所述语音样本的语种相同的所有语音样本的特征向量的平均值，反例的特征向量为与所述语音样本的语种不同的所有语音样本的特征向量的平均值；所述重新定义语音样本的正例和反例，包括：确定语音样本的目标语种；将每一批量的语音样本中，语种与所述目标语种相同的语音样本定义为正例；将每一批量的语音样本中，语种与所述目标语种不相同的语音样本定义为反例；所述根据所述上下文特征预测每个所述语音样本包括的正例和反例，包括：计算所述上下文特征与每帧语音样本的降维特征向量的内积；根据计算得到的内积结果和预设相关度，预测每帧语音样本为正例或反例；通过预设的特征提取模型的损失函数，确定预测的正例和反例的误差，根据所述误差更新语种特征提取模型的模型参数；其中，所述预设特征提取模型的损失函数包括对抗噪声损失函数，所述通过所述预设特征提取模型的损失函数，确定预测的正例和反例的误差，包括：通过所述对抗噪声损失函数，将预测的正例和反例与实际的正例和反例进行拟合，通过拟合结果确定预测的正例和反例的误差。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司语种特征提取模型训练方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

下一篇：一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

相关技术

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

一种可移动升降旋转变形床头置物柜_山西传媒学院_202322018692.X

一种不锈钢带输送机构_佛山市南海区东励森金属制品有限公司_202322463638.6

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种点火线圈密封结构_一汽解放汽车有限公司_202322812056.4

一种纸箱生产用贴标机_浙江华信科技发展有限公司_202322178698.3

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种抑菌保暖女式羊绒大衣_安庆初颖数字科技有限公司_202322077610.9

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

方法相关技术

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

通信方法及装置_华为技术有限公司_202010617172.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

信息处理方法_丰田自动车株式会社_202311358127.6

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

冰箱及其控制方法_LG电子株式会社_202080061858.2

冰箱及其控制方法_重庆海尔制冷电器有限公司_202211295888.7

训练相关技术

警务政策多功能训练装置_南京软明信息科技有限公司_202322181392.3

一种足球训练辅助装置_山西铁道职业技术学院_202420196121.7

用于胸腔穿刺训练的服装_中日友好医院(中日友好临床医学研究所)_202322044819.5

一种训练足球反弹率测量装置_天水师范学院_202410145976.1

一种步态康复训练机器人_苏州大学_201811359142.1

一种腿部恢复护理训练装置_鄂俊_202321448389.7

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种骨关节运动康复训练装置_山东大学齐鲁医院_202322393150.0

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

模型相关技术

结构识别模型训练、模型结构识别方法、设备及介质_北京燧原智能科技有限公司_202410090059.8

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

用于模型蒸馏的方法和装置_北京百度网讯科技有限公司_202011473804.5

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种手板模型用打磨设备_青岛诚品模型有限公司_202322254282.5

基于ARIMA模型的容量预测装置及其控制方法_上海新炬网络信息技术股份有限公司_202010209101.5

模型处理方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202011056384.0

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

利用模型增强的自监督学习_硕动力公司_202280060208.5

龙图腾网&IPTOP

【发明授权】语种特征提取模型训练方法、装置、设备及存储介质_平安科技(深圳)有限公司_202110467103.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务