腾讯音乐娱乐科技(深圳)有限公司谭志力获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉腾讯音乐娱乐科技(深圳)有限公司申请的专利音色特征提取模型的训练和音频合成的方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115862586B 。
龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211485541.9,技术领域涉及:G10L13/02;该发明授权音色特征提取模型的训练和音频合成的方法及装置是由谭志力设计研发完成,并于2022-11-24向国家知识产权局提交的专利申请。
本音色特征提取模型的训练和音频合成的方法及装置在说明书摘要公布了:本申请实施例公开了一种音色特征提取模型的训练和音频合成的方法及装置,属于计算机技术领域。所述方法包括:根据待训练的音色特征提取模型对第一人物的第一样本音频提取第一音色特征,对第一人物的第二样本音频提取第二音色特征,对第二人物的第三样本音频提取第三音色特征;以最小化第一音色特征与第二音色特征的差异、且最大化第一音色特征与第三音色特征的差异为训练目的,对待训练的音色特征提取模型进行训练;若满足训练结束条件,则将满足训练结束条件的音色特征提取模型确定为目标音色特征提取模型。采用本申请实施例,可以提高音色特征提取的效率。
本发明授权音色特征提取模型的训练和音频合成的方法及装置在权利要求书中公布了:1.一种音色特征提取模型的训练方法,其特征在于,所述方法包括: 获取第一人物的第一样本音频、所述第一人物的第二样本音频和第二人物的第三样本音频,所述第一样本音频和所述第三样本音频是对应相同文本的朗读音频,所述第一样本音频和所述第二样本音频是对应不同文本的朗读音频; 根据待训练的音色特征提取模型对所述第一样本音频提取第一音色特征,根据所述待训练的音色特征提取模型对所述第二样本音频提取第二音色特征,根据所述待训练的音色特征提取模型对所述第三样本音频提取第三音色特征; 以最小化所述第一音色特征与所述第二音色特征的差异、且最大化所述第一音色特征与所述第三音色特征的差异为训练目的,对所述待训练的音色特征提取模型进行训练;若满足训练结束条件,则将满足训练结束条件的音色特征提取模型确定为目标音色特征提取模型; 其中,所述训练结束条件为条件一、条件二或者条件三,所述条件一为达到指定的训练次数,所述条件二为使用训练得到的音色特征提取模型计算得到的损失值小于指定数值,所述条件三为使用训练得到的音色特征提取模型提取的音色特征进行音频合成的实验,以得到合成的音频,对所述合成的音频与提取音色特征所使用的音频进行对比,匹配度达到指定数值,或连续多次实验的匹配度达到指定数值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯音乐娱乐科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市前海深港合作区前湾一路1号A栋201室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。