成都开心音符科技有限公司杨沛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都开心音符科技有限公司申请的专利和声识别及其模型训练方法、程序产品、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118969012B 。
龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411442252.X,技术领域涉及:G10L25/03;该发明授权和声识别及其模型训练方法、程序产品、设备及存储介质是由杨沛设计研发完成,并于2024-10-16向国家知识产权局提交的专利申请。
本和声识别及其模型训练方法、程序产品、设备及存储介质在说明书摘要公布了:本申请涉及音频处理技术领域,具体提供和声识别及其模型训练方法、程序产品、设备及存储介质。该和声识别模型训练方法基于节拍数据对待训练音频数据进行分割,对分割获得的多个音频分割片段进行特征提取,并将提取获得的待训练音频特征数据输入到待训练和声识别模型中,获得待训练和声识别模型输出的模型识别结果;根据模型识别结果以及待训练音频数据的和声标注结果,对待训练和声识别模型的内部参数进行优化,获得经训练的和声识别模型。由于节拍数据能够更好地表征待训练音频数据的和弦变化位置,基于节拍数据可以更加准确地实现对待训练音频数据的分割定位,进而提高了经训练的和声识别模型的和声识别准确性。
本发明授权和声识别及其模型训练方法、程序产品、设备及存储介质在权利要求书中公布了:1.一种和声识别模型训练方法,其特征在于,所述方法包括: 基于待训练音频数据的节拍数据对所述待训练音频数据进行分割,获得多个音频分割片段; 对所述音频分割片段进行特征提取,获得待训练音频特征数据; 将所述待训练音频特征数据输入到待训练和声识别模型中,获得所述待训练和声识别模型输出的模型识别结果; 根据所述模型识别结果以及所述待训练音频数据的和声标注结果,对所述待训练和声识别模型的内部参数进行优化,获得经训练的和声识别模型; 其中,所述待训练音频数据的节拍数据包括重音节拍位置;在所述基于待训练音频数据的节拍数据对所述待训练音频数据进行分割,获得多个音频分割片段之前,所述方法还包括:对所述待训练音频数据进行节奏特征识别,获得所述待训练音频数据的节奏特征数据;基于所述节奏特征数据,确定所述重音节拍位置; 在所述基于所述节奏特征数据,确定所述重音节拍位置之后,所述方法还包括:根据所述重音节拍位置,计算出所述待训练音频数据的平均节拍帧;根据所述平均节拍帧对所述重音节拍位置进行补充,获得补充后的节拍位置; 所述基于待训练音频数据的节拍数据对所述待训练音频数据进行分割,获得多个音频分割片段,包括:基于所述补充后的节拍位置对所述待训练音频数据进行分割,获得多个所述音频分割片段; 其中,所述基于待训练音频数据的节拍数据对所述待训练音频数据进行分割,获得多个音频分割片段,包括:根据所述重音节拍位置确定所述待训练音频数据的节拍数量;基于所述待训练音频数据的音频长度、所述节拍数量以及确定所述待训练音频数据的节拍速度;根据所述节拍速度和标准节拍速度对所述待训练音频数据进行速度归一化处理,获得标准化音频数据;基于所述节拍数据对所述标准化音频数据进行分割,获得多个所述音频分割片段;tm表示所述待训练音频数据的音频长度,m表示所述节拍数量,bpm表示所述节拍速度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都开心音符科技有限公司,其通讯地址为:610000 四川省成都市高新区天府三街199号B区16层B3-2、B4、B5、B6单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。