买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种音频节拍的检测方法、装置、计算机设备和存储介质_百果园技术(新加坡)有限公司_202110565138.6 

申请/专利权人:百果园技术(新加坡)有限公司

申请日:2021-05-24

公开(公告)日:2024-02-23

公开(公告)号:CN113299318B

主分类号:G10L25/51

分类号:G10L25/51;G10L25/30

优先权:

专利状态码:有效-授权

法律状态:2024.02.23#授权;2021.09.10#实质审查的生效;2021.08.24#公开

摘要:本发明实施例提供了一种音频节拍的检测方法、装置、计算机设备和存储介质,该方法包括:获取多媒体文件,多媒体文件中具有多帧音频信号,从多媒体文件的多帧音频信号中提取局部的特征,获得多帧音频特征向量,对多帧音频特征向量进行编码,获得第一背景向量,在对第一背景向量添加关于音频信号的注意力的条件下,对第一背景向量进行全局的解码,获得音频信号表达的音符,注意力机制具有更高的感受野,可感知全局的信息,有注意对长期信息建模,适于处理音频信号中的节拍,并且,使用注意力机制训练时并不要求样本帧级对齐,降低对样本的要求,提高符合条件的样本的数量,在保证模型的性能的条件下简化模型训练,从而保证检测节拍的精确度。

主权项:1.一种音频节拍的检测方法,其特征在于,包括:获取多媒体文件,所述多媒体文件中具有多帧音频信号;从所述多媒体文件的多帧音频信号中提取局部的特征,获得多帧音频特征向量;对多帧所述音频特征向量进行编码,获得第一背景向量;在对所述第一背景向量添加关于所述音频信号的注意力的条件下,对所述第一背景向量进行全局的解码,获得所述音频信号表达的音符;所述对多帧所述音频特征向量进行编码,获得第一背景向量,包括:确定预先针对音频信号训练的编码器;将多帧所述音频特征向量输入所述编码器中进行编码,以输出位于所述编码器中末位第一时间步的多帧隐藏状态,作为第一背景向量。

全文数据:

权利要求:

百度查询: 百果园技术(新加坡)有限公司 一种音频节拍的检测方法、装置、计算机设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。