买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于声学特征的音乐情绪匹配方法_合肥师范学院_202410131236.2 

申请/专利权人:合肥师范学院

申请日:2024-01-31

公开(公告)日:2024-04-09

公开(公告)号:CN117668285B

主分类号:G06F16/635

分类号:G06F16/635;G06F16/65;G06F16/683;G06N3/0442;G06N3/0455;G06N3/0499;G06N3/082

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2024.03.26#实质审查的生效;2024.03.08#公开

摘要:本发明涉及音乐推荐技术领域,公开了一种基于声学特征的音乐情绪匹配方法,包括:对原始音频数据进行预处理后,将得到的预处理后的音频数据划分为若干段;对于每段音频数据,使用梅尔谱来获得频率特征;利用Transformer模型的编码器结构对所述频率特征进行编码,为每段音频数据生成音频特征向量;将多段音频数据对应的音频特征向量组合为音频特征序列通过双向长短期记忆网络模型捕获音频特征序列中的时间依赖关系,并输出每段音频数据对应的情绪类别;实现音乐情绪的综合理解建模,精准匹配音乐所能唤起的情绪类别。

主权项:1.一种基于声学特征的音乐情绪匹配方法,包括以下步骤:步骤一:对原始音频数据进行预处理后,将得到的预处理后的音频数据划分为N段;对于每段音频数据,使用梅尔谱来获得频率特征,得到频率特征序列;步骤二:通过为所述频率特征添加位置编码获得频域特征,利用Transformer模型的多头自注意力对所述频域特征进行编码,通过捕捉各频域特征之间的关联性,为每段音频数据生成一个向量表征,记为音频特征向量;将N段音频数据对应的音频特征向量组合为音频特征序列,表示音频特征序列中第t个的音频特征向量;步骤三,通过双向长短期记忆网络模型捕获音频特征序列中的时间依赖关系,并输出每段音频数据对应的情绪类别,具体包括:双向长短期记忆网络模型包括正向层和反向层,正向层从读取到,反向层从读取到;正向层第t个时间步的隐藏状态为:;反向层第t个时间步的隐藏状态为:;其中,表示双向长短期记忆网络模型的正向层;表示双向长短期记忆网络模型的反向层;将每个时间步的正向层隐藏状态和反向层隐藏状态串联起来,得到音频特征序列的综合表示:;表示串联;将传递给全连接层,并使用softmax函数或回归方法,得到每段音频数据的情绪类别。

全文数据:

权利要求:

百度查询: 合肥师范学院 一种基于声学特征的音乐情绪匹配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。