申请/专利权人:音频分析有限公司
申请日:2020-09-29
公开(公告)日:2021-04-09
公开(公告)号:CN112634944A
主分类号:G10L25/51(20130101)
分类号:G10L25/51(20130101);G10L25/30(20130101);G10L25/03(20130101)
优先权:["20191007 US 16/594,624"]
专利状态码:在审-实质审查的生效
法律状态:2022.10.04#实质审查的生效;2021.04.09#公开
摘要:一种用于识别包括音频数据帧序列的音频信号中的非语言声音事件和场景中的至少一个的方法,该方法包括:对于序列的每个帧:处理音频数据帧以提取音频数据帧的多个声学特征;以及通过为声音类别集合中的每个声音类别确定帧表示声音类别的得分,对声学特征进行分类以对帧进行分类;处理帧序列中的多个帧的声音类别得分,以针对每个帧生成每个帧的声音类别决策;以及处理帧序列的声音类别决策,以识别非语言声音事件和场景中的至少一个。
主权项:1.一种用于识别音频信号中的非语言声音事件和场景中的至少一个的方法,所述音频信号包括音频数据帧序列,所述方法包括:对于所述序列的每个帧:处理音频数据帧,以提取所述音频数据帧的多个声学特征;以及通过针对声音类别集合中的每个声音类别确定所述帧表示所述声音类别的得分,对所述声学特征进行分类以对所述帧进行分类;处理所述帧序列中的多个帧的所述声音类别得分,以针对每个帧生成每个帧的声音类别决策;以及处理所述帧序列的所述声音类别决策,以识别非语言声音事件和场景中的至少一个。
全文数据:
权利要求:
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。