申请/专利权人:深圳市友杰智新科技有限公司
申请日:2020-07-23
公开(公告)日:2020-11-24
公开(公告)号:CN111739555B
主分类号:G10L25/30(20130101)
分类号:G10L25/30(20130101);G06N3/04(20060101);G06N3/08(20060101)
优先权:
专利状态码:有效-授权
法律状态:2020.11.24#授权;2020.10.30#实质审查的生效;2020.10.02#公开
摘要:本申请揭示了一种基于端到端深度神经网络的音频信号处理方法、装置、存储介质及计算机设备,该方法包括获取音频信号;对音频信号进行分帧处理,得到分帧后的时域信号;将分帧后的时域信号输入预设的第一加窗层进行处理,得到第一输出信号;将第一输出信号输入预设的第一傅里叶变换层进行计算,得到第二输出信号;将所述第二输出信号输入预设的听觉滤波层进行计算,得到已转换成听觉域的第三输出信号,其中所述第一加窗层、第一傅里叶变换层以及听觉滤波层为可训练的且作为深度神经网络的网络前端一部分,与现有技术中全连接方式的网络前端相比,其网络连接稀疏化,使得参数量、运算量大大减小。
主权项:1.一种基于端到端深度神经网络的音频信号处理方法,其特征在于,包括:获取音频信号;对所述音频信号进行分帧处理,得到分帧后的时域信号;将所述时域信号输入预设的第一加窗层进行处理,得到第一输出信号,所述第一输出信号为增加帧与帧之间的连续性的时域信号;将所述第一输出信号输入预设的第一傅里叶变换层进行计算,得到变换成频域信号的第二输出信号;将所述第二输出信号输入预设的听觉滤波层进行计算,得到已转换成听觉域的第三输出信号,其中所述第一加窗层、第一傅里叶变换层以及听觉滤波层为可训练的且作为预设的深度神经网络的一部分。
全文数据:
权利要求:
百度查询: 深圳市友杰智新科技有限公司 基于端到端深度神经网络的音频信号处理方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。