【发明公布】一种音频信号时序对齐方法和装置_歌尔股份有限公司_202011447392.8

导航：龙图腾网> 最新专利技术> 一种音频信号时序对齐方法和装置_歌尔股份有限公司_202011447392.8

申请/专利权人：歌尔股份有限公司

申请日：2020-12-09

公开（公告）日：2021-04-13

公开（公告）号：CN112651429A

主分类号：G06K9/62(20060101)

分类号：G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);G10L21/0216(20130101)

优先权：

专利状态码：有效-授权

法律状态：2022.07.12#授权;2021.04.30#实质审查的生效;2021.04.13#公开

摘要：本申请公开了一种音频信号时序对齐方法和装置。其中方法包括：为待对齐音频信号和模板音频信号分别生成频域图像；将频域图像分别输入到时序偏移量预测模型的双生神经网络中，得到双生神经网络输出的两个频域特征；将两个频域特征进行融合，得到融合特征；将融合特征输入到时序偏移量预测模型的预测网络中，得到预测网络输出的时序偏移量；根据时序偏移量对待对齐音频信号进行时序对齐处理。该技术方案利用深度神经网络从待对齐音频信号和模板音频信号的频域图像中进行特征提取，相较于传统的人工特征方法，鲁棒性更好，特别是在多噪声环境下，深度神经网络提取的特征更具有本质性，稳定性更好；端到端的时序偏移量预测模型精度更高，速度更快。

主权项：1.一种音频信号时序对齐方法，包括：为待对齐音频信号和模板音频信号分别生成频域图像；将所述频域图像分别输入到时序偏移量预测模型的双生神经网络中，得到所述双生神经网络输出的两个频域特征；将所述两个频域特征进行融合，得到融合特征；将所述融合特征输入到时序偏移量预测模型的预测网络中，得到所述预测网络输出的时序偏移量；根据所述时序偏移量对所述待对齐音频信号进行时序对齐处理。

全文数据：

权利要求：

百度查询：歌尔股份有限公司一种音频信号时序对齐方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种国土空间规划用地理信息勘测采集设备_武汉永业赛博能规划勘测有限公司_202410226338.2

下一篇：一种用于输送线的自动取样装置_河南黄河新材料科技有限公司_202410231803.1

相关技术

一种国土空间规划用地理信息勘测采集设备_武汉永业赛博能规划勘测有限公司_202410226338.2

一种用于输送线的自动取样装置_河南黄河新材料科技有限公司_202410231803.1

沿空缺陷型宽煤柱冲击地压防治方法和装置_华亭煤业集团有限责任公司_202211178548.6

投影成像方法及投影成像系统_中国人民解放军国防科技大学_202311858454.8

一种连续管注气工艺管柱及其操作方法_中国石油天然气股份有限公司_202211165652.1

快闪存储器装置、快闪存储器控制器及快闪存储器控制器的方法_慧荣科技股份有限公司_202311186612.X

基于多镜头的图像处理方法、装置、电子设备及存储介质_OPPO广东移动通信有限公司_202410027999.2

电荷泵电路_思瑞浦微电子科技(上海)有限责任公司_202311870614.0

MNT在检测肺腺癌铁死亡和化疗敏感性中的应用_复旦大学附属中山医院_202311869101.8

巡检动画生成方法、装置、计算机设备及存储介质_浙江中控信息产业股份有限公司_202410004969.X

一种虚实结合的遇险救援系统及方法_北京达美盛软件股份有限公司_202311860939.0

一种烹饪器具的风流控温方法_九阳股份有限公司_202410117477.1

龙图腾网&IPTOP

【发明公布】一种音频信号时序对齐方法和装置_歌尔股份有限公司_202011447392.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务