【发明公布】一种融合位置和音频通用表征的双耳音频生成方法及系统_厦门大学_202410021101.0

导航：龙图腾网> 最新专利技术> 一种融合位置和音频通用表征的双耳音频生成方法及系统_厦门大学_202410021101.0

申请/专利权人：厦门大学

申请日：2024-01-08

公开（公告）日：2024-03-29

公开（公告）号：CN117789692A

主分类号：G10L13/02

分类号：G10L13/02;G10L21/02;G10L25/03;G10L25/21;G10L25/24;G10L25/30;H04S7/00

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.16#实质审查的生效;2024.03.29#公开

摘要：本发明公开了一种融合位置和音频通用表征的双耳音频生成方法及系统，其特征在于，包括，S1，制作视频帧数据集和音频数据集；S2，对音频数据集进行短时傅里叶变换和计算，得到对应的复数谱图、幅度谱图和相位谱图；S3，将视频帧数据集、音频数据集及其对应的谱图输入包含相对位置信息提取器、音频通用表征提取器、掩膜生成模块的双耳音频还原模型中进行训练和优化；S4，基于训练好的所述双耳音频还原模型进行双耳音频还原。本发明提出的网络模型能够有效提取视频帧中声音源的相对位置信息，获得更有效的音频通用表征，用于引导双耳音频的生成，从而提升系统性能。

主权项：1.一种融合位置和音频通用表征的双耳音频生成方法，其特征在于，包括以下步骤：S1，制作视频帧数据集和音频数据集；S2，对音频数据集进行短时傅里叶变换和计算，得到对应的复数谱图、幅度谱图和相位谱图；S3，将视频帧数据集、音频数据集及其对应的谱图输入包含相对位置信息提取器、音频通用表征提取器、掩膜生成模块的双耳音频还原模型中进行训练和优化；S4，基于训练好的所述双耳音频还原模型进行双耳音频还原。

全文数据：

权利要求：

百度查询：厦门大学一种融合位置和音频通用表征的双耳音频生成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种矿井提升机防止跑车的控制方法与装置_洛阳九亿重工集团有限公司_202410421104.3

下一篇：供电系统、功率变换器以及功率变换电路的控制方法_华为数字能源技术有限公司_202410139301.6

相关技术

一种矿井提升机防止跑车的控制方法与装置_洛阳九亿重工集团有限公司_202410421104.3

供电系统、功率变换器以及功率变换电路的控制方法_华为数字能源技术有限公司_202410139301.6

一种探测烟雾粒度及浓度的方法_烟台创为新能源科技股份有限公司_202410159903.8

一种社团机器人竞赛用综合管理系统_昆山峻优科技培训有限公司_202311812065.1

一种全自动铜铝焊接装置_怀化亚信科技股份有限公司_202410351666.5

数据标注方法、电子设备和计算机可读存储介质_浙江大华技术股份有限公司_202311671122.9

一种脑膜炎球菌发酵培养基及其制备方法和应用_成大生物(本溪)有限公司_202410343870.2

一种RISC-V架构芯片快速测试加速单元的方法及装置_山东浪潮科学研究院有限公司_202410162392.5

CPR辅助按压器_重庆心搏康医疗科技有限公司_202311753834.5

热解油提质为BTEX的两级催化方法_沙特阿拉伯石油公司_202280065181.9

一种中心静脉压手动测量装置_中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)_202410152192.1

一种设备锁定方法、装置及电子设备_联想(北京)有限公司_202410116925.6

龙图腾网&IPTOP

【发明公布】一种融合位置和音频通用表征的双耳音频生成方法及系统_厦门大学_202410021101.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务