首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】利用生成神经网络的通用语音增强_杜比国际公司_202280065808.0 

申请/专利权人:杜比国际公司

申请日:2022-09-29

公开(公告)日:2024-05-17

公开(公告)号:CN118056236A

主分类号:G10L21/0316

分类号:G10L21/0316;G10L25/30;G10L21/0264;G06N3/0442;G06N3/0455;G06N3/0464;G06N3/0475;G06N3/088;G06N3/0895;G06N3/094;G06N3/084

优先权:["20210929 ES P202130914","20220518 ES P202230427","20211208 US 63/287,207","20220727 US 63/392,575"]

专利状态码:在审-公开

法律状态:2024.05.17#公开

摘要:本公开涉及一种基于神经网络的语音增强系统,该系统包括用于生成增强音频信号的生成网络和用于生成用于生成网络的调节信息的调节网络。调节网络包括多个层,并被配置为接收音频信号作为输入;通过所述多个层传播音频信号;以及提供音频信号的一个或多个第一内部表示或其处理后版本作为调节信息,其中音频信号的所述一个或多个第一内部表示在调节网络的各层被提取。生成网络被配置为接收噪声矢量和调节信息作为输入,并基于噪声矢量和调节信息生成增强音频信号。本公开还涉及一种训练系统的方法。

主权项:1.一种用于音频信号语音增强的基于神经网络的系统,所述系统包括用于生成增强音频信号的生成网络和用于生成用于生成网络的调节信息的调节网络,其中,所述调节网络包括多个层,并被配置为:接收音频信号作为输入;通过所述多个层传播音频信号;以及提供音频信号的一个或多个第一内部表示或其处理后版本作为调节信息,其中音频信号的所述一个或多个第一内部表示在调节网络的各层被提取;并且其中,所述生成网络被配置为:接收噪声矢量和调节信息作为输入,以及基于噪声矢量和调节信息生成增强音频信号。

全文数据:

权利要求:

百度查询: 杜比国际公司 利用生成神经网络的通用语音增强

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术