【发明公布】音频获取方法、装置、电子设备及存储介质_深圳市声扬科技有限公司_202410344779.2

导航：龙图腾网> 最新专利技术> 音频获取方法、装置、电子设备及存储介质_深圳市声扬科技有限公司_202410344779.2

申请/专利权人：深圳市声扬科技有限公司

申请日：2024-03-25

公开（公告）日：2024-04-26

公开（公告）号：CN117935838A

主分类号：G10L21/0232

分类号：G10L21/0232;G10L21/0364;G10L25/18;G10L25/30;G06N3/0442;G06N3/048;G06N3/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.14#实质审查的生效;2024.04.26#公开

摘要：本申请公开一种音频获取方法、装置、电子设备及存储介质。该方法包括：获取样本音频片段；基于对应的实数谱和虚数谱获取与多个通道各自对应的掩膜；基于对应的掩膜更新每个通道对应的实数谱和虚数谱，得到新的多通道实数谱和新的多通道虚数谱；将新的多通道实数谱和新的多通道虚数谱输入待训练神经网络模型的指定注意力池化层，并获取指定注意力池化层输出的与样本音频片段对应的单通道实数谱与单通道虚数谱；基于单通道实数谱与单通道虚数谱获取目标损失函数，并将目标损失函数收敛时的待训练神经网络模型作为目标神经网络模型，通过目标神经网络模型进行音频拾取。本方法提升了神经网络模型对音频片段关键通道的关注能力，提升音频拾取效果。

主权项：1.一种音频获取方法，其特征在于，所述方法包括：获取样本音频片段，所述样本音频片段包括多个通道，每个通道有对应的实数谱和虚数谱；基于所述对应的实数谱和虚数谱获取与所述多个通道各自对应的掩膜；基于所述对应的掩膜更新每个通道对应的实数谱和虚数谱，得到新的多通道实数谱和新的多通道虚数谱；将所述新的多通道实数谱和新的多通道虚数谱输入待训练神经网络模型的指定注意力池化层，以对所述指定注意力池化层进行训练，并获取所述指定注意力池化层输出的与所述样本音频片段对应的单通道实数谱与单通道虚数谱；基于所述单通道实数谱与单通道虚数谱获取目标损失函数，并将目标损失函数收敛时的待训练神经网络模型作为目标神经网络模型，通过所述目标神经网络模型进行音频拾取。

全文数据：

权利要求：

百度查询：深圳市声扬科技有限公司音频获取方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种法兰平面研磨装置_无锡开多瑞科技有限公司_202410444198.6

下一篇：电压比较电路、控制方法及BOOST开关变换器_晶艺半导体有限公司_202410496916.4

相关技术

一种法兰平面研磨装置_无锡开多瑞科技有限公司_202410444198.6

电压比较电路、控制方法及BOOST开关变换器_晶艺半导体有限公司_202410496916.4

一种具有节水灌溉功能的新型农业大棚_太原师范学院_202410447907.6

一种用于面包的包装设备_卡洛斯(福建)食品有限公司_202410438281.2

激光切割机_河北睿高机器人科技有限公司_201710965426.4

一种飞灰水洗脱盐资源化系统及其一体化设备_北京国润伟业科技中心(有限合伙)_202410417014.7

针对由一个DCI调度的多个PDSCH传输或PUSCH传输的波束确定_联想(北京)有限公司_202180101107.3

一种深基坑支护结构的施工方法_中铁二十四局集团有限公司_202410448681.1

一种用于连续化制备POE的工艺设备及工艺_天津君宇科技股份有限公司_202410471373.0

环境状态变化量记录仪器的收纳支撑装置及其使用方法_洛阳石化工程建设集团有限责任公司_202410460998.7

一种多档可调光照明电路、PCB板及照明装置_佛山市南海区平翊电子有限公司_202410503403.1

测试钳及中置柜断路器回路电阻测试装置_国网山东省电力公司泰安供电公司_201910017586.5

龙图腾网&IPTOP

【发明公布】音频获取方法、装置、电子设备及存储介质_深圳市声扬科技有限公司_202410344779.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务