申请/专利权人:合肥工业大学
申请日:2024-01-30
公开(公告)日:2024-04-19
公开(公告)号:CN117912488A
主分类号:G10L25/18
分类号:G10L25/18;G10L25/21;G06N3/0464;G06N3/045
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.07#实质审查的生效;2024.04.19#公开
摘要:本发明提供一种通用音频篡改定位方法、系统、存储介质和电子设备,涉及数字音频技术领域。本发明基于预设的深度学习框架,包括:首先,提取音频信号的Mel谱图作为检测特征,设计了密集连接卷积网络和通道‑空间注意力机制结合增强特征,又引入了自主注意力机制与实际的篡改检测任务相呼应,以增强篡改区域和真实区域的特征差异,最大化的提取特征信息;同时,在解码阶段将浅层特征与深层特征相融合来提高网络的性能;最后,使用自适应阈值来进行预测掩码的精细化,实现在一个网络框架内检测多种篡改类型音频并对篡改区域进行定位。
主权项:1.一种通用音频篡改定位方法,其特征在于,基于预设的深度学习框架,所述深度学习框架包括通道高通滤波器模块、特征增强模块、扩张卷积模块、自注意力模块和解码模块;该方法包括:处理待检测的音频信号,获取相应的Mel谱图;将所述Mel谱图作为通道高通滤波器模块的输入,获取数字滤波信号;将所述数字滤波信号作为特征增强模块的输入,获取第一优化特征和第二优化特征;将所述第二优化特征作为扩张卷积模块的输入,获取接受域放大特征;将所述接受域放大特征作为自注意力模块的输入,获取篡改注意特征;将所述第一优化特征、第二优化特征和篡改注意特征作为解码模块的输入,获取粗略预测掩码;根据所述粗略预测掩码,基于自适应阈值获取相应的精细化预测掩码,以判断待检测的音频信号是否被篡改,若被篡改,在音频信号上确定相应的篡改位置。
全文数据:
权利要求:
百度查询: 合肥工业大学 通用音频篡改定位方法、系统、存储介质和电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。