首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】利用GAN网络生成基于语音对抗样本的ASR系统_山西警察学院_202410133286.4 

申请/专利权人:山西警察学院

申请日:2024-01-31

公开(公告)日:2024-04-30

公开(公告)号:CN117953876A

主分类号:G10L15/16

分类号:G10L15/16;G10L15/06

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.17#实质审查的生效;2024.04.30#公开

摘要:本发明涉及多模态信号融合和语音恢复系统,具体为利用GAN网络生成基于语音对抗样本的ASR系统。由于攻击者通过对语音信号增加微小扰动,致使ASR系统产生具有攻击性的指令,给ASR系统带来了大量的、潜在的安全威胁。因此,针对此类型语音对抗样本攻击的防御技术研究对促进ASR系统完善化、人机交互全面化两方面具有重要的研究价值,成为人工智能领域一大研究热点。基于此,本发明在ASR系统中加入了GAN网络防御模型,构建了一种防御成功率高、可迁移性强、鲁棒性强的语音对抗样本防御技术来解决目前针对采用神经网络方法进行语音攻击防御的相关研究尚未成熟这一难点。

主权项:1.利用GAN网络生成基于语音对抗样本的ASR系统,其特征在于:该系统的使用包括以下步骤:第一步:改进ASR语音识别系统:原ASR系统包括卷积层、双向GRU循环层、全连接层和Softmax函数,在原ASR系统中全连接层和Softmax函数之间加入CTC损失函数,CTC损失函数为衡量扰动大小的损失函数;第二步:搭建GAN网络防御模型:在改进后的ASR系统中加入GAN网络,GAN网络包括生成器和判别器,其中GAN网络位于全连接层和CTC损失函数之间;第三步:构建数据集:将音频数据利用梯度优化算法来引导加入扰动构建数据集,并将数据集分为训练集和验证集;第四步:训练模型:定义训练循环,其中包括生成器和判别器的训练过程,在训练步骤中,生成器围绕上一阶段系统所给定的语音样本生成已防御扰动的语音样本数据,判别器对该生成的语音样本数据和音频数据进行对比,并将语音样本数据中不含有扰动的数据和音频数据分为一类,将含有扰动的数据分为一类,利用CTC损失函数计算损失值,将损失值可视化后通过梯度下降法对GAN网络模型进行优化,在完成上述训练过程后,使用验证集进行验证,用验证集对训练的模型进行评估,直到模型达到要求;第五步:训练好的ASR系统即可抵御扰动。

全文数据:

权利要求:

百度查询: 山西警察学院 利用GAN网络生成基于语音对抗样本的ASR系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术