买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种针对说话人识别系统对抗样本的防御方法_贵州师范大学_202310918349.2 

申请/专利权人:贵州师范大学

申请日:2023-07-25

公开(公告)日:2024-04-09

公开(公告)号:CN117012204B

主分类号:G10L17/18

分类号:G10L17/18;G10L17/04;G06F18/21;G06N3/094

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2023.11.24#实质审查的生效;2023.11.07#公开

摘要:本发明公开了一种针对说话人识别系统对抗样本的防御方法,包括:(1)制作所需的数据集;(2)构建网络模型,通过改进的CycleGAN‑VC2模型构建出最终的模型CycleGAN‑L2;(3)利用减量学习对模型进行训练;(4)使用训练得到的模型在测试集中进行性能测试,并对CW2、MIM、ADA和FGSM产生的对抗样本进行防御。本发明以CycleGAN‑VC2为骨干网络,在训练集中加入对抗样本和良性样本,减轻防御方法的副作用。并根据减量学习的思想,在训练的过程中删除良性样本,加快模型的训练,使用L2距离对损失函数进行约束,鼓励模型筛选更多的特征,从而实现对抗样本的防御。

主权项:1.一种针对说话人识别系统对抗样本的防御方法,其特征在于:通过融合减量学习和改进的CycleGAN-VC2、维护了说话人识别系统的准确性和鲁棒性;首先,在数据集中加入了良性样本和对抗样本进行生成器的训练,并在训练过程中融入了减量学习的方法对良性数据进行删除;其次对CycleGAN-VC2进行改进,采用L2距离约束损失函数,包括如下步骤:步骤1、制作所需的数据集;步骤2、构建网络模型,通过改进的CycleGAN-VC2模型构建出最终的模型CycleGAN-L2;步骤3、利用减量学习对模型CycleGAN-L2进行训练;步骤4、使用训练得到的模型在测试集中进行性能测试,并对CW2、MIM、ADA和FGSM产生的对抗样本进行防御;所述步骤1具体为,获取Librispeech语音数据集,并从中随机选取10个说话人,每个人100个音频文件用作良性数据集,对良性数据集进行PGD攻击,产生1000个对抗样本用作对抗样本数据集,合并良性数据集和对抗样本数据集获得实验所需自然数据集,并把自然数据集按照9:1的比例划分为训练集和测试集,其中训练集和测试集中良性样本和对抗样本的比例是1∶1;所述步骤2具体为,对CycleGAN-VC2模型中的循环一致性损失Lcyc和身份映射性损失Lid进行修改得到CycleGAN-L2模型,具体公式如下: 其中Gnat→ori和Gori→nat是生成器;循环一致性损失中,Gnat→orix是把自然数据集中的x生成良性数据y,Gori→naty是把良性样本y生成自然数据x;身份映射性损失中,Gnat→oriy是把良性数据y生成良性数据y,Gori→natx是把自然数据x生成自然数据x;循环一致性损失Lcyc和身份映射性损失Lid分别用L2距离进行约束;所述步骤3具体为,采用减量学习的方法对CycleGAN-L2模型进行训练,在训练的过程中如果Gnat→ori输入的是良性样本,输出的良性样本使说话人识别模型x-vector的准确率不变或者下降则去掉自然数据集中的良性数据;所述步骤4具体为,对测试集的良性样本和对抗样本分开进行测试,并用CW2、MIM、ADA和FGSM分别生成1000个对抗样本,进行防御效果测试。

全文数据:

权利要求:

百度查询: 贵州师范大学 一种针对说话人识别系统对抗样本的防御方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。