买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于动态步长的变长染色体进化方法_大连理工大学_202311854339.3 

申请/专利权人:大连理工大学

申请日:2023-12-29

公开(公告)日:2024-04-02

公开(公告)号:CN117809740A

主分类号:G16B20/20

分类号:G16B20/20;G16B40/00

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.19#实质审查的生效;2024.04.02#公开

摘要:本发明公开了一种基于动态步长的变长染色体进化方法,属于智能优化技术领域。本发明动态地改变了变长染色体进化方法的步长,在前若干代用较大步长探索整个搜索空间,在中后期利用动态步长开发局部的搜索空间,本发明实现了在搜索空间上探索与开发的良好的平衡,有效地增加了算法收敛的速度,并更不容易陷入问题的局部最优值当中,促使深度神经网络对抗攻击问题得到收敛速度更快、表现更好的解决方案。

主权项:1.一种基于动态步长的变长染色体进化方法,其特征在于,该方法包括以下步骤:步骤1、设定问题模型,确定任务目标和适应度函数1.1在一个标准的深度强化学习场景中,在时间步t时,智能体根据观察到的环境状态st生成动作概率分布并采取行动at,并从环境中获得奖励rt;深度神经网络攻击是指对智能体观测到的环境状态st添加一定的噪声δt,使智能体做出错误的动作;噪声δt由两部分组成,一是攻击的像素个数,二是像素改变的幅度,也就是每个像素更改的值大小;对于解决该问题的方法来说,攻击的像素越少越好,改变像素的幅度越低越好,噪声最后需要添加在目标图片上;1.2由此得出深度神经网络攻击的目标为最大化攻击前后智能体动作概率的差值,具体表述如下: 其中,δt表示在时间步长t处对原始状态st添加的扰动,同时也是当前任务的解决方案;在这种情况下,o和e分别表示经过训练的智能体在攻击之前和之后采取的行动;π·|ste表示智能体的动作概率分布为π·|st时选择动作e的概率;π·|st代表当智能体观测到状态st时,产生所有候选动作的概率分布;当公式1中的函数值f大于0时,攻击成功,说明智能体被欺骗,采取了不同的动作;步骤2、确定编码方式所述的编码方式为:在染色体的连续三个点位上记录攻击像素的x坐标、y坐标和攻击幅度;其中,x坐标指的是攻击像素相对于最下方像素的位置,最下方像素坐标为1;y坐标指的是攻击像素相对于最左方像素的位置,最左方像素坐标为1;攻击幅度指的是对于该像素,改变的灰度值大小;灰度值变小为负,灰度值变大为正;原始编码采取连续编码,生成0到1上的小数,通过缩放和四舍五入,映射到需要的范围中;步骤3、初始化种群首先确定当前染色体长度l和最大染色体长度ml,根据步骤2中的编码方式,l和ml均采用图片的最大像素个数乘以3;下文将乘以3省去,也就是将三个点位看成一个步长,这样,每个步长都对应一个像素点,更直观地说明像素攻击的变化;在确定染色体初始长度和最大长度后,随机地生成N个初始子代,子代染色体上的每个点位均为0到1上的随机实数;步骤4、生成子代采用动态步长改变染色体长度,前若干代采取较大步长,初步探索全局搜索空间;剩余代采取动态步长,进一步探索局部搜索空间,由此平衡探索与开发;在染色体长度变化之后,再次应用进化算子:交叉、变异来使种群朝着做出更好攻击的方向进化;步骤5、评估候选解新产生的N个候选解由公式1进行评估;评估结果表明该候选解是否能够实现成功攻击,并作为接下来选择的依据;步骤6、选择下一代候选解新生成的候选解在公式1上评估之后,若其表现优于原先的候选解则进行替换,反之舍弃;步骤7、输出优化后的解决方案完成预设的迭代次数时,种群中保留着表现最好的N个能够实现成功攻击的候选解。

全文数据:

权利要求:

百度查询: 大连理工大学 一种基于动态步长的变长染色体进化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。