买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于背靠背协作学习的分布式诱骗抗干扰方法和系统_中国人民解放军国防科技大学_202210528197.0 

申请/专利权人:中国人民解放军国防科技大学

申请日:2022-05-16

公开(公告)日:2022-09-20

公开(公告)号:CN115085856A

主分类号:H04K3/00

分类号:H04K3/00

优先权:

专利状态码:在审-实质审查的生效

法律状态:2022.10.11#实质审查的生效;2022.09.20#公开

摘要:本发明提出的基于背靠背协作学习的分布式诱骗抗干扰方法中,各节点基于相同的信念在无信息交互的条件下根据特定抗干扰策略更新机制制定自身的抗干扰策略,通过背靠背协作机制联合抵抗反应式干扰攻击。各节点持有的相同信念为“单边策略的改变会导致其他节点的联合策略发生线性变化”,在该信念下,各节点在制定自身抗干扰策略时能够对其他节点的诱骗策略进行推测,并在该推测的基础上制定自身抗干扰策略,实现无信息交互条件下的协作抗干扰。该方法应用于分布式无线通信网络场景中,可使用户不通过任何信息交互即可学习到有效的欺骗式抗干扰策略,同时自主选择高效通信策略,在抵御反应式干扰攻击的同时最大化通信系统容量。

主权项:1.一种基于背靠背协作学习的分布式诱骗抗干扰方法,其特征在于,适用于由N个节点和1个反应式干扰机组成的无线通信网络;每个节点包括发射端和接收端,每个发射端均配备有两台发射机,其中一台发射机用于向本节点中的接收端发射数据传输信号,另一台发射机用于向反应式干扰机发射诱骗信号;反应式干扰机对所有信道进行持续监测并选择接收功率值最高的信道进行压制性干扰;所述分布式诱骗抗干扰方法包括以下步骤:S1、定义节点ni的动作ai={ci,vi,pi},其中,ci为节点ni的数据传输信道,vi为节点ni选择的诱骗信道,pi为节点ni的欺骗功率值;定义节点ni的抗干扰策略为其中,A为动作空间,表示为A=M×M×T;M为可用信道集合,M={信道1,信道2,…,信道m},m为可用信道总数量;T为欺骗功率档位集合,记为T={p1,p2,…,pL},p1,p2,…,pL均为功率值,且p1<p2<……<pL,pL为设定欺骗功率上限值,L表示欺骗功率档位数量,pi∈T;πiai表示节点ni选择动作ai的概率值,定义诱骗策略推测集合其中,p-i为除节点ni以外的其他所有节点选择的欺骗功率向量,p-i={p1p2…pi-2pi-1pi+1pi+2…pN},其中pi-1为节点ni-1的欺骗功率值,以此类推;p-i为所有欺骗功率向量p-i的集合,即除节点ni以外的其他所有节点选择的欺骗功率向量的不同组合;为t时隙上节点ni推测其他所有节点选择欺骗功率向量p-i的概率值,N为节点总数;定义诱骗策略推测更新函数: 其中,为欺骗功率向量p-i对应的推测更新系数,为定义的推测更新系数集合;为t+1时隙上节点ni选择欺骗功率pi的概率值,为t时隙上节点ni选择欺骗功率pi的概率值。定义学习回报:其中,表示t时隙上节点ni执行动作ai后获得的学习回报;表示节点ni的诱骗策略推测集合,ri表示节点ni执行动作ai后的有效数据接收功率,D表示节点ni观测得到的诱骗信道数量;ε1、ε2、ε3为预设常数;定义抗干扰策略更新函数:其中,a表示动作,a∈A;表示t+1时隙上节点ni选择动作a的概率值,表示t时隙上节点ni选择动作a的概率值;θ为学习率,θ为预设常数;S2、针对任意节点ni,执行以下步骤;S21、初始化表示t时隙上节点ni选择动作ai的概率值;表示t时隙上节点ni的诱骗策略推测集合;分别表示的初始化值;初始化t=0;S22、判断迭代次数是否达到设定值;否,则执行以下步骤S23-S25;是,则此后所有时隙上节点ni均根据t时隙上的抗干扰策略选择动作ai;S23、节点ni在t时隙上基于选择动作ai,观测诱骗信道数量D并获得执行动作ai后的有效数据接收功率ri;计算学习回报S24、节点ni基于抗干扰策略更新函数获取下一个时隙上的抗干扰策略节点ni基于诱骗策略推测更新函数获取下一个时隙上的诱骗策略推测集合S25、令t=t+1,然后返回步骤S22。

全文数据:

权利要求:

百度查询: 中国人民解放军国防科技大学 一种基于背靠背协作学习的分布式诱骗抗干扰方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。