买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种D2D通信中基于超模博弈的功率控制方法_桂林电子科技大学_201810446097.7 

申请/专利权人:桂林电子科技大学

申请日:2018-05-11

公开(公告)日:2021-01-05

公开(公告)号:CN108601077B

主分类号:H04W52/24(20090101)

分类号:H04W52/24(20090101);H04W52/36(20090101);H04W4/70(20180101)

优先权:

专利状态码:有效-授权

法律状态:2021.01.05#授权;2018.10.26#实质审查的生效;2018.09.28#公开

摘要:本发明公开了一种D2D通信中基于超模博弈的功率控制方法,其特征是,包括如下步骤:1)建立基于超模博弈的系统模型;2)获得蜂窝用户、D2D用户对的终端功率的帕累托占优解。这种方法具有提升系统效用值、保持系统公平性的优点。

主权项:1.一种D2D通信中基于超模博弈的功率控制方法,其特征在于,包括如下步骤:1建立基于超模博弈的系统模型:系统模型其中K={1,2,…,K}表示蜂窝用户和D个D2D用户对的终端集合,是终端j∈κ的策略空间,p是策略集合的最小功率,是用户终端的最大发射功率,为终端效用函数,c为价格因子,在上行链路通信期间,D个D2D用户对共享蜂窝用户的信道资源,并对基站接收信号造成干扰,蜂窝用户信干噪比为:蜂窝用户终端会对D个D2D用户对的接收机产生干扰,相应的D2D用户对接收机信号的的信干噪比为: 其中pk,pd和pd'分别代表蜂窝用户k和D2D用户d,d'的发射功率,gke为蜂窝用户到基站之间的信道增益,gde为第d个D2D对和基站之间的信道增益,gij表示不同用户间的信道增益,σ2表示接收端的热噪声功率,表示D对D2D对基站的干扰功率和,表示蜂窝用户和D2D用户d'∈D,d'≠d对的干扰功率和,每一个终端的最优策略是其他终端策略的响应函数即:根据纳什均衡下的取值得到不同用户的响应函数,蜂窝用户响应函数: D2D用户响应函数: 终端的效用函数如公式5所示: 多终端目标优化问题可以表示为: 终端功率的帕累托占优解为: 其中R是传输速率,为数据帧的准确接收概率,M为一帧比特数,γj为不同用户的信干噪比,即公式1或公式2,lj表示电池生存时间,使用Peukert’s定律C是电池容量,终端用户j的发射功率pj,电路消耗功率p0,工作电压V0,a是一个常数,是价格函数;2获得蜂窝用户、D2D用户对的终端功率的帕累托占优解:使用双层迭代,在外层迭代中求解超模博弈中最优价格cbest,在内层迭代中求解最优价格下的帕累托占优解pcbest,包括:1初始化价格c,并将价格c的值广播给小区内所有终端,初始化所有终端的功率为并依据公式5得到初始效用2进入纳什均衡迭代,重新设置参数n=0,并依据公式5计算每个终端效用,进行迭代更新功率,依据公式7得纳什均衡解p,重新计算所有终端功率更新后的效用值3如果则转到步骤4,否则转到步骤5;4转到步骤2;5cbest=c+△c,pcbest=p0,终止迭代;

全文数据:一种D2D通信中基于超模博弈的功率控制方法技术领域[0001]本发明涉及蜂窝网络中D2D通信技术,具体是一种D2DDevice—to—DeviceCommunication,简称D2D通信中基于超模博弈的功率控制方法。背景技术[0002]蜂窝网络中引入D2D通信,在带来诸多优点的同时也面临着一些挑战,如会话建立、资源分配、功率控制和干扰协调等。D2D通信在一定程度上能解决无线频谱的匮乏,但其仍需在基站控制下复用小区资源,同时给系统带来干扰。D2D通信最主要的挑战是如何恰当地分配可复用的信道资源、传输功率及D2D链路和蜂窝链路的同信道干扰消除。[0003]在超模博弈中,终端的最优响应是随干扰者策略单调递增的。超模博弈最大意义在于它具有纳什均衡,并且可以确定一个纳什均衡的解集,两个纳什均衡点组成解集的上界和下界,超模博弈的简单性使得凸性假设和可微性假设不再必要。[0004]纳什均衡可以最大化每个参与博弈终端的效用值,但是对系统全局效用来说,往往不是帕累托有效的。若通过改变终端策略新策略不同于纳什均衡),可以在不降低某些终端效用值的前提下,提高其他终端效用值,并获得一个更优的全局有效策略组合,称为帕累托占优。[0005]根据上述理论,设计双层迭代最优价格均衡算法求解超模博弈,在外层迭代中求解超模博弈中最优价格cbest,在内层迭代中求解最优价格下的帕累托占优解P^st,并证明了该博弈策略空间中最小功率矢量帕累托占优其它功率矢量。发明内容[0006]本发明的目的是针对现有技术的不足,而提供一种D2D通信中基于超模博弈的功率控制方法。这种方法具有提升系统效用值、保持系统公平性的优点。[0007]实现本发明目的的技术方案是:[0008]—种D2D通信中基于超模博弈的功率控制方法,与现有技术不同的是,包括如下步骤:[0009]1建立基于超模博弈的系统模型:系统模型4是电池容量,终端用户j的发射功率Pj,电路消耗功率Po,工作电压Vo,a是一个常数K是价格函数;[0022]2获得蜂窝用户、D2D用户对的终端功率的帕累托占优解:使用双层迭代,在外层迭代中求解超模博弈中最优价格cbest,在内层迭代中求解最优价格下的帕累托占优解Pcbest,包ιί舌:[0023]1初始化价格c,并将价格c的值广播给小区内所有终端,初始化所有终端的功率为,并依据公式⑸得到初始效用J[0024]2进入纳什均衡迭代,重新设置参数η=0,并依据公式5计算每个终端效用,进行迭代更新功率,依据公式⑺得纳什均衡解P,重新计算所有终端功率更新后的效用值:[0025]3如果;则转到步骤⑷,否则转到步骤⑸;[0026]⑷..,.c=c+z\c,转到步骤⑵;[0027]5==终止迭代;[0028]步骤2中所述的纳什均衡迭代包括:[0029]1设置功率迭代序列j•,初始化迭代次数η,原始功率截止系数为10_6到KT7之间的极小正数ε,用户最大发射功库:歹;[0030]2由响应函数公式(3、公式(4式更新功率序列值,计算最佳响应函数然后分配发射功率;3若或者__f成立,转到步骤⑷;否则转到步骤2,继续循环;[0031]⑷如果.成立,则;否则1保持不变,终止循环。[0032]求解最小功率£,博弈是超模博弈的条件是,效用函数I在(PhPi以及(PhC上具有非递减可微性,由非递减可微性条件得.当:D=21nM时是信干噪比变化率最大点,推导出策略集合的最小功率£i。[0033]定理1:在策略空间下的NPGP博弈是超模博弈,证明:[0034][0035]化简上式括号内的子式得:[0036][0037]又,在策略空间Pj下,故.一得证,即效用函·在PhPn上具有非递减可微性。[0038]2在上述策略空间中求,做量替换令e=-c,有,所以效用函数i在P^c也具有非递减可微性。[0039]综上效用函数丨在PhPn与PM上都具有非递减可微性,满足超模博弈的条件,定理1得证。[0040]超模博弈均衡解集中最小元素PsC=£,可证明PsC为帕累托占优解,并且在该功率下终端的效用最大。[0041]本技术方案利用微观经济学的概念并使用超模博弈理论,将通信网络中的功率控制问题建模为经济学模型,得到有效的帕累托占优解。[0042]传统能效函数仅能表示瞬时数据流量,本技术方案改进效用函数,使其更加接近实际的指标,考虑终端电池的非线性效应,使效用函数包含遍历能效;然后在效用函数中加入定价机制,通过定价激励合作来提高系统性能,但是仍然保持功率控制解决方案的不合作性质。[0043]这种方法具有提升系统效用值、保持系统公平性的优点。附图说明[0044]图1为实施例中D2D通信的系统模型示意图;[0045]图2为实施例中五个终端效用和随价格c的变化曲线示意图;[0046]图3为实施例中总功率随D2D对数的变化曲线示意图;[0047]图4为实施例中总效用随D2D对数的变化曲线示意图;[0048]图5为实施例中信干噪比随D2D对数的变化曲线示意图。具体实施方式[0049]下面结合附图和实施例对本发明的内容作进一步的阐述,但不是对本发明的限定。[0050]实施例:[0051]—种D2D通信中基于超模博弈的功率控制方法,包括如下步骤:[0052]1建立基于超模博弈的系统模型:如图1所示,系统模型,其中K={1,2,···,!}表示蜂窝用户和D个D2D用户对的终端集合,是终端jεκ的策略空间,£是策略集合的最小功率,=是用户终端的最大发射功率,为终端效用函数,c为价格因子,在上行链路通信期间,由于D个D2D用户对共享蜂窝用户的信道资源,并对基站接收信号造成干扰,因此蜂窝用户信干噪比为:[0053][0054]与此同时,蜂窝用户终端也会对D个D2D用户对的接收机产生干扰,相应的D2D用户对接收机信号的的信干噪比为:[0055][0056]其中pk,pd和Pd’分别代表蜂窝用户k和D2D用户d,d’的发射功率,gke为蜂窝用户到基站之间的信道增益,gde为第d个D2D对和基站之间的信道增益,glj表示不同用户间的信道增益,σ2表示接收端的热噪声功率,:·表示D对D2D对基站的干扰功率和,表示蜂窝用户和D2D用户d’eD,d’对的干扰功率和,每一个终端的最优策略是其他终端策略的响应函数即:|,根据纳什均衡下f的取值得到不同用户的响应函数,蜂窝用户响应函数:[0057][0058]D2D用户响应函数:[0059][0060]终端的效用函数如公式⑸所示:[0061]5,多终端目标优化问题可以表示为:[0062]W:,终端功率的帕累托占优解为:[0063][0064]其中R是传输速率,为数据帧的准确接收概率,M为一帧比特数,γ沩不同用户的信干噪比,即公式⑴或公式⑵山表示电池生存时间,使用Peukert’s定律,C是电池容量,终端用户j的发射功率ρ」,电路消耗功率Po,工作电压V〇,a是一个常数,本例a为1.3,是价格函数;[0065]2获得蜂窝用户、D2D用户对的终端功率的帕累托占优解:使用双层迭代,在外层迭代中求解超模博弈中最优价格cbest,在内层迭代中求解最优价格下的帕累托占优解Pcbest,包ιί舌:[0066]1初始化价格c,并将价格c的值广播给小区内所有终端,初始化所有终端的功率为并依据公式⑸得到初始效用€;[0067]2进入纳什均衡迭代,重新设置参数n=0,^」并依据公式5计算每个终端效用,进行迭代更新功率,依据公式⑺得纳什均衡解P,重新计算所有终端功率更新后的效用值;[0068]3如果:则转到步骤⑷,否则转到步骤⑸;[0069]⑷,:c=c+z\c,转到步骤⑵;[0070]5cbest=c+Z\c,,pcbest=p。,终止迭代;[0071]步骤2中所述的纳什均衡迭代包括:[0072]1设置功率迭代序列…,初始化迭代次数η,原始功率,截止系数为ε、本例ε为1〇_6,用户最大发射功率_[0073]2由最佳效应函数公式(3、公式(4式更新功率序列值,计算最佳响应函数办,然后分配发射功率.[0074]3若;或者_f成立,转到步骤4;否则转到步骤2,继续循环;[0075]⑷如果成立,则;否则1保持不变,终止循环。[0076]具体地:[0077]本例为1个蜂窝用户和D=K-I个D2D用户对均匀分布在小区中,位置相对静止,用户终端和基站配备单个天线,每个D2D用户对包含一个发射机和一个接收机终端,D2D用户对和蜂窝用户共享信道资源,蜂窝用户通过基站通信,D2D用户对间距离足够近且直接通信,假设信道系数为简单路径损耗模型:其中A=O.097是一常数,其他参数见下表1:[0078]表1[0079][0080][0081]本例求解最小功率£,博弈’是超模博弈的条件是,效用函数在(P^Pi以及(P^c上具有非递减可微性,由非递减可微性条件得,当:^=21ηΜ时是信干噪比变化率最大点,推导出策略集合的最小功率£i。[0082]超Ϊ莫博弈均衡解集中最小元素psc=£,可证明psc为帕累托占优解,并且在该功率下终端的效用最大。[0083]如图2所示,图中p为不同c值时的均衡解,cbest对应着函数取最大值,pcbest最大程度地保证了所有终端总效用值的最大化,但是,由于cbest的值无法通过数学方法准确计算,受搜索精度的限制,Pc^st是一个帕累托占优解,如果出现有一个用户效用值比以前的均衡效用值要差,我们终止递增定价因子。[0084]如图3所示,图中NPGp表示纳什均衡解,M-NPGPPcbest表示超模博弈均衡解,M-NPGPSpscbest表示超模博弈解集的下界,从图中可以看出系统总功率随D2D对数的增多而增大,并且Pscbest〈Pc;best〈p,说明改进后M-NPGP提高了系统性能,pscbest帕累托占优iPcbest、P〇[0085]如图4所示,从图中可知,M-NPGP效用值较NPG的效用值有所提高,而在M-NPGP中较小的元素Pscbest可以得到比较大的元素Pcbest更高的效用值,同时,随着D2D对数的增加,三种解的总效用值不断减小,最后趋于一致。[0086]如图5所示,NPG中的值是固定值,M-NPGP中pscbest对应的:以上两种均衡解使得各终端的接收信干噪比均相等,而在本实施例中,每个终端的功率搜索空间变为,从图中可以看出在D2D对数较少时,终端均衡时的信干噪比大。[0087]综上可以得出M-NPGP与NPG的结果相比,所有终端的发射功率都下降了,而效用值和生存时间却都得到了提高,但是上述性能的改进是以降低一定的信干噪比为代价的,而降低后的信干噪比仍能保证基本通信,这种代价换取的效益符合应急通信的实际情况。

权利要求:I.一种D2D通信中基于超模博弈的功率控制方法,其特征在于,包括如下步骤:1建立基于超模博弈的系统模型:系统模型1其中K={1,2,···,K}表示蜂窝用户和D个D2D用户对的终端集合,是终端jeK的策略空间,£是策略集合的最小功率,歹是用户终端的最大发射功率,为终端效用函数,c为价格因子,在上行链路通信期间,D个D2D用户对共享蜂窝用户的信道资源,并对基站接收信号造成干扰,蜂窝用户信干噪比为:,蜂窝用户终端会对D个D2D用户对的接收机产生干扰,相应的D2D用户对接收机信号的的信干噪比为:其中Pk,Pd和pd’分别代表蜂窝用户k和D2D用户d,d’的发射功率,gke为蜂窝用户到基站之间的信道增益,gde为第d个D2D对和基站之间的信道增益,glj表示不同用户间的信道增益,σ2表示接收端的热噪声功率,表示D对D2D对基站的干扰功率和,表示蜂窝用户和D2D用户d’eD,d’#d对的干扰功率和,每一个终端的最优策略是其他终端策略的响应函数即,根据纳什均衡下f的取值得到不同用户的响应函数,蜂窝用户响应函数:D2D用户响应函数:终端的效用函数如公式⑸所示:5,多终端目标优化问题可以表示为:,终端功率的帕累托占优解为:其中R是传输速率,为数据帧的准确接收概率,M为一帧比特数,γ」为不同用户的信干噪比,即公式(1或公式(2,込表示电池生存时间,使用Peukert’s定律,C是电池容量,终端用户j的发射功率ρ」,电路消耗功率Po,工作电压V0,a是一个常数,CjPj,p-j=CPj,_Vj'e__K是价格函数;2获得蜂窝用户、D2D用户对的终端功率的帕累托占优解:使用双层迭代,在外层迭代中求解超模博弈中最优价格cbest,在内层迭代中求解最优价格下的帕累托占优解Pc^st,包括:1初始化价格C,并将价格C的值广播给小区内所有终端,初始化所有终端的功率为并依据公式⑸得到初始效用2进入纳什均衡迭代,重新设置参数n=0,并依据公式5计算每个终端效用,进行迭代更新功率,依据公式7得纳什均衡解p,重新计算所有终端功率更新后的效用值⑶如果则转到步骤⑷,否则转到步骤5;⑷時到步骤⑵;5终止迭代。2.根据权利要求1所述的D2D通信中基于超模博弈的功率控制方法,其特征在于,步骤2中所述的纳什均衡迭代包括:1设置功率迭代序列初始化迭代次数n,原始功率截止系数为HT6到1〇_7之间的极小正数ε,用户最大发射功率尹;2由响应函数公式(3、公式(4式更新功率序列值,计算最佳响应函数,然后分配发射功率⑶若或者成立,转到步骤⑷;否则转到步骤2,继续循环;⑷如果成立,则;否则保持不变,终止循环。

百度查询: 桂林电子科技大学 一种D2D通信中基于超模博弈的功率控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。