买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于最大权重调度策略的时延和时新联合优化方法_香港中文大学(深圳)_202211249575.8 

申请/专利权人:香港中文大学(深圳)

申请日:2022-10-12

公开(公告)日:2023-04-07

公开(公告)号:CN115442910B

主分类号:H04W72/542

分类号:H04W72/542;H04W72/53

优先权:

专利状态码:有效-授权

法律状态:2023.04.07#授权;2022.12.23#实质审查的生效;2022.12.06#公开

摘要:本发明公开了一种基于最大权重调度策略的时延和时新联合优化方法,S1.构建时延和时新联合的优化模型,并确定联合优化的目标问题;S2.设计联合调度框架,所述联合调度框架包含权重评估模块、排序模块和信道分配模块;S3.确定联合优化的目标优化问题所对应的调度策略,作为时延和时新联合优化结果。本发明适用于存在高维状态空间和行动空间的马尔科夫决策过程,高效实现了延迟和时新的联合优化。

主权项:1.一种基于最大权重调度策略的时延和时新联合优化方法,其特征在于:包括以下步骤:S1.构建时延和时新联合的优化模型,并确定联合优化的目标问题;所述步骤S1包括:S101.对于一个基站、I个信息节点和J个移动终端构成的移动通信系统;I个信息节点会在每个时隙生成I种最新的状态信息;J个移动终端均匀分布在基站小区里,并随机向基站发送请求以获取信息节点的最新状态信息;基站有L个可用信道,其在接收到移动终端的请求后,一方面会调用信道实现信息节点最新状态信息的上行传输并会将其存储到基站的缓存空间中,另一方面会调用信道将缓存的状态信息下行传输至移动终端;S102.为了量化移动终端的平均时延,首先基于移动终端与基站的信道增益大小,将J个移动终端分为K个终端集合其中,内的移动终端在第t个时隙内会向基站发送ak,it个请求以获取第i个信息节点的最新状态信息;接收到移动终端的请求信息后,基站一方面会调度下行信道服务这些请求,记bk,it为内请求第i个状态信息的移动终端中在第t个时隙内被服务到的数量;另一方面,基站使用KI个队列来存储未被及时服务的请求,记第kI+i个队列在第t个时隙开始时存储的请求数量为qk,it,则有qk,it+1=qk,it-bk,it+ak,it公式1.1将移动终端的平均时延表征为 为了量化移动终端的平均时新,记第t个时隙时基站端所缓存状态信息的信息年龄为cit基站端所缓存的第i状态信息的信息年龄,i=1,2…I,将移动终端的平均时新表征为 移动终端的平均时新包括三个部分,第一部分为移动终端发出请求后,其请求在基站端排队的时延,第二部分为基站端缓存的状态信息当前的信息年龄,第三部分为将所请求状态信息下行传输的时间;S103.构建时延和时新联合优化的目标函数为 联合优化的控制变量为L个信道的调度策略其中,d1t,d2t,…,dKIt表示下行服务的策略;dKI+1t,dKI+2t,…,dKI+It为上行服务策略;dk-1I+it,k∈{1,2,…,K},i∈{1,2,…,I}表征第t时隙时用于下行服务中请求第i个状态信息移动终端的信道数量;dKI+it,i∈{1,2,…,I}表征第t时隙时用于上行更新第i种状态信息分配的信道数量;因信道数量共有L个,dt需满足以下限制条件 最后基于dt确定bk,it和ct的更新规则:考虑内的移动终端与基站之间的下行信道增益为gk,当基站调用信道下行传输内移动终端的请求时,传输成功的概率为pgk,则有 Prbk,it=l表示bk,it=l的概率;即采用dk-1I+it个信道服务内请求第i个状态信息的移动终端时,成功服务l个移动终端的概率等于dk-1I+it中取l的组合总数乘上成功概率pgk的l次方,再乘上失败概率1-pgk的dI+kI+it-l次方;考虑第i个信息节点与基站之间的上行信道增益满足分布gI+i,当基站调用信道上行传输第i个信息节点的状态信息时,传输成功的概率为pgI+i,则有 将时延和时新联合优化的目标问题总结为 s.t.公式1.1~1.5其中,该问题为马尔科夫决策过程,定义K行I列矩阵Qt来存储所有的队列信息,使得则马尔科夫决策过程的状态为行动为dt,状态转移规则为公式1.1,公式1.4和公式1.5,奖励为rt;S2.设计联合调度框架,所述联合调度框架包含权重评估模块、排序模块和信道分配模块;所述步骤S2包括:S201:构建权重评估模块,其将状态信息st作为输入,输出权重向量并将其记为S2011:初始化权重向量为S2012:基于st中Qt的值更新即令其中的k和i满足k∈{0,1,…,K-1},i∈{1,2,…,I};S2013:基于st中ct的值更新即令S202:构建排序模块,其将作为输入,输出中值最大的元素位置并记为:x=kxI+ix,kx∈{0,1,…,K},ix∈{1,2,…,I},即有 同时,令并输出更新后的S203:构建信道分配模块,其将状态信息st,排序模块的输出位置x=kxI+ix的值和一特定中间变量y作为输入,输出调度策略的值和更新后的y值:S2031:如果x=kxI+ix的值满足kx<K,则令同时,更新y为S2032:如果x=kxI+ix的值满足kx=K,则令同时,更新y为y=y-1;S3.确定联合优化的目标优化问题所对应的调度策略,作为时延和时新联合优化结果;所述步骤S3中,需要确定联合联合优化问题的对应的调度策略包括以下子步骤:S301:初始化t=1;基站端所缓存的I个状态信息的信息年龄为c1=1I×1;令临时变量y=L;并基于公式1.1得到状态信息的被存储的请求数量矩阵Q1;S302:初始化调度策略的值为dt=0KI+I×1;联合Qt和ct的值得到t时隙时的状态信息st={Qt,ct};S303:将状态信息st的值送入S201中设计的权重评估模块,该模块会调用步骤S2012分别评估KI路下行传输对时延时新联合优化的影响,调用步骤S2013分别评估I路上行传输对时延时新联合优化的影响;最后基于KI+I路各自对联合优化的影响大小赋予各路相应权重并存储在权重向量中,即执行S2012中的和S2013中的S304:联合S202中的排序模块和S203中的信道分配模块得到调度策略dt:A1、将权重向量作为输入送给S202中设计的排序模块,得到中最大权重所在位置并将此位置赋给x=kxI+ix,并基于S202更新将st,x=kxI+ix和y的值送入S203中设计的信道分配模块,得到调度策略dt中元素的值,同时基于S203更新临时变量y的值;A2、如果y=0,代表调度策略dt中所有的元素都已被赋值,则跳转至步骤S305;否则跳转回步骤A1;S305:执行dt对应的调度决策;S306:令t=t+1;如果t=T,则结束调度;S307:基于公式1.1得到状态信息的被存储的请求数量矩阵Qt;基于公式1.4和公式1.5得到基站端所缓存的I个状态信息的信息年龄ct;S308:跳转回步骤S302。

全文数据:

权利要求:

百度查询: 香港中文大学(深圳) 一种基于最大权重调度策略的时延和时新联合优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。