买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于智能反射面的架构及任务卸载方法_东北大学秦皇岛分校_202210699515.X 

申请/专利权人:东北大学秦皇岛分校

申请日:2022-06-20

公开(公告)日:2024-04-16

公开(公告)号:CN114928893B

主分类号:H04W72/54

分类号:H04W72/54;H04W72/53;H04W4/40

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.09.06#实质审查的生效;2022.08.19#公开

摘要:本发明提供一种基于智能反射面的架构及任务卸载方法,涉及自动驾驶领域。该基于智能反射面的架构及任务卸载方法,包括以下步骤:S1、建立用于任务卸载的车辆‑智能反射面‑边缘计算服务器的无线通信信道;S2、降低系统的时延;S3、映射平面层将边缘设备进行数字孪生体映射;S4、深度强化学习DRL算法从历史数据中随机选择数据;S5、数字孪生网络DTN通过控制平面层对边缘网络EN进行卸载决策以及智能反射面的反射表明元素的反馈;S6、重复步骤S1‑S6直至达到终止条件。通过引入数字孪生技术,动态地监控车联网中的车辆状态以及智能反射面状态,协同调度车联网计算资源,合理分配卸载决策以及通过智能反射面增强任务卸载信道质量。

主权项:1.一种基于智能反射面的架构及任务卸载方法,其特征在于:包括以下步骤:S1、建立用于任务卸载的车辆-智能反射面-边缘计算服务器的无线通信信道:hk=hk,m+GHΘHhr,mhk为车辆k到边缘服务器的信道增益,其中GH表示IRS和车辆k之间的信道增益,ΘH表示IRS的反射系数,而hr,m表示IRS到边缘服务器的信道增益;S2、建立任务卸载以及智能反射面控制的目标优化函数以降低系统的时延,直接在车辆本地执行任务时,产生的时延为: 车辆k将任务大小为Xkt的数据卸载到边缘服务器执行时,其传输时延则为: 其中fst为MEC服务器CPU的频率,θt为CPU的转速,flt为本地CPU的频率;S3、映射平面层将边缘设备进行数字孪生体映射,这些映射表示边缘网络EN的运行状态信息,数字孪生网络DTN不仅实时监控网络的状态,还记录网络的历史运行状态,供基于深度强化学习DRL的任务卸载以及智能反射面控制联合优化算法学习,并将数字表示转换为深度强化学习DRL平面层可以处理的张量Tensor形式;S4、深度强化学习DRL算法从历史数据中随机选择数据,在深度强化学习DRL平面层上训练模型,在ODM中,利用ΨPri提取特征,在ΨPri中,利用卷积神经网络CNN中提取空间相关性,最后利用全连接网络FC层进行特征变换使之符合策略输出维度,然后利用以下公式进行第一阶段的双重深度Q网络DDQN的训练: 其中ΨTar中的网络参数每隔一定时间同步来自ΨPri的参数,r为奖励,即r=-Lt,γs为折扣因子,利用L1求解误差,并利用梯度下降法即可更新ΨPri中的参数,而ΨPri的输出即为任务卸载策略,[P,C,W]′为智能体在状态[P,C,W]下采取策略y后的状态,因此ΨTar的作用是让ΨPri的学习更加稳定,在ICM中,将第一阶段的网络参数迁移到ΦPri结构相同的部分,在ΦPri中,利用CNN分别提取[P,C,W]以及智能反射面状态I的空间相关性,最后分别利用FC进行特征变换并聚合使之符合反射元素表面输出维度,然后利用以下公式进行第二阶段DDQN的训练: 其中ΦTar中的网络参数每隔一定时间同步来自ΦPri的参数,r为奖励,即r=-Lt,γp为折扣因子,利用L2求解误差,并利用梯度下降法即可更新ΦPri中的参数,而ΦPri的输出即为反射表明元素的输出[P,C,W]′和I′为智能体在车辆状态[P,C,W]和智能反射面运行状态I下采取使得ΨPri输出值最大的策略后的车辆状态状态以及智能反射面运行状态;S5、数字孪生网络DTN通过控制平面层对边缘网络EN进行卸载决策以及智能反射面的反射表明元素的反馈,边缘网络EN根据反馈的信息进行智能反射面的控制,对车辆的任务卸载进行资源分配;S6、重复步骤S1-S6直至达到终止条件,终止条件可为车联网生命周期的结束。

全文数据:

权利要求:

百度查询: 东北大学秦皇岛分校 一种基于智能反射面的架构及任务卸载方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。