买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】终端调度方法及装置_超讯通信股份有限公司;中山大学_202111075428.9 

申请/专利权人:超讯通信股份有限公司;中山大学

申请日:2021-09-14

公开(公告)日:2023-05-26

公开(公告)号:CN113852969B

主分类号:H04W16/22

分类号:H04W16/22;H04W72/542;H04W72/53

优先权:

专利状态码:有效-授权

法律状态:2023.05.26#授权;2022.01.14#实质审查的生效;2021.12.28#公开

摘要:本申请提供一种终端调度方法及装置。其中,所述方法包括:获取包含终端待执行目标动作信息的控制指令;通过终端监控模型,计算当前时刻各终端单元的能量状态值、信息年龄阈值裕度;根据计算得到的各终端单元的能量状态值、信息年龄阈值裕度,并通过终端调度模型,确定执行目标动作的若干目标终端单元;发送所述控制指令至若干目标终端单元。通过充分的考虑环境中能量、以及各终端单元对于数据有效性的限制和差异,有效增加了系统中各传感器终端的时效性,提高了信息数据的新鲜度,从而降低了系统整体的信息年龄水平。

主权项:1.一种终端调度方法,其特征在于,包括以下步骤:获取包含终端待执行目标动作信息的控制指令;通过终端监控模型,计算当前时刻各终端单元的能量状态值、信息年龄阈值裕度;根据计算得到的各终端单元的能量状态值、信息年龄阈值裕度,并通过终端调度模型,确定执行目标动作的若干目标终端单元;发送所述控制指令至若干目标终端单元;其中,所述能量状态值为当前时刻各终端单元剩余电量是否能够支撑一次数据传输的状态评估值,表示为当传感器的剩余电量足够进行一次传输,当传感器的剩余电量不足以进行一次传输,式中,Es为每次发送数据时会消耗固定大小的能量;为传感器当前时刻的估计能量,通过下式计算得到: 式中,Eon为传感器待机时消耗的固定能量,Eon=βEs;Eht为传感器每次捕获的能量,Eht=μEs;Emax为传感器电池具有的最大容量;Ph,n为传感器每次能量成功补充的统计概率;系数β、μ的具体大小由传感器属性决定;所述信息年龄阈值裕度为当前信息距离失效的时间余量,表示为δnt,通过下式计算得到:δnt=τn-Δnt;式中,Δnt为每个传感器在时刻t的信息年龄,代表传感器最新一次成功更新到现在所经历的时间,体现传感器更新的数据的时效性;τn为传感器n在时刻t的信息年龄阈值;所述终端调度模型通过以下步骤优化获得:获取若干训练用的、包含各终端单元执行动作以及调度状态的执行动作-调度状态数据集合;根据所述执行动作-调度状态数据集合并通过双深度Q学习神经网络,负反馈优化所述终端调度模型;所述执行动作-调度状态数据集合通过以下步骤获得:获取包含终端待执行动作信息的训练指令;发送所述训练指令至各终端单元;接收各终端单元发送的实时动作数据;根据接收的实时动作数据并通过终端监控模型,确定各终端单元的调度状态;将所述训练指令、所述各终端单元的调度状态拟合为执行动作-调度状态数据集合;根据所述执行动作-调度状态数据集合并通过双深度Q学习神经网络,负反馈优化所述终端调度模型,具体包括:通过终端监控模型,计算终端完成待执行动作的奖励值,其表示如下: 式中,Rt+1为终端完成待执行动作的奖励值,N为终端的总数,Δnt表示终端n在时刻t的信息年龄,τn为终端n在时刻t的信息年龄阈值;根据所述执行动作-调度状态数据集合以及所述终端完成待执行动作的奖励值,并通过双深度Q学习神经网络,计算所述终端调度模型中待优化的调度参数,其表示如下: 式中,Y为终端调度模型中待优化的调度参数,Rt+1为终端完成待执行动作的奖励值,QT为目标神经网络输出的终端调度策略值,Q为估计神经网络输出的终端调度策略值,γ为折扣因子,为各终端单元的执行动作-调度状态数据集合,Dt+1为下一时刻各终端单元的执行动作数据;根据所述调度参数并通过双深度Q学习神经网络,负反馈优化所述终端调度模型,其表示如下: 式中,Lω为调度参数Y的误差函数,ω为估计神经网络的参数,B指每次计算的批大小,式代表对ω赋值。

全文数据:

权利要求:

百度查询: 超讯通信股份有限公司;中山大学 终端调度方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。