申请/专利权人:南京邮电大学
申请日:2022-05-24
公开(公告)日:2022-09-16
公开(公告)号:CN115066036A
主分类号:H04W74/08
分类号:H04W74/08;H04W28/08;G06N3/08
优先权:
专利状态码:在审-实质审查的生效
法律状态:2022.10.04#实质审查的生效;2022.09.16#公开
摘要:本发明公开了一种基于多智能体协作的多基站排队式前导码分配方法,针对海量智能体随机接入时发生的拥塞问题,在多基站多小区的场景下,提出了一种非竞争的前导码分配方法。基于深度强化学习将设备排队式地选择前导码,并采用联邦学习的训练方法,有效解决了竞争接入时会发生的拥塞问题。首先对新接入的智能体进行分组,根据延迟容忍时间来设定优先级;其次基于多智能的强化学习算法将智能体合理分配给空闲队列;最后采用联邦训练方法,通过神经网络梯度的平均优化来同步优化每个智能体的神经网络,完成各智能体的前导码分配。
主权项:1.一种基于多智能体协作的多基站排队式前导码分配方法,其特征在于,目标区域内包括由至少两个基站组成的网络,每个基站分别均包括前导码池,针对接入网络的各智能体,执行以下步骤S1-步骤S3,完成各智能体的前导码分配;S1.根据各智能体的业务种类,对接入网络的各智能体进行分组,分别针对各组智能体,计算平均延迟容忍度,并按照升序排列各组智能体的平均延迟容忍度,获得优先级集;S2.分别针对各组智能体,基于强化学习算法对各组中的各智能体进行前导码分配;其中,每个前导码对应一个队列,以各队列的最大排队数构建状态空间S,以智能体选择前导码进行排队的动作构建动作空间A,以状态空间S为输入,基于深度神经网络,结合Q学习方法,智能体基于贪婪策略,以收益最大化为目标,选择动作空间A中的动作作为智能体的可执行动作,以智能体的可执行动作的Q值为输出,构建本地智能体前导码分配模型;S3.基于各智能体对应的本地智能体前导码分配模型、以及联邦智能体,构建全局智能体前导码分配模型,基于联邦学习方法,对全局智能体前导码分配模型进行训练,获得训练好的全局智能体前导码分配模型,应用全局智能体前导码分配模型,完成接入网络的各智能体的前导码分配。
全文数据:
权利要求:
百度查询: 南京邮电大学 一种基于多智能体协作的多基站排队式前导码分配方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。