买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种面向协作学习的动态聚合方法及装置_清华大学_202410161417.X 

申请/专利权人:清华大学

申请日:2024-02-05

公开(公告)日:2024-04-19

公开(公告)号:CN117709486B

主分类号:G06N20/00

分类号:G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2024.04.19#授权;2024.04.02#实质审查的生效;2024.03.15#公开

摘要:本发明公开了一种面向协作学习的动态聚合方法及装置,该方法应用于协作学习的聚合节点,获取协作学习模型和参与协作学习模型的训练节点,并根据协作学习模型和训练节点的训练节点状态,得到初始化数据集;基于初始化数据集,构建并初始化面向协作学习动态聚合策略的初始强化学习模型;基于训练节点的实时训练节点状态与训练协作学习模型一个轮次所需的实际时间开销,在线训练初始强化学习模型,得到目标强化学习模型;基于目标强化学习模型的预测结果得到目标协作学习聚合策略,并利用目标协作学习聚合策略完成对协作学习模型的训练。本发明保证了协作学习过程中所有训练节点均参与训练,减少了训练节点整体闲置率,提高了全局训练效率与精确度。

主权项:1.一种面向协作学习的动态聚合方法,其特征在于,所述方法应用于聚合节点,包括:协作学习任务开始前,获取协作学习模型和参与所述协作学习模型的训练节点,并根据所述协作学习模型和所述训练节点的训练节点状态,得到初始化数据集;基于所述初始化数据集,构建并初始化面向协作学习动态聚合策略的初始强化学习模型;执行协作学习任务中,获取所述训练节点的实时训练节点状态与训练所述协作学习模型一个轮次所需的实际时间开销;基于所述实时训练节点状态与实际时间开销,在线训练所述初始强化学习模型,得到目标强化学习模型;基于所述目标强化学习模型的预测结果得到目标协作学习聚合策略,并利用所述目标协作学习聚合策略完成对所述协作学习模型的训练;其中,所述基于所述初始化数据集,构建并初始化面向协作学习动态聚合策略的初始强化学习模型,包括:定义强化学习状态,其中,表示第个训练节点完成一个训练轮次所需要的时间;定义强化学习动作为个训练节点的分组数量,即训练节点被分为个组;基于所述强化学习动作定义强化学习奖励,并基于所述强化学习奖励利用聚类算法确定目标分组数量对应的最佳分组集合;基于所述初始化数据集训练强化学习模型,得到初始强化学习模型;所述根据所述目标强化学习模型的预测结果确定目标协作学习聚合策略,并利用目标协作学习聚合策略完成对所述协作学习模型的训练,包括:根据所述目标强化学习模型的预测结果,确定所述协作学习模型对应的最佳分组集合;根据所述最佳分组集合和时间开销,设置协作学习参数聚合算法中聚合函数权重,并获取每个训练节点训练完成的模型参数;根据所述最佳分组集合和所述聚合函数权重对所述训练节点的模型参数进行组内聚合,得到组内聚合结果;定义每个分组中所有训练节点从训练到聚合完成的时间为组内时间开销;根据各组内时间开销和所述组内聚合结果,利用所述协作学习参数聚合算法对所述协作学习模型进行更新,重复上述步骤,直至完成对所述协作学习模型的训练。

全文数据:

权利要求:

百度查询: 清华大学 一种面向协作学习的动态聚合方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。