【发明公布】一种面向大模型神经架构搜索的联邦协同训练方法_天津大学_202410135781.9

导航：龙图腾网> 最新专利技术> 一种面向大模型神经架构搜索的联邦协同训练方法_天津大学_202410135781.9

申请/专利权人：天津大学

申请日：2024-01-31

公开（公告）日：2024-04-30

公开（公告）号：CN117952190A

主分类号：G06N3/098

分类号：G06N3/098;G06N3/096;G06N3/0464;G06N5/01

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.17#实质审查的生效;2024.04.30#公开

摘要：本发明公开了一种面向大模型神经架构搜索的联邦协同训练方法，属于联邦协同训练技术领域，包括以下步骤：步骤1、在云端进行NAS工作，以大模型拆分的残差块作为搜索空间，拼凑最优模型架构；步骤2、根据各个边缘设备的条件限制，将云端的模型按照预设的退出点切分为适合在边缘设备上进行对应场景训练的较小模型并分配；步骤3、分配得到模型后训练，通过距离聚合，按权重将参数聚合至云端；步骤4、未能聚合的参数，通过知识蒸馏的方式，将参数蒸馏至云端；步骤5、通过节能机制调整边缘设备模型训练过程中的迭代次数，加速模型的收敛。本发明提供了一种面向大模型神经架构搜索的联邦协同训练方法，为实现绿色、高效的边缘计算提供一种新的路径。

主权项：1.一种面向大模型神经架构搜索的联邦协同训练方法，其特征在于，包括以下步骤：步骤1、在云端进行NAS工作，以大模型拆分出的残差块作为搜索空间，拼凑出最优模型架构；步骤2、根据各个边缘设备内存以及算力的条件限制，将拼凑得到的最优模型架构按照预设的退出点切分为适合在边缘设备上进行对应场景训练的较小模型并分配；步骤3、分配得到模型后训练，通过距离聚合，按权重将参数聚合至云端；步骤4、未能聚合的参数，通过知识蒸馏的方式，将参数蒸馏至云端；步骤5、通过节能机制调整边缘设备模型训练过程中的迭代次数，加速模型的收敛。

全文数据：

权利要求：

百度查询：天津大学一种面向大模型神经架构搜索的联邦协同训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：移动式组合盐水分离系统_大连盐化集团有限公司_202111204431.6

下一篇：一种外导体压接装置_江苏博之旺自动化设备有限公司_202111235070.1

相关技术

移动式组合盐水分离系统_大连盐化集团有限公司_202111204431.6

一种外导体压接装置_江苏博之旺自动化设备有限公司_202111235070.1

RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

用于运行机动车的方法、调节装置和机动车_奥迪股份公司_202110617439.9

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

一种结构紧凑的测斜仪骨架_青岛智腾科技有限公司_201910663221.X

一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

一种直径与中继协作的信号空间分集传输方法_山东交通学院_202110011021.3

虹吸定量加药装置及加药方法_江西华兴四海机械设备有限公司_202111502512.4

基于数字镜像的变电站自动化设备状态诊断方法和系统_北京四方继保工程技术有限公司_202210022507.1

一种全自动样品混合缩分装置及方法_青岛海关技术中心_201910859073.9

双极化天线阵列测向角度的获取方法、系统、设备及介质_网络通信与安全紫金山实验室_202111062353.0

龙图腾网&IPTOP

【发明公布】一种面向大模型神经架构搜索的联邦协同训练方法_天津大学_202410135781.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务