【发明授权】基于世界建模的持续学习框架的学习方法、装置及设备_清华大学_202210522533.0

导航：龙图腾网> 最新专利技术> 基于世界建模的持续学习框架的学习方法、装置及设备_清华大学_202210522533.0

申请/专利权人：清华大学

申请日：2022-05-13

公开（公告）日：2024-04-26

公开（公告）号：CN115099401B

主分类号：G06N3/08

分类号：G06N3/08;G06F18/214;G06F30/27

优先权：

专利状态码：有效-授权

法律状态：2024.04.26#授权;2022.10.14#实质审查的生效;2022.09.23#公开

摘要：本申请涉及一种基于世界建模的持续学习框架的学习方法、装置及设备，方法包括：将获取的目标数据分为多个训练阶段数据；确定当前训练阶段对应的训练阶段数据，并利用当前训练阶段对应的训练阶段数据同时训练任务模型、世界模型和机理模型；使用前一训练阶段对应的训练阶段数据训练的世界模型进行数据采样，生成与第一训练阶段对应的训练阶段数据至前一训练阶段对应的训练阶段数据相同分布的采样数据，并使用前一训练阶段数据训练的机理模型，对当前训练阶段数据和采样数据处理，得到任务模型上对采样数据的采样梯度响应；基于同时训练的任务模型、世界模型和机理模型，通过采样梯度响应来控制任务模型的学习进程。由此，可以实现持续学习的目标。

主权项：1.一种基于世界建模的持续学习框架的学习方法，其特征在于，持续学习框架包括任务模型、世界模型和机理模型，其中，所述方法包括以下步骤：获取目标数据，并将所述目标数据分为多个训练阶段数据，其中，所述目标数据由自然图像的分类任务得到，且所述目标数据为二维彩色自然图像；确定当前训练阶段对应的训练阶段数据，并利用所述当前训练阶段对应的训练阶段数据同时训练所述任务模型、所述世界模型和所述机理模型；使用前一训练阶段对应的训练阶段数据训练的世界模型进行数据采样，生成与第一训练阶段对应的训练阶段数据至所述前一训练阶段对应的训练阶段数据相同分布的采样数据，并使用前一训练阶段数据训练的机理模型，对当前训练阶段数据和所述采样数据处理，得到所述任务模型上对所述采样数据的采样梯度响应；以及基于所述当前训练阶段对应的训练阶段数据同时训练的所述任务模型、所述世界模型和所述机理模型，通过所述采样梯度响应来控制所述任务模型的学习进程；其中，所述通过所述采样梯度响应来控制所述任务模型的学习进程，包括：基于梯度加权融合算法，通过所述采样梯度响应来控制所述任务模型的学习进程，其中，所述梯度加权融合算法为：；其中，和；均为所述任务模型的参数，为整数，为学习率，为利用所述当前训练阶段对应的训练阶段数据训练任务模型时得到的参数梯度，为所述采样梯度响应，为所述参数梯度的学习权重，为所述采样梯度响应的学习权重；所述多个训练阶段数据不重合，且当前训练阶段数据无法再次使用所述前一训练阶段数据。

全文数据：

权利要求：

百度查询：清华大学基于世界建模的持续学习框架的学习方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：双电源双炉体切换开关的自动化控制系统_苏州振湖电炉有限公司_202111432710.8

下一篇：RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

相关技术

双电源双炉体切换开关的自动化控制系统_苏州振湖电炉有限公司_202111432710.8

RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

一种基于Flink流处理的地铁轨道几何检测数据清洗方法_成都国铁电气设备有限公司_202210023454.5

泌尿道菌群检测在女性泌尿道结石诊断中的应用_广东省科学院微生物研究所(广东省微生物分析检测中心)_202111500822.2

消息的发送方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202210060996.X

燃料电池以及燃料电池的制造方法_丰田自动车株式会社_202110209899.8

一种焊剂片约束电弧焊焊接T型接头的夹具_兰州理工大学_201910643137.1

一种农产品供应链信息管理系统_河南建设产业投资有限公司_202311393351.9

高速公路隧道边墙二次衬砌模板支座、结构及使用方法_中铁十四局集团建筑工程有限公司_202111210321.0

移动式组合盐水分离系统_大连盐化集团有限公司_202111204431.6

龙图腾网&IPTOP

【发明授权】基于世界建模的持续学习框架的学习方法、装置及设备_清华大学_202210522533.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务