【发明授权】行为模型的训练方法、结构扩容模型的训练方法_腾讯科技(深圳)有限公司_202210087915.5

导航：龙图腾网> 最新专利技术> 行为模型的训练方法、结构扩容模型的训练方法_腾讯科技(深圳)有限公司_202210087915.5

申请/专利权人：腾讯科技(深圳)有限公司

申请日：2022-01-25

公开（公告）日：2024-04-16

公开（公告）号：CN114404977B

主分类号：A63F13/55

分类号：A63F13/55;A63F13/60;A63F13/822;G06N3/044;G06N3/045;G06N3/082;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2022.10.25#实质审查的生效;2022.04.29#公开

摘要：本申请公开了一种行为模型的训练方法、结构扩容模型的训练方法、基于行为模型控制第一对象的方法、装置、电子设备及存储介质，属于计算机技术领域。该方法包括：通过结构扩容模型，对待扩容模型的模型结构进行扩容，得到行为模型的模型结构信息；获取与该模型结构信息相匹配的初始行为模型；对该初始行为模型进行训练，得到该行为模型，该行为模型控制该第一对象所执行行为的操作水平符合预期水平，且该预期水平高于该待扩容模型控制该第一对象所执行行为的操作水平。本申请利用结构扩容模型在低等级的行为模型基础上扩容得到高等级的行为模型，有利于逐级分层构建对应于不同操作水平的一系列行为模型。

主权项：1.一种行为模型的训练方法，其特征在于，所述方法包括：通过结构扩容模型，对待扩容模型的模型结构进行扩容，得到行为模型的模型结构信息，所述待扩容模型用于控制虚拟场景中的第一对象的行为；获取与所述模型结构信息相匹配的初始行为模型；以所述结构扩容模型为智能体、权重继承模型为环境，对所述结构扩容模型进行强化训练，其中，所述权重继承模型用于提供具有不同模型结构的初始行为模型的模型参数，所述强化训练的强化信号为所述初始行为模型的性能参数，所述性能参数用于表征所述初始行为模型控制所述第一对象所执行行为的操作水平；在所述性能参数符合预期水平时，对所述结构扩容模型停止训练，基于所述权重继承模型和训练完毕的结构扩容模型，获取行为模型；所述行为模型控制所述第一对象所执行行为的操作水平符合所述预期水平，且所述预期水平高于所述待扩容模型控制所述第一对象所执行行为的操作水平。

全文数据：

权利要求：

百度查询：腾讯科技(深圳)有限公司行为模型的训练方法、结构扩容模型的训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

下一篇：一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

相关技术

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

一种矮轴gasket结构的机械键盘_渴创技术(深圳)有限公司_202322395230.X

一种接触器触头机构_杭州玛实迪电器科技有限公司_202322179096.X

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

房屋建设用墙面喷漆装置_台州龙翔建设有限公司_202322374884.4

用于高压柜体的固定防护装置_江苏贯中电气有限公司_202322341188.3

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种电池叠放平台_济源市万洋绿色能源有限公司_202322480402.3

一种液压锁密闭性测试装置_靖江市长源液压机械有限公司_202322518953.4

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

龙图腾网&IPTOP

【发明授权】行为模型的训练方法、结构扩容模型的训练方法_腾讯科技(深圳)有限公司_202210087915.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务