买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】行为模型的训练方法、结构扩容模型的训练方法_腾讯科技(深圳)有限公司_202210087915.5 

申请/专利权人:腾讯科技(深圳)有限公司

申请日:2022-01-25

公开(公告)日:2024-04-16

公开(公告)号:CN114404977B

主分类号:A63F13/55

分类号:A63F13/55;A63F13/60;A63F13/822;G06N3/044;G06N3/045;G06N3/082;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.10.25#实质审查的生效;2022.04.29#公开

摘要:本申请公开了一种行为模型的训练方法、结构扩容模型的训练方法、基于行为模型控制第一对象的方法、装置、电子设备及存储介质,属于计算机技术领域。该方法包括:通过结构扩容模型,对待扩容模型的模型结构进行扩容,得到行为模型的模型结构信息;获取与该模型结构信息相匹配的初始行为模型;对该初始行为模型进行训练,得到该行为模型,该行为模型控制该第一对象所执行行为的操作水平符合预期水平,且该预期水平高于该待扩容模型控制该第一对象所执行行为的操作水平。本申请利用结构扩容模型在低等级的行为模型基础上扩容得到高等级的行为模型,有利于逐级分层构建对应于不同操作水平的一系列行为模型。

主权项:1.一种行为模型的训练方法,其特征在于,所述方法包括:通过结构扩容模型,对待扩容模型的模型结构进行扩容,得到行为模型的模型结构信息,所述待扩容模型用于控制虚拟场景中的第一对象的行为;获取与所述模型结构信息相匹配的初始行为模型;以所述结构扩容模型为智能体、权重继承模型为环境,对所述结构扩容模型进行强化训练,其中,所述权重继承模型用于提供具有不同模型结构的初始行为模型的模型参数,所述强化训练的强化信号为所述初始行为模型的性能参数,所述性能参数用于表征所述初始行为模型控制所述第一对象所执行行为的操作水平;在所述性能参数符合预期水平时,对所述结构扩容模型停止训练,基于所述权重继承模型和训练完毕的结构扩容模型,获取行为模型;所述行为模型控制所述第一对象所执行行为的操作水平符合所述预期水平,且所述预期水平高于所述待扩容模型控制所述第一对象所执行行为的操作水平。

全文数据:

权利要求:

百度查询: 腾讯科技(深圳)有限公司 行为模型的训练方法、结构扩容模型的训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。