买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于任务相似度的智能决策模型泛化方法和装置_中国人民解放军军事科学院国防科技创新研究院_202410118074.9 

申请/专利权人:中国人民解放军军事科学院国防科技创新研究院

申请日:2024-01-29

公开(公告)日:2024-05-10

公开(公告)号:CN117648585B

主分类号:G06F18/22

分类号:G06F18/22;G06F18/213;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2024.05.10#授权;2024.03.22#实质审查的生效;2024.03.05#公开

摘要:本发明提供一种基于任务相似度的智能决策模型泛化方法和装置,属于人工智能领域,其中方法包括:构建智能决策模型库;智能决策模型库包括至少一个智能决策模型和每一个智能决策模型对应的任务特征;获取待匹配任务的静态特征和动态特征;动态特征是基于当前时刻待匹配任务的任务状态和预先训练的变分解码器得到的;计算每一个所述智能决策模型的任务特征与所述待匹配任务的任务相似度;所述任务相似度为静态特征相似度和动态特征相似度的加权和;基于各所述任务相似度,确定所述待匹配任务对应的泛化智能决策模型。本发明的基于任务相似度的智能决策模型泛化方法实现了在智能决策模型库中确定与待匹配任务匹配度最高的智能决策模型。

主权项:1.一种基于任务相似度的智能决策模型泛化方法,其特征在于,包括:构建智能决策模型库;所述智能决策模型库包括至少一个智能决策模型和每一个所述智能决策模型对应的任务特征;获取待匹配任务的静态特征和动态特征;所述动态特征是基于当前时刻所述待匹配任务的任务状态和预先训练的变分解码器得到的;计算每一个所述智能决策模型的任务特征与所述待匹配任务的任务相似度;所述任务相似度为静态特征相似度和动态特征相似度的加权和;基于各所述任务相似度,确定所述待匹配任务对应的泛化智能决策模型;其中,所述变分解码器基于以下步骤训练得到:获取样本库和仿真次数;所述样本库中包括初始样本任务;在仿真环境中执行所述初始样本任务,并记录至少一个当前决策时刻点的任务状态和上一决策时刻点的执行效果值;将各所述任务状态和执行效果值存储至所述样本库中,得到更新后的样本库;基于所述更新后的样本库和损失函数对所述变分解码器进行训练,得到用于表征所述初始样本任务动态特征的隐变量;训练次数为所述仿真次数;所述损失函数是采用公式(1)确定的,所述公式(1)如下: (1)其中,B为选取样本的数量,为所述当前决策时刻的任务状态,为预测的下一决策时刻的任务状态,为上一决策时刻的执行效果值,为预测的下一决策时刻的执行效果值。

全文数据:

权利要求:

百度查询: 中国人民解放军军事科学院国防科技创新研究院 基于任务相似度的智能决策模型泛化方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。