深圳若愚科技有限公司孙腾获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳若愚科技有限公司申请的专利基于多模态大模型的具身智能任务规划器训练方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118036750B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410250472.6,技术领域涉及:G06N5/04;该发明授权基于多模态大模型的具身智能任务规划器训练方法及系统是由孙腾;崔伊然;董忠设计研发完成,并于2024-03-05向国家知识产权局提交的专利申请。
本基于多模态大模型的具身智能任务规划器训练方法及系统在说明书摘要公布了:本申请涉及具身智能的领域,并公开了一种基于多模态大模型的具身智能任务规划器训练方法,包括以下步骤:对多个具身领域原始数据集的重新格式化,数据集格式为图像‑文本‑机器人动作轨迹对;简明具身规划数据的输出,使得具身规划数据的粒度统一;将具身任务规划问题形式化;将重复使用可用信息不断推理的过程表示在行为树上进行搜索。本申请解决了现有技术中具身智能任务规划缺乏与环境的反馈机制,且对于多模态信息的利用不足的技术问题,实现了在具身规划领域数据上的微调,模型能够基于领域内知识理解生成规划的机器人可执行性,提高了具身智能任务规划器的规划成功率。
本发明授权基于多模态大模型的具身智能任务规划器训练方法及系统在权利要求书中公布了:1.基于多模态大模型的具身智能任务规划器训练方法,其特征在于,包括以下步骤:对多个具身领域原始数据集的重新格式化,数据集格式为图像-文本-机器人动作轨迹对;简明具身规划数据的输出,使得具身规划数据的粒度统一;将具身任务规划问题形式化;将重复使用可用信息不断推理的过程表示在行为树上进行搜索;行为树的每个节点是一个状态,该状态表示具有到目前为止的输入和中间步骤序列的部分解决方案,该状态表示为s=[x,z1…i],其中,根节点即为s=[x]表示问题输入,每一个中间步骤zi是一个文本表述的单步可执行动作,如果状态s包含的zn为完成输入x要求所需的最后一个步骤,那么将所有中间步骤组合得到y=z1,…,zn,作为最终的任务规划步骤结果;在生成行为树上的节点状态时,使用步骤生成器Gpθ,s,k,其中pθ表示多模态大模型的参数,其中k为超参数,代表需要生成的中间步骤个数,在当前状态s下,通过对中间步骤可能性分布采样,得到k个可能的中间步骤其中j=1.....k;在对行为树上的节点状态进行评估时,使用大模型生成得到状态s=[x,z1…i]的概率作为评分,即其中用pθ来表示一个经过预训练得到参数θ的大模型,并设置阈值T,如果得到的状态评分scores=T,即认为该状态给出的规划能够实现,输出对应规划y=z1,…,zn;利用多模态大模型本身对具身任务行为树进行可行性校验的增强,可行性校验的增强的步骤包括:设用于状态评估的prompt为promptv;当前需要评估的状态集合为S,包含状态s=[x,z1…i]∈S;将promptvS以及视觉观察O输入给多模态大模型后,其将作为一个状态评估器Vpθ,S,评估S中每个状态的评分Vpθ,Ss;评估器Vpθ,S将会为每个状态独立进行打分,设为其评分方式,则具体数值v代表状态s的评分;集合S中保存的状态将会根据评分不断优化,当状态评分达到阈值后,则实现输入x的需求。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳若愚科技有限公司,其通讯地址为:518125 广东省深圳市龙华区大浪街道浪口社区华昌路239号凯豪达工业园39栋306;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。