Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京同方智科科技有限公司路静获国家专利权

北京同方智科科技有限公司路静获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京同方智科科技有限公司申请的专利一种基于离线学习的多样化交互智能体构建系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119312833B

龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411817674.0,技术领域涉及:G06N3/006;该发明授权一种基于离线学习的多样化交互智能体构建系统是由路静;王帅;唐微微;范黎;于斌设计研发完成,并于2024-12-11向国家知识产权局提交的专利申请。

一种基于离线学习的多样化交互智能体构建系统在说明书摘要公布了:本发明公开了一种基于离线学习的多样化交互智能体构建系统,该系统包括:离线循环系统和智能体交互系统,所述离线循环系统包含进程拆分单元、自我进化单元、存储处理单元、模型调用单元,所述智能体交互系统包含信息共享单元和协作单元;所述离线循环系统使用离线强化算法处理单一智能体独立条件下智能体基本功能,包含思考功能、感知功能、执行功能;智能体交互系统使用交互调节学习算法,增强离线循环系统中信息,使用距离收缩调节算法提升所述智能体交互系统协作效率,与其他单一智能体进行信息交互,有效完成复杂任务。本发明实现了智能体离线状态下的高效学习,提高了多样化智能体完成复杂任务的数据处理效率。

本发明授权一种基于离线学习的多样化交互智能体构建系统在权利要求书中公布了:1.一种基于离线学习的多样化交互智能体构建系统,其特征在于,包括: 离线循环系统和智能体交互系统,所述离线循环系统包含进程拆分单元、自我进化单元、存储处理单元、模型调用单元,所述智能体交互系统包含信息共享单元和协作单元; 所述离线循环系统使用离线强化算法处理单一智能体在独立条件下的智能体基本功能,所述智能体基本功能包含思考功能、感知功能、执行功能; 所述智能体交互系统使用交互调节学习算法,增强所述离线循环系统中存储处理单元中信息,使用距离收缩调节算法提升所述智能体交互系统协作效率,可以与其他单一智能体进行信息交互,有效完成复杂任务; 所述多样化交互智能体包含医疗教学信息管理智能体、协作交互智能体、学生助手智能体、医疗教学探索智能体; 所述智能体交互系统使用交互调节学习算法,增强所述离线循环系统中存储处理单元中信息,使用距离收缩调节算法提升所述智能体交互系统协作效率;其中: 所述交互调节学习算法通过对智能体基本功能的统一训练和分布式实现增强智能体稳定性; 所述交互调节学习算法包含步骤: S1对回归离线功能轨迹进行归一化重构; S2使用隐藏状态分析法建立自洽模型; S3通过距离收缩调节算法提升所述智能体交互系统协作效率; 每个时间序列的智能体动作反馈,表示为: ; 其中,表示上一个时间步的归一化智能体动作反馈,求和符号,表示从时间步t=1到时间步t=T的所有项的总和,T表示时间步的总长度; 归一化策略C,表示为: ; 其中,表示策略函数,t直接表示当前时间步t,表示在时间步t时刻选择的执行动作,K表示时间序列抽样度,表示当前时间步t过去K个时间步的动作反馈,表示当前时间步t过去K个时间步的归一化反馈,表示当前时间步t过去K个时间步的观测状态,表示当前时间步t过去K个时间步的执行动作; 对于归一化重构后的归一化回归离线功能轨迹G,表示为: ; 完成对离线功能轨迹经过序列化建模得到了回归离线功能轨迹过程进行归一化,得到归一化回归离线功能轨迹,其中为归一化的观测值,表示在时间步t时刻选择的执行动作,i为智能体编号; 所述隐藏状态分析法首先对其他智能体n进行采样得到其他智能体的采样轨迹,表示为: ; 其中,v表示采样度,表示智能体n在时间步t的采样状态; 通过最邻近算法对其他智能体的采样轨迹进行概率分布提取,所述概率分布提取时使用所述收缩调节算法,所述收缩调节算法为计算其他智能体的采样轨迹与归一化回归离线功能轨迹G进行比较得到差值最小的时间序列的归一化回归离线功能收缩轨迹,表示为: ; 其中,表示索引的归一化回归离线功能轨迹向量,表示取到的所有归一化回归离线功能轨迹向量,表示取到最小值,表示的估计轨迹向量,j表示遍历索引,k表示最邻近索引; 其中,在在取到所有归一化回归离线功能轨迹向量时使用指数移动平均值法用于提升效率; 所述可以与其他单一智能体进行信息交互,有效完成复杂任务;其中: 所述与其他单一智能体进行信息交互时通过引入自发预训练转换模型降低智能体误差; 所述自发预训练转换模型通过MAPPO算法对多个智能体的归一化回归离线功能轨迹G进行拟合,提升完成复杂任务精度。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京同方智科科技有限公司,其通讯地址为:100080 北京市海淀区王庄路1号清华同方科技大厦A座25层2506室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。