【发明公布】智能体的训练方法、交互方法及相应系统_中国科学院自动化研究所_202410444184.4

导航：龙图腾网> 最新专利技术> 智能体的训练方法、交互方法及相应系统_中国科学院自动化研究所_202410444184.4

申请/专利权人：中国科学院自动化研究所

申请日：2024-04-12

公开（公告）日：2024-05-17

公开（公告）号：CN118051780A

主分类号：G06F18/214

分类号：G06F18/214;G06N3/006

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.04#实质审查的生效;2024.05.17#公开

摘要：本公开提供了一种智能体的训练方法、交互方法及相应系统。适用于人机交互场景的智能体的训练方法包括：从所述智能体的策略空间采样多个策略作为本轮训练的测试策略；在人机交互任务环境中对各测试策略进行测试，得到所述各测试策略在m个测试任务上的测试结果；基于所述测试结果，计算用于评估所述各测试策略在各测试任务中的表现的客观评估数据；向用户输出所述测试结果，并接收所述用户对所述各测试策略在所述各测试任务中的表现的主观评估数据；基于所述客观评估数据和所述主观评估数据，更新所述智能体。根据本公开的示例性实施例，综合考虑人类的主观感受和智能体的客观能力完成智能体评估及训练，使训练得到的智能体能力强且被人类认可。

主权项：1.一种适用于人机交互场景的智能体的训练方法，其特征在于，所述训练方法包括：从所述智能体的策略空间采样多个策略作为本轮训练的测试策略，其中，所述策略空间包括n个策略，n为大于1的整数；在人机交互任务环境中对各测试策略进行测试，得到所述各测试策略在m个测试任务上的测试结果，m为大于0的整数；基于所述测试结果，计算用于评估所述各测试策略在各测试任务中的表现的客观评估数据；向用户输出所述测试结果，并接收所述用户对所述各测试策略在所述各测试任务中的表现的主观评估数据；基于所述客观评估数据和所述主观评估数据，更新所述智能体，并确定是否继续更新所述智能体；在确定停止继续更新所述智能体的情况下，将已完成更新的所述智能体作为最终训练好的目标智能体，所述目标智能体用于与人类进行信息交互；其中，在确定继续更新所述智能体的情况下，返回执行从所述智能体的策略空间采样多个策略作为本轮训练的测试策略的步骤，以开始新一轮训练。

全文数据：

权利要求：

百度查询：中国科学院自动化研究所智能体的训练方法、交互方法及相应系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种应用废弃土的材料、制造方法及其应用_深圳市深汕特别合作区世纪凯恒科技有限公司_202410257908.4

下一篇：一种捕获大气中二氧化碳的气肥增施变电吸附组件及其应用_大连理工大学_202410350057.8

相关技术

一种应用废弃土的材料、制造方法及其应用_深圳市深汕特别合作区世纪凯恒科技有限公司_202410257908.4

一种捕获大气中二氧化碳的气肥增施变电吸附组件及其应用_大连理工大学_202410350057.8

一种基于电化学刻蚀出MXene的方法、MXene悬浊液及其用途_江苏大学_202210355260.5

基于热重分析测量沥青路面自修复胶囊囊芯含量的方法_武汉理工大学_202410331310.5

一种智能化墙体块材、饰面砖排版、工程量核算及三维可视化系统及处理方法_中交二航局建筑工程有限公司_202410118335.7

一种建设工程施工噪声数据异常监测方法及系统_天津大学_202410148926.9

一种海域段灌注桩施工质量控制系统_中化学南方建设投资有限公司_202410298081.1

一种分散剂产品提浓方法及装置_中国石油化工股份有限公司_202211551902.5

PICC导管助力装置_兰州大学_202210785700.0

一种钴酸锂正极烧结用防吸锂匣钵及其制备方法_贵州鑫铠新材料科技有限公司_202410092522.2

一种玉米种植用施肥装置及施肥方法_安庆师范大学_202410337560.X

一种战场通信定位系统、装置及测试方法_浙江省军工集团股份有限公司_202410127232.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】智能体的训练方法、交互方法及相应系统_中国科学院自动化研究所_202410444184.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务