【发明授权】一种人机自主智能协同的跟踪方法_中国科学院沈阳自动化研究所_202110671009.5

导航：龙图腾网> 最新专利技术> 一种人机自主智能协同的跟踪方法_中国科学院沈阳自动化研究所_202110671009.5

申请/专利权人：中国科学院沈阳自动化研究所

申请日：2021-06-17

公开（公告）日：2024-04-16

公开（公告）号：CN115494831B

主分类号：G05D1/43

分类号：G05D1/43

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2023.01.03#实质审查的生效;2022.12.20#公开

摘要：本发明构建了一种人机自主智能协同的跟踪方法，步骤为：1基于马尔科夫链对工业现场人机协同场景建立链式模型；2对人机协同行为和过程建立示教模型；3通过机器学习人机协同行为，并基于目标完成情况建立奖惩函数和协同策略规则；4对策略规则进行训练，寻找最优方案；5依据评价指标对训练好的策略进行测试，如果表现满足要求则将策略函数输出，否则回到3进行重新学习；6利用子目标评价函数对策略函数进行分类，并根据目标函数的偏好选取合适的策略函数。本发明收敛速度快，目标协同精度高，对快速移动或者速度变化频繁的人机协同任务目标性能好等优点，并在流水线机器人跟随作业、台车跟随注油等领域具有广阔的应用前景。

主权项：1.一种人机自主智能协同的跟踪方法，其特征在于，包括以下步骤：1建立人机协同场景链式模型：根据马尔科夫链模型建立一个五元组；2根据目标要求，进行人工示教，得到多个策略，构成训练集，所述策略为智能体的某一状态对此状态下所有可能的动作的映射；3智能体获取策略，并对其进行离散采样，分别提取每个策略中各个动作的参数数值和频率，进而得到智能体不同状态下每个动作的近似概率分布；4通过近似概率分布以及状态回报得到对应动作的奖励值，进而得到奖励函数；5基于奖励函数训练最优策略；6对最优策略的性能进行测试：依据评价函数判断最优策略是否满足要求，即将评价函数与阈值比较，若不满足要求，则执行步骤7，否则，执行步骤8；7将最优策略加入训练集中，并修改估计参数，返回步骤4重新估计奖励函数；8提取最优策略的偏好；9根据最优策略的偏好判断该策略是否存在部分优于现有策略，如果是，则将该策略加入现有策略，组成策略集，并修改估计参数，返回步骤4，否则，舍弃该策略；若连续舍弃次数满足设定次数，则执行步骤10，否则，修改估计参数，返回步骤4；10智能体根据最优策略的偏好进行策略集中的策略分类，完成模型构建，智能体根据模型中的策略进行自主跟踪。

全文数据：

权利要求：

百度查询：中国科学院沈阳自动化研究所一种人机自主智能协同的跟踪方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种农牧业通电线卷绕装置_山东恒通智能新材料有限公司_202322431480.4

下一篇：一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

相关技术

一种农牧业通电线卷绕装置_山东恒通智能新材料有限公司_202322431480.4

一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

一种水泥砼搅拌机用振动下料装置_巢湖市恒峰建设工程有限公司_202322581391.8

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

一种火车集卡装卸装置_杭州奥拓机电股份有限公司_202322190678.8

一种籽晶自动熔接结构_四川永祥光伏科技有限公司_202322431204.8

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种接触器触头机构_杭州玛实迪电器科技有限公司_202322179096.X

一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

龙图腾网&IPTOP

【发明授权】一种人机自主智能协同的跟踪方法_中国科学院沈阳自动化研究所_202110671009.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务