【发明授权】基于方向奖励的机械臂智能控制方法_中国人民解放军军事科学院国防科技创新研究院_202111070047.1

申请/专利权人：中国人民解放军军事科学院国防科技创新研究院

申请日：2021-09-13

公开（公告）日：2023-05-16

公开（公告）号：CN113967909B

主分类号：B25J9/16

分类号：B25J9/16

优先权：

专利状态码：有效-授权

法律状态：2023.05.16#授权;2022.02.15#实质审查的生效;2022.01.25#公开

摘要：本发明公开了一种基于方向奖励的机械臂智能控制方法，该方法包括：S1：确定机械臂的初始姿态，获取预定的目标点位置；S2：通过强化学习算法控制机械臂移动，以使得机械臂的末端执行器移动至预定的目标点位置；在S2中，强化学习算法为DDPG算法，强化学习算法设置有控制机械臂移动的奖励函数，奖励函数的公式如下：R＝Rd+Rv+Rg。由此，本方法可以避免传统机械臂控制中的雅各比矩阵求逆问题和机械臂存在的奇异点问题，能够简化机械臂控制算法的设计。通过该方法驱动的机械臂具有较高的自主能力，而且机械臂控制系统可以在与环境交互的过程中自主到达预定的目标位置，能够增强机械臂控制的自主能力。

主权项：1.一种基于方向奖励的机械臂智能控制方法，其特征在于，所述方法包括：S1：确定机械臂的初始姿态，获取预定的目标点位置；S2：通过强化学习算法控制所述机械臂移动，以使得所述机械臂的末端执行器移动至所述预定的目标点位置；在所述S2中，所述强化学习算法为DDPG算法，所述强化学习算法设置有控制所述机械臂移动的奖励函数，所述奖励函数的公式如下：R＝Rd+Rv+Rg其中，R表示总奖励；Rd表示所述机械臂的末端执行器运动的速度方向与所述预定的目标点位置的目标方向的夹角取负后的值；Rv表示所述机械臂的末端执行器运动的速度绝对值取负后的值；Rg表示所述机械臂的末端执行器是否到达所述预定的目标点位置范围内的奖励值，如果是，Rg＝1，如果不是，Rg＝0；在所述S2中，为提高所述机械臂的末端执行器移动至所述预定的目标点位置的成功率，当所述机械臂无法通过所述强化学习算法训练得到的策略完成移动时，切换至通过综合控制策略控制所述机械臂移动，之后再切换回通过所述强化学习算法训练得到的策略继续移动，其中，所述综合控制策略包括第一随机策略和第二随机策略，所述第一随机策略是以通过所述强化学习算法训练得到的策略输出的动作值为均值来产生服从高斯分布的随机动作值，从而使得所述机械臂能够跳出无法完成移动的状态；所述第二随机策略是采用限定的动作值替代所述强化学习算法训练得到的策略输出的动作值，使得所述机械臂可以先暂时远离所述预定的目标点位置。

全文数据：

权利要求：

百度查询：中国人民解放军军事科学院国防科技创新研究院基于方向奖励的机械臂智能控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种凹凸棒土负载硫化纳米双金属材料、制备方法及应用_安徽国祯环境修复股份有限公司_202311464026.7

下一篇：校准方法、校准装置、介质及电子设备_上海交通大学_202211218075.8

相关技术

一种凹凸棒土负载硫化纳米双金属材料、制备方法及应用_安徽国祯环境修复股份有限公司_202311464026.7

校准方法、校准装置、介质及电子设备_上海交通大学_202211218075.8

一种配电场景监测设备的安全通信方法和系统_广西电网有限责任公司桂林供电局_202311027852.5

热镀锌机组清洗段换辊装置_浙江协和陶瓷有限公司_202311836104.1

电机参数的自动调整方法、装置、存储介质以及电子设备_北京东土科技股份有限公司_202311801193.6

一种用于测量斜视合并屈光不正患者的三棱镜装置及方法_深圳爱尔眼科医院_202311604419.3

一种智能密集型母线槽插接箱_纳图(镇江)母线有限公司_202311829316.7

一种辅助筛选抗条锈病小麦的分子标记、引物及方法_河南农业大学_202311663553.0

一种基于车载的无人机电力巡检管控系统和方法_国电投河南工程运维有限公司_202311765863.3

一种基于激光点云的对焊焊缝高精度识别方法_大连理工大学_202311821280.8

果蔬废弃物发酵生产液体酵素肥的复合发酵菌剂及应用_新疆农业科学院微生物应用研究所(中国新疆—亚美尼亚生物工程研究开发中心)_202311543397.4

语言模型的压缩方法和文本生成方法_北京三快在线科技有限公司_202410016988.4

龙图腾网&IPTOP

【发明授权】基于方向奖励的机械臂智能控制方法_中国人民解放军军事科学院国防科技创新研究院_202111070047.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务