【发明授权】基于强化学习的机器人自动选择电梯的方法及装置_北京云迹科技股份有限公司_202211254835.0

申请/专利权人：北京云迹科技股份有限公司

申请日：2022-10-13

公开（公告）日：2023-01-06

公开（公告）号：CN115330276B

主分类号：G06Q10/06

分类号：G06Q10/06;G06N20/00

优先权：

专利状态码：有效-授权

法律状态：2023.01.06#授权;2022.11.29#实质审查的生效;2022.11.11#公开

摘要：本公开涉及机器人技术领域，提供了一种基于强化学习的机器人自动选择电梯的方法及装置。该方法包括：获取目标机器人在当前时刻对应的择梯相关信息；基于择梯相关信息，利用择梯模型的近似值函数计算目标机器人乘坐每一部电梯的近似值；基于目标机器人乘坐每部电梯的近似值，通过择梯模型为目标机器人选择最优电梯；在为目标机器人选择最优电梯之后，利用奖励值函数计算本次为目标机器人选择最优电梯的奖励值；根据奖励值和本次为目标机器人选择的最优电梯的近似值，利用择梯模型的损失值函数计算本次为目标机器人选择最优电梯所对应的损失值，并通过损失值更新近似值函数的参数，以为下一次目标机器人选择最优电梯提供支持。

主权项：1.一种基于强化学习的机器人自动选择电梯的方法，其特征在于，包括：获取目标机器人在当前时刻对应的择梯相关信息；基于所述择梯相关信息，利用择梯模型的近似值函数计算所述目标机器人乘坐每一部电梯的近似值；基于所述目标机器人乘坐每部电梯的近似值，通过所述择梯模型为所述目标机器人选择最优电梯；在为所述目标机器人选择最优电梯之后，利用奖励值函数计算本次为所述目标机器人选择最优电梯的奖励值；根据所述奖励值和本次为所述目标机器人选择的最优电梯的近似值，利用所述择梯模型的损失值函数计算本次为所述目标机器人选择最优电梯所对应的损失值，并通过所述损失值更新所述近似值函数的参数，以为下一次目标机器人选择最优电梯提供支持；其中，所述奖励值函数为：其中，R为所述奖励值，Tac为当前时刻所述目标机器人从起始位置到目标位置所需的平均时间，T1为所述目标机器人从所述起始位置出发到电梯所需的时间，T2为所述目标机器人乘电梯到所述目标位置所需的时间，α为预设的权重参数；其中，所述损失值函数为：其中，s为所述择梯相关信息，a为所述目标机器人从起始位置到达所选择的最优电梯的过程中所述目标机器人的动作，θ为所述近似值函数的参数，为所述近似值，R为所述奖励值，E[]为求数学期望的函数。

全文数据：

权利要求：

百度查询：北京云迹科技股份有限公司基于强化学习的机器人自动选择电梯的方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种危废行业可快速更换的水封出渣系统_渤瑞环保股份有限公司_202322016372.0

下一篇：无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

相关技术

一种危废行业可快速更换的水封出渣系统_渤瑞环保股份有限公司_202322016372.0

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

一种实验室地层品质因子估算方法_中国石油化工股份有限公司_202211297976.0

一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

龙图腾网&IPTOP

【发明授权】基于强化学习的机器人自动选择电梯的方法及装置_北京云迹科技股份有限公司_202211254835.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务