买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于生长式长时记忆的机器人发育式自主学习算法_浙江交通职业技术学院_202310733762.1 

申请/专利权人:浙江交通职业技术学院

申请日:2023-06-20

公开(公告)日:2024-04-16

公开(公告)号:CN117892793A

主分类号:G06N3/0895

分类号:G06N3/0895;G06N3/0499;G06N3/042

优先权:

专利状态码:在审-公开

法律状态:2024.04.16#公开

摘要:一种基于生长式长时记忆的机器人发育式自主学习算法,包括SOINN算法和自主学习算法,所述SOINN算法基于SOINN网络;采用以上方法后,本发明具有如下优点:本发明通过SOINN算法和自主学习算法,解决无监督在线学习问题,自组织增量学习神经网络,使得网络能在线处理,终生学习一般分布的数据,且无需节点数,网络大小,类别数等先验知识,抗噪能力强,同时在逐步随机学习到新类别,识别率随学习过程的上升速度较高,同时主动学习能力和识别率高。

主权项:1.一种基于生长式长时记忆的机器人发育式自主学习算法,其特征在于,包括SOINN算法和自主学习算法,所述SOINN算法基于SOINN网络;所述SOINN算法步骤如下:步骤1:初始化节点集合Anode={c1,c2},其中c1,c2节点的权值向量从输入中随机选取;初始化边的集合Cedge=Φ,步骤2:输入新模式步骤3:由式 如果ξ和l1或l2的距离比阈值和大,则新输入模式ξ是一个新节点,添加新节点,转到步骤2输入下一新模式,即或则Anode=Anode∪rnew且步骤4:如果l1和l2之间没有连接它们的边,则创建此连接l1和l2的边,并加入集合Cedge,Cedge=Cedge∪l1,l2,将l1和l2连接边的年龄初始化为0,步骤5:更新所有与l1相连的边的年龄; 步骤6:将输入信号与胜者节点的欧几里德距离加入局部积累误差 步骤7:更新节点获胜次数 步骤8:更新胜者节点及与其直接拓扑近邻节点的权值; 其中ε1t是胜者节点权值学习率,ε2t是胜者近邻节点权值学习率;步骤9:移除年龄大于阈值agedead的边,即如果i,j∈Cedge,则Cedge=Cedge\{i,j};步骤10:如果输入信号数是设定参数β的整数倍,类内插入节点更新聚类,并移除低概率冗余噪声节点;步骤11:如果满足迭代次数阈值LT,输出聚类数目和聚类结果;步骤12:返回步骤2继续在线无监督学习;所述自主学习算法包括知识网络和Q值网络,通过工作记忆控制和协调更新,所述自主学习算法其步骤如下:步骤1:初始化Q学习参数:值函数Qst,at,并选定学习率α,折扣因子γ,以及内部动机和外部动机奖励函数的权重ζ,η;初始化节点集合Pnode={p1,p2},Qnode={q1,q2},其中p1,p2,q1,q2节点的权值向量从输入中随机选取;初始化边的集合Cedge=Φ,Dedge=Φ,步骤2:输入当前样本xt,当前动作Q值为步骤3:当前自适应子空间基为Ut,将当前输入样本投影至感知子空间,得样本的感知映射输入ξ=UtTxt;步骤4:由式 步骤5:增维更新增量PCA感知映射子空间,转步骤2输入新样本;步骤6:判断阈值,如果deuclidean_min>θdistance,则通过在线PCA算法计算新子空间,舍去其最后一个分量,使dimUt+1=dimUt,转入步骤7;如果deuclidean_min<θdistance,直接执行步骤8;步骤7:更新感知知识网络:如果和之间没有连接它们的边,则创建此连接和的边,并加入集合Cedge,更新胜者节点及与其直接拓扑近邻节点的权值; 其中ε1pt是胜者节点权值学习率,ε2pt是胜者近邻节点权值学习率,移除年龄大于阈值agedead_p的边,即如果kp,lp∈Cedge,则Cedge=Cedge\{kp,lp};步骤8:在感知知识Q值网络中获取与计算所有可采取动作的Q值;步骤9:根据Q值和Boltzmann规则选择采取的动作; 步骤10:执行动作,计算外部奖励rex;步骤11:计算视觉陌生度内部动机rin=nv=||ξ-Wwinner||euclidean;步骤12:计算最优动作; 步骤13:Q值迭代更新; 记TD误差为: 步骤14:更新感知知识Q值网络:如果和之间没有连接它们的边,则创建此连接和的边,并加入集合Dedge,更新胜者节点及与其直接拓扑近邻节点的权值; 其中ε1qt是胜者节点权值学习率,ε2qt是胜者近邻节点权值学习率;移除年龄大于阈值agedead_q的边,即如果kq,lq∈Dedge,则Dedge=Dedge\{kq,lq};步骤15:更新当前状态t=t+1,s=st+1;步骤16:当前时间步学习结束,返回步骤2输入新样本进行下一时间步学习。

全文数据:

权利要求:

百度查询: 浙江交通职业技术学院 基于生长式长时记忆的机器人发育式自主学习算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。