买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种切换系统的无模型最优切换方法_北京理工大学_201910527858.6 

申请/专利权人:北京理工大学

申请日:2019-06-18

公开(公告)日:2020-07-03

公开(公告)号:CN110262235B

主分类号:G05B13/04(20060101)

分类号:G05B13/04(20060101)

优先权:

专利状态码:有效-授权

法律状态:2020.07.03#授权;2019.10.22#实质审查的生效;2019.09.20#公开

摘要:本发明公开了一种切换系统的无模型最优切换方法,整个最优切换方法包括迭代关系式的变形、状态数据的处理、近似函数权值的估计和切换策略的更新。迭代关系式在只有初始容许策略应用于系统的情况下进行变形,其中未知量采用基函数权值和的近似形式替代,之后利用状态数据计算迭代关系式中需要的数据矩阵,根据变形后的迭代关系式估计权值并更新切换策略。经过多次迭代计算更新即可获得一个近似的最优切换策略。该方法不需要知道具体的子系统模型,只要状态量可测,便可有效实现切换系统的最优切换调度。

主权项:1.一种切换系统的无模型最优切换方法,其特征在于,该方法适用于有连续时间自治子系统的切换系统,且系统状态量可测,该方法包括:步骤一、对策略迭代中的策略评估迭代关系式进行积分并结合关于初始切换策略所得轨迹相关的代价函数可得迭代关系式的变形,将变形关系式中的未知量利用基函数权值和来表示并忽略逼近误差,得到估计值关系式: 其中,Φx为由一组线性无关的基函数组成的向量,Nw是组成Φx的基函数的数量,是与Φx对应的权值向量的估计值;xt为t时刻的状态量;Ψx为由一组线性无关的基函数组成的向量,Nc是组成Ψx的基函数的数量,是与Ψx对应的权值向量估计值,i表示第i个子系统,V是所有子系统的索引集合;上角标k表示第k次迭代;Q是正定对称函数;是对第k次迭代获得的切换策略v在状态x下的取值的估计;为了从I式求解各未知权值向量估计值,定义与状态有关的数据矩阵: 其中,r=1,2,...l,l是正整数,t1<t2<…<tl是选定的时刻点;以上数据矩阵满足如下假设:存在正整数和正数α使得对于所有的下列式子成立: 其中时刻tr满足如下条件 其中时刻tr满足如下条件v0xtr=i,i∈V; 其中时刻tr满足如下条件且v0xtr=j,i,j∈V且i≠j;针对难以单独估计的权值向量建立差值的估计公式: 其中,L为正整数且L<l;其中时刻tr满足如下条件且v0xtr=j,i,j∈V且i≠j;设计切换策略vk+1x的估计公式: 步骤二、设置迭代轮次k=0,初始化切换策略v0x;步骤三、应用初始化切换策略v0x于目标系统并测得状态数据,设置根据公式II利用状态数据计算数据矩阵dtr和gtr;步骤四、对所有的子系统i∈V,根据下式计算权值向量估计并根据式IV中k=0情况下的公式计算切换策略估计然后设置k=1; 其中时刻tr满足如下条件v0xtr=i,i∈V;步骤五、按照下式计算权值向量估计进而按照式III为所有的i≠j,i,j∈V,计算 其中时刻tr满足如下条件步骤六、按照式IV中k0情况下的公式更新切换策略步骤七、如果则执行步骤八,否则,令k自加1,并返回到步骤五,其中ε是给定的阈值,||·||为欧几里得范数;步骤八、计算为近似最优代价,为近似最优切换策略。

全文数据:一种切换系统的无模型最优切换方法技术领域本发明涉及切换控制系统,具体涉及一种无模型的切换系统最优切换控制方法。背景技术切换系统是一类重要而典型的混杂系统,该系统由多个子系统以及特定的切换规则组成,这些切换规则是用来协调各子系统的运行的。在切换系统控制中,由于不确定性因素的存在,可能难以获得子系统模型或者精确的子系统模型,此时传统的基于模型的方法已经不能解决问题或者难以保证良好的性能。因此,如果在控制过程中不能准确得到系统模型,就需要研究一种不依赖于系统模型的控制方法。工业过程中产生大量的过程数据,其中包括有价值的状态信息,利用这些在线和离线的数据,可以直接设计控制器、评估性能、做出决策等等。本发明的无模型的控制方法就是利用这些数据替代系统模型来设计控制器。发明内容有鉴于此,本发明提供了一种无模型的切换系统最优切换控制方法,能够在切换系统具有连续未知子系统模型的情况下,实现最优切换控制。为了解决上述技术问题,本发明是这样实现的:一种切换系统的无模型最优切换方法,该方法包括:步骤一、对策略迭代中的策略评估迭代关系式进行积分并结合关于初始切换策略所得轨迹相关的代价函数可得迭代关系式的变形,将变形关系式中的未知量利用基函数权值和来表示并忽略逼近误差,得到估计值关系式:其中,Φx为由一组线性无关的基函数组成的向量,是与Φx对应的权值向量的估计值;xt为t时刻的状态量;Ψx为由一组线性无关的基函数组成的向量,是与Ψx对应的权值向量估计值,i表示第i个子系统,V是所有子系统的索引集合;上角标k表示第k次迭代;Q是正定对称函数;是对第k次迭代获得的切换策略v在状态x下的取值的估计;为了从I式求解各未知权值向量估计值,定义与状态有关的数据矩阵:其中,r=1,2,...l,l是正整数,t10情况下的公式更新切换策略步骤七、如果则执行步骤八,否则,令k自加1,并返回到步骤五,其中ε是给定的阈值,||·||为欧几里得范数;步骤八、计算为近似最优代价,为近似最优切换策略。有益效果:本发明对迭代关系式进行变形,变形后迭代关系式中的未知量采用基函数权值和的近似形式替代,之后利用状态数据计算迭代关系式中需要的数据矩阵,根据变形后的迭代关系式估计权值并更新切换策略。经过多次迭代计算更新即可获得一个近似的最优切换策略。该方法不需要知道具体的子系统模型,只要状态量可测,便可有效实现切换系统的最优切换调度。附图说明图1为本发明流程图。图2为MATLAB仿真代价函数对比图;图3为MATLAB仿真切换系统状态轨迹对比图;图4为MATLAB仿真切换策略对比图。具体实施方式下面结合附图并举实施例,对本发明进行详细描述。本发明提供了一种无模型的切换系统最优切换控制方法,整个最优切换方法包括迭代关系式的变形、状态数据的处理、近似函数权值的估计和切换策略的更新。迭代关系式在只有初始容许策略应用于系统的情况下进行变形,其中未知量采用基函数权值和的近似形式替代,之后利用状态数据计算迭代关系式中需要的数据矩阵,根据变形后的迭代关系式估计权值并更新切换策略。经过多次迭代计算更新即可获得一个近似的最优切换策略。该方法不需要知道具体的子系统模型,只要状态量可测,便可有效实现切换系统的最优切换调度。考虑如下带有连续时间自治子系统的切换系统:其中,xt∈Rn为系统状态,该状态量是可测的;v∈V代表当前活跃子系统的索引;V={1,2,...,N}是所有子系统的索引集合,N是子系统数量;fv:Rn→Rn是子系统v的模型。x0=x0∈Ω是初始状态,是本发明的研究区间,包括原点。本发明设计最优切换策略使得切换系统1在无限时间域代价最小。为此,需要定义无限时间域代价函数如下:其中Q:Rn→R是正定对称函数。在优化过程中,从时刻t的状态xt∈Ω开始的系统1的代价定义为且满足:根据已有文献,给定初始切换策略,可得如下策略迭代方法:其中上角标的k和k+1均是迭代轮次;vkx是第k次迭代获得的切换策略,即切换系统第k次迭代后在状态x下被激活子系统的索引。从56式可以看出,其公式中包含所有子系统模型fix其中i取V中所有值,当子系统模型已知时,该方法不断迭代地通过策略评估式5求解代价并通过策略改进式6更新切换策略从而获得切换方案。但对于子系统模型未知的情况,该方案则不适用。本发明针对子系统模型未知的情况,整个最优切换方法包括迭代关系式的变形、状态数据的处理、近似函数权值的估计和切换策略的更新。下面分别进行具体阐述。1.迭代关系式的变形。当子系统模型未知时,本发明为获得初始切换策略,将初始切换策略v0x应用于系统,产生大量在线数据,从而用于迭代计算。沿着初始切换策略产生的状态轨迹,可得:其中δt0非常小。为了利用初始切换策略产生的状态轨迹数据,对式5沿着所得状态轨迹积分并将该积分两侧分别加到式7两侧可得:由于Vkx未知,对于所有的状态x∈Ω,本发明采用如下形式替代Vkx:其中为由一组线性无关的基函数组成的向量,基函数为Φjx:Rn→Rj=1,2,...,Nw,是权值向量,是逼近误差。Nw是基函数的数量,取值越大逼近误差越小,当取值足够大时能保证误差逼近于零。一组基函数可以构成一个函数空间的基并几乎可以逼近该函数空间内的任意函数。当子系统模型fix,i∈V未知的情况下,公式8中的和也未知,本发明将其作为一个整体统一处理,采用如下形式替代其中为由一组线性无关的基函数组成的向量,基函数为Ψjx:Rn→Rj=1,2,...,Nc,是权值向量,是逼近误差。Nc是基函数的数量,取值越大逼近误差越小,当取值足够大能保证误差逼近于零。实际应用中Nw和Nc不可能无限大,其相应的Φx和Ψx最好选择不同类型的基函数,或者如果选择同一类型的基函数,则参数、阶数需要不同。将逼近函数9和10代入式8可得:其中是逼近误差。考虑到δt非常小,可以认为在时间区间[t,t+δt内vkx和v0x保持恒定进而和保持恒定,因此忽略逼近误差得到估计关系式:2.状态数据的处理。为了从12求解各未知权值向量,需要使用所得状态轨迹的大量数据,根据式12一些和状态有关的数据矩阵定义如下:其中t10情况下的公式更新切换策略f.如果则令并则执行步骤g,否则令k=k+1并返回到步骤d,其中ε是给定的阈值。g.计算为近似最优代价,为近似最优切换策略。利用matlab对上述方法进行仿真验证其有效性。考虑具有两个连续自治子系统的切换系统:系统参数设置为:x0=2和Qxt=x2t。目标是寻找最优切换策略使得代价函数最小。根据文献可知,其最优切换策略为选择初始切换策略为:当x≤1.5时,v0x=1;当x1.5时,v0x=2。基函数向量为Φx=[x2,x4,x6,x8,x10]T。采样周期为δt=0.002。应用无模型最优切换方法,使用t=0到t=0.2s的状态数据,经过0.05s内的6次在线迭代,可得近似最优代价和其相对应的近似最优切换策略。初始切换策略对应的代价近似最优代价和最优代价V*如图2所示,可以看出近似最优代价和最优代价V*相近。图3展示了始终应用初始切换策略v0、在t=0.25s之后应用近似最优切换策略和最优切换策略v*的状态轨迹,其中对应的状态轨迹几乎与v*对应的状态轨迹重合。图4展示了x∈[-2,2]区间上的初始切换策略v0、近似最优切换策略和最优切换策略v*,可以看出近似最优切换策略接近于最优切换策略v*。该仿真验证了所提方法的有效性。综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

权利要求:1.一种切换系统的无模型最优切换方法,其特征在于,该方法包括:步骤一、对策略迭代中的策略评估迭代关系式进行积分并结合关于初始切换策略所得轨迹相关的代价函数可得迭代关系式的变形,将变形关系式中的未知量利用基函数权值和来表示并忽略逼近误差,得到估计值关系式:其中,Φx为由一组线性无关的基函数组成的向量,是与Φx对应的权值向量的估计值;xt为t时刻的状态量;Ψx为由一组线性无关的基函数组成的向量,是与Ψx对应的权值向量估计值,i表示第i个子系统,V是所有子系统的索引集合;上角标k表示第k次迭代;Q是正定对称函数;是对第k次迭代获得的切换策略v在状态x下的取值的估计;为了从I式求解各未知权值向量估计值,定义与状态有关的数据矩阵:其中,r=1,2,...l,l是正整数,t10情况下的公式更新切换策略步骤七、如果则执行步骤八,否则,令k自加1,并返回到步骤五,其中ε是给定的阈值,||·||为欧几里得范数;步骤八、计算为近似最优代价,为近似最优切换策略。

百度查询: 北京理工大学 一种切换系统的无模型最优切换方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。