基于帕德逼近式的机器人线性重复学习控制外文翻译资料

 2022-12-08 11:12

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


基于帕德逼近式的机器人线性重复学习控制

Cristiano Maria Verrelli, Salvatore Pirozzi, Patrizio Tomei,和Ciro Natale

摘要:本文目的是使用[m m]-Pade近似式的重复的实现学习的渐近关节位置跟踪控制机器人机械手与不确定的动态和周期性位置参考信号(时期)。由此产生的学习线性控制,通过详细的推导稳定的证据(包括使用合适的Lyapunov-like函数),被转移函数表现出他们所有的极点的负实部,同时允许实验改善输出跟踪误差的近似订单增加。从理论和实验分析的观点。这样的控制律是好的候选人在工业机器人控制单元实现对古典proportional-integralderivative重复性任务(PID)控制。

关键字:学习控制;Pade近似值;机器人操纵者;

Ⅰ.介绍

学习方案输出跟踪的存在不确定非线性系统的控制问题非结构化的不确定性(即当没有参数不确定性是可用的)可以证明的当输出限制属于参考信号周期时间函数与一个已知的群体。学习控制不是基于模型和目标执行动态系统反演:他们历史上的动机一些工业应用,需要一个不确定的机器人将重复的方式(见[10]和引用学习控制机器人机械手的应用程序)。在这方面,著名的n-link的动态模型刚性旋转关节机器人是专门给出的

H(q) uml; q C(q, ˙ q) ˙ q E(q) F( ˙ q) = tau; (1)

问isin;Rn关节坐标向量,H(·)isin;M(n,R)惯性是对称正定矩阵,C(··)isin;M(n,R)考虑科氏力和离心力扭矩,E(·)isin;Rn和F(·)isin;Rn向量描述重力和摩擦力矩分别,而tau;isin;Rn是梯度向量的分量是控制力矩。读者被称为[9]和[10]的详尽的描述典型模型的性能和设计的假设。在最不确定的情况下,不确定的函数H(·),C(·),E(·)和F(·)(1)不限于线性parameterized-i.e。,他们不需要被写成一个已知(位置/速度)的产品功能和未知参数自适应控制技术(见[4]的引用[16])可能无法解决相应的控制问题,除非剩余跟踪错误允许(见[14]和引用其中)。这允许也考虑很常见的复杂的非线性影响工业机器人使用谐波驱动器,如干摩擦和Stribeck效应的模型并不总是线性的不确定的参数。

当(组装、操作和重复的任务检查)都将由机器人机械手,控制问题涉及关节位置的设计跟踪控制器的渐近收敛于零关节位置矢量跟踪误差tilde;q(t)= qlowast;(t)minus;q(t)保证:1)尽管非结构化的不确定性系统动力学(1)和2)任何足够光滑的参考信号问lowast;(t)与一个已知周期周期t可以彻底解决以上问题的学习控制算法在[10](参见[7]的总和自适应/重复学习控制方法)提要回错误变量tilde;q(t)和˙tilde;q(t)。它是构成的proportional-derivative-type控制器(robustifying术语这里忽略了这样一个分散的解视图所需的有限的计算负担和方便融入工业分散控制架构

tau;(t) = [tau;1(t), . . . , tau;n(t)]T

= diag[k1, . . . , kn]r (t) circ; wr (t)

= diag[k1, . . . , kn]r (t) [ circ; wr1(t), . . . , circ;wrn (t)]T

r (t) = [r1(t), . . . , rn(t)]T

= ˙tilde;q(t) diag[gamma;1, . . . ,gamma;n] tilde; q(t) (2)

结合重复学习评估方案

(i = 1, . . . , n)

w^ ri (t) = satMi ( circ;wri (t minus; T )) kLiϕT (t)ri (t) forall; t ge; 0

w^ri (t) = 0 forall; t lt;0 (3)

satMi(·)表示的饱和函数[18]ki、gamma;i Mi kLi(i = 1,。,n)合适的阳性参数。特别是:satMi(·):R→(minus;Mi,Mi)是奇数连续,增加饱和度函数[3]令人满意satMi(q)=问任何问isin;(0,Mi)和satMi(q)= Mi对任何问gt; Mi,根据[18](参见[3]),连续不减少的功能ϕT(t)(这样ϕT(0)= 0ϕT所有tge;t(t)= 1)扮演的角色使circ;wri(t)(因此tau;i(t))连续时间即使ri(0)= 0。参数类似用于[3],[10],[18]演示控制器的理论有效性(2),(3)以下条款:

  1. 渐近关节位置跟踪;
  2. 特定的强收敛属性等任意小残余误差指数衰减集以及估计的可能性,通过circ;wr(t)=(circ;wr1(t)。,circ;wrn t(t)),输入参考wr(t)并对初始条件保证兼容完美的跟踪tilde;q(t)equiv;0 tge;0,提供函数H(·),C(··),E(·)和F(·)(1)足够光滑。

上面的学习评估法(3),然而,需要通常发生在重复的学习场景[8],[10],[18],[25]-[27]——T内存装置:在每一个时间t,输入参考价值的估计时间(tminus;)需要提供反馈。另一方面,有限的内存的实现控制laws-involving使用有限数量的存储值和依赖分段线性逼近技术(见理论基础[3]和[1],[2]相关电气电动机应用程序)或者finite-dynamic-order控制-涉及使用傅里叶级数近似技术(见自适应学习控制方法[16]和[24]和引用其中)——在实践中实际需要。

相比之下,在这个短暂的上述有限记忆学习控制方法[3],以及自适应学习控制方法[24],我们近似的延迟(3)与Pade基于理论的合理适当的功能作为delay-based近似无限维的系统与一个有限维。由于线性动态Pade性质近似式,使用稳定过滤器(根据最近的结果[20]),线性timeinvariant推广了经典控制了proportional-integral-derivative(PID)的情况周期(非常数的)引用:它们所描述的转移函数表现出所有与消极的极点实部(导致一个强大的稳定性质),这样典型的古典重复学习的长期不稳定问题控制由于高频干扰噪声[17]是可以避免的。此外,提出了进行分析从一个相当普遍的观点,同时允许对于高阶学习评估方案的设计(见[6],[11],[15],[19],[22],[23]的相关结果)选择一个合适的Lyapunov-like函数。比较实验结果说明建议的有效性的方法。

2 从一阶到高阶学习

在本节中,我们初步概括一阶重复学习评估方案(3)高阶一个(见后续评估法(4))。为了清晰和简洁的符号,由于权力的分散控制器(2),(3)展出为每个链接我们跳过相同的结构,在这一节中(以及在随后的一个),下标我和参考tau;,tilde;q,circ;wr,r为标量变量。我们相应的写

tau;(t) = kr(t) circ;wr (t)

通过

circ;wr (t) =

circ;wr (t) = 0 forall; t le;0

alpha;j satM( circ;wr (t minus; jT )) kLbϕjlowast;T (t)r (t)kL和alpha;j 1le;le;p,是积极的设计参数与alpha;j满意pj = 1alpha;j = 1,alpha;jge;0,1 jle;le;p和b =pj = 1 jalpha;j和jlowast;=最小{ j:alpha;j gt; 0 }。

学习评估方案(4)显然依赖于加权和之前的信息存储在p执行[6]与重量alpha;j 1 jle;le;p构成额外的程度的自由的控制设计,突出了视角过去的所有可用的信息可以用于性能周期系统的改进。显然that1如果alpha;jlowast;j = 1和alpha;j = 0 1le;le;p j =lowast;,然后结果估计方案降低了经典的一阶一个(3)的输入参考wr(t)解读为周期信号与周期jlowast;T。注意(p 1)分向后差分逼近的circ;wr导数隐式地参与上述学习估计表达式(见注释[18],p = 1)。此外,上面的凸组合pj = 1alpha;j x连锁是如此不平等的最小j xle;pj = 1alpha;j xle;maxj x j是满意的。另一方面,当饱和函数的作用是被忽视和ϕjlowast;T(T)equiv;1被认为是,我们获得了吗评估方案

circ;wr (t)=

在拉普拉斯域(假定时间函数Laplace-transformable)满足

(1 minus;) L[ circ; wr (t)](s) = kLbL[r (t)](s)

的多项式pj = 1alpha;j eminus;圣(eminus;sT)明显替换的典型词eminus;圣阶学习控制(3)jlowast;= 1。因为前面的方程写成(kL =macr;kLT)

使用McLaurin系列eminus;j圣,以限制对于T→0时,我们(取消pj = 1alpha;j = 1)

sL[ circ; wr (t)](s) = . kLL[r (t)](s)

描述经典比例积分控制。这完全按照一阶泰勒的事实扩张˙circ;wr(t)˙circ;wr(t)=(bT)minus;1(circ;wrminus;(t)pj = 1alpha;jcirc;wr(tminus;jT)和一个常数函数可以解释为一个时间函数周期与任何任意小正周期T。

3.新的线性学习估计方案

重复学习评估法律circ;wr(t)的未来(3)或(4)T内存设备或要求(相当于)内部无限维度的副本动态exosystem生成wr(t):渐近收敛输出跟踪误差为零的只是实现只要在每个时间t值circ;wr(tminus;jT)是可用的为反馈。我们现在介绍(m m]-Pade的使用近似值P(m m](jsT)指数函数eminus;j圣,j = 1,2,。,p,我们利用线性的动态特性的Pade近似值。其目的是获得,如前所述,总体线性定常控制推广了经典PID的描述转移函数表现出所有与消极的极点实部,这样强大的稳定性能以及鲁棒性(例如,对添加剂干扰噪声)。(m m]-Pade近似值eminus;圣读取P(m m](sT)=点(minus;sT)/点(sT)点(sT)=可= 0米k((2 mminus;k)! /(2米)!)(sT)k。由此产生的表达式的简单例m = 1,3可以派生P1(sT)= 1 圣/ 2,P3(sT)= 1 圣/ 2 2/10 (sT)(sT)3/120。然后我们设计(1 p·m)有限维度系统状态变量circ;wrisin;Risin;Rp·米(circ;wr(0)= 0,(0)= 0)

alpha;˙circ;wr (t) = minus;circ; wr (t) beta;[Cp_(t) Dp circ;wr (t)] kLbr(t)

_(t) = Ap_(t) Bp circ;wr (t) (5)

(Ap, Bp,Cp, Dp)的最小实现正确的吗有理函数

P(s)=

近似pj = 1minus;alpha;j e。使用函数ϕjlowast;T(·)因此不再需要。美联社是赫维茨矩阵和dp(s)是一种p·m-order多项式,而alpha;isin;(0,1)和beta;isin;(0,1)assumed2保证多项式qpi;(s)=(alpha;s 1)dp(s)minus;beta;n p(s)的根源Cminus;= {lambda;isin;C:(lambda;)lt; 0 }。这个词Cp(t) Dpcirc;wr(t)(5)没有别的其他的Pade逼近延迟项pj = 1alpha;jcirc;wr(tminus;jT)而对于beta;= 1minus;alpha;,alpha;2 =···=alpha;p = 0和circ;wr(tminus;t)的基于相应Pade逼近项,设计减少在[20]。整体结果学习线性控制器,当写在拉普拉斯域,

L[tau;(t)](s) = [] L[r (t)](s)

在第二部分,正如前面所讨论的那样,概括了吗PI控制

L[tau;(t)](s)

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[31845],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。