Sistemas No Lineales (Notas de Clase)
Sistemas No Lineales (Notas de Clase)
Sistemas No Lineales (Notas de Clase)
Notas de Clase
Automatizaci
on y Control Industrial
Universidad Nacional de Quilmes
Basadas en Khalil, H. Nonlinear Systems.
Tercera edici
on. Prentice Hall, NJ, 2002.
Versi
on compilada el 9 de noviembre de 2011.
Indice general
I
An
alisis
1. Introducci
on
2. Propiedades Fundamentales
33
3. Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
51
4. Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
79
99
II
Control
123
6. Control en Realimentaci
on
125
7. Linealizaci
on Exacta por Realimentaci
on
145
8. Dise
nos Basados en Lyapunov
169
Parte I
An
alisis
Captulo 1
Introducci
on
1.1.
1.1.1.
Introducci
on
Sistemas No Lineales de Control
Introducci
on
dise
no es que, aunque restringidos a sistemas con estructura especial, incluyen sistemas de importancia pr
actica, tales como barcos, motores a reacci
on, motores turbo-diesel y motores electricos de
induccion.
1.1.2.
El Curso
(1.1)
(1.2)
u
f (x, u)
h(x, u)
(x)
Figura 1.1: Sistema no lineal
Muchas veces la entrada u no aparece explcitamente en (1.1), ya sea porque la entrada es cero
o porque fue especificada como una funci
on del estado u = (x) control por realimentacion. En
este caso la ecuaci
on de estado es la ecuaci
on no forzada
x = f (x) .
(1.3)
(1.4)
1.2 Ejemplos
para todo t t0 .
1.2.
Ejemplos
1.2.1.
Ecuaci
on del P
endulo
Introducci
on
mg
(1.5)
(1.6)
Varios sistemas fsicos pueden describirse con ecuaciones similares a las del pendulo, e.g., un generador sincronico conectado a un bus infinito [Khalil, 1996, Ejercicio 1.7], el circuito de una juntura
Josephson [Khalil, 1996, Ejercicio 1.8], un lazo de PLL (phase locked loop) [Khalil, 1996, Ejercicio 1.10].
1.2.2.
x 1 =
(1.7)
E
1
x1 .
R R
Seg
un el valor de E/R puede haber uno o tres PE, como se ve el la Figura 1.4.
1.2 Ejemplos
iL
L
+ vL
i mA
iR
iC
i = h(v)
0,5
+
vC
+
vR
0
0
0,5
iR
Q1
Q2
0,5
Q3
0
0
0,5
vR
vV
Introducci
on
1.2.3.
Sistema Masa-Resorte
Ff
Fr
F
y
|ay| < 1 ,
(1.8)
que es un ejemplo cl
asico en el estudio de excitacion peri
odica de sistemas no lineales.
Otro ejemplo de fuerza de friccion es la friccion est
atica o de Coulomb. Este tipo de amortiguamiento aparece cuando la masa se desliza sobre una superficie seca. Cuando la masa est
a en reposo,
existe una fuerza de friccion est
atica Fs que act
ua paralela a la superficie y est
a limitada por los
valores s mg, donde 0 < s < 1 es el coeficiente de friccion est
atica. Esta fuerza toma cualquier
valor, dentro de sus lmites, para mantener la masa en reposo. Para que haya movimiento, debe
ejercerse una fuerza en la masa que venza a la fuerza de friccion. En ausencia de la fuerza exterior,
F = 0, la fuerza de friccion est
atica compensa la fuerza de recuperaci
on del resorte y mantiene
el equilibrio si |g(y)| s mg. Una vez que la masa entra en movimiento, aparece una fuerza de
friccion de deslizamiento de magnitud k mg que se opone al movimiento, donde k es el coeficiente
de friccion cinetica, que asumimos constante. Un modelo ideal de la fuerza de friccion es
si y < 0
k mg ,
Fd = Fs ,
si y = 0
k mg ,
si y > 0
1.2 Ejemplos
,
k mg sign(y)
(y, y)
= ky ,
s mg sign(y) ,
si |y|
>0
si y = 0 y |y| s mg/k
si y = 0 y |y| > s mg/k
El valor de (y, y)
para y = 0 y |y| s mg/k resulta de la condici
on de equilibrio y = y = 0.
Tomando x1 = y y x2 = y,
la ecuaci
on de estado es
x 1 = x2
x 2 =
c
1
k
x1 x2 (x1 , x2 )
m
m
m
(1.9)
1.2.4.
El sistema masa-resorte recien visto es un ejemplo de sistema donde la funcion f que define las
ecuaciones de estado (1.3) es discontinua. A continuaci
on veremos otros ejemplos usuales donde las
ecuaciones de estado tambien est
an definidas por una funcion discontinua.
Control S-No (On-Off )
La ecuaci
on (1.10) modela la din
amica termica de una habitaci
on, donde x representa la temperatura de la habitaci
on, u el flujo calorfico aportado por un calentador electrico, w la temperatura
exterior y con = 1 hora y = 0,02 o C/W.
1
1
x = x + u + w,
(1.10)
10
Introducci
on
habitaci
on alrededor de los 20o C. Esta estrategia de control a lazo abierto, tiene la desventaja de que
cualquier mnima perturbacion (por ejemplo, un cambio en la temperatura exterior, la apertura de
una puerta, la disminuci
on de radiaci
on solar que entra por una ventana) hara que la temperatura
ya no se mantuviera alrededor de 20 o C. Por este motivo, es mucho m
as apropiado el empleo de un
control por realimentaci
on o a lazo cerrado. Con este fin, se debe medir la temperatura x y aplicar
el control en funcion del valor de x. Conceptualmente, sera logico pensar en encender el calentador
si la temperatura est
a por debajo de la temperatura deseada r (e.g., r =20o C) y apagarlo en caso
contrario:
(
umax si e > 0,
(1.11)
u = k(e) =
0
si e 0,
donde se ha definido e = r x. Este esquema de control se muestra en la Figura 1.6. Reemplazando
w
r
k()
x = 1 x + u + 1 w
x = x + k(
r x) =: f (x).
(1.12)
Tecnol
ogicamente, el inconveniente con el control dado por (1.11) es que cuando la temperatura x
se iguala a la temperatura r, el calentador se apaga, lo que hace que x disminuya, pero ni bien x
disminuye, el calentador debe encenderse, haciendo que x suba y se iguale a r, entrando as en un ciclo
de encendido-apagado muy r
apido. Este fenomeno se conoce como chattering. Matematicamente,
debido a que la funci
on k es discontinua, tambien lo es f , y la ecuaci
on diferencial (1.12) no tiene
soluci
on en el sentido usual en ning
un conjunto que contenga al punto x = r.
Por supuesto, la soluci
on a los problemas mencionados es incluir en el control un lmite mnimo
en el tiempo entre conmutaciones (de encendido a apagado y vice-versa) o bien una banda de
histeresis. En cualquiera de estos dos casos, el control ya no resulta una funcion est
atica del estado,
sino que posee memoria.
Convertidor Boost
La figura 1.7 muestra la estructura de un convertidor conmutado del tipo Boost, al que se
le ha conectado una carga resistiva. La entrada de control del circuito es la se
nal de disparo del
transistor. Dise
nando adecuadamente esta entrada, este circuito permite generar a la salida una
tensi
on continua m
as elevada que la tensi
on de fuente, E.
Como el transistor funciona u
nicamente en corte o saturacion, se puede pensar que la entrada
de control u del circuito puede asumir solamente dos valores, por ejemplo 1 si el transistor satura
y 0 si est
a en corte. Tomemos como primer variable de estado la tensi
on del capacitor (x1 = vC )
y como segunda la corriente por la bobina (x2 = iL ). Suponiendo al diodo y al transistor como
llaves ideales, la din
amica de este sistema puede describirse, para valores no negativos de x1 y x2 ,
1.2 Ejemplos
11
iL L
+
vR = vC
M1
x 1
=
=
1
x1 ,
RC
E
,
L
M2
x 1
1
1
x1 + x2 ,
RC
C
1
E
= x1 + ,
L
L
=
M3
x 1
1
x1 ,
RC
(1.13)
= 0,
1.2.5.
dv
d2 v
+ v + Lh (v)
=0
2
dt
dt
12
Introducci
on
i
+
C
iC
iL
i
v
donde =
v + f (v)v + g(v) = 0
(1.14)
Cuando
1
h(v) = v + v 3
3
la ecuaci
on toma la forma de la ecuaci
on de Van der Pol
v (1 v 2 )v + v = 0
(1.15)
Esta ecuaci
on tiene una soluci
on peri
odica que atrae toda otra soluci
on excepto la trivial correspondiente al u
nico PE v = v = 0. Tomando x1 = v y x2 = v llegamos al modelo de estado
x 1 = x2
x 2 = x1 h (x1 )x2
1.2.6.
(1.16)
Control Adaptable
Sea la planta
y = ay + ku
donde u es la entrada de control e y es la salida medida. Supongamos que se quiere obtener un
sistema a lazo cerrado cuyo comportamiento entradasalida sea el del modelo de referencia
y m = am ym + km r
donde r es la entrada de referencia y el modelo se eligio de forma que ym (t) represente la salida
deseada para el sistema a lazo cerrado. Este objetivo puede alcanzarse mediante el control en
realimentacion
u(t) = 1 r(t) + 2 y(t)
siempre que los par
ametros de la planta a y k sean conocidos, k 6= 0, y los par
ametros del control
se elijan como
1 =
km
k
2 =
am a
.
k
13
donde las ganancias variables 1 (t) y 2 (t) van a ser ajustadas on-line usando los datos disponibles:
r( ), ym ( ), y( ) y u( ) con < t. La adaptaci
on debe ser tal que 1 (t) y 2 (t) evolucionen hacia sus
valores nominales 1 y 2 . La regla de adaptaci
on se elige en base a consideraciones de estabilidad,
por ejemplo, el algoritmo del gradiente [Khalil, 1996, 13.4]:
1 = (y ym )r
2 = (y ym )y
donde es una constante positiva que determina la velocidad de adaptaci
on. Para escribir un modelo
de estado, es conveniente definir los errores: de salida e = y ym y parametricos 1 = 1 1 y
2 = 2 2 . Con un poco de manipulacion algebraica (ejercicio) se llega al lazo cerrado descripto
por la ecuaci
on de estado no lineal, no aut
onoma
e(t)
= am e(t) + k1 (t)r(t) + k2 (t)(e(t) + ym (t))
1 (t) = e(t)r(t)
2 (t) = e(t)(e(t) + ym (t))
(1.17)
donde las se
nales r(t) e ym (t) son entradas externas.
Un modelo m
as simple se obtiene cuando se conoce k. En este caso se puede tomar 1 = 1
y s
olo 2 debe ajustarse on line. Ejercicio: escribir el modelo en este caso y hallar los PE cuando
r(t) 0.
1.3.
1.3.1.
Sistemas Lineales
Es u
til repasar el retrato de fase de sistemas lineales de segundo orden como herramienta para
estudiar el comportamiento local del sistema no lineal alrededor de un PE. Consideremos el sistema
de segundo orden
x = Ax
La soluci
on para un estado inicial x0 est
a dada por
x(t) = M eJr t M 1 x0
donde Jr es la forma real de Jordan de A y M es una matriz real no singular tal que M 1 AM = Jr .
Dependiendo de los autovalores de A, la forma real de Jordan toma alguna de las siguientes tres
formas
1 0
k
(1.18)
0 2
0
donde k es 0 o 1. La primera forma corresponde al caso en que los autovalores 1 y 2 son reales
y distintos, la segunda corresponde al caso en que los autovalores son reales e iguales, y la tercera
corresponde al caso de autovalores complejos 1,2 = j. En el caso de autovalores reales, hay
que separar el caso en que al menos uno de los autovalores es cero. En este caso, el origen no es un
PE aislado y el comportamiento cualitativo del sistema es distinto de los otros casos.
14
Introducci
on
Autovalores Reales 1 6= 2 6= 0
En este caso M = [v1 , v2 ], donde v1 y v2 son los autovectores asociados con 1 y 2 . El retrato
de fase es el de un:
nodo estable si ambos autovalores son negativos. Las trayectorias en el plano de fase son
par
abolas que se hacen tangentes al autovector lento (correspondiente al mayor autovalor)
cuando se acercan al origen, y paralelas al autovector r
apido (correspondiente al menor autovalor) lejos del origen.
v1
x2
v2
x1
nodo inestable si ambos autovalores son positivos. Las trayectorias en el plano de fase son
par
abolas con formas similares a la del nodo estable pero con sentido invertido.
ensilladura si los autovalores tienen distinto signo. Las trayectorias en el plano de fase (excepto las correspondientes a los autovectores, que son rectas) son hiperbolas que comienzantangentes al autovector estable (correspondiente al autovalor estable) en infinito, y terminantangentes al autovector inestable (correspondiente al autovalor inestable), tambien en
infinito.
x2
v2
.
x1
v1
15
x1
foco inestable si es positiva. Las trayectorias en el plano de fase son espirales logartmicas
que divergen del origen.
centro si = 0. Las trayectorias en el plano de fase son elipses centradas en el origen.
x2
x1
16
Introducci
on
Autovalores M
ultiples No Nulos 1 = 2 6= 0
El retrato de fase en este caso se asemeja al de un nodo (estable o inestable seg
un sea negativo
o positivo. Las trayectorias no tienen en este caso el comportamiento asintotico r
apidolento como
en el caso de autovalores distintos.
x2
x1
Nota 1.1 (Resumen del caso en que el origen es un PE aislado). El sistema puede tener 6 retratos de
fase diferentes asociados con diferentes tipos de equilibrio: nodo estable, nodo inestable, ensilladura,
foco estable, foco inestable y centro. El tipo de equilibrio est
a completamente especificado por la
ubicaci
on de los autovalores de A. El comportamiento global del sistema (en todo el plano de fase)
est
a cualitativamente determinado por el tipo de equilibrio.
Uno o Ambos Autovalores Es Cero
En este caso A tiene un kernel o espacio nulo no trivial, es decir existe un subespacio no trivial
del espacio de estado cuyos elementos son mapeados al cero bajo la transformacion lineal definida
por A. Todo vector en el kernel de A es un punto de equilibrio del sistema. La dimension del kernel
puede ser uno o dos; si es dos, entonces A es la matriz nula y todo punto en el espacio de estado
es un punto de equilibrio. Cuando la dimension del kernel de A es uno, la forma de Jordan de A
dependera de la multiplicidad del cero como autovalor.
Cuando la multiplicidad del cero como autovalor es uno, el autovector correspondiente define el
conjunto o subespacio de equilibrio del sistema. Todas las trayectorias en el plano de fase convergen
al subespacio de equilibrio cuando el autovalor no nulo es negativo, y divergen cuando es positivo;
el caso mostrado en la Figura 1.14.
Cuando la multiplicidad del cero como autovalor es dos, el autovector v1 , donde M = [v1 , v2 ]
es la transformacion que lleva a la forma de Jordan, es el conjunto o subespacio de equilibrio del
sistema. Las trayectorias que comienzan fuera del subespacio de equilibrio se mueven paralelas a el,
como se ve en la Figura 1.15.
Nota 1.2 (Persistencia del Tipo de Equilibrio Frente a Perturbaciones). Veamos el caso de perturbaciones lineales. Supongamos que A tiene autovalores distintos y consideremos la matriz A + A,
donde A es una matriz real de 2 2 cuyos elementos son arbitrariamente peque
nos. Por la teora
de perturbaciones de matrices (ver por ejemplo Golub and van Loan 1996, 7) sabemos que los autovalores de una matriz dependen continuamente de sus par
ametros. Es decir, dado > 0, existe
> 0 tal que si la magnitud de la perturbacion de cada elemento de A es menor que , los autovalores de la matriz perturbada A + A estar
an en una bola de radio centrada en los autovalores
17
x2
v2
v1
.
x1
x2
x1
18
Introducci
on
0
1
2 0
1
2
1
0
1
0
donde puede ser positivo o negativo. Es facil de ver que el PE en cada uno de estos cuatro casos
puede ser un centro, un foco, un nodo o una ensilladura, respectivamente.
1.3.2.
Equilibrios M
ultiples
19
Supongamos que h es
h(x1 ) = 17,76 x1 103,79 x21 + 229,62 x31 226,31 x41 + 83,72 x51
El retrato de fase obtenido por simulaci
on en computadora puede verse en la Figura 1.16. Hay
tres PE aislados Q1 , Q2 y Q3 ; todas las trayectorias en el plano de fase tienden hacia Q1 o Q3 ,
excepto dos u
nicas trayectorias que tienden hacia Q2 y que definen la curva separatriz que divide
el plano de fase en 2 mitades, en cada una de las cuales las trayectorias tienden hacia Q1 o Q3 ,
respectivamente. Los PE Q1 y Q3 son asint
oticamente estables 2 , ya que todas las trayectorias que
comienzan suficientemente cerca de Q1 tienden asintoticamente a Q1 , y lo mismo sucede con Q3 .
Esta caracterstica de estabilidad local es un fenomeno que se da exclusivamente en los sistemas no
lineales. Por el contrario, cuando en un sistema lineal hay un PE aislado asintoticamente estable,
toda trayectoria, sin importar d
onde comience, tiende asintoticamente al PE.
x2
Q1
Q2
Q3
.
x1
Ejemplo 1.3 (Pendulo). Consideremos el modelo de estado del pendulo (1.5) con k/l = 1 y
k/m = 0,5. El retrato de fase obtenido por simulaci
on en computadora puede verse en la Figura 1.17.
Puede verse que es peri
odico con un perodo de 2 , por lo cual el comportamiento puede estudiarse
en la franja x1 . Salvo dos trayectorias especiales que terminan en el PE inestable (, 0),
toda otra trayectoria converge al PE estable (0, 0).
1.3.3.
M
as adelante definiremos con precisi
on a que nos referimos con esto.
(1.19)
20
Introducci
on
x2
x1
.
y supongamos que las funciones f1 y f2 son continuamente diferenciables (derivables con derivada
continua). Expandiendo el lado derecho de (1.19) en series de Taylor alrededor de (p1 , p2 ) obtenemos
x 1 = f1 (p1 , p2 ) + a11 (x1 p1 ) + a12 (x2 p2 ) + T.O.S
y 2 = x2 p 2
f
a11 a12
=
A=
a21 a22
x x=p
21
x 2 = x1 x2 (x21 + x22 )
1.4.
Ciclos Lmites
t0
para alg
un T > 0. La imagen de una soluci
on peri
odica en el retrato de fase es la de una o
rbita
peri
odica o una
orbita cerrada.
Un sistema lineal con autovalores en el eje imaginario es un oscilador arm
onico ya que como
el PE en el origen es un centro, las trayectorias son orbitas cerradas cuya amplitud depende de la
condici
on inicial. Sin embargo, un oscilador lineal no es robusto (estructuralmente estable) ya que
cualquier perturbacion (como ya vimos en la Nota 1.2), destruye la oscilaci
on porque el PE deja de
ser un centro.
Con sistemas no lineales es posible construir osciladores tales que
sean estructuralmente estables;
la amplitud de la oscilaci
on (en regimen permanente) no dependa de la condici
on inicial.
Un ejemplo de oscilador no lineal es el oscilador de resistencia negativa de la secci
on 1.2.5, con
modelo de estado (1.16). El origen es un PE inestable debido a la resistencia negativa del elemento
3
22
Introducci
on
resistivo cerca del origen, lo que significa que el elemento resistivo es activo entrega energa. Esto
se puede ver escribiendo la expresi
on analtica de la tasa de intercambio de energa. La energa total
almacenada en el capacitor y la inductancia para cada tiempo t es
2
E=
1 2
1
1
vC + Li2L = C x21 + [h(x1 ) + x2 ]2
2
2
2
Esta expresi
on confirma que cerca del origen la trayectoria gana energa ya que para |x1 | peque
no el
termino x1 h(x1 ) es negativo. Tambien se ve que hay una regi
on a x1 b tal que la trayectoria
gana energa dentro de la franja y pierde energa fuera de ella, como se ve en la Figura 1.18. Una
oscilaci
on estacionaria va a tener lugar si, a lo largo de una trayectoria, el intercambio neto de
energa durante el ciclo es cero. Tal trayectoria es una orbita cerrada.
x1
a
(1.20)
1
z1 = (z1 z2 + z23 )
3
El retrato de fase en el plano z1 z2 se muestra en la Figura 1.20 (derecha). La orbita cerrada
acticamente vertical.
est
a muy cerca de la curva z1 = z2 13 z23 excepto en las esquinas, donde es pr
23
x2
x1
x1
Figura 1.19: Retratos de fase del oscilador de Van der Pol, con = 0,2 (izquierda) y con = 1
(derecha)
x2
z2
x1
z1
Figura 1.20: Retratos de fase del oscilador de Van der Pol, con = 0,5; en el plano x1 x2 (izquierda)
y en el plano z1 z2 (derecha)
La orbita cerrada del oscilador de Van der Pol es diferente de las del oscilador lineal arm
onico.
En el primer caso, la
orbita cerrada es aislada mientras que en el segundo, hay un continuo de
orbitas cerradas. Una
orbita peri
odica aislada se denomina ciclo lmite. Si todas las trayectorias en
la vecindad del ciclo lmite tienden a (se alejan de) el cuando t se dice que el ciclo lmite es
estable (inestable).
24
Introducci
on
1.5.
Otros Fen
omenos No Lineales
1.5.1.
Sabemos que en un sistema lineal con un PE asintoticamente estable, toda trayectoria que no
comience sobre el PE converge al PE asint
oticamente, es decir que en teora se requiere infinito
tiempo para que el estado converja al PE. Por el contrario, en los sistemas no lineales puede suceder
que el tiempo requerido por una trayectoria no trivial para converger al PE sea finito. Analogamente,
tambien puede suceder que el tiempo requerido para diverger sea finito. Veamos estas situaciones
con ejemplos.
Ejemplo 1.5 (Tiempo de convergencia finito). Consideremos el problema de condiciones iniciales
p
(1.21)
x = |x| signo(x), x(0) = 1.
x
,
1t
x(0) = 1,
(1.22)
tiende a
infinito, de modo que es de esperar que la soluci
on de (1.22) diverja en tiempo finito. Efectivamente,
podemos resolver (1.22), obteniendo
x(t) =
1
,
1t
t [0, 1),
(1.23)
x(0) = 1
tambien est
a dada por (1.23).
1.6 Construcci
on Num
erica de Retratos de Fase
1.5.2.
25
Caos y Atractores
x 2 = x1 + 0,1x2 ,
x 3 = 0,1 + x3 (x1 18).
60
x3
40
20
0
40
20
0
20
x2
40
40
20
x1
20
40
1.6.
Construcci
on Num
erica de Retratos de Fase
x1 mn x1 x1 max ,
x2 mn x2 x2 max .
26
Introducci
on
x(0) = x0
hacia adelante en el tiempo (con t positivo) y en tiempo invertido (con t negativo). La soluci
on en
tiempo invertido es equivalente a resolver hacia adelante en el tiempo la ecuaci
on
x = f (x),
x(0) = x0 ,
puesto que el cambio de variable = t cambia el signo del lado derecho de la ecuaci
on. La soluci
on
en tiempo invertido facilita dibujar bien las trayectorias cerca de equilibrios inestables.
La ventana debe elegirse de forma que todas las caractersticas esenciales se vean, por ejemplo
todos lo puntos de equilibrio. Si esta informaci
on no es disponible al comenzar habra que iterar.
Algunos programas permiten dibujar la distribucion del campo vectorial f (x) para una grilla en
la ventana seleccionada. Este gr
afico es muy u
til para tener idea somera de la distribucion de
las trayectorias antes de dibujarlas. Esto es posible por ejemplo con Scilab,5 usando la funcion
portrait que dibuja retratos de fase de sistemas de segundo orden.
Una buena forma de elegir las condiciones iniciales es distribuirlas en una grilla regular en la
ventana elegida. Una forma mejor es ir eligiendolas en forma interactiva a medida que se van viendo
las trayectorias (que se puede hacer con el portrait de Scilab).
Para una ensilladura es conveniente usar linealizaci
on para calcular las trayectorias estables e
inestables correspondientes a los autovectores de la matriz Jacobiana. La conveniencia viene de que
estas trayectorias son separatrices en el plano de fase.
1.7.
Ejercicios
Ejercicio 1.1.
Un modelo matem
atico usado frecuentemente para describir sistemas no lineales es la ecuaci
on
diferencial de orden n
dn1 y
dn y
=
g
t,
y,
y,
.
.
.
,
,u ,
dtn
dtn1
donde u e y son variables escalares. Tomando u como entrada e y como salida, obtener un modelo
en ecuaciones de estado.
Ejercicio 1.2.
Tomando las variables escalares u e y como entrada y salida respectivamente, obtener un modelo
en ecuaciones de estado del sistema descripto por la ecuaci
on diferencial de orden n
dn y
dn1 y
dn2 y
t,
y,
y,
.
.
.
,
t,
y,
y,
.
.
.
,
=
g
,
u
+
g
u,
1
2
dtn
dtn1
dtn2
Scilab
es
un
programa
http://www-rocq.inria.fr/scilab/
gratuito
similar
Matlab
desarrollado
por
el
INRIA
1.7 Ejercicios
Ayuda:
Tomar xn =
27
dn1 y
dtn1
n1
g2 (t, y, y,
. . . , ddtn2y )u.
Ejercicio 1.3.
Las ecuaciones din
amicas no lineales de un robot de m juntas tiene la forma
M (q)
q + C(q, q)
q + g(q) = u,
donde q Rm representa la posici
on de las juntas, u Rm representa las entradas de torque, y
M (q) es una matriz simetrica (de inercia) definida positiva para todo valor de q. El termino C(q, q)
q
representa el efecto de fuerzas centrfugas y de Coriolis. El termino g(q) representa el efecto de la
gravedad. Elegir variables de estado para el sistema y escribir las ecuaciones de estado.
Ejercicio 1.4.
La Figura muestra una conexion en realimentacion de un sistema lineal estacionario (representado por su funci
on transferencia G(s)) y un elemento no lineal inestacionario. Las variables r, u,
e y son vectores de la misma dimension, y (t, y) es a valores vectoriales. Encontrar un modelo en
espacio de estados del sistema realimentado tomando r como entrada e y como salida.
r +
Sistema Lineal
G(s) = C(sI A)1 B
(t, y)
Elemento
No Lineal
Ejercicio 1.5.
Un generador sincronico conectado a un bus infinito puede representarse por las ecuaciones
M = P D 1 Eq sen ,
E q = 2 Eq + 3 cos + E,
donde es un
angulo en radianes, Eq es tensi
on, P es potencia mec
anica, E es tensi
on de entrada, D
es un coeficiente de amortiguamiento, M es un coeficiente de inercia, es una constante de tiempo,
y 1 , 2 , 3 son par
ametros constantes.
(a) Usando , y Eq como variables de estado obtener las ecuaciones de estado.
(b) Encontrar todos los puntos de equilibrio corrrespondientes a los valores
P = 0,815
E = 1,22
1 = 2
3 = 1,7
= 6,6
M = 0,0147
2 = 2,7
D/M = 4
(c) Suponiendo que es suficientemente grande como para tomar E q 0, mostrar que el modelo
del sistema se reduce a la ecuaci
on del pendulo.
28
Introducci
on
i +
u
sen()
y
G(s)
1
s
Ejercicio 1.6.
Un PLL (phase-locked loop) es un dispositivo en realimentacion que genera una oscilaci
on
cuya fase sigue a una se
nal de referencia (
util para generar se
nales moduladas en fase). Puede
representarse con el diagrama de bloques de la Figura 1.22. Sea (A, B, C) una realizaci
on mnima
de la funcion transferencia de orden m, escalar y estrictamente propia, G(s). Asumir que todos
los autovalores de A tiene parte real negativa, G(0) 6= 0, y i es constante. Si z es el estado de la
realizaci
on (A, B, C),
(i) Mostrar que el sistema a lazo cerrado puede representarse por la ecuaci
on
z = Az + B sen e
e = Cz.
(ii) Encontrar todos los PE del sistema y determinar su tipo.
(iii) Mostrar que cuando G(s) = 1/( s + 1) el lazo cerrado coincide con el modelo de la ecuaci
on
de un pendulo.
Ejercicio 1.7.
Para cada uno de los siguientes sistemas encontrar todos los PE y determinar el tipo de cada
PE aislado.
x 1 = x2
x 2 = x1 +
x31
x2
6
x 1 = x1 + x2
1.7 Ejercicios
29
Ejercicio 1.8.
Encontrar todos los PE del sistema
x 1 = ax1 x1 x2
x 2 = bx21 cx2
Ejercicio 1.9.
El sistema
x
p 2
log x21 + x22
x
p 1
x 2 = x2 +
log x21 + x22
x 1 = x1
(i) Linealizar el sistema alrededor del origen y encontrar el tipo del origen como PE.
(ii) Obtener el retrato de fase del sistema no lineal cerca del origen y mostrar que se asemeja al
de un foco estable. Ayuda: transformar las ecuaciones a coordenadas polares.
(iii) Explicar la discrepancia entre (i) y (ii).
Ejercicio 1.10.
Para el sistema
x 1 = (x1 x21 ) + 1 x1 x2
x 2 = (x2 x22 ) + 1 x1 x2
Ejercicio 1.11.
Los retratos de fase de los siguientes sistemas se muestran en la Figura 1.23. Identificar que sistema corresponde a que retrato de fase, marcar los sentidos de las trayectorias, y discutir el com-
30
Introducci
on
x2
10
x2
2
.
x1
-1
-2
-4
-3
-6
-4
-8
-5
x1
-2
-10
-5
10
-4
-3
-2
-1
-10
1
.
-8
-6
-4
-2
x2
-2
-2
-6
-3
-8
-4
10
x1
-1
-4
-10
x1
x2
-5
-10
-8
-6
-4
-2
10
-5
-4
-3
-2
-1
1.7 Ejercicios
31
x 2 = 2x21 x2
x 1 = x1 + x2 x1 (|x1 | + |x2 |)
Captulo 2
Propiedades Fundamentales
En este captulo repasamos elementos de an
alisis matem
atico que vamos a usar en el resto del
curso, incluyendo las propiedades fundamentales de ecuaciones diferenciales ordinarias que hacen
que x = f (t, x) sea un modelo apropiado para representar sistemas fsicos. Estas propiedades son
esencialmente las de
existencia y unicidad de soluci
on
dependencia continua respecto de par
ametros y condiciones iniciales.
Vamos a presentar los resultados para sistemas aut
onomos (sin entrada), y en general no estacionarios, es decir, representados por x = f (t, x).
2.1.
Preliminares
kxk = m
ax |xi |
1p<
Todas las normas p son equivalentes en el sentido de que si k k y k k son dos normas p diferentes,
existen constantes positivas c1 y c2 tales que
c1 kxk kxk c2 kxk
para todo x Rn . Un resultado cl
asico relativo a normas p es la desigualdad de H
older
|xt y| kxkp kykq ,
1 1
+ =1
p q
para todo x, y Rn .
Una matriz A Rmn define un mapeo lineal y = Ax de Rn en Rm . La norma p inducida de A
est
a definida como
kAkp = sup
x6=0
kAxkp
= m
ax kAxkp
kxkp
kxkp =1
m
X
i=1
|aij | ,
1/2
kAk = m
ax
i
n
X
j=1
|aij |
34
Propiedades Fundamentales
2.1.1.
Desigualdad de Gronwall-Bellman
(s)y(s) ds
Rt
(s)(s)e
( )d
ds
y(t) e
( )d
y si adem
as (t) es constante:
y(t) e(ta)
Rt
Demostraci
on. Definamos z(t) =
diferenciable y
(t, s) = e
( )d
El termino
Rt
z(t)
t Rt
( )d
(s)(s)ds,
que, usando el hecho que y(t) (t) + z(t), completa la prueba en el caso general. En el caso
especial de (t) tenemos
Z
Rt
(s)e
( )d
d R t ( )d
es
ds
a ds
Rt
s=t
= e s ( )d
ds =
Rt
= 1 + e
s=a
( )d
2.1 Preliminares
2.1.2.
35
Mapeo Contractivo
cuando k .
Definici
on 2.3 (Conjunto cerrado). Un conjunto S X es cerrado s toda secuencia convergente
con elementos en S tiene lmite en S.
Definici
on 2.4 (Secuencia de Cauchy). Una secuencia {xk } en X se dice secuencia de Cauchy si
kxk xm k 0 cuando k, m .
Notar que toda secuencia convergente es Cauchy, pero no toda secuencia Cauchy es convergente.
Definici
on 2.5 (Espacio de Banach). Un espacio lineal normado X es completo si toda secuencia
de Cauchy converge a un vector en X . Un espacio lineal normado completo es un espacio de Banach.
Ejemplo 2.1. Consideremos el conjunto de funciones continuas f : [a, b] Rn , al que denotamos
como C[a, b]. Este conjunto es un espacio vectorial sobre R. La suma x+y se define como (x+y)(t) =
x(t) + y(t). La multiplicaci
on por un escalar se define como (x)(t) = x(t). El vector nulo es la
funcion identicamente nula en [a, b]. Definimos una norma como
kxkC = m
ax kx(t)k
t[a,b]
36
Propiedades Fundamentales
que toda secuencia de Cauchy en C[a, b] converge a un vector en C[a, b]. Supongamos que {xk } es
una secuencia de Cauchy en C[a, b]. Para cada t [a, b] fijo,
kxk (t) xm (t)k kxk xm kC 0 cuando k, m
Por lo tanto {xk (t)} es una secuencia de Cauchy en Rn . Pero Rn con cualquier norma p es completo
porque convergencia implica convergencia componente a componente y R es completo. Entonces
existe un vector real x(t) al cual la secuencia converge: xk (t) x(t). Esto prueba convergencia
puntual. Ahora probamos que la convergencia es uniforme en t [a, b]. Dado > 0 elegimos N tal
que kxk xm kC < /2 para k, m > N . Entonces, para k > N ,
kxk (t) x(t)k kxk (t) xm (t)k + kxm (t) x(t)k
kxk xm kC + kxm (t) x(t)k
Eligiendo m suficientemente grande (lo cual puede depender de t), cada termino en el lado derecho
puede hacerse menor que /2; entonces kxk (t) x(t)k < para k > N . Por lo tanto {xk } converge
a x, uniformemente en t [a, b]. Para completar la prueba, debemos mostrar que x(t) es continua
y que {xk } converge a x en la norma de C[a, b]. Para probar continuidad consideremos
kx(t + ) x(t)k kx(t + ) xk (t + )k + kxk (t + ) xk (t)k + kxk (t) x(t)k
Como {xk } converge uniformemente a x, dado > 0, podemos elegir k lo suficientemente grande
para hacer el primer y tercer terminos del lado derecho menores que /3. Como xk (t) es continua,
podemos elegir lo suficientemente peque no para hacer el segundo termino menor que /3. Por
lo tanto x(t) es continua. La convergencia de {xk } a x en la norma de C[a, b] es una consecuencia
directa de la convergencia uniforme.
x, y S , 0 < 1.
Entonces T tiene un u
nico punto fijo en S, es decir, existe un u
nico vector x S que satisface
x = T (x ). Adem
as, x puede obtenerse por el metodo de aproximaciones sucesivas comenzando
de cualquier vector en S.
Demostraci
on. Tomemos un vector arbitrario x1 S y definamos la secuencia {xk } por la formula
xk+1 = T (xk ). Como T mapea S en S, xk S para todo k 1. El primer paso de la prueba es
mostrar que {xk } es una secuencia de Cauchy. Tenemos
kxk+1 xk k = kT (xk ) T (xk1 )k
kxk xk1 k
2 kxk1 xk2 k
..
.
k1 kx2 x1 k.
Sigue que
kxk+r xk k kxk+r xk+r1 k + kxk+r1 xk+r2 k + + kxk+1 xk k
k+r2 + k+r3 + + k1 kx2 x1 k
X
i kx2 x1 k
k1
i=0
k1
kx2 x1 k.
=
1
37
El lado derecho tiende a cero cuando k . Por lo tanto, la secuencia es Cauchy. Como X es un
espacio de Banach, xk x X cuando k . Ademas, como S es cerrado, en particular x S.
Ahora mostramos que x = T (x ). Para cualquier xk = T (xk1 ) tenemos que
kx T (x )k kx xk k + kxk T (x )k
kx xk k + kxk1 x k.
2.2.
Existencia y Unicidad
En esta secci
on se dan condiciones suficientes para la existencia y unicidad de la soluci
on del
problema de valor inicial
x = f (t, x) ,
x(t0 ) = x0 .
(2.1)
= f (t, x(t)) para todo t [t0 , t1 ]. Vamos a asumir que f (t, x) es continua en
x pero s
olo seccionalmente continua en t (esto nos va a permitir considerar entradas con saltos o
escalones).
Una ecuaci
on diferencial con una dada condici
on inicial puede tener varias soluciones. Por ejemplo, la ecuaci
on escalar
x = x1/3 ,
x(0) = 0
tiene como soluciones tanto x(t) = (2t/3)3/2 como x(t) 0. Vemos que f (x) = x1/3 es una funci
on
continua de x, por lo tanto es claro que la condici
on de continuidad de f (t, x) en sus argumentos
no es suficiente para asegurar unicidad de la soluci
on, aunque esta condici
on asegura la existencia
de al menos una soluci
on. En el Teorema 2.3 vamos a utilizar una condici
on que garantiza a la vez
ambas propiedades.
Teorema 2.3 (Existencia local y unicidad). Sea f (t, x) seccionalmente continua en t y supongamos
que satisface la condici
on de Lipschitz
kf (t, x) f (t, y)k L kx yk
(2.2)
x, y Br = {x Rn | kx x0 k r}, t [t0 , t1 ]. Entonces existe > 0 tal que (2.1) tiene una
soluci
on u
nica en [t0 , t0 + ].
Demostraci
on. Notar que si x(t) es una soluci
on de (2.1) entonces, integrando, tenemos
Z t
f (s, x(s)) ds
x(t) = x0 +
(2.3)
t0
Es decir, x(t) satisface (2.1) s satisface (2.3), por lo que el estudio de existencia y unicidad de
la soluci
on de la ecuaci
on diferencial (2.1) es equivalente al estudio de existencia y unicidad de la
38
Propiedades Fundamentales
soluci
on de la ecuaci
on integral (2.3). Vamos a considerar el lado derecho de (2.3) como un mapeo
de la funcion continua x : [t0 , t1 ] Rn ; denot
andolo como (P x)(t), podemos re-escribir (2.3) como
x(t) = (P x)(t)
(2.4)
m
ax
t[t0 ,t0 +]
kx(t)k
S = {x X | kx x0 kC r}
donde r es el radio de la bola Br y es una constante positiva a elegir. Nos vamos a restringir a
elegir tal que satisfaga t1 t0 de forma que [t0 , t0 + ] [t0 , t1 ]. Notar que kx(t)k es una
norma en Rn mientras que kxkC es una norma en X ; de la misma forma Br es una bola en Rn
mientras que S es una bola en X . Por definicion, P mapea X en X . Para probar que mapea S en
S escribimos
Z t
Z t
(P x)(t) x0 =
f (s, x(s)) ds =
[f (s, x(s)) f (s, x0 ) + f (s, x0 )] ds
t0
t0
Usando la condici
on Lipschitz (2.2) y el hecho de que para cada x S
kx(t) x0 k r , t [t0 , t0 + ]
obtenemos
k(P x)(t) x0 k
t0
Z t
t0
Z t
t0
= (t t0 )(Lr + h)
(Lr + h)
y tambien
kP x x0 kC =
m
ax
t[t0 ,t0 +]
t0
t
t0
Lkx(s) y(s)k ds
(t t0 ) L kx ykC
39
Entonces
kP x P ykC Lkx ykC kx ykC
con
mn t1 t0 ,
,
, <1
(2.5)
Lr + h L
entonces (2.3) tiene una u
nica soluci
on en S. Nos falta probar que la soluci
on es u
nica en X . Para
eso vamos a probar que toda soluci
on de (2.3) en X tiene que estar en S. Notemos primero que,
como x(t0 ) = x0 est
a en la bola Br , toda soluci
on continua x(t) debe permanecer en Br durante
alg
un tiempo. Supongamos que x(t) deja la bola Br y sea t0 + el primer instante en que x(t)
intersecta la frontera de Br . Entonces
kx(t0 + ) x0 k = r
Por otro lado, para todo t t0 + ,
Z t
kx(t) x0 k
[kf (s, x(s)) f (s, x0 )k + kf (s, x0 )k] ds
t0
t
t0
Z t
[Lkx(s) x0 k + h] ds
(Lr + h) ds
t0
Por lo tanto
r = kx(t0 + ) x0 k (Lr + h) =
Lr + h
lo que significa que x(t) no puede dejar Br durante el intervalo [t0 , t0 + ], es decir, toda soluci
on en
X debe estar en S. En consecuencia, unicidad de la soluci
on en S implica unicidad de la soluci
on
en X .
Una funci
on que satisface (2.2) se dice Lipschitz en x y L es la constante de Lipschitz. Decimos
que f (x) es localmente Lipschitz en un dominio (conjunto abierto y conexo) D Rn si cada punto
de D tiene un entorno D0 tal que f satisface (2.2) con alguna constante de Lipschitz L0 . Decimos
que f (x) es Lipschitz en un conjunto W si satisface (2.2) en todos los puntos de W , con la misma
constante de Lipschitz L. Toda funcion localmente Lipschitz en un dominio D es Lipschitz en
todo subconjunto compacto (cerrado y acotado) de D. Decimos que f (x) es globalmente Lipschitz
si es Lipschitz en Rn .
Decimos que f (t, x) es localmente Lipschitz en x en [a, b] D R Rn si cada punto x D
tiene un entorno D0 tal que f satisface (2.2) en [a, b] D0 con alguna constante de Lipschitz L0 .
Decimos que f (t, x) es localmente Lipschitz en x en [t0 , ) D si es localmente Lipschitz en x en
[a, b] D para todo intervalo compacto [a, b] [t0 , ). Decimos que f (t, x) es Lipschitz en [a, b] W
si satisface (2.2) para todo t [a, b] y todo punto en W , con la misma constante de Lipschitz L.
Para funciones escalares, la condici
on de Lipschitz se puede escribir como
|f (y) f (x)|
L
|y x|
40
Propiedades Fundamentales
en [a, b] W , entonces
Definamos g(s) = z t f (t, (s)). Como g(s) es una funcion a valores reales continuamente diferenciable en un intervalo abierto que contenga al [0, 1], concluimos mediante el teorema del valor medio
que existe s1 (0, 1) tal que
g(1) g(0) = g (s1 )
Evaluando g en s = 0, s = 1, y calculando g (s) usando la regla de la cadena, obtenemos
f
(t, (s1 ))(y x)
x
f
kf (t, y) f (t, x)kp kzkq
(t, (s1 ))
ky xkp Lky xkp
x
La propiedad de Lipschitzidad es m
as fuerte que la de continuidad. Si f (x) es Lipschitz en
W , entonces es uniformemente continua en W . La propiedad de Lipschitzidad es m
as debil que la
de poseer derivada continua, como vemos en el siguiente Lema.
Lema 2.5 (C 1 implica Lipschitz). Sea f : [a, b] D Rm una funcion continua, D un dominio en
Rn . Si f /x existe y es continua en [a, b] D entonces f es localmente Lipschitz en x en [a, b] D.
Demostraci
on. Dado x0 D, sea r tan peque
no que la bola D0 = {x Rn | kx x0 k r}
este contenida en D. El conjunto D0 es convexo y compacto. Por continuidad, f /x est
a acotada
en [a, b]D0 . Sea L0 una cota para f /x en [a, b]D0 . Por el Lema 2.4, f es Lipschitz en [a, b]D0
con constante de Lipschitz L0 .
Lema 2.6 (Condiciones para Lipschitz global). Sea f : [a, b] Rn Rm una funcion continua. Si
f /x existe y es continua en [a, b] Rn , entonces f es globalmente Lipschitz en x en [a, b] Rn
s f /x est
a uniformemente acotada en [a, b] Rn .
41
| 1 + x2 | + |x1 | 1 + a2 + a1
|x2 | + |1 x1 | a2 + 1 + a1
Por lo tanto,
f
1 + a2 + a1
x
x(0) = 1
La funcion f (x) = x2 es localmente Lipschitz para todo x R. Por lo tanto, es Lipschitz en todo
subconjunto compacto de R. La soluci
on u
nica
x(t) =
1
t1
existe sobre [0, 1). Cuando t 1, x(t) deja cualquier conjunto compacto.
42
Propiedades Fundamentales
<1
Por lo tanto, el Teorema 2.7 muestra que el sistema lineal tiene soluci
on u
nica en [t0 , t1 ]. Como
t1 puede ser arbitrariamente grande, concluimos que si A(t) y g(t) son seccionalmente continuas
t t0 , entonces el sistema tiene una soluci
on u
nica t t0 .
Para un sistema lineal es razonable pedir Lipschitzidad global. Pero para sistemas no lineales
esto es muy restrictivo. No as la condici
on de Lipschitz local, que est
a garantizada si la funcion del
lado derecho es continuamente diferenciable.
43
(2.7)
Como la condici
on de Lipschitz global es muy conservadora, es u
til disponer de otro resultado
que, a expensas de pedir un mayor conocimiento acerca de la soluci
on del sistema, s
olo requiera que
la funcion sea localmente Lipschitz.
Teorema 2.8 (Existencia global y unicidad de vuelta). Sea f (t, x) seccionalmente continua en t y
localmente Lipschitz en x para todo t t0 y todo x en un dominio D Rn . Sea W un subconjunto
compacto de D, x0 W , y supongamos que se sabe que toda soluci
on de (2.1) permanece todo el
tiempo en W . Entonces existe una soluci
on u
nica que est
a definida para todo t t0 .
Demostraci
on. Por el Teorema 2.3, existe una soluci
on local u
nica en [t0 , t0 + ]. Sea [t0 , T ) el
m
aximo intervalo de existencia. Si T es finito, entonces la soluci
on debe abandonar todo subconjunto
compacto de D (Ejercicio 2.10). Como la soluci
on nunca deja el conjunto compacto W , concluimos
que debe ser T = .
El truco al aplicar el Teorema 2.8 es verificar que toda soluci
on permanezca en un conjunto
compacto sin resolver la ecuaci
on diferencial. Vamos a ver en el Captulo 3 que el metodo de
Lyapunov va a ser u
til para esto.
Ejemplo 2.6. Consideremos nuevamente el sistema (2.7). La funcion f (x) es localmente Lipschitz
en R. Si en alg
un instante x(t) es positiva, la derivada x(t)
2.3.
44
Propiedades Fundamentales
dado > 0, existe > 0 tal que para todo en la bola { Rp | k 0 k < }, la ecuaci
on
x = f (t, x, ) tiene una soluci
on u
nica x(t, ) definida en [t0 , t1 ], con x(t0 , ) = x0 , y satisface
kx(t, ) x(t, 0 )k < para todo t [t0 , t1 ].
Antes de estudiar los dos tipos de continuidad recien definidos, necesitamos el siguiente resultado.
Teorema 2.9. Sea f (t, x) seccionalmente continua en t y Lipschitz en x en [t0 , t1 ]W , con constante
de Lipschitz L, donde W Rn es un conjunto abierto y conexo. Sean y(t) y z(t) soluciones de
y = f (t, y) ,
y(t0 ) = y0
y
z = f (t, z) + g(t, z) ,
z(t0 ) = z0
(t, x) [t0 , t1 ] W ,
para alg
un > 0, y
ky0 z0 k
Entonces
ky(t) z(t)k eL(tt0 ) +
L(tt0 )
[e
1]
L
(2.8)
f (s, y(s)) ds
t0
Z t
t0
t0
+ (t t0 ) +
t
t0
t0
kg(s, z(s))k ds
Lky(s) z(s)k ds
t
t0
L[ + (s t0 )]eL(ts) ds
45
t [t0 , t1 ]
Demostraci
on. Por continuidad de y(t, 0 ) en t y la compacidad de [t0 , t1 ], sabemos que y(t, 0 )
est
a uniformemente acotada en [t0 , t1 ]. Definamos un tubo U alrededor de la soluci
on y(t, 0 ) de
la siguiente manera
U = {(t, x) [t0 , t1 ] Rn | kx y(t, 0 )k },
como se ilustra en la Figura 2.1.
z(t)
y(t)
z0
y0
t
t0
t1
Figura 2.1: Tubo construido alrededor de la soluci
on y(t)
(t, x) U ,
k 0 k <
Tomemos < y ky0 z0 k < . Por el teorema de existencia local y unicidad, existe una soluci
on
u
nica z(t, ) en alg
un intervalo [t0 , t0 + ]. La soluci
on comienza dentro del tubo U y mientras
permanezca en el tubo puede extenderse. Vamos a mostrar que, eligiendo lo suficientemente
peque
no, la soluci
on permanece en el tubo U para todo t [t0 , t1 ]. En particular, sea el primer
instante en que la soluci
on deja el tubo; vamos a probar que > t1 . En el intervalo [t0 , ], todas las
condiciones del Teorema 2.9 se satisfacen con = = . Por lo tanto
46
Propiedades Fundamentales
2.4.
Principio de Comparaci
on
u(t0 ) = u0
f (t, v(t)) ,
v(t0 ) u0
x(0) = a
= 2x(t)x(t)
2v(t) ,
v(0) = a2
u(0) = a2
u(t) = a2 e2t
2.5 Ejercicios
2.5.
47
Ejercicios
Ejercicio 2.1.
Sea f (x) una funci
on continuamente diferenciable. Mostrar que el punto de equilibrio x de
x = f (x) es aislado si la matriz Jacobiana [f /x](x ) es no singular.
Ayuda:
y(t) k1 e
t0
k1 , k2 , k3 0, > k2 .
i
k3 h
1 e(k2 )(tt0 ) .
k2
Ejercicio 2.3.
Usando el Teorema del Mapeo Contractivo mostrar que el sistema de ecuaciones no lineales
x1
x1 + x2 = 1
1+
1 + x21
x2
x1 + 1 +
x2 = 2,
1 + x22
nica soluci
on real.
donde < 12 , tiene una u
Ejercicio 2.4.
Sea f : Rn Rn localmente Lipschitz en un dominio D Rn . Sea S D un conjunto compacto
(cerrado y acotado). Mostrar que existe una constante L > 0 tal que
kf (x) f (y)k Lkx yk,
x, y S.
48
Propiedades Fundamentales
Ayuda:
x(t0 ) = x0 ,
(2.9)
2.5 Ejercicios
49
Ejercicio 2.8.
Sea Dr = {x Rn : kxk < r}. Para cada uno de los siguientes sistemas representados como
x = f (t, x) e introducidos en el Captulo 1 determinar si f es: (a) localmente Lipschitz en x Dr
para r suficientemente peque
no; (b) localmente Lipschitz en x Dr para cualquier r > 0 finito; (c)
globalmente Lipschitz en x.
(i) La ecuaci
on del pendulo con entrada de control.
(ii) El circuito con diodo t
unel.
(iii) El sistema de masa-resorte con resorte lineal, amortiguamiento viscoso, friccion est
atica y
fuerza externa nula.
(iv) El oscilador de Van der Pol.
(v) La ecuaci
on de estado a lazo cerrado de tercer orden del ejemplo de control adaptable.
(vi) El sistema x = Ax B(Cx), donde A Rnn , B Rn1 , C R1n son matrices constantes
y () es una alinealidad de zona muerta, definida por
para y < d
y + d,
(y) = 0,
para d y d
y d,
para y > d
Sistema Lineal
G(s) = C(sI A)1 B
(t, y)
Elemento
No Lineal
50
Propiedades Fundamentales
Ejercicio 2.10.
Sea f (t, x) seccionalmente continua en t y localmente Lipschitz en x sobre [t0 , t1 ] D para alg
un
n
dominio D R . Sea y(t) una soluci
on de (2.9) sobre un intervalo abierto m
aximo [t0 , T ) [t0 , t1 ]
con T < . Sea W cualquier conjunto compacto de D. Mostrar que existe alg
un t [t0 , T ) tal que
y(t)
/ W.
Ayuda:
Ejercicio 2.11.
Sea f (t, x) seccionalmente continua en t, localmente Lipschitz en x, y
kf (t, x)k k1 + k2 kxk,
(t, x) [t0 , ) Rn .
k1 k2 (tt0 )
e
1
k2
t [a, t1 ]
Captulo 3
Estabilidad Seg
un Lyapunov. Sistemas
Estacionarios
La teora de estabilidad juega un rol central en teora de sistemas e ingeniera. Existen distintos
tipos de problemas de estabilidad en los sistemas din
amicos. En este captulo vamos a tratar estabilidad de puntos de equilibrio; m
as adelante en el curso veremos otros problemas de estabilidad,
como el de estabilidad entrada-salida.
La estabilidad de puntos de equilibrio generalmente se caracteriza en el sentido de Lyapunov, un matem
atico e ingeniero ruso que
estableci
o las bases de la teora que hoy lleva su nombre. Un punto
de equilibrio se dice estable si todas las soluciones que se inicien en
las cercanas del punto de equilibrio permanecen en las cercanas del
punto de equilibrio; de otro modo el punto de equilibrio es inestable. Un punto de equilibrio se dice asint
oticamente estable si todas
las soluciones que se inicien en las cercanas del punto de equilibrio
no s
olo permanecen en las cercanas del punto de equilibrio, sino
que adem
as tienden hacia el equilibrio a medida que el tiempo se
Aleksandr Lyapunov
aproxima a infinito. Vemos estas nociones en m
as detalle en 3.1,
1857-1918
donde presentamos tambien los teoremas b
asicos de Lyapunov para sistemas estacionarios. En 3.2 damos una extension de la teora
b
asica de Lyapunov que se debe a LaSalle. En 3.3 analizamos regi
on de atracci
on de un punto
de equilibrio, y en 3.4 vemos c
omo la estabilidad de un punto de equilibrio puede determinarse
mediante linealizaci
on.
Los teoremas de estabilidad de Lyapunov dan condiciones suficientes para estabilidad de puntos de equilibrio. Existen teoremas conversos que establecen que, al menos conceptualmente, en
los teoremas de Lyapunov muchas de estas condiciones son tambien necesarias. Trataremos estos
teoremas conversos en el captulo siguiente, junto a extensiones de los resultados para sistemas
inestacionarios.
3.1.
(3.1)
52
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
x
. Por conveniencia, vamos a asumir que x
= 0 (esto no nos hace perder generalidad porque, si no
es as, definimos y = x x
y trabajamos con la ecuaci
on y = g(y), donde g(y) , f (y + x
), que tiene
un equilibrio en el origen.)
Definici
on 3.1. El PE x = 0 de (3.1) es
estable, si para cada > 0 existe = () tal que
kx(0)k < = kx(t)k < ,
t 0
inestable si no es estable.
asint
oticamente estable (AE) si es estable y puede elegirse tal que
kx(0)k < = lm x(t) = 0
t
53
f1 (x)
n
n
X
X
V
V
V
V
V
f2 (x) V
V (x) =
x i =
fi (x) =
f (x)
,
, ...,
. =
xi
xi
x
x1 x2
xn ..
i=1
i=1
fn (x)
Teorema 3.1 (Lyapunov). Sea el origen x = 0 un PE de (3.1) y sea D Rn un dominio que
contiene el origen. Sea V : D R una funcion continuamente diferenciable tal que
V (0) = 0
V (x) 0
y
en
V (x) > 0 en
D
D {0}
(3.3)
(3.4)
en
D {0}
(3.5)
entonces x = 0 es AE.
Demostraci
on. Dado > 0, elijamos r (0, ] tal que
Br = {x Rn | kxk r} D
Sea = mnkxk=r V (x). Entonces > 0 por (3.3). Tomemos (0, ) y sea
= {x Br | V (x) }
Entonces est
a en el interior de Br ;
D
r
B
Br
t 0
Si no fuera as, existira un punto p que se encuentra sobre la frontera de Br . En este punto, V (p) > ,
pero para todo x , V (x) , lo cual es una contradicci
on.
54
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
t 0
Por lo tanto
kx(0)k < = kx(t)k < r ,
t 0
V (x) alcanza un m
aximo sobre el conjunto compacto {d kxk r}. Sabemos que < 0 por
Como el lado derecho se va a hacer negativo despues de un cierto tiempo, la desigualdad contradice
la suposici
on de que c > 0.
Una funcion continuamente diferenciable que satisface (3.3) y (3.4) se denomina funci
on de
Lyapunov. La superficie V (x) = c se denomina superficie de Lyapunov o superficie de nivel. Usando
superficies de Lyapunov, la Figura 3.2 da una interpretacion intuitiva del Teorema 3.1. La condici
on
V 0 implica que cuando la trayectoria cruza la superficie de Lyapunov V (x) = c se introduce en
el conjunto c = {x Rn | V (x) c} y nunca puede salir de el. Cuando V < 0, la trayectoria
se mueve de una superficie de Lyapunov a otra superficie de Lyapunov interior con un c menor.
A medida que c decrece, la superficie de Lyapunov V (x) = c se achica hasta transformarse en el
origen, mostrando que la trayectoria tiende al origen cuando t . Si s
olo sabemos que V 0, no
podemos asegurar que la trayectoria tienda al origen, pero podemos concluir que el origen es estable
porque la trayectoria puede ser encerrada en cualquier bola B s
olo con requerir que el estado inicial
x(0) pertenezca a una superficie de Lyapunov contenida en dicha bola.
Una funcion V (x) que satisface (3.3) se dice definida positiva. Si satisface la condici
on m
as
debil V (x) 0 para x 6= 0, se dice semidefinida positiva. Una funcion se dice definida negativa o
semidefinida negativa si V (x) es definida positiva o semidefinida positiva, respectivamente. Si V (x)
no tiene signo definido con respecto a alguno de estos cuatro casos se dice indefinida. El teorema
de Lyapunov se puede enunciar, usando esta nueva terminologa como: el origen es estable si existe
una funci
on definida positiva y continuamente diferenciable tal que V (x) es semidefinida negativa,
y es AE si V (x) es definida negativa.
55
c2
c3
V (x) = c1
c1 < c2 < c3
a 0 1
P = 0 a 2
1 2 a
entonces V (x) es definida positiva si a >
x g(x) > 0 ,
x 6= 0 , x (a, a)
g(y) dy
0
En el dominio D = (a, a), V (x) es continuamente diferenciable, V (0) = 0 y V (x) > 0 para todo
x 6= 0, es decir, es una candidata a funcion de Lyapunov valida. Calculemos su derivada a lo largo
de las trayectorias del sistema:
V
V (x) =
[g(x)] = [g(x)]2 < 0 ,
x
x D {0}
56
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
k
m
para que V (x) sea definida positiva. Una posible eleccion es p12 = 0,5(k/m), y as
gk
1
V (x) =
x1 sen x1 x22 .
2lm
2
El termino x1 sen x1 > 0 para todo x1 : 0 < |x1 | < . Tomando D = {x Rn : |x1 | < } tenemos
que V (x) es positiva definida y V (x) es definida negativa en D. Por el Teorema 3.1 concluimos que
el origen es AE.
57
El ejemplo anterior muestra que las condiciones del Teorema 3.1 son s
olo suficientes. Si una dada
candidata a funci
on de Lyapunov no alcanza para probar que el PE es AE, esto no significa que no
lo sea.
En el Ejemplo 3.4 enfocamos el problema en una forma inversa. Investigamos una expresi
on
propuesta para V (x) y determinamos sus par
ametros de forma que V (x) fuera definida positiva y
V (x) definida negativa. Esta idea es u
til para buscar funciones de Lyapunov, y se aprovecha en el
procedimiento siguiente.
3.1.1.
M
etodo del Gradiente Variable
El metodo del gradiente variable es un metodo para construir funciones de Lyapunov. Sea V (x)
una funcion escalar de x y g(x) = (V /x)t . Entonces
V
f (x) = g t (x)f (x)
V (x) =
x
La idea es tratar de encontrar g(x) tal que sea el gradiente de una funcion definida positiva V (x) y
tal que V (x) sea definida negativa. Es facil de probar que g(x) es el gradiente de una funcion escalar
s la matriz Jacobiana [g/x] es simetrica, es decir
gj
gi
=
,
xj
xi
i, j = 1, 2, . . . , n
Bajo esta restriccion, elegimos g(x) tal que g t (x)f (x) sea definida negativa. Luego V (x) se computa
mediante la integral
Z xX
Z x
n
t
gi (y)dyi
g (y)dy =
V (x) =
0
i=1
Como la integral de un gradiente no depende del camino, podemos integrar a lo largo de los ejes:
Z x2
Z x1
g2 (x1 , y2 , . . . , 0)dy2
g1 (y1 , 0, . . . , 0)dy1 +
V (x) =
0
0
Z xn
gn (x1 , x2 , . . . , yn )dyn
+ +
0
(3.6)
x 6= 0
Probemos con
(x)x1 + (x)x2
g(x) =
(x)x1 + (x)x2
(3.7)
58
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
(3.8)
de forma que
V (x) = [a(x) (x)]x22 (x)x1 h(x1 )
Para simplificar elegimos (x) = constante, (x) = constante, y (x) = constante, por lo
cual en (3.8) depende s
olo de x1 . La condici
on de simetra (3.6) se reduce entonces a = . La
expresi
on de g(x) en (3.7) resulta
ax1 + h(x1 ) + x2
g(x) =
x1 + x2
Integrando obtenemos
Z x2
Z x1
(x1 + y2 )dy2
[ay1 + h(y1 )]dy1 +
V (x) =
0
0
Z x1
1
1
= ax21 +
h(y)dy + x1 x2 + x22
2
2
Z0 x1
1
h(y)dy
= xt P x +
2
0
donde
P =
Eligiendo > 0 y 0 < < a aseguramos que V (x) es definida positiva y V (x) es definida negativa.
Por ejemplo, tomando = ka con 0 < k < 1, obtenemos la funcion de Lyapunov
Z x1
t ka2 ka
V (x) = x
h(y)dy
(3.9)
x+
ka 1
2
0
que satisface las condiciones (3.3) y (3.4) del Teorema 3.1 en el dominio D = {x R2 | b < x1 < c}.
Concluimos que el origen es AE.
3.1.2.
Sobre la Regi
on de Atracci
on. Estabilidad Asint
otica Global
59
x21
+ x22
1 + x21
x1
x21
1+x21
+ x22
entonces c ser
a acotado si c < . En el ejemplo anterior,
= lm mn
r kxk=r
x21
x21
2
+
x
=1
=
l
m
2
1 + x21
|x1 | 1 + x2
1
60
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
V (x) > 0 x 6= 0
kxk = V (x)
V (x) < 0
x 6= 0
(3.10)
(3.11)
(3.12)
entonces x = 0 es GAE.
Demostraci
on. Dado cualquier punto p Rn , sea c = V (p). La condici
on (3.11) implica que para
cualquier c > 0, existe r > 0 tal que V (x) > c cuando kxk > r. Por lo tanto c Br , lo que implica
que c es acotado. El resto de la prueba es similar a la del Teorema 3.1.
Ejemplo 3.6. Consideremos otra vez el sistema del Ejemplo 3.5, pero supongamos que la condici
on
2
yh(y) > 0 vale y 6= 0. La funci
on de Lyapunov (3.9) satisface (3.10) y (3.11) para todo x R . Su
derivada
V (x) = a(1 k)x22 akx1 h(x1 )
es definida negativa para todo x R2 porque 0 < k < 1. Por lo tanto el origen es GAE.
3.1.3.
Inestabilidad
Vamos a ver un teorema que prueba que un PE es inestable. Sea V : D R una funcion
continuamente diferenciable en un dominio D Rn que contiene al origen x = 0. Supongamos que
V (0) = 0 y que hay un punto x0 arbitrariamente cercano al origen tal que V (x0 ) > 0. Elijamos
r > 0 tal que la bola Br = {x Rn | kxk r} este contenida en D, y sea
U = {x Br | V (x) > 0}
(3.13)
Esta desigualdad muestra que x(t) no se puede quedar indefinidamente en U porque V (x) est
a acotada en U . Ahora, x(t) no puede dejar U a traves de la superficie V (x) = 0 porque V (x(t)) a.
Por lo tanto debe dejar U a traves de la esfera kxk = r. Como esto pasa para kx0 k arbitrariamente
peque
na, el origen es inestable.
2
Es decir, para todo > 0 existe x0 D que satisface kx0 k < y V (x0 ) > 0.
61
1 2
(x x22 ).
2 1
Br
x2
x2 = x1
U
x1
x2 = x1
Figura 3.4: El conjunto U para V (x) = 12 (x21 x22 )
Sobre el eje x2 = 0, V (x) > 0 en puntos arbitrariamente cercanos al origen. El conjunto U
est
a graficado en la Figura 3.4. La derivada de V (x) sobre las trayectorias del sistema es
V (x) = x21 + x22 + x1 g1 (x) x2 g2 (x)
La magnitud del termino x1 g1 (x) x2 g2 (x) satisface
|x1 g1 (x) x2 g2 (x)|
2
X
i=1
Por lo tanto,
V (x) kxk22 2kkxk32 = kxk22 (1 2kkxk2 )
Eligiendo r tal que Br D y r < 1/(2k), vemos que todas las condiciones del Teorema 3.3 se
satisfacen. Entonces el origen es inestable.
62
3.2.
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
El Principio de Invariancia
salvo en el eje x2 = 0, donde V (x) = 0. Para que el sistema pueda mantener la condici
on V (x) = 0,
la trayectoria debe quedar confinada al eje x2 = 0. Pero esto es imposible a menos que x1 = 0
porque
x2 (t) 0 = x 2 (t) 0 = sen x1 (t) 0
Por lo tanto, en el segmento < x1 < del eje x2 = 0, el sistema puede mantener la condici
on
V (x) = 0 s
olo en el origen. Es decir V (x(t)) debe decrecer a cero y en consecuencia x(t) 0 cuando
t . Esta idea puede formalizarse en el principio de invariancia de LaSalle, que vamos a enunciar
y demostrar luego de introducir algunos conceptos.
Sea x(t) una soluci
on de (3.1).
Un punto p es un punto lmite positivo de x(t) si existe una secuencia {tn }, con tn
cuando n , tal que x(tn ) p cuando n .
El conjunto de todos los puntos lmites positivos de x(t) se denomina el conjunto lmite positivo
de x(t).
Un conjunto M es un conjunto invariante con respecto a (3.1) si
x(0) M = x(t) M ,
t R
t 0
Decimos que x(t) tiende a M cuando t tiende a infinito si para cada > 0 existe T > 0 tal
que
dist(x(t), M ) < ,
t > T
cuando t .
63
Teorema 3.5 (LaSalle). Sea D un conjunto compacto que es invariante positivo con respecto
a (3.1). Sea V : D R una funci
on continuamente diferenciable tal que V (x) 0 en . Sea E
el conjunto de todos los puntos de donde V (x) = 0. Sea M el mayor conjunto invariante en E.
Entonces toda soluci
on que comienza en tiende a M cuando t .
Demostraci
on. Sea x(t) una soluci
on de (3.1) que comienza en . Como V (x) 0 en , V (x(t))
es una funci
on decreciente de t. Como V (x) es continua en el conjunto compacto , est
a acotada
inferiormente en , por lo tanto V (x(t)) tiene un lmite a cuando t . Notemos tambien que
el conjunto lmite positivo L+ est
a en porque es un conjunto cerrado. Para cada p L+ ,
existe una secuencia tn tal que tn y x(tn ) p cuando n . Por continuidad de V (x),
V (p) = lmn V (x(tn )) = a, lo que implica V (x) = a en L+ . Como L+ es un conjunto invariante
(por Lema 3.4), V (x) = 0 en L+ . Por lo tanto,
L+ M E
Como x(t) es acotada, x(t) tiende a L+ cuando t (por Lema 3.4). Por lo tanto x(t) tiende a
M cuando t .
A diferencia del Teorema de Lyapunov, el Teorema 3.5 no requiere que V (x) sea definida positiva.
Tampoco el conjunto est
a necesariamente ligado a la construccion de V (x). Sin embargo, en
muchas aplicaciones, la construccion de V (x) en si misma va a garantizar la existencia de un conjunto
. En particular, si c = {x Rn | V (x) c} es acotado y V (x) 0 en c , entonces podemos
tomar = c . Cuando V (x) es definida positiva, c es acotado para c > 0 suficientemente peque
no.
2
Esto no es verdad en general si V (x) no es definida positiva. Por ejemplo si V (x) = (x1 x2 ) , el
conjunto c no es acotado por m
as peque
no que sea c. Si V (x) es radialmente no acotada (o sea,
verifica (3.11)), el conjunto c es acotado para todo valor de c, sea V (x) definida positiva o no.
Cuando nuestro interes es el de mostrar que x(t) 0 cuando t , tenemos que probar que
el m
aximo conjunto invariante en E es el origen. Esto se hace mostrando que ninguna soluci
on,
excepto la trivial x(t) = 0, puede permanecer identicamente en E. Especializando el Teorema 3.5 a
este caso, obtenemos los siguientes corolarios, que extienden los Teoremas 3.1 y 3.2.
Corolario 3.6. Sea x = 0 un PE de (3.1). Sea V : D R una funcion continuamente diferenciable
y definida positiva en un dominio D que contiene al origen x = 0, y tal que V (x) 0 en D. Sea
S = {x D | V (x) = 0} y supongamos que ninguna soluci
on, excepto la trivial x(t) = 0, puede
permanecer identicamente en S. Entonces el origen es AE.
yg(y) > 0 ,
h(0) = 0 ,
yh(y) > 0 ,
y 6= 0 , y (a, a)
y 6= 0 , y (a, a)
64
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
El sistema tiene un PE aislado en el origen. Dependiendo de las funciones g y h, podra tener otros
PE. La ecuaci
on de este sistema puede verse como una generalizaci
on de la del pendulo con h(x2 )
como el termino de friccion. Tomemos como candidata a funcion de Lyapunov la funcion de energa
Z x1
1
g(y)dy + x22
(3.14)
V (x) =
2
0
Sea D = {x R2 | a < xi < a}. V (x) es definida positiva en D. La derivada de V (x) sobre las
trayectorias del sistema es
V (x) = g(x1 )x2 + x2 [g(x1 ) h(x2 )] = x2 h(x2 ) 0
Por lo tanto, V (x) es semidefinida negativa. Para caracterizar el conjunto S = {x D | V (x) = 0},
notemos que
V (x) = 0 = x2 h(x2 ) = 0 = x2 = 0 , ya que a < x2 < a
Por lo tanto S = {x D | x2 = 0}. Supongamos que x(t) es una trayectoria que pertenece
identicamente a S. Entonces
x2 (t) 0 = x 2 (t) 0 = g(x1 (t)) 0 = x1 (t) 0
Por lo tanto, la u
nica soluci
on que puede quedarse identicamente en S es la trivial; concluimos que
el origen es AE.
Supongamos ahora que el par
ametro a = y adem
as g satisface la condici
on adicional
Z y
g(z)dz cuando |y|
0
El teorema de LaSalle no s
olo relaja el requisito del teorema de Lyapunov de que la derivada
sea definida negativa, sino que lo extiende en tres direcciones:
da una estima de la regi
on de atracci
on que no es necesariamente de la forma c = {x Rn |
V (x) c};
se puede usar en casos donde exista un conjunto de equilibrio en lugar de un PE aislado;
la funcion V (x) no tiene que ser definida positiva.
Ejemplo 3.9. Consideremos el sistema de primer orden (cf. 1.2.6)
y = ay + u
y la ley de control adaptable
u = ky ,
k = y 2 , > 0
3.3 Regi
on de Atracci
on
65
x 2 = x21
El eje x1 = 0 es un conjunto de equilibrio del sistema. Queremos probar que toda trayectoria del
sistema tiende a este conjunto de equilibrio cuando t , lo que significa que el control adaptable
logra regular y a cero. Consideremos la candidata a funcion de Lyapunov
V (x) =
1 2
1
x +
(x2 b)2
2 1 2
donde b > a. La derivada de V (x) sobre las trayectorias del sistema est
a dada por
1
V (x) = x1 x 1 + (x2 b)x 2
2
= x1 (x2 a) + x21 (x2 b)
= x21 (b a) 0
Notemos que si no conocemos la constante a, o una cota de ella, la funcion de Lyapunov del
ejemplo anterior no se conoce, s
olo se sabe que existe.
3.3.
Regi
on de Atracci
on
(3.15)
66
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
x2
x1
x 2 = x1 + (x21 1) x2
es la ecuaci
on de Van der Pol en tiempo invertido, es decir, reemplazando t por t. El sistema tiene
un PE en el origen y un ciclo lmite (CL) inestable (ver Figura 3.5). El retrato de fase muestra que
el origen es un foco estable, por lo tanto es AE. Esto se confirma linealizando, ya que obtenemos
V
0 1
=
(3.16)
A=
1 1
x x=0
que tiene autovalores en 1/2 j 3/2. La RA es acotada porque las trayectorias que comienzan
afuera del CL no lo pueden cruzar para llegar al origen. Como no hay otro PE, la frontera de RA
tiene que ser el CL.
(3.17)
que tiene tres PE aislados en (0, 0), ( 3, 0) y ( 3, 0). El retrato de fase, graficado en la Figura 3.6,
muestra que el origen es un foco estable y los otros dos PE son ensilladuras. Por lo tanto, el origen
es AE y los otros PE son inestables, lo que se puede confirmar linealizando. De la figura se puede
ver que las trayectorias estables de la ensilladura forman dos separatrices que son la frontera de la
RA, la cual es no acotada.
x 2 = x2 (1 x21 x22 )
tiene un PE aislado en el origen y un continuo de PEs sobre el crculo unitario: cada punto sobre el
crculo unitario es un PE. Es claro que RA debe estar confinada al interior del crculo unitario. Las
3.3 Regi
on de Atracci
on
67
x2
x1
trayectorias de este sistemas son los radios del crculo unitario, lo que se puede ver transformando
a coordenadas polares:
x1 = cos ,
x2 = sen
2
= (1 )
Toda trayectoria que comienza con < 1 tiende al origen cuando t . Por lo tanto, RA es el
interior del crculo unitario.
El metodo de Lyapunov puede usarse para encontrar estimas de la RA. Por una estima de la
RA entendemos un conjunto RA tal que toda trayectoria que comienza en tienda al origen
cuando t . Vamos primero a mostrar que el dominio D del Teorema 3.1 no es una estima de
RA . Vimos en el Teorema 3.1 que si D es un dominio que contiene el origen, y si podemos encontrar
una funcion de Lyapunov V (x) que es definida positiva en D y V (x) es definida negativa en D,
entonces el origen es AE. Se podra pensar que D es una estima de la RA. Esto no es cierto, como
lo demuestra el siguiente ejemplo.
Ejemplo 3.13. Consideremos otra vez el sistema (3.17), que es un caso especial del sistema del
Ejemplo 3.5 con h(x1 ) = x1 13 x31 y a = 1. Por lo tanto, una funcion de Lyapunov es (3.9), donde
tomamos, por ejemplo, = 1, k = 1/2:
"1 1#
Z x1
1
1 t 2 2
(y y 3 )dy
x+
V (x) = x 1
2
3
1
0
2
1
1
1
3
= x21 x41 + x1 x2 + x22
4
12
2
2
D = {x R2 | 3 < x1 < 3}
vemos que V (x) > 0 en D y V (x) < 0 en D {0}. Sin embargo, se puede ver en el retrato de fase
de la Figura 3.6 que D no est
a incluido en RA .
El ejemplo anterior muestra que el hecho de que V (x) < 0 en una regi
on no implica que la regi
on
sea una estima de la RA. Aunque una trayectoria que comienza en D se va a mover de una superficie
de nivel V (x) = c1 a otra interior V (x) = c2 con c2 < c1 , no hay garanta de que la trayectoria
68
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
permanecera para siempre en D. Una vez que la trayectoria sale de D, no hay garanta de que V (x)
sea negativa. Para que una regi
on sea una estima de la RA debe ser un conjunto invariante positivo,
es decir, toda trayectoria que comienza en el conjunto debe permanecer dentro de el en todo tiempo
futuro. La estima m
as simple de la RA es el conjunto
c = {x Rn | V (x) c}
cuando c es acotado y est
a contenido en D. Esto sigue como corolario del Teorema 3.5.
Usando los resultados de linealizaci
on de 3.4, sabemos que si la matriz Jacobiana
f
(x)
A=
x
x=0
es Hurwitz, entonces siempre podemos encontrar una funcion de Lyapunov cuadratica V (x) = xt P x
resolviendo la ecuaci
on de Lyapunov (3.20). Entonces, si A es Hurwitz, podemos siempre estimar la
RA del origen. Esto lo ilustramos en el ejemplo siguiente.
Ejemplo 3.14. Consideremos nuevamente el sistema del Ejemplo 3.10. Vimos que el origen es
AE. Tomando Q = I y A de (3.16), obtenemos como u
nica soluci
on de la ecuaci
on de Lyapunov
P A + At P = Q, la matriz definida positiva
1,5 0,5
P =
0,5
1
La funcion cuadratica V (x) = xt P x > 0 es una funcion de Lyapunov para el sistema en un entorno
del origen. Tenemos que determinar un dominio D alrededor del origen donde V (x) sea definida
negativa y un conjunto c D que sea acotado. Nos va a interesar encontrar c lo m
as grande
posible, es decir, el mayor valor para la constante c, porque c ser
a nuestra estima de la RA.
La derivada de V (x) sobre las trayectorias del sistema es
V (x) = (x21 + x22 ) (x31 x2 2x21 x22 )
El primer termino del lado derecho es la contribucion de la parte lineal Ax, mientras que el segundo
es la contribucion de la parte no lineal g(x) = f (x)Ax, que llamaremos el termino de perturbacion.
Como
kg(x)k2
0 cuando kxk2 0
kxk2
sabemos que hay una bola abierta D = {x R2 | kxk2 < r} en donde V (x) es definida negativa.
Una vez que encontremos D, podemos encontrar c D eligiendo
c < mn V (x) = min (P )r 2
kxk2 =r
donde min () denota el mnimo autovalor de una matriz. Por lo tanto, para agrandar la RA tenemos
que encontrar la bola m
as grande para la cual V (x) es definida negativa. Tenemos que
5
2
2
donde usamos |x1 | kxk2 , |x1 x2 | 12 kxk22 y |x1 2x2 | 5kxk2 . Por lo tanto, V (x) es definida
negativa en la bola D con radio dado por r 2 = 2/ 5 = 0,8944. En este ejemplo se puede encontrar
una estima menos conservadora trabajando en coordenadas polares. Tomando
x1 = cos ,
x2 = sen
69
tenemos
V = 2 + 4 cos2 sen (2 sen cos )
2 + 4 0,3849 2,2361
2 + 0,8614 < 0 ,
(3.18)
0,69
0,861
3.4.
(3.19)
tiene un equilibrio en el origen, que es aislado s det A 6= 0. Si det A = 0, todo punto en el kernel
o subespacio nulo de A es un PE. Un sistema lineal no puede tener m
ultiples PE aislados, porque
si x
y z son dos PE de (3.19), entonces, por linealidad, todo punto en la recta que conecta a x
y z
es un PE. Las propiedades de estabilidad del origen pueden caracterizarse mediante la ubicaci
on de
los autovalores de A.
Teorema 3.9 (Estabilidad del Origen en Sistemas Lineales). El PE x = 0 de (3.19) es estable
s todos los autovalores de A tienen parte real no positiva y cada autovalor con parte real nula tiene
un bloque de Jordan asociado de orden 1. El PE x = 0 es GAE s todos los autovalores de A tienen
parte real negativa.
Cuando todos los los autovalores de A tienen parte real negativa, se dice que A es una matriz de
estabilidad o matriz Hurwitz. La estabilidad del origen puede tambien investigarse usando el metodo
de Lyapunov. Consideremos la candidata a funcion de Lyapunov
V (x) = xt P x
donde P es una matriz real simetrica definida positiva. La derivada de V (x) sobre las trayectorias
del sistema est
a dada por
V (x) = xt P x + x t P x = xt (P A + At P )x = xt Qx
donde Q es una matriz simetrica definida por
P A + At P = Q
(3.20)
Si Q es definida positiva, podemos concluir por el Teorema 3.1 que el origen es AE. En el caso de sistemas lineales, es posible revertir los pasos del metodo de Lyapunov. Supongamos que comenzamos
eligiendo Q como una matriz real simetrica definida positiva, y resolvemos (3.20) para encontrar P .
Si (3.20) tiene una soluci
on definida positiva, podemos nuevamente concluir que el origen es AE. La
ecuaci
on (3.20) se denomina ecuaci
on de Lyapunov.
70
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
Teorema 3.10. Una matriz A es Hurwitz, o sea, todos sus autovalores tienen parte real negativa,
s dada una matriz Q simetrica y definida positiva, existe una matriz P simetrica y definida positiva
que satisface la ecuaci
on de Lyapunov (3.20). Mas a
un, si A es Hurwitz, entonces P es la u
nica
soluci
on de (3.20).
Demostraci
on. La suficiencia sigue del Teorema 3.1 con la funcion de Lyapunov V (x) = xt P x,
como ya mostramos. Para probar la necesidad, supongamos que todos los autovalores de A tienen
parte real negativa y consideremos la siguiente matriz P
Z
t
eA t QeAt dt
(3.21)
P =
0
El integrando es una suma de terminos de la forma tk1 ei t con Re i < 0. Por lo tanto, la integral
existe. La matriz P es simetrica. Para probar que es definida positiva, suponemos lo contrario, es
decir, que existe un vector x 6= 0 tal que xt P x = 0. Sin embargo,
Z
t
xt eA t QeAt xdt = 0
xt P x = 0 =
0
= eAt x 0 , t 0 = x = 0
Premultiplicando por eA
0=
tt
d At t
e (P P )eAt
dt
Por lo tanto,
t
eA t (P P )eAt constante t
Evaluando en t = 0 y t = obtenemos P = P .
La resolucion de la ecuaci
on de Lyapunov (3.20) no es numericamente m
as ventajosa que calcular
los autovalores de A. La ventaja de este metodo es que nos provee de una funcion de Lyapunov
cuando A es Hurwitz. Esto nos va a servir para sacar conclusiones sobre el sistema cuando el lado
derecho Ax este perturbado.
Volvamos al sistema no lineal (3.1)
x = f (x)
71
fi
(zi )x
x
(3.22)
donde zi es un punto sobre el segmento de lnea que conecta x al origen. La igualdad (3.22) vale para
todo punto x D tal que el segmento de lnea que conecta x al origen este totalmente contenido
en D. Como f (0) = 0, podemos escribir fi (x) como
fi
fi
fi
fi
fi (x) =
(zi )x =
(0)x +
(zi )
(0) x
x
x
x
x
Por lo tanto
f (x) = Ax + g(x)
donde
A=
f
(0) ,
x
gi (x) =
fi
fi
(zi )
(0) x
x
x
kg(x)k
0 cuando kxk 0
kxk
Esto sugiere que en un entorno peque
no del origen podemos aproximar al sistema no lineal (3.1)
por su linealizaci
on alrededor del origen
x = Ax
donde A =
f
(0)
x
El siguiente teorema, conocido como el metodo indirecto de Lyapunov, da condiciones para determinar la estabilidad del origen del sistema no lineal, a traves del estudio de la estabilidad del sistema
linealizado.
Teorema 3.11 (Metodo Indirecto de Lyapunov). Sea x = 0 un PE del sistema no lineal
x = f (x)
donde f : D Rn es una funci
on continuamente diferenciable y D Rn es un entorno del origen.
Sea
f
(x)
A=
x
x=0
Entonces
72
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
kxk2 < r
Entonces
V (x) < xt Qx + 2kP k2 kxk22 ,
kxk2 < r
pero
xt Qx min (Q)kxk22
Notar que min (Q) es real y positivo porque Q es simetrica y definida positiva. Por lo tanto
V (x) < [min (Q) 2kP k2 ] kxk22 ,
kxk2 < r
Eligiendo < min (Q)/(2kP k2 ) aseguramos que V (x) es definida negativa. Por el Teorema 3.1, el
origen es AE.
Para probar la segunda parte, consideremos primero el caso en que A no tiene autovalores en
el eje imaginario, es decir A tiene un grupo de autovalores en el semiplano derecho abierto y otro
grupo en el semiplano izquierdo abierto. Entonces existe una matriz no singular T tal que
A1 0
T AT 1 =
0
A2
donde A1 y A2 son matrices Hurwitz. Sea
z
z = Tx = 1
z2
donde la partici
on de z es compatible con las dimensiones de A1 y A2 . El cambio de variables z = T x
transforma el sistema original
x = f (x) = Ax + g(x)
73
a la forma
z1 = A1 z1 + g1 (z)
(3.23)
z2 = A2 z2 + g2 (z)
donde las funciones gi (z) tienen la propiedad de que para todo > 0 existe r > 0 tal que
kgi (z)k2 < kzk2 ,
kzk2 r , i = 1, 2
(3.24)
i = 1, 2
(3.25)
tienen soluciones u
nicas definidas positivas P1 y P2 . Sea
0
t
t
t P1
V (z) = z1 P1 z1 z2 P2 z2 = z
z
0 P2
En el subespacio z2 = 0, V (z) > 0 en puntos arbitrariamente cercanos al origen. Sea
U = {z Rn | kzk2 r
V (z) > 0}
> ( 2 2)kzk22
74
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
n
umero que A de autovalores en el semiplano derecho abierto, y ning
un autovalor sobre el eje
imaginario. Usando argumentos similares a los utilizados recien podemos calcular matrices P = P t
y Q = Qt > 0 tales que
P [A (/2)I] + [A (/2)I]t P = Q
y adem
as V (x) = xt P x es positiva en puntos arbitrariamente cercanos al origen. La derivada de
V (x) sobre las trayectorias del sistema satisface
V (x) = xt (P A + At P )x + 2xt P g(x)
= xt [P [A (/2)I] + [A (/2)I]t P ] x + xt P x + 2xt P g(x)
V (x) > 0}
donde r se elige tal que kg(x)k2 < kxk2 , kxk2 r, V (x) satisface
V (x) min (Q)kxk22 2kP k2 kxk2 kg(x)k2 (min (Q) 2kP k2 )kxk22
que es positiva para < min (Q)/(2kP k2 ). Aplicando el Teorema 3.3, concluimos que el origen es
inestable.
Ejemplo 3.15. Consideremos el sistema escalar
x = ax3
Linealizando alrededor del origen obtenemos
f
A=
(x)
= 3ax2 x=0 = 0
x
x=0
El autovalor est
a sobre el eje imaginario, por lo que no podemos decir nada acerca de la estabilidad
del origen como PE del sistema no lineal usando el sistema linealizado. Esta conclusion es genuina
ya que el origen puede ser AE, estable o inestable dependiendo del valor del par
ametro a. Si a < 0,
el origen es AE como puede probarse usando la funcion de Lyapunov V (x) = x4 . Si a = 0, el
sistema es lineal y el origen es estable. Si a > 0, el origen es inestable, como puede concluirse
usando el Teorema 3.3 y la funci
on V (x) = x4 , cuya derivada sobre las trayectorias del sistema es
6
3.5.
Ejercicios
Ejercicio 3.1.
Sea el sistema escalar x = axp + g(x), donde p es un entero positivo y g(x) satisface |g(x)|
k|x|p+1 en alg
un entorno del origen x = 0.
(i) Mostrar que el origen es AE si p es impar y a < 0.
(ii) Mostrar que el origen es inestable si p es impar y a > 0 o p es par y a 6= 0.
3.5 Ejercicios
75
Ejercicio 3.2.
Para cada uno de los siguientes sistemas usar una candidata a funcion de Lyapunov cuadratica
para mostrar que el origen es AE. Luego investigar si el origen es GAE.
x 1 = x1 + x22
(a)
(b)
x 1 = x1 + x21 x2
(c)
x 1 = x1 x2
(d)
x 2 = x2
Usando V (x) = x21 + x22 estudiar la estabilidad del origen del sistema
x 1 = x1 (k2 x21 x22 ) + x2 (x21 + x22 + k2 )
x 1 =
(i) Mostrar que V (x) > 0 y V (x) < 0 para todo x R2 {0}.
(ii) Sea la hiperbola x2 = 2/(x1 2). Mostrar, investigando el campo vectorial sobre la frontera
de esta hiperbola, que las trayectorias a la derecha de la rama en el primer cuadrante no
pueden cruzar esa rama.
(iii) Mostrar que el origen no es globalmente asintoticamente estable.
76
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
Ayuda: En la parte (ii) mostrar que x 2 /x 1 = 1/(1+2 2x1 +2x21 ) sobre la hiperbola, y comparar
con la pendiente de las tangentes a la hiperbola.
Ejercicio 3.6.
Sea el sistema
x 1 = x2
x 2 = x1 sat(2x1 + x2 ).
(i) Mostrar que el origen es asint
oticamente estable.
(ii) Mostrar que todas las trayectorias que comienzan a la derecha de la curva x1 x2 = c (con c > 0
suficientemente grande) no pueden alcanzar el origen.
(iii) Mostrar que el origen no es GAE.
Ayuda: En la parte (ii) considerar V (x) = x1 x2 ; calcular V (x) y mostrar que sobre la curva
V (x) = c la derivada V (x) > 0 cuando c es suficientemente grande.
Ejercicio 3.7.
M
etodo de Krasovskii. Sea el sistema x = f (x) con f (0) = 0, con f (x) continuamente
diferenciable y tal que el Jacobiano [f /x] satisface
h f
i h f
iT
P
(x) +
(x) P I,
x Rn , donde P = P T > 0.
x
x
R1
(i) Usando la representaci
on f (x) = 0 f
x (x)x d, mostrar que
xT P f (x) + f T (x)P x xT x,
x Rn .
(ii) Mostrar que V (x) = f T (x)P f (x) es definida positiva para todo x Rn .
(iii) Mostrar que V (x) es radialmente no acotada.
(iv) Usando V (x) como candidata a funci
on de Lyapunov, mostrar que el origen es GAE.
Ejercicio 3.8.
Mostrar que el origen del sistema
x 1 = x1 + x62
x 2 = x32 + x61
es inestable.
Ejercicio 3.9.
Mostrar que el origen del sistema
x 1 = x31 + x2
x 2 = x61 x32
es inestable.
3.5 Ejercicios
77
x 3 = x3 sat(x22 x23 )
x 2 = x2
x 2 = 2x2 + x1 (3 x1 x2 )
tiene un equilibrio GAE.
78
Estabilidad Seg
un Lyapunov. Sistemas Estacionarios
Ayuda: Encuentre el equilibrio y haga un cambio de coordenadas (x1 , x2 ) (y1 , y2 ) para correrlo
al origen. Luego use una funci
on de la forma
V (y1 , y2 ) = k1
y2
y4
y12
+ k2 2 + k3 1
2
2
4
Captulo 4
Estabilidad Seg
un Lyapunov. Sistemas
Inestacionarios
Este captulo extiende el metodo de Lyapunov a sistemas no lineales inestacionarios. Definimos
los conceptos de estabilidad uniforme, estabilidad asintotica uniforme, y estabilidad exponencial
de un punto de equilibrio, y damos sus teoremas correspondientes. Presentamos adem
as teoremas
conversos, que establecen la existencia de funciones de Lyapunov para clases de sistemas no lineales.
Finalmente, extendemos el principio de invariancia de LaSalle a sistemas inestacionarios.
4.1.
(4.1)
t 0
t= a
t 0
80
Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
soluci
on y( ) del sistema original. Notar que si y( ) no es constante, el sistema transformado es
inestacionario aunque el sistema original sea estacionario. Por lo tanto, el estudio de estabilidad de
soluciones en el sentido de Lyapunov s
olo puede hacerse mediante el estudio de la estabilidad de
equilibrios de sistemas inestacionarios.
Antes de definir estabilidad para el sistema (4.1), veamos un par de ejemplos.
Ejemplo 4.1 (Estabilidad no uniforme en t). El sistema lineal de primer orden
x = (6t sen t 2t)x
tiene como soluci
on
x(t) = x(t0 ) exp
Z
t
t0
(6 sen 2 )d
= x(t0 ) exp 6 sen t 6t cos t t2 6 sen t0 + 6t0 cos t0 + t20
t t0
x(t0 )
cuando n
Por lo tanto, dado > 0, no existe independiente de t0 tal que la propiedad de estabilidad valga
uniformemente en t0 .
x
,
1+t
t0 > 1,
Z
t
t0
1
d
1+
1 + t0
= x(t0 )
1+t
81
Nos va a interesar entonces definir estabilidad del origen como una propiedad uniforme con
respecto al instante inicial.
Definici
on 4.1 (Estabilidad Uniforme). El PE x = 0 de (4.1) es
estable, si para cada > 0 existe = (, t0 ) > 0 tal que
kx(t0 )k < = kx(t)k < ,
t t0
(4.2)
uniformemente estable, si para cada > 0 existe = () > 0, independiente de t0 , tal que
(4.2) se satisface.
inestable, si no es estable.
asint
oticamente estable, si es estable y existe c = c(t0 ) tal que x(t) 0 cuando t , para
todo kx(t0 )k < c.
uniformemente asint
oticamente estable, si es uniformemente estable y existe c > 0 independiente de t0 tal que para todo kx(t0 )k < c, x(t) 0 cuando t , uniformemente en t0 ; es
decir, para cada > 0 existe T = T () tal que
kx(t)k < ,
t t0 + T () ,
kx(t0 )k < c
t t0 + T (, c) ,
kx(t0 )k < c
Definici
on 4.3 (Funci
on de Clase KL). Una funcion continua : [0, a) [0, ) [0, ) pertenece
a la clase KL si, para cada s fijo, el mapeo (r, s) es clase K con respecto a r, y, para cada r fijo,
el mapeo (r, s) es decreciente con respecto a s y (r, s) 0 cuando s .
es clase K pero no K .
Lema 4.1. [Propiedades de funciones clase K y KL] Sean 1 () y 2 () funciones clase K en [0, a),
3 () y 4 () funciones clase K , y (, ) una funcion clase KL. Denotemos 1
i () a la inversa de
i (). Entonces
1
a definida en [0, 1 (a)) y es clase K.
1 est
82
Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
1
a definida en [0, ) y es clase K .
3 est
1 2 es clase K.
3 4 es clase K .
(r, s) = 1 ((2 (r), s)) es clase KL.
t t0 0 ,
kx(t0 )k < c
(4.3)
uniformemente asint
oticamente estable s existe una funcion (, ) clase KL y una constante
positiva c, independiente de t0 , tal que
kx(t)k (kx(t0 )k, t t0 ) ,
t t0 0 ,
kx(t0 )k < c
(4.4)
k > 0, > 0
Una funcion definida positiva puede acotarse con funciones clase K, como lo muestra el siguiente
lema.
Lema 4.3 (Signo definido y funciones clase K). Sea V (x) : D R una funcion continua definida
positiva, definida en un dominio D Rn que contiene al origen. Sea Br D para alg
un r > 0.
Entonces existen 1 y 2 , funciones clase K definidas en [0, r], tal que
1 (kxk) V (x) 2 (kxk)
para todo x Br . Mas a
un, si D = Rn y V (x) es radialmente no acotada, entonces 1 y 2 pueden
elegirse clase K y la desigualdad anterior vale para todo x Rn .
83
Demostraci
on. Definamos (s) como
(s) =
nf
skxkr
V (x)
para 0 s r
para kxk r
para 0 s r
La funcion (s) es continua, definida positiva, y creciente (no necesariamente estrictamente creciente). Mas a
un, V (x) (kxk) para kxk r. Sea 2 (s) una funcion clase K tal que 2 (s) k(s)
con k > 1. Entonces,
V (x) (kxk) 2 (kxk)
para kxk r
Si V (x) es radialmente no acotada, entonces existen constantes positivas c y r1 tales que V (x) c
para todo kxk > r1 . Las definiciones de (s) y (s) son ahora
(s) = nf V (x) ,
kxks
para s 0
Estas funciones son continuas, definidas positivas, crecientes, y tienden a infinito cuando s .
Por lo tanto, las funciones 1 y 2 pueden elegirse clase K .
Si V (x) = xt P x es una funci
on definida positiva cuadratica, el lema anterior sigue de las
desigualdades
min (P )kxk22 xt P x max (P )kxk22
El Teorema siguiente es el metodo de Lyapunov para establecer la estabilidad uniforme de un
PE.
Teorema 4.4 (Estabilidad Uniforme). Sea x = 0 un PE de (4.1) y sea D Rn un dominio que
contiene al origen. Sea V : [0, ) D R una funcion continuamente diferenciable tal que
W1 (x) V (t, x) W2 (x)
V
V
+
f (t, x) 0
t
x
(4.5)
(4.6)
84
Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
V (t, x) c.
W1 (x) c.
t t0 .
Por el Lema 4.3, existen funciones 1 y 2 , ambas de clase K y definidas en [0, r], tales que
1 (kxk) W1 (x) V (t, x) W2 (x) 2 (kxk).
Combinando las desigualdades anteriores, vemos que
1
1
kx(t)k 1
1 (V (t, x(t))) 1 (V (t0 , x(t0 ))) 1 (2 (kx(t0 )k).
1
Como la funcion 1
1 2 es de clase K, la desigualdad kx(t)k 1 (2 (kx(t0 )k)) muestra que el
origen es uniformemente estable.
Vamos a ver ahora el metodo de Lyapunov para demostrar estabilidad asintotica uniforme para
sistemas inestacionarios. Este metodo da condiciones suficientes para que la desigualdad (4.4) se
satisfaga. La funcion (, ) de clase KL en dicha desigualdad resultara de la soluci
on de una ecuaci
on
diferencial escalar aut
onoma, cuyas propiedades se dan en el siguiente resultado.
Lema 4.5. Consideremos la ecuaci
on diferencial escalar
y = (y) ,
y(t0 ) = y0
(r, s) = reks
y0
ky0 (t t0 ) + 1
(r, s) =
85
r
krs + 1
(4.7)
(4.8)
permanece en t, para todo t t0 . Esto es porque V (t, x) es negativa en D {0} y por lo tanto
V (t, x) decrece. Entonces la soluci
on que comienza en (t0 , x0 ) est
a definida para todo t t0 y
x(t) Br . En el resto de la demostracion vamos a asumir que x0 {x Br | W2 (x) }. Por el
Lema 4.3, existen funciones 1 , 2 y 3 clase K, definidas en [0, r], tales que
W1 (x) 1 (kxk) ,
W2 (x) 2 (kxk) ,
W3 (x) 3 (kxk)
86
Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
La funcion () es clase K definida en [0, r] (ver Lema 4.1). Supongamos (sin perdida de generalidad)
que () es localmente Lipschitz. Sea y(t) la soluci
on de la ecuaci
on diferencial
y = (y) ,
t t0
1
1 ((2 (kx(t0 )k), t t0 )) , (kx(t0 )k, t t0 )
W2 (x) k2 kxkc ,
W3 (x) k3 kxkc
87
Por lo tanto,
"
#1/c
V (t, x(t)) 1/c
V (t0 , x(t0 ))e(k3 /k2 )(tt0 )
kx(t)k
k1
k1
#1/c
"
k2 1/c
k2 kx(t0 )kc e(k3 /k2 )(tt0 )
kx(t0 )ke(k3 /k2 )(tt0 )
=
k1
k1
La cota de arriba muestra que el origen es exponencialmente estable. Si todas las hip
otesis valen
globalmente, la desigualdad vale para todo x(t0 ) Rn .
Ejemplo 4.4 (Sistema globalmente exponencialmente estable). Consideremos el sistema
x 1 = x1 g(t) x2
x 2 = x1 x2
g(t)
g(t) , t 0
Tomemos V (t, x) = x21 + [1 + g(t)] x22 como candidata a funcion de Lyapunov. Es facil de ver que
x21 + x22 V (t, x) x21 + (1 + k) x22 , x R2
Por lo tanto, V (t, x) es definida positiva, decreciente, y radialmente no acotada. La derivada de V
sobre las trayectorias del sistema est
a dada por
2
V (t, x) = 2x21 + 2x1 x2 [2 + 2g(t) g(t)]x
Usando la desigualdad
2 + 2g(t) g(t)
2 + 2g(t) g(t) 2
obtenemos
t
2 1 x1
x1
2
2
, xt Qx
V (t, x) 2x1 + 2x1 x2 2x2 =
1 2
x2
x2
donde Q es definida positiva; por lo tanto V (t, x) es definida negativa. Todas las condiciones del
Teorema 4.6 se satisfacen globalmente con funciones cuadraticas W1 , W2 y W3 definidas positivas.
Por el Corolario 4.8, concluimos que el origen es globalmente exponencialmente estable.
(4.9)
tiene un PE en x = 0. Sea A(t) continua para todo t 0. Supongamos que existe una matriz P (t)
simetrica, , acotada y definida positiva, es decir,
0 < c1 I P (t) c2 I ,
t 0
Supongamos adem
as que P (t) es continuamente diferenciable y satisface la ecuaci
on diferencial
matricial
P (t) = P (t)A(t) + At (t)P (t) + Q(t)
(4.10)
88
Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
t 0
Por lo tanto, V (t, x) es definida negativa. Todas las condiciones del Corolario 4.8 se satisfacen
globalmente con c=2. Concluimos que el origen es globalmente exponencialmente estable.
t 0
y si A(t) es continua y acotada, entonces puede probarse que cuando el origen es uniformemente asintoticamente estable, existe una soluci
on de (4.10) con las propiedades requeridas, como lo
muestra el siguiente resultado.
Teorema 4.9. Sea x = 0 un PE uniformemente asintoticamente estable de (4.9). Supongamos que
A(t) es continua y acotada. Sea Q(t) una matriz continua, acotada, simetrica y definida positiva.
Entonces, existe una matriz P (t) continuamente diferenciable, simetrica, acotada y definida positiva,
que satisface (4.10), y V (t, x) = xt P (t)x es una funcion de Lyapunov para el sistema (4.9) que
satisface las condiciones del Teorema 4.6.
4.2.
Teoremas Conversos
El Teorema 4.6 y sus corolarios establecen estabilidad asintotica uniforme (o estabilidad exponencial) del origen requiriendo la existencia de una funcion de Lyapunov que satisfaga ciertas
condiciones. Aqu cabe preguntarnos: existe una funcion que satisfaga las condiciones del teorema?, como la encontramos si existe? Los teoremas conversos dan una respuesta afirmativa a la
primera pregunta. Para responder a la segunda pregunta vamos a ver m
as adelante que ser
a necesario especializar el an
alisis a ciertas clases de sistemas no lineales.
Teorema 4.10. Sea x = 0 un PE del sistema no lineal
x = f (t, x)
donde f : [0, ) D Rn es continuamente diferenciable, D = {x Rn | kxk < r}, y la matriz
Jacobiana f /x es acotada en D, uniformemente en t. Sean k, y r0 constantes positivas con
r0 < r/k. Sea D0 = {x Rn | kxk < r0 }. Supongamos que las trayectorias del sistema satisfacen
kx(t)k kkx(t0 )ke(tt0 ) ,
x(t0 ) D0 ,
t t0 0
89
(4.11)
(4.12)
(4.13)
t+T
t (, t, x)(, t, x)d
donde T es una constante positiva que se va a elegir despues. Dada la cota exponencial decreciente
de las trayectorias, tenemos
V (t, x) =
t+T
t+T
k(, t, x)k22 d
k2 e2( t) d kxk22 =
k2
(1 e2T )kxk22
2
(4.14)
(4.15)
t+T
e2L( t) d kxk22 =
1
(1 e2LT )kxk22
2L
(4.16)
1 e2LT
2L
c2 =
k2 (1 e2T )
2
Para calcular la derivada de V sobre las trayectorias del sistema, definamos las funciones de sensibilidad
t (, t, x) =
(, t, x) ;
t
x (, t, x) =
(, t, x) ;
x
90
Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
Entonces,
V
V
+
f (t, x) =t (t + T, t, x)(t + T, t, x) t (t, t, x)(t, t, x)
t
x
Z t+T
Z t+T
2t (, t, x)x (, t, x)d f (t, x)
2t (, t, x)t (, t, x)d +
+
t
=t (t + T, t, x)(t + T, t, x) kxk22
Z t+T
2t (, t, x)[t (, t, x) + x (, t, x) f (t, x)]d
+
t
Por lo tanto
V
V
+
f (t, x) = t (t + T, t, x)(t + T, t, x) kxk22
t
x
(1 k2 e2T )kxk22
Eligiendo T = ln(2k2 )/(2), la desigualdad (4.12) se satisface con c3 = 1/2. Para probar la desigualdad (4.13), notemos que x (, t, x) satisface la ecuaci
on de sensibilidad
f
x =
(, (, t, x))x ,
x (t, t, x) = I
Por la condici
on (4.15), x satisface la cota (ver Ejercicio 2.7)
kx (, t, x)k2 eL( t)
Por lo tanto,
Z t+T
V
t
2 (, t, x)x (, t, x)d
x (t, x)
=
t
2
2
Z t+T
2kt (, t, x)k2 kx (, t, x)k2 d
t
Z t+T
2k
[1 e(L)T ) ]kxk2
L
Vemos que la desigualdad (4.13) se satisface con c4 = 2k[1 e(L)T ) ]/( L).
Si todas las hip
otesis valen globalmente, entonces r0 puede tomarse arbitrariamente grande.
Si el sistema es aut
onomo, (, t, x) depende s
olo de t; es decir (, t, x) = ( t, x).
Entonces
Z T
Z t+T
t (s, x)(s, x)ds
t ( t, x)( t, x)d =
V (t, x) =
t
que es independiente de t.
El siguiente teorema vincula la estabilidad exponencial del origen del sistema no lineal con la
estabilidad exponencial de su linealizaci
on alrededor del origen.
91
Entonces el origen es un PE exponencialmente estable del sistema no lineal s es un PE exponencialmente estable para el sistema lineal
x = A(t)x
Demostraci
on. Como la matriz Jacobiana f /x es acotada y Lipschitz en D, uniformemente en t,
tenemos que
fi
fi
x1 , x2 D , t 0
x (t, x1 ) x (t, x2 )
L1 kx1 x2 k2 ,
2
para todo 1 i n. Por el teorema del valor medio
fi (t, x) = fi (t, 0) +
fi
(t, zi )x
x
donde zi es un punto en el segmento que conecta x al origen. Como f (t, 0) = 0 (porque el origen es
un PE), podemos escribir
fi
fi
fi
fi
(t, zi )x =
(t, 0)x +
(t, zi )
(t, 0) x
fi (t, x) =
x
x
x
x
Por lo tanto
f (t, x) = A(t)x + g(t, x)
donde
f
A(t) =
(t, 0)
x
fi
fi
gi (t, x) =
(t, zi )
(t, 0) x
x
x
kg(t, x)k2
2 !1/2
n
X
fi
f
i
(t,
z
)
(t,
0)
kxk2 Lkxk22
i
x
x
2
i=1
donde L = nL1 .
Ahora supongamos que el origen es un PE exponencialmente estable del sistema lineal y A(t)
es continua y acotada. Entonces el Teorema 4.9 garantiza la existencia de una matriz P (t) continuamente diferenciable, simetrica, acotada y definida positiva, que satisface (4.10), donde Q(t) es
continua, acotada, simetrica y definida positiva. Vamos a usar V (t, x) = xt P (t)x como candidata
92
Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
a funcion de Lyapunov para el sistema no lineal. La derivada de V (t, x) sobre las trayectorias del
sistema satisface
V (t, x) = xt P (t)f (t, x) + f t (t, x)P (t)x + xt P (t)x
= xt [P (t)A(t) + At (t)P (t) + P (t)]x + 2xt P (t)g(t, x)
= xt Q(t)x + 2xt P (t)g(t, x)
kxk2 <
Eligiendo < mn{r, c3 /(2c2 L)} nos aseguramos que V (t, x) es definida negativa en kxk2 < .
Vemos que todas las condiciones del Corolario 4.8 se satisfacen en kxk2 < , por lo tanto el origen
es exponencialmente estable.
Supongamos ahora que el origen es un PE exponencialmente estable del sistema no lineal.
Entonces existen constantes k, y c tales que
kx(t)k2 kkx(0)k2 e(tt0 ) ,
t t0 0 ,
kx(0)k2 < c
Eligiendo r0 < mn{c, r/k}, todas las condiciones del Teorema 4.10 se satisfacen. Sea V (t, x) la
funcion de Lyapunov dada por el Teorema 4.10, la que tomamos como candidata a funcion de
Lyapunov para el sistema lineal
x = A(t)x = f (t, x) [f (t, x) A(t)x] = f (t, x) g(t, x)
Entonces
V
V
V
V
V
+
A(t)x =
+
f (t, x)
g(t, x)
t
x
t
x
x
c3 kxk22 + c4 Lkxk32
(c3 c4 L)kxk22 ,
kxk2 <
Eligiendo < mn{r0 , c3 /(c4 L)}, resulta V (t, x) definida negativa en kxk2 < . Entonces todas las
condiciones del Corolario 4.8 se satisfacen en kxk2 < , por lo tanto el origen es un PE exponencialmente estable para el sistema lineal.
Ejemplo 4.6. Consideremos el sistema de primer orden
x = x3
Vimos en el Ejemplo 3.15 que el origen es AE, pero la linealizaci
on alrededor del origen es x = 0 cuya
matriz A no es Hurwitz. Usando el Teorema 4.11, concluimos que el origen no es exponencialmente
estable.
x(t0 ) D0 ,
t t0 0
93
(4.17)
donde 1 (), 2 (), 3 () y 4 () son funciones clase K definidas en [0, r0 ]. Si el sistema es estacionario,
V puede elegirse independiente de t.
4.3.
Teoremas de Invariancia
Para sistemas estacionarios, el teorema de invariancia de LaSalle muestra que las trayectorias del
sistema tienden al m
aximo conjunto invariante contenido en el conjunto E = {x : V (x) = 0}.
En el caso de sistemas inestacionarios, no est
a claro, en principio, como definir el conjunto E, ya que
V (t, x) es funci
on tanto del tiempo como del estado. La situaci
on se simplifica si se puede probar
que
V (t, x) W (x) 0
porque entonces E puede definirse como el conjunto de puntos donde W (x) = 0. Sera de esperar que
las trayectorias del sistema tiendan a E cuando t tiende a infinito. Ese es precisamente el resultado
del siguiente teorema, que enunciamos despues de un Lema preliminar.
Lema 4.13 (Lema de Barbalat).
Sea : R R una funcion uniformemente continua en [0, ).
Rt
Supongamos que lmt 0 ( ) d existe y es finito. Entonces
(t) 0 ,
cuando t
Demostraci
on. Supongamos que no es cierto, entonces existe una constante positiva k1 tal que para
todo T > 0 se puede encontrar T1 T tal que |(T1 )| k1 . Como (t) es uniformemente continua,
existe una constante positiva k2 tal que |(t + ) (t)| < k1 /2 para todo t 0 y todo 0 k2 .
Entonces
|(t)| = |(t) (T1 ) + (T1 )|
> k1 k1 /2 = k1 /2 ,
Por lo tanto
Z T1 +k2
Z
=
(t)
dt
T1
t [T1 , T1 + k2 ]
T1 +k2
T1
|(t)| dt > k1 k2 /2
donde laR igualdad es valida porque (t) conserva el signo para t [T1 , T1 + k2 ]. Por lo tanto la
t
integral 0 ( ) d no puede tener un lmite finito cuando t , lo cual es una contradicci
on.
Teorema 4.14 (Principio de invariancia para sistemas inestacionarios). Sea D Rn un dominio
que contiene al origen y supongamos que f (t, x) es seccionalmente continua en t y localmente
94
Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
(4.18)
cuando t .
Mas a
un, si todas las hip
otesis valen globalmente y W1 (x) es radialmente no acotada, el resultado
n
vale para toda x(t0 ) R .
Demostraci
on. Como en la demostracion del Teorema 4.4, se puede probar que
x(t0 ) {x Br | W2 (x) }
x(t) t, {x Br | W1 (x) },
t t0
ya que V (t, x) 0. Por lo tanto, kx(t)k < r para todo t t0 . Como V (t, x(t)) es monot
onicamente
no creciente y acotada por abajo por cero, tiene lmite finito cuando t . De (4.18) tenemos
Z t
Z t
V (, x( ))d = V (t0 , x(t0 )) V (t, x(t))
W (x( ))d
t0
t0
Rt
Por lo tanto, lmt t0 W (x( ))d existe y es finito. Como f (t, x) es localmente Lipschitz en x,
uniformemente en t, en [0, ) D, es Lipschitz en x, uniformemente en t, en [0, ) Br , ya que
Br es compacto. Por lo tanto, tenemos
kf (t, x(t)) f (t, 0)k Lkx(t)k,
debido a que x(t) Br para todo t t0 . Como adem
as f (t, 0) est
a uniformemente acotada por
hip
otesis, entonces x = f (t, x) es acotada uniformemente en t, para todo t t0 . Concluimos que x(t)
es uniformemente continua en t en [t0 , ). En consecuencia, W (x(t)) es uniformemente continua en
t en [t0 , ) ya que W (x) es uniformemente continua en x en el conjunto compacto Br . Por el Lema
de Barbalat concluimos que W (x(t)) 0 cuando t . Si todas las hip
otesis valen globalmente
y W1 (x) es radialmente no acotada, entonces para cada x(t0 ) podemos elegir lo suficientemente
grande tal que x(t0 ) {x Rn | W2 (x) }.
El lmite W (x(t)) 0 implica que x(t) tiende a E cuando t , donde
E = {x D | W (x) = 0}
Por lo tanto, el conjunto lmite positivo de x(t) es un subconjunto de E. Esta conclusion (de que x(t)
tiende a E) es mucho m
as debil que el principio de invariancia de LaSalle para sistemas estacionarios,
que concluye que x(t) tiende al mayor conjunto invariante contenido en E. Esta conclusion m
as
fuerte para sistemas estacionarios es consecuencia de la propiedad de estos sistemas enunciada en el
Lema 3.4, que dice que el conjunto lmite positivo es un conjunto invariante. Existen algunos casos
especiales de sistemas inestacionarios para los cuales el conjunto lmite positivo tiene una cierta
propiedad de invariancia. Sin embargo, para un sistema inestacionario generico, el conjunto lmite
positivo no es invariante. El hecho de que, para sistemas estacionarios, x(t) tiende al mayor conjunto
95
0<<1
W2 (x) k2 kxkc ,
x(t) t, ,
t t0
donde < mnkxk=r W1 (x), ya que V (t, x) 0. Ademas, para todo t t0 , tenemos
Z t+
V (, (, t, x)) d
V (t + , x(t + )) = V (t, x(t)) +
t
(1 )V (t, x(t))
Mas a
un, como V (t, x) 0
V (, x( )) V (t, x(t)) ,
[t, t + ]
1
1 b(tt0 )
e
V (t0 , x(t0 ))
=
1
96
Estabilidad Seg
un Lyapunov. Sistemas Inestacionarios
r
ebs
1
puede verse facilmente que (r, s) es una funcion clase KL y que V (t, x(t)) satisface
V (t, x(t)) (V (t0 , x(t0 )), t t0 ) ,
t 0
y la ecuaci
on diferencial matricial
P (t) = P (t)A(t) + AT (t)P (t) + C T (t)C(t)
donde C(t) es continua. La derivada de la funcion cuadratica
V (t, x) = xT P (t)x
a lo largo de las trayectorias del sistema es
V (t, x) = xT P (t) + P (t)A(t) + AT (t)P (t) x
= xT C T (t)C(t)x 0.
De la teora de sistemas lineales inestacionarios sabemos que las trayectorias del sistema que comienzan en el punto x est
an dadas por
(, t, x) = (, t)x,
donde (, t) es la matriz de transici
on de estados. Entonces,
Z t+
hZ t+
i
V (, (, t, x)) d = xT
T (, t)C T ( )C( )(, t) d x
t
= xT W (t, t + )x,
donde
W (t, t + ) =
t+
t 0.
k
V (, (, t, x)) d kkxk22 V (t, x).
c2
4.4 Ejercicios
97
4.4.
Ejercicios
Ejercicio 4.1.
Dado el sistema
x 1 = x2
x 2 = 2x1 x2 + 3t + 2 3x1 2(t + 1)x2
(i) Verificar que x1 (t) = t, x2 (t) = 1 es una soluci
on.
(ii) Mostrar que si x(0) est
a suficientemente cerca de [ 01 ] entonces x(t) se aproxima a [ 1t ] a medida
que t .
Ejercicio 4.2.
Considerar el sistema
x 1 = 2x1 + g(t)x2
x 2 = g(t)x1 2x2
donde g(t) es continuamente diferenciable y |g(t)| 1 para todo t 0. Mostrar que el origen es
uniformemente asint
oticamente estable. Es el origen globalmente uniformemente asintoticamente
estable?
Ejercicio 4.3.
Sea el sistema
x 1 = x2 g(t)x1 (x21 + x22 )
Captulo 5
(5.1)
(5.2)
El termino de perturbacion g(t, x) puede provenir de errores de modelado, envejecimiento, incertidumbres, etc. Tpicamente no conocemos el termino g(t, x) pero tenemos alguna informaci
on sobre
el, como por ejemplo una cota superior de kg(t, x)k. La representacion aditiva de la perturbacion
en (5.1) modela, por ejemplo, perturbaciones que no modifican el orden del sistema.
Supongamos que el sistema nominal (5.2) tiene un PE uniformemente AE en el origen. Que podemos decir acerca de la estabilidad del sistema perturbado (5.1)? Una forma natural de encarar
esta cuesti
on es la de usar una funci
on de Lyapunov del sistema nominal como candidata a funci
on
de Lyapunov para el sistema perturbado. Esto es lo que hicimos con el an
alisis de la linealizaci
on
en la secci
on 3.4. El elemento nuevo que introducimos ahora es que el termino de perturbacion
puede ser mucho m
as general que en el caso de linealizaci
on. En las primeras dos secciones, vamos a
analizar el caso en que el termino de perturbacion se anula en el origen, es decir g(t, 0) = 0, de forma
que el origen x = 0 sigue siendo un PE del sistema perturbado. El caso g(t, 0) 6= 0 se tratar
a en la
secci
on 5.3. Un caso particular de perturbacion que no necesariamente se anula en el origen nos
servir
a para introducir el concepto de estabilidad entrada-estado (ISS) en la secci
on 5.4.
5.1.
Perturbaci
on de un PE Exponencialmente Estable
(5.3)
(5.4)
(5.5)
para todo (t, x) [0, ) D y para ciertas constantes positivas c1 , c2 , c3 y c4 . La existencia de una
funcion de Lyapunov que satisface (5.3)-(5.5) est
a garantizada por el Teorema 4.10, con algunas
100
hip
otesis adicionales. Supongamos adem
as que el termino de perturbacion g(t, x) satisface la cota
de crecimiento lineal
kg(t, x)k kxk ,
t 0 ,
x D
(5.6)
donde es una constante no negativa. La propiedad (5.6) es natural dadas las hip
otesis que hicimos
sobre g(t, x). Como g(t, x) se anula en el origen y es localmente Lipschitz en un entorno acotado del
origen, entonces es facil de probar que satisface (5.6) en dicho entorno. Usamos V como candidata
a funcion de Lyapunov para el sistema perturbado (5.1). Planteamos
V
V
V
V (t, x) =
+
f (t, x) +
g(t, x).
t
x
x
Usando (5.4)-(5.6), acotamos V de la siguiente manera
V
2
2
V (t, x) c3 kxk2 +
x
kg(t, x)k c3 kxk + c4 kxk .
Si es lo suficientemente peque
na tal que satisface la cota
c3
<
c4
entonces
V (t, x) (c3 c4 )kxk2 < 0 ,
(5.7)
x D {0}.
Este lema es conceptualmente importante porque muestra que la estabilidad exponencial del
origen es robusta con respecto a una clase de perturbaciones que satisface (5.6)-(5.7). Para poder
enunciar esta propiedad de robustez no es necesario conocer V (t, x) explcitamente, s
olo hace falta
saber que el origen es un PE exponencialmente estable del sistema nominal, porque entonces, usando
el Teorema 4.10 (asumiendo adem
as que la matriz Jacobiana f /x es acotada), podemos garantizar la existencia de una V (t, x) que satisface (5.3)-(5.5). Sin embargo, si no conocemos a V (t, x)
explcitamente, entonces no podemos calcular la cota (5.7), en cuyo caso s
olo podemos decir que el
origen es exponencialmente estable para toda perturbacion que satisface (5.6) con suficientemente
peque
na.
Ejemplo 5.1. Consideremos el sistema
x = Ax + g(t, x)
donde A es Hurwitz y g(t, x) satisface (5.6) con D = Rn . Sea Q = Qt > 0 y calculemos la soluci
on
t
P de la ecuaci
on de Lyapunov P A + A P = Q. Por el Teorema 3.10 sabemos que hay una u
nica
soluci
on P = P t > 0. La funci
on de Lyapunov cuadratica V (x) = xt P x satisface (5.3)-(5.5). En
particular,
min (P )kxk22 xt P x max (P )kxk22
V
Ax = xt Qx min (Q)kxk22
x
V
t
x
= k2x P k2 2kP k2 kxk2 = 2max (P )kxk2 .
2
5.1 Perturbaci
on de un PE Exponencialmente Estable
101
min (Q)
2max (P )
(5.8)
(5.9)
1
3,026 k22
(5.10)
Para estimar una cota de k2 , sea c = {x R2 | V (x) c}. Para cualquier constante positiva c, el
conjunto c es cerrado y acotado. La frontera de c es la superficie de nivel
V (x) =
5
3 2 1
x1 + x1 x2 + x22 = c
2
4
16
102
El mayor valor de |x2 | sobre la superficie V (x) = c se puede determinar derivando la ecuaci
on de la
superficie con respecto a x1 e igualando a cero. Esto da
1
3x1 + x2 = 0
4
Por lo tanto, los valores extremos de x2 se obtienen en la intersecci
on de la recta x1 = x2 /12 con la
superficie de nivel. Haciendo esto da un m
aximo para x22 de 96 c/29. Por lo tanto, todos los puntos
en el interior de c satisfacen la cota
|x2 | k2
donde k22 =
96 c
29
29
0,1
96 c 3,026
c
(5.11)
V (x) ser
a definida negativa en c y podemos concluir que el origen x = 0 es exponencialmente
estable, siendo c una estima de la RA.
Vamos a aprovechar este ejemplo para mostrar que la cota (5.7) puede ser muy conservadora.
Usando esa cota, llegamos a la desigualdad (5.10). Esta desigualdad permite al termino de perturbacion g(t, x) ser cualquier vector de dos componentes que satisfaga kg(t, x)k2 k22 kxk2 . Esta
clase de perturbaciones es m
as general que la perturbacion especfica que tenemos en este problema.
Aqu tenemos una perturbaci
on estructurada en el sentido de que la primera componente de g es
siempre cero, mientras que nuestro an
alisis permita perturbaciones no estructuradas donde el vector
g puede cambiar en todas las direcciones. No tener en cuenta la estructura de la perturbacion lleva
en general a resultados conservadores.
Repitamos el an
alisis, esta vez teniendo en cuenta la estructura de la perturbacion. Volvemos a
calcular la derivada de V (x) sobre las trayectorias del sistema:
V (x) = kxk22 + 2xt P g(x)
5
1
= kxk22 + 2x22 ( x1 x2 + x22 )
8
16
5
2
2 1
2
kxk2 + 2x2 ( kxk2 + kxk22 )
16
16
3
kxk22 + k22 kxk22
4
Por lo tanto, V (x) es definida negativa si < 4/(3k22 ). Usando otra vez el hecho de que para todo
c
x c , |x2 |2 k22 = 96
29 , llegamos a la cota
<
0,4
c
5.2.
Perturbaci
on de un PE Uniformemente AE
5.2 Perturbaci
on de un PE Uniformemente AE
103
para todo (t, x) [0, ) D, donde W3 (x) es definida positiva y continua. La derivada de V (t, x)
sobre las trayectorias del sistema (5.1) satisface
V
V
V
V
V (t, x) =
+
f (t, x) +
g(t, x) W3 (x) +
g(t, x)
t
x
x
x
Para lograr que V (t, x) sea definida negativa necesitamos probar que
V
< W3 (x)
g(t,
x)
x
para todo (t, x) [0, ) D. Es claro que esto requiere que pongamos una cota a kg(t, x)k que va
a depender de la naturaleza de la funcion de Lyapunov del sistema nominal. Una clase de funciones
de Lyapunov para las cuales el an
alisis es tan simple como para el caso de estabilidad exponencial
es el caso en que V (t, x) es definida positiva, decreciente, y satisface
V
V
+
f (t, x) c3 2 (x)
t
x
V
x
c4 (x)
(5.12)
(5.13)
<
c3
c4
Entonces
V (t, x) (c3 c4 )2 (x)
lo que muestra que V (t, x) es definida negativa.
Ejemplo 5.3. Consideremos el sistema escalar
x = x3 + g(t, x)
El sistema nominal x = x3 tiene un PE globalmente AE en el origen, pero como vimos en el Ejemplo 4.6, el origen no es exponencialmente estable. Por lo tanto no existe una funcion de Lyapunov
que satisfaga (5.3)-(5.5). La funci
on de Lyapunov V (x) = x4 satisface (5.12)-(5.13) con (x) = |x|3
y c3 = c4 = 4. Supongamos que el termino de perturbacion satisface la cota |g(t, x)| |x|3 para
todo x, con < 1. Entonces la derivada de V (t, x) sobre las trayectorias del sistema perturbado
satisface
V (t, x) 4(1 )x2
Por lo tanto, el origen es un PE globalmente uniformemente AE del sistema perturbado.
104
5.3.
Perturbaci
on No Evanescente
x(t0 ) = a,
a > > 0,
x(t) = e
a+
e(t ) sin d.
t0
La soluci
on satisface la cota
Z t
i
h
(tt0 )
e(t ) d = e(tt0 ) a + 1 e(tt0 )
|x(t)| e
a+
t0
a,
t t0 ,
5.3 Perturbaci
on No Evanescente
105
El lado derecho de esta desigualdad no es definido negativo porque, cerca del origen, el termino
positivo lineal |x| dominara al termino negativo x2 . Sin embargo, V es negativa fuera del conjunto
{x | |x| }. Cuando c > 2 /2, las soluciones que comiencen en el conjunto {x | V (x) c}
permaneceran en ese conjunto para todo tiempo futuro, ya que V es negativa sobre la frontera
{x | V (x) = c}. Por lo tanto, las soluciones est
an uniformemente acotadas. Mas a
un, si elegimos
cualquier que satisfaga (2 /2) < < c, entonces V ser
a negativa dentro del conjunto {x |
V (x) c}, lo que muestra que, en este conjunto, V ser
a estrictamente decreciente hasta que la
soluci
on entre en el conjunto {x | V (x) }. Desde ese instante, la soluci
on no podr
a dejar este
u
ltimo conjunto porque V es negativa sobre la frontera {x | V (x) = }. Por lo tanto, podemos
concluir que la soluci
on es uniformemente finalmente acotada con cota final |x| 2.
En esta secci
on, mostraremos c
omo usar an
alisis de Lyapunov para obtener conclusiones similares
para un sistema de la forma
x = f (t, x)
(5.14)
kx(t)k , t t0 .
(5.15)
kx(t)k b, t t0 + T.
(5.16)
x , t t0 ,
(5.17)
con W3 (x) continua y definida positiva. La desigualdad (5.17) implica que los conjuntos c = {x |
V (x) c} y = {x | V (x) } son positivamente invariantes porque V es negativa sobre sus
fronteras, c y . Como V es negativa en , una trayectoria que comience en debe moverse
106
de modo que V decrezca. De hecho, mientras permanece en , V satisface las desigualdades (4.5) y
(4.8) del Teorema 4.6. Por lo tanto, la trayectoria se comporta como si el origen fuera uniformemente
asintoticamente estable, y satisface una desigualdad de la forma
kx(t)k (kx(t0 )k, t t0 )
para alguna funcion de clase KL. La funci
on V (x(t)) decrecera hasta que la trayectoria entre en
el conjunto , lo cual tomar
a un lapso finito de tiempo. Una vez en , la trayectoria permanecer
a ah para todo tiempo futuro. El hecho de que la trayectoria entra al conjunto en tiempo
finito puede ser demostrado de la siguiente manera. Sea k = mnx W3 (x) > 0. Este mnimo existe
porque W3 (x) es continua y es compacto, y es positivo porque W3 (x) es definida positiva. Por lo
tanto,
W3 (x) k,
x .
(5.18)
x , t t0 .
Por lo tanto,
V (x(t)) V (x(t0 )) k(t t0 ) c k(t t0 ),
lo que muestra que V (x(t)) decrece hasta el valor en el intervalo [t0 , t0 + (c )/k].
En muchos problemas, la desigualdad V W3 se obtiene acotando normas y mediante propiedades de las normas. En estos casos, es muy probable que se obtenga algo como
V (t, x) W3 (x),
kxk r,
t t0 .
(5.19)
Si r es lo suficientemente m
as grande que , podemos elegir c y tales que el conjunto sea no
vaco y este contenido en { kxk r}. En particular, sean 1 y 2 clase K y tales que
1 (kxk) V (x) 2 (kxk).
(5.20)
1 (kxk) c
kxk 1
1 (c).
Por lo tanto, eligiendo c = 1 (r) aseguramos que c Br . Por otro lado, de la desigualdad derecha
en (5.20), tenemos
kxk
V (x) 2 ().
1 (kxk)
kxk 1
1 ().
kxk 1
1 (2 ()).
5.3 Perturbaci
on No Evanescente
107
(5.21)
kxk > 0
(5.22)
(5.23)
0
(que
depende de x(t0 ) y de ) tal que la soluci
on de (5.14) satisface
1
2
kx(t)k (kx(t0 )k, t t0 ) ,
kx(t)k
1
1 (2 ()),
t0 t < t0 + T
t t0 + T
(5.24)
(5.25)
Mas a
un, si D = Rn y 1 es clase K , entonces (5.24) y (5.25) valen para todo estado inicial x(t0 )
y todo .
Demostraci
on. El enunciado de este teorema se reduce al del Teorema 4.6 cuando = 0. Adem
as,
esta demostracion tiene mucho en com
un con la del Teorema 4.6, por lo tanto vamos a usar ideas y
terminologa de dicha prueba a medida que necesitemos. Sea = 1 (r). De este modo, 2 () < y
2 (kx(t0 )k) . Sea = 2 () y definamos los conjuntos variantes en el tiempo t, = {x Br |
V (t, x) } y t, = {x Br | V (t, x) }. Entonces,
B t, {x | 1 (kxk) } {x | 1 (kxk) } = Br D
y
t, t, Br D
x(t0 ) t0 , ,
108
donde 3 y son clase K. La existencia de 3 es asegurada por el Lema 4.3. De manera similar a
la prueba del Teorema 4.6, se demuestra que existe una funci
on de clase KL tal que
V (t, x(t)) (V (t, x(t0 )), t t0 ),
t [t0 , t0 + T ].
Definiendo (q, s) = 1
1 ((2 (q), s)), obtenemos
kx(t)k (kx(t0 )k, t t0 ),
t [t0 , t0 + T ].
2 (kxk) = k2 kxkc ,
W3 (x) = k3 kxkc
kx(t)k k ,
t t1
t0 t < t1
(5.26)
(5.27)
donde usamos la desigualdad |2x1 + 5x2 | kxk2 4 + 25, y k2 es una cota superior de |x2 |. Supongamos que 4(1 )/(3k22 ), donde 0 < < 1. Entonces
109
29 max (P )
b=
8
min (P )
5.4.
Estabilidad Entrada-Estado
(5.29)
(5.30)
kkBk
sup ku( )k
ke(tt0 ) kx(t0 )k +
t0 t
Esta estima muestra que la respuesta con entrada nula tiende a cero exponencialmente mientras
que la respuesta con estado inicial nulo es acotada para cualquier entrada acotada. De hecho, esta
estima no s
olo muestra una propiedad de entrada acotada-estado acotado, sino tambien que la cota
de la respuesta con estado inicial nulo es proporcional a la cota de la entrada. Cuanto de este
comportamiento esperaramos sea posible en un sistema no lineal como el (5.29)? Para un sistema
no lineal general, no es sorprendente que estas propiedades ni siquiera se mantengan en el caso en
que el origen del sistema no forzado sea globalmente uniformemente AE. Consideremos, por ejemplo,
el sistema escalar
x = 3x + (1 + 2x2 )u
110
casos debe ser posible mostrar que V es negativa fuera de una bola de radio , donde dependera de
la cota de u. Por ejemplo, esto es de esperarse si el sistema satisface la condici
on de Lipschitz
kf (t, x, u) f (t, x, 0)k Lkuk,
L0
(5.31)
Si podemos mostrar que V es negativa fuera de una bola de radio , podremos intentar aplicar el
Teorema 5.2 de la secci
on anterior para mostrar que x(t) satisface (5.24) y (5.25). Estas desigualdades
muestran que kx(t)k est
a acotada por una funcion de clase KL, (kx(t0 )k, t t0 ), en el intervalo
[t0 , t0 + T ], y por una funci
on de clase K, 1
1 (2 ()), para t t0 + T . En consecuencia, la siguiente
desigualdad
kx(t)k (kx(t0 )k, t t0 ) + 1
1 (2 ())
es valida para todo t t0 . Esto motiva la siguiente definicion de la propiedad de estabilidad
entrada-estado (Input-to-State Stability, ISS).
Definici
on 5.2 (Estabilidad Entrada-Estado, ISS). El sistema (5.29) es estable entrada-estado si
existen una funcion de clase KL y una funcion de clase K tales que, para cualquier estado inicial
x(t0 ) y cualquier entrada acotada u(t), la soluci
on x(t) existe para todo t t0 y satisface
kx(t)k (kx(t0 )k, t t0 ) + sup ku( )k
(5.32)
t0 t
La desigualdad (5.32) garantiza que para cualquier entrada acotada u(t), el estado x(t) se va
a mantener acotado. Mas a
un, cuando t aumenta, el estado x(t) va a tener una cota final que es
una funcion clase K de suptt0 ku(t)k. Puede probarse que si u(t) converge a cero cuando t ,
tambien lo hace x(t). Cuando u(t) 0, (5.32) se reduce a
kx(t)k (kx(t0 )k, t t0 )
Por lo tanto, ISS implica que el origen del sistema no forzado es globalmente uniformemente AE. El
concepto de ISS se define para el caso global, donde tanto el estado inicial como la entrada pueden
asumir valores arbitrariamente grandes, aunque tambien existen versiones locales.
El siguiente teorema tipo Lyapunov da una condici
on suficiente para ISS.1
Teorema 5.4. Sea f : [0, ) Rn Rm Rn seccionalmente continua en t y localmente Lipschitz
en x y u. Sea V : [0, ) Rn R una funci
on continuamente diferenciable tal que
1 (kxk) V (t, x) 2 (kxk)
V
V
+
f (t, x, u) W3 (kxk) ,
t
x
(5.33)
kxk (kuk) > 0
Para sistemas estacionarios se ha mostrado que las condiciones del Teorema 5.4 son tambien necesarias
[Sontag and Wang, 1995].
111
Demostraci
on. Aplicando la versi
on global del Teorema 5.2, sabemos que la soluci
on x(t) existe y
satisface
kx(t)k (kx(t0 )k, t t0 ) + sup ku( )k ,
t t0
(5.34)
t0
kxk
c4 Lkuk
,
c3
para todo (t, x, u). Por lo tanto, las condiciones del Teorema 5.4 se satisfacen p
con 1 (r) = c1 r 2 ,
2
2 (r) = c2 r y (r) = (c4 L/c3 )r. Concluimos que el sistema es ISS con (r) = c2 /c1 (c4 L/c3 )r.
Cuando el origen del sistema no forzado (5.30) es globalmente uniformemente AE pero no
globalmente exponencialmente estable, el sistema (5.29) no es necesariamente ISS incluso aunque f
sea globalmente Lipschitz en (x, u), uniformemente en t (Ver el Ejercicio 5.5).
En ausencia de estabilidad exponencial global o cuando la condici
on de Lipschitz no sea valida
globalmente, si bien no puede aplicarse el Lema 5.5, puede ser posible aplicar el Teorema 5.4, como
ilustran los siguientes ejemplos.
Ejemplo 5.6. El sistema
x = x3 + u
tiene un PE GAE en el origen cuando u = 0. Tomando V = x2 /2, tenemos
1/3
|u|
4
4
4
4
V = x + xu = (1 ) x x + xu (1 ) x , |x|
donde es una constante tal que 0 < < 1. Probamos entonces que el sistema es ISS con (a) =
(a/)1/3 .
112
|x| u2
(5.35)
x 2 = f2 (t, x2 )
(5.36)
donde f1 : [0, ) Rn1 Rn2 Rn1 y f2 : [0, ) Rn2 Rn2 son seccionalmente continuas en t
y localmente Lipschitz en x = [ xx12 ]. Supongamos que tanto
x 1 = f1 (t, x1 , 0)
como (5.36) tienen un PE globalmente uniformemente AE en sus respectivos orgenes. Que condicion asegurara que el origen x = 0 del sistema en cascada tenga la misma propiedad? El pr
oximo
Lema muestra que este es el caso si (5.35), con x2 visto como entrada, es ISS.
Lema 5.6. Bajo las hip
otesis mencionadas, si el sistema (5.35), con x2 visto como una entrada,
es ISS y el origen de (5.36) es globalmente uniformemente AE, entonces el origen del sistema en
cascada (5.35)(5.36) es globalmente uniformemente AE.
5.5.
Pasividad
5.5 Pasividad
113
R2
y
+
L
iL
R1
+
vc
R3
La energa almacenada en el sistema es V (x) = 21 Lx21 + 21 Cx22 . Como la red es pasiva, la energa
que entra a la red en un perodo [0, t] debe ser mayor o igual que el aumento de energa almacenada
en la red durante ese perodo, es decir
Z t
u(s)y(s)ds V (x(t)) V (x(0))
(5.37)
0
Si la desigualdad (5.37) vale con mayor estricto, la diferencia entre la energa entrante y la almacenada por la red es la energa disipada en los componentes resistivos de la red. Podemos tambien
escribir (5.37) en forma instant
anea como
u(t)y(t) V (x(t))
(5.38)
Para la red RLC, podemos llegar a la desigualdad (5.38) directamente planteando la derivada de
V (x) sobre las trayectorias del sistema, es decir
1
x2 )
V (x) = Lx1 x 1 + Cx2 x 2 = x1 (u R2 x1 x2 ) + x2 (x1
R3
1 2
x
= x1 u R2 x21
R3 2
1 2
1
u)u R2 x21
x
= (y
R1
R3 2
1 2
1 2
= uy
u R2 x21
x
R1
R3 2
Por lo tanto
uy = V (x) +
1 2
1 2
u + R2 x21 +
x V (x)
R1
R3 2
114
1 2
x
R3 2
Consideremos el sistema
x = f (x, u)
(5.39)
y = h(x, u)
V
f (x, u) + ut u + y t y + (x) ,
x
(x, u) Rn Rm
(5.40)
donde , y son constantes no negativas, y (x) es una funcion semidefinida positiva del estado
tal que
(x(t)) 0 = x(t) 0
(5.41)
para todas las soluciones de (5.39) y cualquier u(t) para el cual la soluci
on existe. El termino (x)
se denomina tasa de disipaci
on en el estado. Mas a
un, el sistema se dice
conservativo si (5.40) se satisface con la igualdad y con = = = 0;
pasivo estricto de entrada si > 0;
5.5 Pasividad
115
(5.42)
y = Cx
116
x(0) = x0
y = h(x)
(5.43)
(5.44)
W
W
W
[f (x) + g(x)u] = ut h(x)
f (x) ht (x)u =
f (x) 0
x
x
x
k>0
(5.45)
W
[f (x) + g(x)u] ky t y
x
Veamos ahora un ejemplo para introducir la definicion de pasividad para una funcion est
atica.
Ejemplo 5.10. Consideremos una fuente de tensi
on conectada a una resistencia R > 0. Tenemos
y=
1
u
R
1 2
1 2 R 2
u = Ry 2 =
u + y
R
2R
2
o sea que el sistema puede definirse como pasivo estricto de entrada, de salida, o de entrada y
salida.
Consideremos la funci
on est
atica inestacionaria
y = h(t, u)
(5.46)
u Rm
(5.47)
5.5 Pasividad
117
u1 c + l e1 H1
y1
-c
c
y2
H2
e2
?+
l
u2
c
5.5.1.
Estabilidad de la Interconexi
on en Realimentaci
on de Sistemas Pasivos
Vi
fi (xi , ei ) + i eti ei + i yit yi + i i (xi ) ,
xi
i = 1, 2
118
Si ambos sistemas son solo pasivos, entonces V 0 y el sistema es estable, y existe c > 0 tal
que todas las soluciones que comienzan en {V (x) c} est
an acotadas. Si V (x) es radialmente no
acotada, c puede ser arbitrariamente grande. Para probar estabilidad asintotica usamos Lasalle, o
sea, probamos que V (x(t)) 0 implica x(t) 0, en cada caso.
Caso 1 Sigue de la propiedad (5.41) de i (xi ).
Caso 2
1 > 0 = 1 (x1 (t)) 0 = x1 (t) 0
y
1 + 2 > 0 = y2 (t) 0 = e1 (t) 0
Ahora
x1 (t) 0 , e1 (t) 0 = y1 (t) 0 = e2 (t) 0
y por observabilidad de H2 concluimos que x2 (t) 0.
Caso 3 Analogo al Caso 2.
Caso 4
1 + 2 > 0 = y2 (t) 0
2 + 1 > 0 = y1 (t) 0
5.6 Ejercicios
119
Caso 1 1 > 0;
Caso 2 2 + 1 > 0 y H1 es observable al estado cero.
Si V1 (x1 ) es radialmente no acotada, entonces el origen es GAE.
5.6.
Ejercicios
Ejercicio 5.1.
Sea la ecuaci
on de Lyapunov P A + AT P = Q, donde Q = QT > 0 y A es Hurwitz. Sea
(Q) = mn (Q)/max (P ).
(i) Mostrar que (kQ) = (Q) para cualquier n
umero positivo k.
=Q
T > 0 tal que mn (Q)
= 1. Mostrar que (I) (Q).
(ii) Sea Q
(iii) Mostrar que (I) (Q) para toda Q = QT > 0.
Ayuda: Para la parte (ii), si P1 y P2 son las soluciones de la ecuaci
on de Lyapunov para Q = I
respectivamente, mostrar que
yQ=Q
Z
T
At dt 0.
P1 P2 =
eA t (I Q)e
0
Ejercicio 5.2.
Sea el sistema x = Ax + Bu y sea u = F x una realimentacion de estados estabilizante; es decir,
tal que la matriz (A + BF ) es Hurwitz. Supongamos que, debido a limitaciones fsicas, debemos
usar un limitador para evitar que el valor de las componentes ui de u no superen en valor absoluto
el m
aximo preestablecido L > 0, o sea que |ui (t)| L.
- B
- l - RS
6
A
Fx
F
120
1, para v1 < 1
sat(vi ) = vi , para |vi | 1
1,
para vi > 1
F =
0
1
,
1 1,9
y L = 1. Estimar la regi
on de atracci
on del origen.
Ejercicio 5.3.
Sea el sistema
x 1 = x1 + (t)x2
5.6 Ejercicios
121
Ejercicio 5.5.
Sea el sistema escalar
x =
x
1 + x2
y V (x) = x4 .
(i) Mostrar que las desigualdades (4.17) se satisfacen con
1 (r) = 2 (r) = r 4 ,
3 (r) =
4r 4
,
1 + r2
4 (r) = 4r 3
x
+
1 + x2
donde es una constante positiva. Mostrar que para toda > 1/2 la soluci
on x(t) escapa a
infinito para cualquier condicion inicial x(0).
Ejercicio 5.6.
Investigar la estabilidad entrada-estado (ISS) de cada uno de los siguientes sistemas escalares
x = (1 + u)x3 ,
x = (1 + u)x3 x5 ,
x = x + x2 u,
x = x x3 + u.
Ejercicio 5.7.
Sea el sistema
x2 2
1
x 1 = x1 sen
2
x 2 = x2 + u.
(i) Con u = 0, mostrar que el origen es GAE.
(ii) Mostrar que para cualquier entrada acotada u(t), el estado x(t) es acotado.
(iii) Con u(t) 1, x1 (0) = a, y x2 (0) = 1, mostrar que la soluci
on es x1 (t) a,x2 (t) 1.
(iv) Es el sistema ISS?
Parte II
Control
Captulo 6
Control en Realimentaci
on
Los u
ltimos captulos tratan sobre el dise
no de control en realimentacion. Introducimos varias
herramientas de dise
no, incluyendo linealizaci
on, tabulaci
on de ganancia, linealizaci
on exacta por
realimentaci
on, control integral, etc. La mayora de las herramientas de an
alisis que hemos visto en
los captulos anteriores entran en juego en estos u
ltimos captulos. En particular, en este captulo
comenzamos con una secci
on general sobre problemas de control a modo de introducci
on a los
captulos que siguen. Luego presentamos dos secciones sobre dise
no va linealizaci
on, y dise
no por
tabulaci
on de ganancia (gain scheduling).
6.1.
Problemas de Control
Muchas tareas de control requieren el uso de control por realimentacion. En general, un objetivo
b
asico de un sistema de control es hacer que alguna salida, digamos y, se comporte de forma deseada
mediante la manipulacion de alguna entrada, digamos u. El objetivo m
as simple puede ser tratar
de mantener y peque
na (o cercana a alg
un punto de equilibrio) un problema de regulaci
on o
estabilizaci
on o tratar de mantener la diferencia y r peque
na, donde r es una se
nal de entrada
de referencia perteneciente a cierta clase de se
nales deseadas un problema de servomecanismo o
seguimiento. Por ejemplo:
En un avion comercial la aceleraci
on vertical debe mantenerse por debajo de cierto valor para
garantizar comodidad a los pasajeros.
En un amplificador de audio la potencia de se
nales de ruido en la salida debe ser suficientemente peque
na para obtener buena fidelidad.
En la fabricaci
on de papel el contenido de humedad debe mantenerse entre ciertos valores
especificados.
Cada problema de control, a su vez, puede tener distintas versiones, dependiendo de los elementos
disponibles para resolverlo. Por ejemplo, uno puede resolver un problema de regulaci
on por realimentaci
on de estados, si es que todos los estados necesarios son medibles, o bien, por realimentaci
on
de salida.
En un problema de control tpico existen objetivos de dise
no adicionales a los b
asicos de regulaci
on o seguimiento. Por ejemplo, pueden existir requerimientos especiales sobre la respuesta
transitoria de y, o restricciones en los valores de la entrada de control u. Estos objetivos adicionales
pueden no ser completamente compatibles entre s, por lo que en muchos casos forzosamente se cae
en soluciones de compromiso. El deseo de optimizar estas soluciones de compromiso da lugar a la
formulaci
on de varios problemas de control optimo.
126
Control en Realimentaci
on
6.1.1.
Estabilizaci
on
Realimentaci
on de estados.
El problema de estabilizaci
on para el sistema
x = f (t, x, u)
es el problema de dise
nar una ley de control
u = (t, x)
tal que el origen x = 0 sea un punto de equilibrio uniformemente asintoticamente estable del sistema
a lazo cerrado
x = f (t, x, (t, x)).
Una vez que sabemos como resolver este problema, podemos estabilizar el sistema con respecto a
un punto p arbitrario mediante traslaci
on del origen con el cambio de variables = x p. Mas
a
un, p no tiene que ser un punto de equilibrio del sistema a lazo abierto (basta que exista q tal que
f (t, p, q) = 0, t).
La ley de control en realimentaci
on u = (t, x) suele llamarse realimentacion est
atica, puesto
que es una funcion est
atica de x. Alternativamente, puede usarse una ley de control din
amica
u = (t, x, z)
z = g(t, x, z),
donde z es la soluci
on de un sistema din
amico cuya entrada es x. Un ejemplo tpico de realimentacion
din
amica es el control con acci
on integral, que veremos m
as adelante.
Realimentaci
on de salida.
sistema
El problema de estabilizaci
on por realimentacion de salida para el
x = f (t, x, u)
y = h(t, x, u)
consiste en dise
nar el control est
atico
u = (t, y)
127
u = Kx
128
Control en Realimentaci
on
(i) Dise
no va linealizaci
on (Secci
on 6.2): linealizamos el sistema alrededor del origen, y dise
namos un control lineal estabilizante para la linealizaci
on. La estabilidad alcanzada en el
sistema no lineal ser
a local, aunque podemos estimar la regi
on de atracci
on. La validez de esta
idea est
a garantizada por el Metodo Indirecto de Lyapunov (Teorema 3.11).
(ii) Control por ganancia tabulada (Secci
on 6.3): linealizamos el sistema alrededor de una familia de puntos de equilibrio deseados, dise
namos un control lineal estabilizante para cada
linealizaci
on, y usamos alg
un mecanismo para conmutar de uno a otro.
En el Captulo 7 veremos una idea de linealizaci
on distinta; trabajaremos con clases especiales
de sistemas no lineales que pueden transformarse en sistemas lineales mediante realimentacion y
(posiblemente) cambio de coordenadas. Luego de esta transformacion se puede dise
nar un controlador lineal estabilizante para el sistema lineal obtenido. A diferencia de la anterior, este tipo de
linealizaci
on no involucra ninguna aproximacion; es exacta. Esta exactitud, sin embargo, asume
conocimiento perfecto de las ecuaciones de estado del sistema y usa este conocimiento para cancelar
en forma exacta las alinealidades del sistema. Como en la pr
actica es imposible el conocimiento
exacto del modelo del sistema, este metodo siempre resulta en un sistema a lazo cerrado que es
una perturbacion del sistema a lazo cerrado nominal. La validez del metodo, entonces, utiliza los
resultados de teora de Lyapunov para sistemas perturbados vistos en el Captulo 5.
Cuando un sistema lineal se estabiliza por realimentacion, el origen del sistema a lazo cerrado
es globalmente asint
oticamente estable. Para sistemas no lineales hay distintas posibilidades de
estabilizaci
on, que ilustramos sobre un ejemplo.
Ejemplo 6.1. Supongamos que deseamos estabilizar el origen del sistema escalar
x = x2 + u
usando realimentaci
on.
Estabilizaci
on Local: PE AE sin estima de la RA.
Linealizando sobre el PE x = 0 obtenemos el sistema x = u, para el cual calculamos un control
lineal local u = k x, k > 0, obteniendo
x = k x + x2
6.2 Dise
no Va Linealizaci
on
6.1.2.
129
t T
6.2.
Dise
no Va Linealizaci
on
Ilustramos el dise
no va linealizaci
on para los problemas de estabilizaci
on y regulaci
on. En cada
caso, comenzamos con el control por realimentacion de estados y luego presentamos el control por
realimentaci
on de salidas.
6.2.1.
Estabilizaci
on
Realimentaci
on de estados
Consideramos el sistema
x = f (x, u),
x Rn , u Rp ,
(6.1)
(6.2)
130
Control en Realimentaci
on
donde
f
A=
x (x,u)=(0,0)
f
B=
.
u (x,u)=(0,0)
(6.3)
De la teora de sistemas lineales, recordamos ahora algunas propiedades que vamos a usar en adelante. Para m
as detalles y demostraciones ver por ejemplo Chen [1999, Captulos 6 y 8] o Bay [1999,
Captulos 8 y 10].
Definici
on 6.1 (Controlabilidad). La ecuaci
on de estados (6.2), o el par (A, B), se dice controlable
si para cualquier estado inicial x(0) = x0 Rn y cualquier estado final x1 Rn , existe una entrada
u que transfiere el estado x de x0 a x1 en tiempo finito. En caso contrario, la ecuaci
on (6.2), o el
par (A, B), se dice no controlable.
Proposici
on 6.1 (Test de Controlabilidad). El par (A, B), A Rnn , B Rnp , es controlable si
y s
olo si la matriz de controlabilidad,
C = B AB A2 B An1 B , C Rnnp ,
Proposici
on 6.2 (Invariancia de la controlabilidad respecto a realimentacion). El par (A+BK, B),
para cualquier matriz K pn , es controlable si y s
olo si el par (A, B) es controlable.
Proposici
on 6.3 (Controlabilidad y asignabilidad de autovalores). Todos los autovalores de (A +
BK) pueden asignarse arbitrariamente (siempre y cuando los autovalores complejos conjugados se
asignen en pares) eligiendo la matriz constante real K si y s
olo si (A, B) es controlable.
6.2 Dise
no Va Linealizaci
on
131
pendulo en un
angulo = . Tomando como variables de estado x1 = y x2 = se obtiene el
modelo de estado
x 1 = x2 ,
x 2 = a sen(x1 + ) b x2 + c T
(6.4)
Para que (6.4) tenga un PE en el origen, el par debe tener una componente est
atica Tf que satisfaga
a sen + c Tf = 0
es decir
a sen
c
Definimos la variable de control u = T Tf y reescribimos (6.4) como
Tf =
(6.5)
x 1 = x2 ,
x 2 = a [sen(x1 + ) sen ] b x2 + c u
que est
a en la forma (6.1) con f (0, 0) = 0. Linealizando alrededor del origen obtenemos las matrices
0
1
0
A=
,
B=
(6.6)
a cos b
c
El par (A, B) es controlable. Tomando K = [k1 k2 ], obtenemos
0
1
A + BK =
,
k1 c a cos k2 c b
T =
a sen
a sen
+Kx =
+ k1 ( ) + k2 .
c
c
Realimentaci
on de salida
Consideramos el sistema
x = f (x, u) ,
y = h(x)
donde f (0, 0) = 0, h(0) = 0, f y h son continuamente diferenciables en un dominio que contiene al
origen (x, u) = (0, 0). Linealizando alrededor de (x, u) = (0, 0), obtenemos el sistema lineal
x = Ax + Bu
y = Cx
donde A y B est
an definidas en (6.3), y
h
C=
.
x x=0
(6.7)
De la teora de sistemas lineales, recordemos ahora los conceptos y resultados relativos a observabilidad.
132
Control en Realimentaci
on
Definici
on 6.2 (Observabilidad). La ecuaci
on de estado (6.7) es observable si para cualquier estado
inicial x(0) (desconocido), existe un tiempo finito t1 tal que el conocimiento de la entrada u y la
salida y sobre el intervalo [0, t1 ] es suficiente para determinar en forma u
nica el estado inicial x(0).
En caso contrario el sistema no observable.
Proposici
on 6.4 (Dualidad entre controlabilidad y observabilidad). El par (A, C) es observable si
y s
olo si el par (AT , C T ) es controlable.
Volviendo a nuestro sistema (6.7), asumimos (A, B) controlable, (A, C) observable, y dise
namos
el control din
amico
z = F z + Gy
u = Lz + M y
tal que la matriz de lazo cerrado del sistema aumentado (6.7)(6.8),
A + BM C BL
ALC =
,
GC
F
(6.8)
(6.9)
sea Hurwitz. Un ejemplo es el control basado en observador (la variable z corresponde entonces a
la estima del estado x
)
x
= A
x + Bu + H(C x
y)
u = Kx
6.2 Dise
no Va Linealizaci
on
133
h2 < a cos b h1
a sen
+Kx
.
c
6.2.2.
Regulaci
on Va Control Integral
a sen
+ Kx,
c
est
a formada por
(i) una componente est
atica de regimen estacionario Tf = (a/c) sen que da el valor de equilibrio
de , digamos f , en el valor deseado de angulo , y
(ii) una componente de realimentacion Kx que hace que A + BK sea Hurwitz.
Mientras el c
alculo de ambas componentes depende de los par
ametros del sistema, la parte de
realimentaci
on puede dise
narse para que sea robusta dentro de un rango de valores de los par
ametros.
Por otro lado, el c
alculo de Tf puede ser sensible a variaciones en los par
ametros del modelo respecto
de sus valores nominales, lo cual cambiar
a el valor estacionario de del valor deseado . El esquema
que presentamos a continuaci
on permitira que el valor de regule al valor deseado tambien en forma
robusta.
Consideramos el sistema
x = f (x, u)
y = h(x)
donde x Rn , u Rp , f y h son funciones continuamente diferenciables en un dominio incluido en
Rn Rp , y Rp es la salida a regular. Sea yR Rp una se
nal de referencia constante. Queremos
dise
nar un control en realimentaci
on tal que
y(t) yR
cuando
134
Control en Realimentaci
on
Asumimos que medimos la salida y. Vamos a estabilizar el sistema a lazo cerrado en un PE tal
que y = yR . Es claro que, para que esto sea posible, deben existir valores xf y uf tales que
0 = f (xf , uf )
(6.10)
0 = h(xf ) yR
Asumimos que (6.10) tiene una soluci
on u
nica en el dominio de interes.
Integramos el error de seguimiento e , y yR :
= e = y yR
y aumentamos el sistema con el integrador
x = f (x, u)
= h(x) yR
El control se va a dise
nar como una realimentacion de los estados x y y tal que el sistema a lazo
cerrado tenga un PE en (
x,
) con x
= xf .
Si linealizamos alrededor de (x, , u) = (xf ,
, uf ), obtenemos
A
0
B
=
+
v , A + Bv
C 0
0
con
x xf
=
v = u uf
y donde
f
A=
x (x,u)=(xf ,uf )
f
B=
u (x,u)=(xf ,uf )
h
C=
x x=xf
A B
Supongamos
Si (A, B) es controlable y el rango de C
0 es n + p, entonces (A, B) es controlable.
que es as y calculemos K tal que A + BK sea Hurwitz. Partimos K como K = K1 K2 , donde
K2 es p p y no singular (si fuera singular, puede mostrarse que A + BK sera singular, lo que
contradice el hecho de que es Hurwitz). El control es entonces
u = K1 (x xf ) + K2 (
) + uf
El control integral introduce un grado de libertad que puede usarse para asignar el valor de
. Si
elegimos
= K21 (uf K1 xf ) , f
el control din
amico obtenido queda
= e = y yR
u = K1 x + K2
6.2 Dise
no Va Linealizaci
on
135
yR R
+ u
c - j- A - K
- j
2
+6
+6
f (x, u)
x R x
- A
- h(x)
-c
K1
= (A + BK),
que es exponencialmente estable. Por lo tanto y(t) yR cuando t (para condiciones iniciales
en la regi
on de atracci
on).
Ejemplo 6.4 (Control del pendulo por linealizaci
on y realimentacion de estados con accion integral).
Volvemos a considerar el pendulo del Ejemplo 6.2, donde el objetivo de control es estabilizar al
y = x1 y u = T obtenemos el modelo de
pendulo en un
angulo = . Tomando x1 = , x2 = ,
estado
x 1 = x2 ,
x 2 = a sen(x1 + ) b x2 + c u
y = x1 = e
k3 c > 0
136
Control en Realimentaci
on
La robustez del control integral puede explicarse intuitivamente de la siguiente manera. El control
en realimentacion de estados crea un PE AE. Cuando el sistema est
a en este punto de equilibrio,
todas las se
nales deben ser constantes. Para que el integrador = e tenga una salida constante ,
su entrada e debe ser cero. Por lo tanto, el control integral fuerza que el error de seguimiento sea
cero en equilibrio. Si hay variaciones parametricas, el PE va a cambiar en general, pero la condici
on
e = 0 en el equilibrio se mantiene. Por supuesto, como el resultado de estabilizaci
on es local, esto
va a valer para condiciones iniciales (x(0), (0)) lo suficientemente cercanas al PE (xf , f ).
Si no disponemos de los estados x pero medimos y, el control integral puede implementarse
mediante un observador de la siguiente manera
u = K1 x
+ K2
= e = y yR
x
= A
x + Bu + H(C x
y),
representado en el esquema de la Figura 6.2. Notar que usamos el observador para estimar solamente
x, ya que est
a siempre disponible para la realimentacion.
yR R
+ u
c - j- A - K
- j
2
+6
+6
x R x
- A . - h(x)
f (x, u)
-c
B
x
K1
A
-
R + ?
j
+
6
H
A + HC
Observador
6.3.
La principal limitaci
on del control por linealizaci
on es que s
olo se puede garantizar que el control
cumple su objetivo localmente alrededor de un u
nico PE, o punto de operaci
on (PO). Una forma de
137
d
(z)dz = q c 2h,
dt
0
donde h es el nivel del lquido en el tanque, q es el caudal de entrada y c es una constante positiva.
Tomando x = h como variable de estado y u = q como entrada de control obtenemos el modelo de
estado
x =
1
(u c 2x) , f (x, u)
(x)
El objetivo de control es que el nivel y = x siga a una referencia yR . Usamos yR como variable de
tabulaci
on. Cuando yR = constante,
y debe mantenerse igual a , para lo cual necesitamos que u
se mantenga en el valor u
() = c 2.
E
6E
?q
E
J
138
Control en Realimentaci
on
donde
x = x ,
u = u u
(),
f
c 2
a() =
=
,
x x=
2()
u=u
1
f
=
b() =
u x=
()
u=
u
1
0
1
cuyo polinomio caracterstico es
s2 (a + bK1 )s bK2 .
Si, por ejemplo, proponemos tener un polinomio caracterstico de la forma s2 + 2n s + n2 , con
determinados valores deseados de y , podemos lograrlo eligiendo las ganancias del control
K1 () =
2n + a()
,
b()
K2 () =
n2
b()
El control por ganancia tabulada se obtiene cuando reemplazamos por yR , con lo que las ganancias
variar
an directamente con la altura deseada. Antes de seguir, veamos primero una reparametrizacion
del controlador PI que simplificar
a la tarea de tabulaci
on.
Parametrizaci
on simplificada del control PI. A veces es posible simplificar la tarea de monitoreo y tabulaci
on mediante una elecci
on adecuada de los par
ametros del controlador. Por ejemplo,
si reparametrizamos el controlador PI como
K1
1
K = K1 , T =
,
u = K e + ,
T
K2
y suponiendo que |a()| 2n (o sea que la parte real deseada para los polos a lazo cerrado es
mucho mayor que el polo a lazo abierto), entonces obtenemos
K() =
2n
2n + a()
,
b()
b()
T () =
2n + a()
2
2
n
n
x
y = C ,
139
donde
A () =
a() 2n n2
,
1
0
B =
2n
,
1
C = 1 0 .
(6.11)
s2 + [2n a()]s + n2
Control PI de ganancia tabulada por yR . Dejemos por ahora este an
alisis lineal y consideremos el controlador PI de ganancia tabulada
1
n
u = K(yR ) e + = 2n (yR ) e +
(6.12)
T
2
= e = y yR
n
1
c 2x
2n (yR ) x yR +
x =
(x)
2
= x yR
y = x.
c 2
x = ,
() , 2
,
n ()
()
y = Cn
Bn =
2n + ()
,
1
Cn = 1 0 ,
(6.13)
y la ganancia () = K ()
()/(T ()) donde K () = K/yR y = . La funcion de transfeR
rencia a lazo cerrado de r a y = x resulta en este caso
[2n + ()]s + n2
s2 + [2n a()]s + n2
Comparando (6.11) con (6.13), vemos que los dos modelos lineales representados por (A , B , C )
y (An , Bn , Cn ) son distintos (en la matriz B):
140
Control en Realimentaci
on
(A , B , C ) representa el modelo a lazo cerrado de la familia de modelos lineales parametrizados usados para el dise
no del control;
(An , Bn , Cn ) representa la linealizaci
on alrededor del PO deseado del sistema no lineal a lazo
cerrado con el control por ganancia tabulada.
No imponer la condici
on
c 2
() = 2
n ()
(que evita el uso de terminos constantes en el control) y en cambio usar el grado de libertad de
asignar
() arbitrariamente. El control entonces es
1
u = K(yR ) e + (
(yR )) + u
(yR ) ,
T
= e = y yR
p
u
(yR ) = c 2yR
(6.14)
y
(yR ) arbitrario. El control (6.12) que usamos antes es un caso particular de (6.14) que surge de
imponer la condici
on
K(yR )
(yR ) = u
(yR ).
T
El sistema a lazo cerrado puede escribirse como
x = fc (x, yR ).
Linealizando alrededor de (x, yR ) = (, ) obtenemos
fc
= a() 2n ,
x yx=
=
R
donde
() =
fc
= 2n + (),
yR yx=
=
R
()
()
1 u
K()
+
.
T ()
()
Si elegimos
() tal que () = 0, es decir tal que
()
u
()
K()
=
T
141
Truco 2.
Reemplazar el controlador
1
u = K(yR ) e +
T
= e
por el controlador
u = K(yR )e +
1
z
T
z = K(yR )e
que, para K constante, puede interpretarse como conmutar la ganancia K con el integrador.
Resumen. En base al ejemplo, podemos resumir los pasos a seguir para dise
nar un control por
ganancia tabulada de la siguiente manera.
(i) Linealizar el modelo no lineal alrededor de una familia de POs parametrizada por las variables
de tabulaci
on.
(ii) Dise
nar una familia parametrizada de controladores lineales que consigan el desempe
no deseado para la familia de modelos lineales en cada PO.
(iii) Construir un control por ganancia tabulada tal que, en cada PO,
el control genere un valor est
atico que de error est
atico nulo,
la linealizaci
on del sistema no lineal a lazo cerrado en cada PO sea la misma que la de la
conexion en realimentaci
on del modelo lineal parametrizado y el correspondiente control
lineal.
(iv) Verificar por simulaci
on el desempe
no no local del control por ganancia tabulada para el
modelo no lineal.
El paso (ii) puede conseguirse resolviendo el problema de dise
no para una familia de modelos
lineales parametrizados por variables de tabulaci
on, como hicimos en el ejemplo, o bien, resolviendo
el problema s
olo en un n
umero finito de POs usando la misma estructura de control para todos ellos
pero permitiendo que los par
ametros del controlador cambien de un PO a otro; luego los par
ametros
del controlador se interpolan para producir una familia de controladores lineales. Este proceso de
interpolaci
on se hace usualmente ad hoc, y se basa en conocimiento del sistema fsico.
Como vimos, la elecci
on del controlador por ganancia tabulada no es u
nica. Poder satisfacer el
requerimiento sobre los modelos linealizados enunciado en el paso (iii) depende de la estructura de
control elegida. Adem
as, la decisi
on de hasta que punto debe insistirse en que las linealizaciones
del modelo no lineal a lazo cerrado y del modelo lineal parametrizado a lazo cerrado coincidan
dependera de las especificaciones y objetivos de control.
Notar que el an
alisis de lazo cerrado del controlador por ganancia tabulada s
olo considera el
comportamiento local alrededor de un PO constante. Que puede decirse del comportamiento regional, o global? Que sucede cuando la variable de tabulaci
on no es constante? En la pr
actica, la
regla es que puede implementarse un controlador de este tipo siempre que las variables de tabulacion varen en forma suficientemente lenta. La estabilidad de sistemas inestacionarios lentos puede
justificarse usando los resultados en Khalil [1996, Secci
on 5.7].
142
6.4.
Control en Realimentaci
on
Ejercicios
Ejercicio 6.1.
La Figura 6.4 muestra un esquema de un sistema de suspensi
on magnetica, en el que una bola de
material met
alico se suspende mediante un electroim
an de corriente controlada por realimentacion
a traves de una medici
on
optica de la posici
on de la bola.
Este sistema tiene los ingredientes b
asicos de sistemas para
levitaci
o
n
de
masas
usados
en
gir
o
scopos,
aceler
ometros y
i
trenes de alta velocidad.
+
Basicamente, la ecuaci
on de movimiento de la bola es
v
R, L(y)
y
m
v
mg
L(y) = L1 +
m
y = ky + mg + F (y, i)
donde m es la masa de la bola, y 0 es la posici
on vertical
(hacia abajo) de la bola medida desde un punto de referencia
(y = 0 cuando la bola est
a pegada al electroim
an), k es el coeficiente de friccion viscosa, g es la aceleraci
on de la gravedad,
F (y, i) es la fuerza generada por el electroim
an, e i es la corriente. La inductancia del electroim
an depende de la posici
on
de la bola, y puede modelarse como
L0
1 + y/a
E
L0 i2
=
y
2a(1 + y/a)2
6.4 Ejercicios
143
k = 0,001N/m/s
L1 = 0,02H
g = 9,81m/s2
R = 10
a = 0,05m
yR = 0,05m
estudiar el desempe
no del sistema a lazo cerrado mediante simulaci
on digital. En particular,
estudiar el comportamiento transitorio y el efecto de una variaci
on del 20 % en todos los
valores nominales de los par
ametros del sistema.
(vi) Estima de la regi
on de atracci
on: con los mismos datos numericos del punto anterior, realizar
el siguiente experimento: comenzando con la bola en el equilibrio, desplazarla una distancia
peque
na hacia arriba y luego soltarla. Repetir el experimento gradualmente incrementando
la distancia de desplazamiento inicial. Determinar mediante simulaci
on digital el m
aximo
rango de captura para el cual la bola vuelve al equilibrio deseado. Repetir la experiencia para
desplazamientos hacia abajo.
(vii) Redise
nar el control por realimentacion de estados del punto (iv) para incluir accion integral.
Repetir los ensayos de los puntos (v) y (vi) y comparar el desempe
no de este dise
no con el
del punto (iv).
(viii) Asumiendo que s
olo puede medirse la posici
on de la bola y y la corriente i, dise
nar un control
lineal por realimentaci
on de salida, con accion integral, para estabilizar la bola en la posici
on
deseada yR . Repetir los ensayos de los puntos (v) y (vi) y comparar el desempe
no de este
dise
no con los de los puntos (iv) y (vii).
(ix) Asumiendo que s
olo puede medirse la posici
on de la bola y y la corriente i, dise
nar un control
por ganancia tabulada con accion integral y por realimentacion de salida para que la posici
on
de la bola siga una posici
on de referencia yR . Estudiar por simulaci
on digital el desempe
no
del sistema a lazo cerrado y compararlo con el dise
no via linealizaci
on del punto anterior.
Ejercicio 6.2.
La Figura 6.5 representa un sistema de pendulo invertido. El pivote del pendulo est
a montado sobre un carrito
que puede moverse horizontalmente mediante la accion de
una fuerza F . Manipulando F como variable de control,
el objetivo es estabilizar el pendulo en posici
on vertical
en una posici
on deseada del carrito.
Los par
ametros del sistema, y sus valores nominales,
son los siguientes,
m
mg
L
F
M
y
Figura 6.5: Pendulo invertido
144
Control en Realimentaci
on
m = 0,1kg
M = 1kg
L = 0,5m
I = 1/120kg m2
k = 0,1N/m/s
g = 9,81m/s2
y
y su comportamiento din
amico puede describirse por las ecuaciones diferenciales ordinarias
1
mgL sen
m+M
mL cos
=
F + mL 2 sen ky
y
() mL cos I + mL2
donde
() = (I + mL2 )(m + M ) m2 L2 cos2 (I + mL2 )M + m > 0.
x3 = y y x4 = y como variables de estado y u = F como entrada de
(i) Usando x1 = , x2 = ,
control, escribir las ecuaciones de estado.
(ii) Mostrar que el sistema tiene un conjunto de equilibrio.
(iii) Se pretende estabilizar el pendulo en su posici
on vertical, = 0. Determinar un punto de
equilibrio a lazo abierto para el cual = 0 y mostrar que es inestable.
(iv) Linealizar la ecuaci
on de estado alrededor del punto de equilibrio elegido y comprobar que la
ecuaci
on de estado linealizada es controlable.
(v) Usando linealizaci
on, dise
nar un control por realimentacion de estados para estabilizar el
sistema alrededor del punto de equilibrio deseado.
(vi) Ensayo de robustez: estudiar el desempe
no del sistema a lazo cerrado mediante simulaci
on
digital. Estudiar en particular el efecto de variaciones de 10 % en los valores nominales de
los par
ametros del sistema sobre la respuesta transitoria.
(vii) Estima de la regi
on de atracci
on: determinar, mediante simulaci
on digital, el rango m
aximo de
angulo inicial que puede tener el pendulo, comenzando en reposo, para que el control dise
nado
pueda llevarlo al equilibrio = 0.
(viii) Asumiendo que s
olo puede medirse el
angulo y la posici
on y del carrito, dise
nar por linealizacion un control por realimentaci
on de salidas para estabilizar el pendulo en = 0. Repetir
los ensayos (vi) y (vii) y comparar el desempe
no de este dise
no con el obtenido con el control
por realimentaci
on de estados del punto (v).
Captulo 7
Linealizaci
on Exacta por
Realimentaci
on
En este captulo introducimos elementos de la teora moderna de control geometrico de sistemas
no lineales de control. Esta teora se inici
o alrededor de los a
nos 70 con intentos de extender
resultados de la teora de sistemas lineales a sistemas no lineales; resultados tales como los que se
refieren a controlabilidad y observabilidad del sistema. M
as tarde, en 1981 se mostro [Isidori et al.,
1981] que no s
olo estas extensiones eran posibles, sino tambien gran parte de la teora de control
geometrico de sistemas lineales al estilo Wonham [1985]. El artculo de Isidori et al. fue seguido
durante los a
nos 80 por un gran n
umero de resultados que generaron un fantastico juego de
herramientas para sistemas no lineales [Isidori, 1995, 1999]. Una herramienta central en este juego
de herramientas es la linealizaci
on exacta por realimentacion, que presentamos en este captulo.
Consideramos sistemas no lineales afines en la entrada de control, es decir, de la forma
x = f (x) + g(x)u,
y = h(x),
y planteamos que condiciones se necesitan para que exista una realimentaci
on de estados
u = (x) + (x)v
y un cambio de variables
z = T (x)
que transformen al sistema no lineal a una forma lineal equivalente. Esta linealizaci
on no se refiere
a la linealizaci
on Jacobiana aproximada del sistema, vista en el Captulo 6, sino que convierte
exactamente al sistema en lineal.
Comenzaremos con linealizaci
on entrada-estado, en la que la ecuaci
on de estado completa se linealiza exactamente. Luego introduciremos la linealizaci
on entrada-salida, en la que s
olo la respuesta entrada-salida se linealiza, mientras que una parte del sistema permanece no lineal. Finalmente,
presentamos la estabilizaci
on de sistemas por medio de linealizaci
on exacta por realimentaci
on.
7.1.
Linealizaci
on Entrada-Estado
146
Linealizaci
on Exacta por Realimentaci
on
Ejemplo 7.1 (Linealizacion exacta del pendulo). La inspeccion del modelo de estado del pendulo
x 1 = x2 ,
x 2 = a [sen(x1 + ) sen ] b x2 + c u,
muestra que podemos elegir
u=
a
v
[sen(x1 + ) sen ] +
c
c
1
a
[sen(x1 + ) sen ] + k1 x1 + k2 x2 .
c
c
(7.1)
7.1 Linealizaci
on Entrada-Estado
147
(7.2)
(7.3)
obtenemos el sistema
z1 = z2
z2 = a cos x2 (x21 + u)
que tiene la forma (7.1), valida en la regi
on /2 < x2 < /2. Usando
u = x21 +
1
v
a cos x2
z2
a
que est
a bien definida para a < z2 < a. La ecuaci
on de estado transformada es
z1 = z2
z2
z2 = a cos arc sen
(z12 + u).
a
Definici
on 7.1 (Difeomorfismo). Un difeomorfismo es un cambio de variables T tal que z = T (x)
est
a definido en un dominio Dx , su transformacion inversa x = T 1 (z) est
a definida en Dz = T (Dx ),
1
y ambos T y T
son continuamente diferenciables en Dx y Dz , respectivamente.
148
Linealizaci
on Exacta por Realimentaci
on
(7.4)
(7.5)
Tomando 0 (z) = (T 1 (z)) , 0 (z) = (T 1 (z)) nos queda el sistema expresado en las nuevas
coordenadas:
z = Az + B0 (z)1 [u 0 (z)]
Y cu
ando ser
a posible encontrar un difeomorfismo que pueda llevar un sistema dado a la forma
(7.5)? Derivando la ecuaci
on z = T (x), es decir
z =
T
T
x =
[f (x) + g(x)u]
x
x
e igual
andola a (7.5), concluimos que el difeomorfismo T debe satisfacer las condiciones
T
f (x) = AT (x) B (x)1 (x)
x
T
g(x) = B (x)1 .
x
(7.6)
En resumen:
La existencia de T , , , A y B que satisfagan las ecuaciones en derivadas
parciales (7.6) es una condici
on necesaria y suficiente para que x = f (x) + g(x)u
sea linealizable entrada-estado.
As, la determinacion de si un sistema no lineal dado es linealizable exactamente por realimentacion se reduce a la resolucion de las ecuaciones en derivadas parciales (7.6). La resolucion de estas
ecuaciones puede simplificarse, como explicamos a continuaci
on.
7.1.1.
7.1 Linealizaci
on Entrada-Estado
no singular que lo
M B = Bc , con
0 1
0 0
Ac = . .
.. ..
149
...
...
..
.
0 0 ...
...
Es decir,
0
0
.. ,
.
0
0
Bc = .
..
1
1
2
= . .
..
n
donde
(x) = (x) (x)t M T (x). Vemos que podemos, sin perdida de generalidad, considerar
que A y B est
an en la forma can
onica controlable Ac y Bc . Ahora escribamos
T1 (x)
T2 (x)
T (x) = . .
.
.
Tn (x)
T2 (x)
..
.
Tn (x)
(x)/(x)
y que
0
..
.
Bc (x)1 =
.
0
1/(x)
Usando estas expresiones en las ecuaciones en derivadas parciales (7.6) se obtiene el siguiente conjunto de ecuaciones
T1
g(x) = 0,
x
T2
g(x) = 0,
x
..
.
T1
f (x) = T2 (x),
x
T2
f (x) = T3 (x),
x
..
.
Tn1
f (x) = Tn (x),
x
Tn
f (x) = (x)/(x),
x
Tn1
g(x) = 0,
x
Tn
g(x) = 1/(x).
x
i = 1, 2, . . . , n 1;
donde
Ti+1 (x) =
Ti
f (x) ,
x
i = 1, 2, . . . , n 1.
(7.7)
150
Linealizaci
on Exacta por Realimentaci
on
1
,
(Tn /x)g(x)
(x) =
(7.8)
(7.9)
(7.10)
donde
T1
T1
f (x) =
T2 (x) =
x
x1
T1
x2
a sen x2
.
x21
(7.11)
Vemos de (7.9) que T1 (x) no depende de x2 . Usando este dato en (7.11) obtenemos
T2 (x) =
T1
a sen x2 .
x1
(7.12)
Ejemplo 7.4 (Generador sincronico). Un generador sincronico conectado a un bus infinito puede
representarse con el modelo
x = f (x) + g u
con
x2
f (x) = a[(1 + x3 ) sen(x1 + ) sen ] bx2 ,
cx3 + d[cos(x1 + ) cos ]
0
g = 0 ,
1
(7.13)
(7.14)
(7.15)
7.1 Linealizaci
on Entrada-Estado
151
donde
T1
f (x)
x
T2
f (x).
T3 (x) =
x
Usando (7.13) en (7.16) tenemos
T2 (x) =
T2 (x) =
T1
T1
x2
{a[(1 + x3 ) sen(x1 + ) sen ] bx2 }.
x1
x2
(7.16)
(7.17)
(7.18)
T1
x2 .
x1
(7.19)
T2
T1
x2
{a[(1 + x3 ) sen(x1 + ) sen ] bx2 }.
x1
x1
(7.20)
z3 + b z2 a sen
a sen(z1 + )
est
a definida en 0 < z1 + < . Las funciones y est
an dadas por (7.8) (con n = 3), es decir
1
a sen(x1 + )
(T3 /x) f (x)
(x) =
a sen(x1 + )
(x) =
152
7.2.
Linealizaci
on Exacta por Realimentaci
on
Linealizaci
on Entrada-Salida
La linealizaci
on exacta de la ecuaci
on de estado que describimos en la secci
on anterior no necesariamente linealiza la ecuaci
on de salida. Consideremos otra vez el ejemplo (7.2). Si tomamos como
salida y = x2 , el cambio de variables y el control
z1 = x1 ,
u = x21 +
z2 = a sen x2 ,
1
v
a cos x2
resultan en
z1 = z2
z2 = v
y = arc sen
z2
a
que tiene un modelo de estado lineal con salida no lineal. Si, en cambio, tomamos u = x21 + v,
obtenemos el modelo
x 1 = a sen x2
x 2 = u
y = x2
que tiene una transformacion lineal entrada-salida (de u a y) y una din
amica (la de x1 ) que es
inobservable a la salida, ya que y no depende de x1 . Si s
olo nos interesara la variable y, el control
v podra dise
narse usando tecnicas lineales para que y tenga el desempe
no deseado. Sin embargo,
no hay que descuidar la din
amica inobservable; por ejemplo, si y fuera estabilizada en un valor
constante yR 6= 0, la variable x1 tendra una evoluci
on x1 (t) = x1 (0) + t a sen yR , que crece con t!
Veamos esta idea m
as formalmente. Sea el sistema mono-entrada mono-salida
x = f (x) + g(x)u,
y = h(x).
El caso m
as simple de sistema linealizable entrada-salida se da cuando es linealizable entrada-estado
y la salida de interes es h(x) = T1 (x). En ese caso, el cambio de variables z = T (x) y el control
u = (x) + (x)v lo transforman en
z = Ac z + Bc v
y = Cc z = 1 0 . . .
0 z
i = 1, 2, . . . , n 1;
n
g(x) 6= 0,
x
1
f (x) = 2 (x)
x
2
f (x) = 3 (x)
x
7.2 Linealizaci
on Entrada-Salida
153
(n /x)g(x)
x
y (n) =
(7.21)
y = h(x),
r
g(x) 6= 0
x
i
f (x) , i = 1, 2, . . . , r 1.
para todo x D0 , donde 1 (x) = h(x) y i+1 (x) =
x
i = 1, 2, . . . , r 1;
>0
154
Linealizaci
on Exacta por Realimentaci
on
Ejemplo 7.6 (Sistema sin grado relativo bien definido). Consideremos el sistema
x 1 = x1
x 2 = x2 + u
y = x1
Las derivadas de la salida son
y = x 1 = x1 = y = y (n) = y = x1 , n 1
Vemos que en ninguna derivada de la salida aparece la entrada u. En este caso el sistema no tiene
un GR bien definido porque la salida y(t) = x1 (t) = et x1 (0) es independiente de la entrada.
Ejemplo 7.7 (Motor de corriente continua controlado por campo). Un motor de corriente continua
controlado por corriente de campo puede describirse por las ecuaciones
x 1 = ax1 + u
x 2 = bx2 + cx1 x3
x 3 = x1 x2
Ejemplo 7.8 (Sistema lineal). Consideremos el sistema lineal representado por la funcion transferencia
H(s) =
bm sm + bm1 sm1 + + b0
,
sn + an1 sn1 + + a0
donde m < n y bm
0
0
A= .
..
1
0 ...
0
0
0
0
1 ...
0
B = .
..
..
.. ,
..
..
.
.
.
.
a0 a1 . . . . . . an1
1
C = b0 b1 . . . bm 0 . . . 0 .
Este sistema es un caso particular de (7.21) con f (x) = Ax, g(x) = B y h(x) = Cx. Veamos el GR
del sistema calculando las derivadas de la salida. La primera derivada es
y = CAx + CBu.
Si m = n 1, entonces CB = bn1 6= 0 y el sistema tiene GR 1. En caso contrario, CB = 0 y
seguimos derivando. Notemos que CA es un vector fila que se obtiene moviendo los elementos de C
7.2 Linealizaci
on Entrada-Salida
155
una posici
on a la derecha, CA2 se obtiene moviendo los elementos de C dos posiciones a la derecha,
y as sucesivamente. Entonces vemos que
CAi1 B = 0 ,
nm1
CA
i = 1, 2, . . . , n m 1
B = bm 6= 0.
7.2.1.
Linealizaci
on Entrada-Salida y Estabilidad Interna. Forma Normal
1
Q(s)
,
1 R(s)
1+
Q(s) N (s)
+ e
6
1
Q(s)
R(s)
N (s)
-c
156
Linealizaci
on Exacta por Realimentaci
on
(7.22)
y = Cc
1
[t + bm C0 + v]
bm
resulta en el sistema
= A0 + B0 Cc
= Ac + Bc v
y = Cc
cuya funcion transferencia de v a y es una cadena de r integradores, y cuyo subvector de estado
es inobservable desde y.
Supongamos que queremos estabilizar al sistema con una realimentacion v = K tal que Ac +
Bc K sea Hurwitz. El correspondiente sistema a lazo cerrado es
A0
B0 Cc
=
0 Ac + Bc K
(7.23)
7.2 Linealizaci
on Entrada-Salida
157
Para elegir las variables , va a ser importante respetar la caracterstica fundamental del modelo
(7.22), que es que la entrada u no aparece en la ecuaci
on de . Tomamos entonces
1 (x)
..
.
nr (x)
, (x) ,
(7.24)
z = T (x) =
1 (x)
(x
..
.
r (x)
i
donde 1 (x) = h(x) y i+1 (x) =
x f (x) , i = 1, 2, . . . , r 1, y las i se eligen tales que T (x) sea
un difeomorfismo en un dominio Dx D0 y
i
g(x) = 0 ,
x
1 i n r , x Dx .
(7.25)
Esto siempre es posible para sistemas mono-entrada con grado relativo r. La condici
on (7.25) asegura
(7.26)
y = Cc
f (x)
f0 (, ) =
x
x=T 1 (z)
(x) =
1
(r /x)g(x)
(x) =
(r /x)f (x)
(r /x)g(x)
(7.27)
Notar que (x) y (x) no dependen de la eleccion de . La estructura del sistema en forma normal
se representa (en coordenadas z) en el diagrama de bloques de la Figura 7.2.
e - j-
R TT r- R TT -r1
R T 1
- T
(
z
...
0 (z)1
0 (z)
R f0 (, )
TT
-e
158
Linealizaci
on Exacta por Realimentaci
on
7.2.2.
Din
amica de los Ceros
La forma normal (7.26) tiene una parte externa, representada por las variables , y una parte
interna, representada por las variables . El control u = (x) + (x)v linealiza la parte externa y
hace inobservable la parte interna. Haciendo = 0 en la primera ecuaci
on tenemos la din
amica de
los ceros
= f0 (, 0)
(7.28)
que es la contraparte no lineal de = A0 , donde los autovalores de A0 son los ceros de H(s). El
sistema se dice de mnima fase si la din
amica de los ceros tiene un PE AE en el dominio de interes.
La ecuaci
on (7.28) representa la din
amica de los ceros en las nuevas variables. Podemos tambien
caracterizarla en las coordenadas originales. Notar que
y(t) 0 = (t) 0 = u(t) (x(t)).
Entonces, mantener la salida identicamente cero implica que la soluci
on de la ecuaci
on de estados
debe quedar confinada al conjunto
Z = {x D0 | 1 (x) = 2 (x) = = r (x) = 0},
y la entrada debe ser
u = u (x) , (x)|xZ .
La din
amica de los ceros es entonces la din
amica restringida
x = f (x) = [f (x) + g(x)(x)]| xZ .
Ejemplo 7.9 (Sistema de mnima fase). Consideremos el sistema
x 1 = x1 +
2 + x23
u
1 + x23
x 2 = x3
x 3 = x1 x3 + u
y = x2
que tiene un PE en el origen. Las derivadas de la salida son
y = x 2 = x3
y = x 3 = x1 x3 + u
Por lo tanto el sistema tiene GR 2 en R3 . Las variables de la transformacion (7.24) son 1 (x) = x2
y 2 (x) = x3 . Usando (7.27) obtenemos
= 1,
= x1 x3
159
g(x) = 0
x
=0
+
2
x1 1 + x3 x3
puede resolverse por el metodo de separacion de variables; esto da
(x) = x1 + x3 + arctan x3
que satisface la condici
on (0) = 0. La transformacion T (x) es un difeomorfismo global, ya que para
3
cualquier z R , la ecuaci
on T (x) = z tiene una soluci
on u
nica. Por lo tanto, la forma normal
2 + 22
2
= ( 2 + arctan 2 ) 1 +
1 + 22
1 = 2
2 = ( 2 + arctan 2 ) 2 + u
y = 1
est
a definida en forma global.
7.3.
7.3.1.
Estabilizaci
on
z = T (x)
(7.29)
u=
(x) + (x)K
T(x)
160
Linealizaci
on Exacta por Realimentaci
on
z = Az + B(x)1 [
(x) + (x)K
T(x) (x)]
Sumando y restando el termino BKz, podemos re-escribir la ecuaci
on anterior como
z = (A + BK)z + B(z)
donde
n
o
x=T 1 (z)
Vemos que el sistema a lazo cerrado es una perturbacion del sistema nominal (7.29). Sea P = P t
la soluci
on de la ecuaci
on de Lyapunov
P (A + BK) + (A + BK)P t = I
y supongamos que en un entorno del origen el termino de error satisface
k(z)k2 1 kzk2 + 2 ,
1 , 2 > 0
Si
1 <
1
4 kP Bk2
tenemos que
1
V (z) kzk22 + 2kP Bk2 2 kzk2 < 0 ,
2
lo que demuestra que las trayectorias del sistema perturbado son finalmente acotadas con cota final
proporcional a 2 .
7.3.2.
(7.30)
donde
T1 (x)
z = T (x) =
,
T2 (x)
T (x) es un difeomorfismo en un dominio Dx Rn , Dz = T (Dx ) contiene al origen, (A, B) es
controlable, (x) es no singular para todo x Dx , f0 (0, 0) = 0, y f0 (, ), (x) y (x) son continuamente diferenciables. La forma (7.30) est
a basada en la forma normal (7.26), pero en este caso
no consideramos la salida porque no juega ning
un papel en el problema de estabilizaci
on.
161
El control
u = (x) + (x)K = (x) + (x)KT2 (x)
(7.31)
(7.32)
(7.33)
en alg
un entorno de = 0, donde 3 es una funcion de clase K. Sea P = P T > 0 la soluci
p on de la
T
ecuaci
on de Lyapunov P (A + BK) + (A + BK) P = I y usemos V (, ) = V1 () + k T P , con
k > 0, como candidata a funci
on de Lyapunov para (7.32). La derivada V satisface
k
V1
f0 (, ) + p
T [P (A + BK) + (A + BK)T P ]
V =
T
2 P
V1
k T
V1
f0 (, 0) +
[f0 (, ) f0 (, 0)] p
=
2 T P
Sobre cualquier entorno acotado del origen, podemos usar la diferenciabilidad continua de V1 y f0
para obtener
V 3 (kk) + k1 kk kk2 kk
para ciertas constantes positivas k1 y k2 . Si elegimos k > k1 /k2 aseguramos que V sea definida
negativa. En consecuencia, el origen es AE.
Del Lema 7.1 concluimos que
un sistema linealizable entrada-salida que sea mnima fase es localmente estabilizado asint
oticamente por el control (7.31).
La demostracion del Lema 7.1 es valida u
nicamente en conjuntos acotados. Por lo tanto, no
podemos extenderla al caso de estabilidad asintotica global. Esto u
ltimo puede ser establecido
requiriendo que el subsistema de (7.32) sea ISS (globalmente) cuando se considera su entrada.
Lema 7.2. El origen de (7.32) es GAE si el sistema = f0 (, ) es ISS.
Demostraci
on. Aplicar el Lema 5.6.
162
Linealizaci
on Exacta por Realimentaci
on
Si el origen de = f0 (, 0) es GAE, se podra pensar que el sistema triangular (7.32) se estabilizara globalmente si los estados decaen a cero arbitrariamente r
apido. Esto indicara que la
soluci
on de = f0 (, ) se aproxima r
apidamente a la de = f0 (, 0), que tiende a cero. Vamos a
ver en el ejemplo siguiente que esta no es necesariamente una buena estrategia debido al fenomeno
de peaking.
Ejemplo 7.10 (Peaking). Consideremos el sistema
1
= (1 + 2 ) 3
2
1 = 2
2 = v.
El control lineal
v = 2 1 22 , K
asigna los autovalores de A + BK en (, ).
Para la condici
on inicial (0) = 0 , 1 (0) = 1, 2 (0) = 0, el estado 2 tiene la evoluci
on
2 (t) = 2 tet
cuyo valor absoluto alcanza un pico proporcional a antes de decaer a cero. Vamos a ver que este
pico puede interferir con la estabilidad del sistema aunque tienda a cero r
apidamente. El estado
satisface
1
= (1 2 tet ) 3
2
Durante el perodo de peaking, el coeficiente de 3 es positivo, lo que hace que |(t)| crezca. En alg
un
momento el coeficiente de 3 se har
a negativo, pero esto puede que no suceda lo suficientemente
r
apido para evitar que el sistema tenga escape en tiempo finito. Para ver esto, consideremos la
variable = 1/ 2 , que satisface la ecuaci
on
=
1
[(1 + 2 ) 3 ] = 1 + 2
3
1
=
(t)
1
2 (0)
1
+ m(t)
(7.34)
163
Ejemplo 7.11 (No siempre es bueno cancelar alinealidades). Consideremos el sistema escalar
x = ax bx3 + u,
donde a y b son constantes positivas. Podemos tomar el control linealizante y estabilizante
u = ( + a)x + bx3 ,
> 0,
que resulta en el sistema a lazo cerrado x = x. Este control cancela el termino bx3 , que provee
amortiguamiento no lineal al sistema. De hecho, este termino garantiza que las soluciones del
sistema sean acotadas, sin ning
un control, y a pesar de que el origen sea inestable. Por que cancelarlo
entonces? Alternativamente, usando el control lineal
u = ( + a)x,
> 0,
7.3.3.
Regulaci
on con Acci
on Integral
164
Linealizaci
on Exacta por Realimentaci
on
ycR N
u
+
+ 6 6+ 6
(x)
- j
- - j
f (x, u)
x R x
- A
- h(x)
-c
(x)
6
K
T (x)
Ac 0
A=
,
Cc 0
Bc
B=
,
0
yR
0
YR = . ,
..
0
e = YR ,
e
a =
.
r1
7.4 Ejercicios
yR
165
R A + - - ju
K2 - j
+6
+ 6 6+ 6
(x)
c - j-
f (x, u)
x R x
- A
- h(x)
-c
(x)
6
+
K1 j T2 (x)
6
YR
Figura 7.4: Regulador con accion integral va linealizaci
on por realimentacion
7.4.
Ejercicios
Ejercicio 7.1.
El mecanismo de control de una articulaci
on simple de robot puede modelarse mediante las
ecuaciones
x 1 = x2
k
M gL
sen x1 (x1 x3 )
x 2 =
I
I
x 3 = x4
k
x 4 = (x1 x3 ) + u,
J
donde M, g, L, I y J son constantes positivas. Mostrar que el sistema es linealizable entrada-estado.
Ejercicio 7.2.
Para cada uno de los siguientes sistemas mostrar que el sistema es linealizable entrada-estado.
Dar la transformacion que lleva al sistema a la forma z = Az + B 1 (x)[u (x)] y especificar el
domino sobre el cual es valida.
x 1 = ex2 u
x 2 = x1 + x22 + ex2 u
(7.35)
x 3 = x1 x2
x 1 = x3 (1 + x2 )
x 2 = x1 + (1 + x2 )u
x 3 = x2 (1 + x1 ) x3 u
Ayuda:
(7.36)
166
Linealizaci
on Exacta por Realimentaci
on
Ejercicio 7.3.
Sea el sistema
x 1 = x1 + x2 x3
x 2 = x1 x3 x2 + u
x 3 = x1 + u.
x 2 = x1 x3 x2 + u
x 3 = x1 + u
y = x3 .
x2
f (x) = a[(1 + x3 ) sen(x1 + ) sen ] bx2 ,
cx3 + d[cos(x1 + ) cos ]
g = 0 ,
1
donde a, b, c y d son constantes positivas. Considerar las siguientes dos posibles salidas,
y1 = h1 (x) = x1 ;
y2 = h2 (x) = x1 + x2 ,
6= 0.
En cada caso, estudiar el grado relativo del sistema y transformarlo a la forma normal. Especificar
la regi
on sobre la cual la transformacion es valida. Si existe din
amica de ceros no trivial, determinar
si el sistema es de mnima fase o no.
Ejercicio 7.6.
Considerar el sistema de pendulo invertido del Ejercicio 6.2. Suponiendo que la salida es y = ,
es el sistema linealizable entrada-salida? Es de mnima fase?
7.4 Ejercicios
167
Ejercicio 7.7.
Considerar el sistema
x 1 = tan x1 + x2
x 2 = x1 + u
y = x2 .
Es el sistema linealizable entrada-salida? Es de mnima fase?
Ejercicio 7.8.
Sea el sistema del pendulo
x 1 = x2
x 2 = a[sen(x1 + ) sen ] bx2 + cu,
donde x1 = , x2 = y u = T ac sen . Para los valores a = 1 = c, b = 0 y = /4, dise
nar un
control estabilizante va linealizaci
on p
exacta por realimentacion de estados, ubicando los autovalores
no obtenido con el del control va
del sistema a lazo cerrado en 1 j 3/2. Comparar el desempe
linealizaci
on aproximada.
Ejercicio 7.9.
Mostrar que el sistema
x 1 = a(x2 x1 ),
x 2 = bx1 x2 x1 x3 + u,
a > 0,
b > 0,
x 3 = x1 + x1 x2 2ax3 ,
Captulo 8
Dise
nos Basados en Lyapunov
El metodo de Lyapunov, originalmente utilizado como herramienta de an
alisis de sistemas, es
adem
as una herramienta u
til en el dise
no de control por realimentacion. Existen muchos metodos
basados en la idea de dise
nar el control de forma que la derivada de una funcion de Lyapunov tenga
ciertas propiedades que garanticen estabilidad de las trayectorias del sistema a lazo cerrado con
respecto a un punto o un conjunto de equilibrios. En este captulo presentamos dos metodos de este
tipo. El primero (8.1) es el metodo de redise
no Lyapunov por amortiguamiento no lineal (nonlinear
damping), que permite robustificar un dise
no dado para que tolere cierto tipo de incertidumbres y
errores de modelado que satisfacen la condici
on de apareamiento (matching condition) es decir,
incertidumbre y errores que ocurren en el mismo punto del lazo donde se aplica el control. El segundo
metodo (8.2) es backstepping, un poderoso metodo recursivo que permite obtener dise
nos robustos
frente a incertidumbres y errores que no necesariamente satisfagan la condici
on de apareamiento.
Referimos a Khalil [1996, Captulo 13] para ver otras tecnicas basadas en Lyapunov, como redise
nos
Lyapunov, que generalizan la idea de amortiguamiento no lineal, y el control adaptable, que muestra
una aplicaci
on pr
actica de los teoremas de invariancia vistos en 4.15.
8.1.
Redise
no Lyapunov para Robustificar por Amortiguamiento No Lineal
(8.1)
(8.2)
pretendemos redise
nar u de forma de robustificar el dise
no nominal y hacer que el sistema a lazo
cerrado preserve sus propiedades de estabilidad frente a las incertidumbres .
170
Dise
nos Basados en Lyapunov
(8.3)
es globalmente asint
oticamente estable, y sea V (t, x) una funcion de Lyapunov conocida que satisface
1 (kxk) V (t, x) 2 (kxk)
V
V
+
[f (t, x) + g(t, x)(t, x)] 3 (kxk)
t
x
(8.4)
(8.5)
(8.6)
es una perturbacion del sistema a lazo cerrado nominal (8.3). Calculemos la derivada de V a lo
largo de las trayectorias de (8.6),1
V
V
V
+
[f + g] +
g[v + ]
V =
t
x
x
V
3 +
g[v + ].
x
Introduzcamos la notaci
on wT ,
V
x g,
V 3 + wT v + wT .
Tomando
v = wkk22 ,
> 0,
(8.7)
obtenemos
V 3 kwk22 kk22 + kwk2 kk2 k,
donde k es una cota (desconocida pero finita) de kk. El termino
kwk22 kk22 + kwk2 kk2 k
alcanza un m
aximo
k2
4
en kwk2 kk2 =
k
2 .
Por lo tanto,
k2
V (x) 3 (kxk) +
4
Como 3 es clase K , V siempre ser
a negativa fuera de alguna bola, con lo que las soluciones
del sistema a lazo cerrado ser
an uniformemente acotadas. El redise
no de Lyapunov (8.7) se llama
amortiguamiento no lineal. Resumimos nuestras conclusiones en el siguiente lema.
Lema 8.1 (Amortiguamiento no lineal). Sea el sistema (8.1) y sea (t, x) un control por realimentacion estabilizante para el sistema nominal (8.2) con funcion de Lyapunov V (t, x) que satisface
(8.4)(8.5) para todo t 0 y todo x Rn , con ciertas funciones 1 (), 2 () y 3 () clase K . Supongamos que el termino de incertidumbres es uniformemente acotado para (t, x, u) [0, )Rn Rp .
Sea v dada por (8.7) y u = (t, x) + v. Entonces, para cualquier x(t0 ) Rn la soluci
on del sistema
a lazo cerrado es uniformemente acotada.
8.2 Backstepping
171
8.2.
Backstepping
8.2.1.
Backstepping de un integrador
(8.8)
(8.9)
R J
J
g()
6
- m
f ()
R J
J
-d
f ()
172
Dise
nos Basados en Lyapunov
Supongamos que sabemos que la componente (8.8) puede estabilizarse con un control suave
= (), con (0) = 0, vale decir, el origen de
= f () + g()()
es asintoticamente estable. Mas a
un, supongamos que se conoce una funcion de Lyapunov V ()
(suave, definida positiva) que satisface
V
[f () + g()()] W () ,
D,
(8.10)
donde W () es definida positiva. Sumando y restando g()() al lado derecho de (8.8), obtenemos
la representacion equivalente
= [f () + g()()] + g() [ ()]
= u,
que se muestra en la Figura 8.2.
R J
J - m - g()
- m
R J
J
-d
f () + g()()
d- m
6
R J
J
g()
6
- m
6
R J
J
-d
f () + g()()
v = u ,
obtenemos el sistema
= [f () + g()()] + g() z
z = v,
(8.11)
8.2 Backstepping
173
que se muestra en la Figura 8.3. Notar que, como f , g y son conocidas, podemos calcular la
derivada usando la expresi
on
[f () + g()].
=
El sistema (8.11) tiene la misma estructura que el sistema original, pero ahora la primera componente
= [f ()+g()()]+g() z tiene un punto de equilibrio asintoticamente estable en el origen cuando
su entrada z es cero. Esta caracterstica va a ser explotada en el dise
no de un control v que estabilice
todo el sistema.
Consideremos como candidata a funcion de Lyapunov para (8.11) la funcion
Va (, z) = V () + 21 z 2
(8.12)
V
W () +
g() + v z.
Eligiendo
v=
V
g() k z ,
k>0
obtenemos
V a W () k z 2 ,
que muestra que el origen = 0, z = 0 es asintoticamente estable. Como (0) = 0, concluimos
[f () + g()]
g() k[ ()]
(8.13)
Si las hip
otesis valen globalmente y V () es radialmente no acotada, concluimos que el origen es
globalmente asint
oticamente estable. Esta tecnica se denomina integrator backstepping 2 ya que el
control virtual = () se corre un integrador para atr
as para obtener el control real u (ver la
secuencia en las Figuras 8.1, 8.2 y 8.3). Resumimos el resultado en el siguiente lema.
Lema 8.2 (Backstepping de un integrador). Sea el sistema (8.8)(8.9). Sea () un control por realimentaci
on de estados estabilizante para (8.8) con (0) = 0 y sea V () una funcion de Lyapunov
que satisface (8.10) con alguna funcion definida positiva W (). Entonces, el control por realimenon de
tacion de estados (8.13) estabiliza el origen de (8.8)(8.9) con V () + 21 [ ()]2 como funci
Lyapunov. Adem
as, si todas las hip
otesis valen globalmente y V () es radialmente no acotada, el
origen ser
a globalmente asint
oticamente estable.
x 2 = u,
2
174
Dise
nos Basados en Lyapunov
x1 R
u=
(8.14)
1 2 1
x + (x2 + x21 + x1 )2
2 1 2
(8.15)
Para sistemas de mayor orden, se puede aplicar backstepping en forma recursiva, como ilustramos
en el siguiente ejemplo.
Ejemplo 8.3. El sistema de tercer orden
x 1 = x21 x31 + x2
x 2 = x3
x 3 = u
est
a formado por el sistema de segundo orden del ejemplo anterior con un integrador adicional a la
entrada. Por el ejemplo anterior sabemos que el subsistema formado por las dos primeras ecuaciones
puede estabilizarse con el control virtual (8.14), o sea
x3 = (2x1 + 1)(x21 x31 + x2 ) x1 (x2 + x21 + x1 ) , 1 (x1 , x2 )
y (8.15) es la funci
on de Lyapunov correspondiente. Ahora podemos considerar al sistema de tercer
orden como un caso especial del sistema (8.8)(8.9) con
2
x1
x1 x31 + x2
0
=
, = x3 f =
, g=
0
x2
1
y aplicar nuevamente backstepping. El control u de la forma (8.13) es entonces
u=
1 2
1
V1
(x1 x31 + x2 ) +
x3
[x3 1 (x1 , x2 )]
x1
x2
x2
donde V1 est
a dada por (8.15), y la funci
on de Lyapunov total es
V2 (x1 , x2 , x3 ) = V1 (x1 , x2 ) +
1
[x3 1 (x1 , x2 )]2
2
8.2 Backstepping
8.2.2.
175
(8.16)
1
[ua fa (, )],
ga (, )
(8.17)
que reduce al segundo subsistema de (8.16) al integrador puro = ua . Si conocemos, como antes, el par de funciones () y V () correspondientes a la estabilizaci
on del primer subsistema de
(8.16), podemos tomar ua igual al control (8.13), y combin
andolo con (8.17) obtener el control por
backstepping para (8.16)
V
1
[f () + g()]
g() k[ ()] fa (, ) ,
(8.18)
u = a (, ) ,
ga (, )
1
[ ()]2 .
2
(8.19)
(8.20)
176
Dise
nos Basados en Lyapunov
0
g=
,
g1
fa = f2 ,
ga = g2 .
(8.21)
y = 1
8.3 Ejercicios
177
(8.22)
8.3.
Ejercicios
Ejercicio 8.1.
Para cada uno de los siguientes sistemas escalares, usar amortiguamiento no lineal para dise
nar
un control por realimentaci
on de estados que garantice que el estado x(t) este siempre acotado y
uniformemente finalmente acotado con cota final . La funcion (t) es acotada para todo t 0
aunque la cota es desconocida.
(i) x = x + x2 [u + (t)]
(ii) x = x2 [1 + (t)] xu
Ejercicio 8.2.
Usando backstepping, dise
nar un control por realimentacion de estados que estabilice globalmente el origen del sistema
x 1 = x1 x2
x 2 = x1 + u
Puede el origen estabilizarse globalmente mediante linealizaci
on exacta?
Ejercicio 8.3.
Sea el sistema
x 1 = x2 3x21 /2 x31 /2
x 2 = u
178
Dise
nos Basados en Lyapunov
Ejercicio 8.4.
Sea el sistema
x 1 = x1 + x21 [x2 + (t)]
x 2 = u
donde (t) es acotada para todo t 0 aunque la cota es desconocida. Combinando backstepping
y amortiguamiento no lineal dise
nar un control por realimentacion de estados que garantice que el
estado x(t) este globalmente acotado para todo x(0) R2 .
Ejercicio 8.5.
Considerar el sistema de suspensi
on magnetica del Ejercicio 6.1. Usando backstepping, dise
nar
un control por realimentaci
on de estados para la entrada de tensi
on u que estabilice la bola en la
posici
on deseada y = yR .
Ejercicio 8.6.
Considerar el sistema del Ejercicio 7.9.
(i) Comenzando con las dos primeras ecuaciones, usar backstepping para dise
nar un control por
realimentacion de estados u = (x) tal que el origen (x1 , x2 ) = (0, 0) sea globalmente exponencialmente estable.
(ii) Mostrar que con el control del apartado anterior, el origen x = 0 del sistema completo es
globalmente asint
oticamente estable.
(iii) Comparar este control con el que se dise
no en el Ejercicio 7.9.
Ejercicio 8.7.
Considerar el sistema
x = + x2
= 3 + x
= u
1
2
8.3 Ejercicios
179
Ejercicio 8.8.
Considerar el modelo rotacional de una nave espacial rgida:
= H()
(8.23)
= J 1 S() J + J 1 u
(8.24)
0
x3 x2
S(x) = x3
0
x1
x2 x1
0
y la matriz H() est
a definida como
H() =
1
I S() +
2
Bibliografa
John S. Bay. Fundamentals of Linear State Space Systems. WCB/McGraw-Hill, 1999.
Chi-Tsong Chen. Linear System Theory and Design. Oxford University Press, 3rd edition, 1999.
G.H. Golub and C.F. van Loan. Matrix computations. Johns Hopkins University Press, 3 edition,
1996.
J. Guckenheimer and P. Holmes. Nonlinear oscillations, dynamical systems and bifurcations of
vector fields. Springer, 1983.
A. Isidori, A.J. Krener, C. Gori-Giorgi, and S. Monaco. Nonlinear decoupling via feedback: A
differential geometric approach. IEEE Trans. Automat. Contr., 26:331345, 1981.
Alberto Isidori. Nonlinear control systems. Springer-Verlag, 3rd edition, 1995.
Alberto Isidori. Nonlinear control systems II. Springer-Verlag, 1999.
H. K. Khalil. Nonlinear systems. Prentice-Hall, 2nd edition, 1996.
M. Krstic, I. Kanellakopoulos, and P. V. Kokotovic. Nonlinear and adaptive control design. John
Wiley & Sons, 1995.
Shankar Sastry. Nonlinear Systems: Analysis, Stability and Control. Interdisciplinary Applied
Mathematics. Springer, 1999.
R. Sepulchre, M. Jankovic, and P. V. Kokotovic. Constructive Nonlinear Control. CCES Series.
Springer-Verlag, 1997.
E. D. Sontag. Smooth stabilization implies coprime factorization. IEEE Trans. Automat. Contr.,
34:435443, 1989.
E.D. Sontag and Y. Wang. On characterizations of the input-to-state stability property. Systems
and Control Letters, 24:351359, 1995.
A. J. van der Schaft. L2 -gain and passivity techniques in nonlinear control. Springer-Verlag, 2000.
W. M. Wonham. Linear Multivariable Control: A Geometric Approach. Third Edition. SpringerVerlag, 1985.
Indice alfab
etico
foco, 15
forma de Jordan, 18
backstepping, 159
forma normal, 145
de sistemas en realimentacion estricta, 163
friccion de Coulomb, 8
de un integrador, 159
friccion est
atica, 8
Banach, vease espacio de Banach
funci
on de Lyapunov, 54
Barbalat, vease lema de Barbalat
funci
on definida positiva, 54
Barbashin-Krasovskii, vease teorema de Barbashin- funciones de clase K y KL, 81
Krasovskii
grado relativo, 141
Cauchy, vease secuencia de Cauchy
Gronwall-Bellman, vease desigualdad de Gronwallcentro, 15
Bellman
Chetaev, vease teorema de Chetaev
H
older, vease desigualdad de H
older
ciclo lmite, 21
clausura, 35
inestabilidad, 52, 60
condicion de apareamiento, 157
ISS, vease estabilidad entrada-estado
condicion de Lipschitz, 37
conjunto cerrado, 35
Jacobiana, 21
control adaptable, 12, 157
Jordan, vease forma de Jordan
convergencia de secuencias, 35
Convertidor Boost, 10
LaSalle, vease teorema de LaSalle
Coulomb, vease friccion de Coulomb
lema de Barbalat, 92
amortiguamiento no lineal, 157
desigualdad de Gronwall-Bellman, 34
desigualdad de H
older, 33
difeomorfismo, 135
dinamica de los ceros, 146
diodo t
unel, 6, 19
ecuaci
on de Lienard, 12
ecuaci
on de Van der Pol, 12, 22
ensilladura, 14
equilibrios
definicion, 4
hiperb
olicos, 18
m
ultiples, 18
perturbacion, 16
espacio de Banach, 35
espacio lineal normado, 35
estabilidad, 52
estabilidad asint
otica global, 58
estabilidad de sistemas perturbados, 97
estabilidad entrada-estado, 105
estabilidad estructural, 18
estabilidad exponencial, 82
robusta, 98
estabilidad uniforme, 81
Indice alfab
etico
184
de resistencia negativa, 11
de Van der Pol, vease ecuaci
on de Van der Pol
pendulo, 5, 19
perturbacion de equilibrios, 16
principio de comparaci
on, 46
principio de invariancia, 62
sistemas inestacionarios, 92
punto fijo, 35
puntos de equilibrio, 4
redise
no Lyapunov, 157
regi
on de atracci
on, 58, 65
retrato de fase, 13
construcci
on numerica, 25
secuencia convergente, 35
secuencia de Cauchy, 35
separatriz, 19
sistema en realimentacion estricta, 163
sistema linealizable entrada-estado, 136
sistema masa-resorte, 8
superficie de Lyapunov, 54
teorema de Barbashin-Krasovskii, 59
teorema de Chetaev, 60
teorema de estabilidad de Lyapunov, 53
teorema de LaSalle, 62
teoremas conversos, vease Lyapunov
Van der Pol, vease ecuaci
on de Van der Pol