Garrido Bullon Santiago

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 186

D.

LUIS SANTIAGO GARRIDO BULLN

con D.N.I.: 1.495.533

AUTORIZA:

Que su tesis doctoralcon el ttulo: IDENTIFICACIN ESTIMACIN Y CONTROL DE SISTEMASNO LINEALESMEDIANTE RGO pueda ser utilizada para fines de investigacinpor parte de la UniversidadCarlos III de Madrid. Legans, 18 de febrero de 2000.

Fdo.: Luis SantiagoGarridoBulln

z, Jc ko

L(ru

(?

k)

UNIVERSIDAD CARLOS DE MADRID III Departamentode IngenieraElctrica,Electrnicay Automtica

TESIS DOCTORAL

Identificacin, EstimacinControl y de Sistemas No-lineales mediante RGO

Autor: Santiago Garrido

Directores: Dr. Luis Moreno Dr. CarlosBalaguer

Legans, 1999

TESIS

DOCTORAL

IDENTIFICACIN,

ESTIMACIN Y CONTROL DE SISTEMAS NOLINEALES MEDIANTE RGO

Autor:
Directores:

Santiago Garrido Bulln Dr. Luis E. Moreno Lorente Dr. Carlos Balaguer Bernaldo de Quirs

Tribunal Calificador:
--.. -__7.

Presidente: Vocales:

Av
A:3
-

eu..o

Vocal Secretario:

Calificacin:

Legans, )de

de %Ooo

A M Jos, Clara y Bruno, por todo el tiempoque no les he podidodedicar.

AGRADECIMIENTOS
Quiero dar las gracias en primer lugar a mis directores de tesis, D. Luis Mo reno y D. Carlos Balaguer, por su inapreciable ayuda y buenos consejos, no slo con el tema de la tesis, y que ahora culminan con la presentacin de este trabajo. A todos mis compaeros en el Departamento, por su desinteresada ayuda en todos los problemas que han ido surgiendo a lo largo de estos aos, y por los buenos ratos que hemos pasado entre tanto. En un aspecto ms personal, debo dar las gracias a mi familia por aguantar y animar durante tanto tiempo a alguien que hace cosas tan raras como sta.

RESUMEN
La identificacin de sistemas trata de la estimacin de modelos de sistemas dinmicos a partir de los datos observados. La estimacin trata de evaluar y di sear los estimadores de estado. Ambos se suponen que operan en un entorno estocstico. Esta tesis dirige su esfuerzo investigador principalmente hacia la mejora de la resolucin de los problemas de identificacin y estimacin de estados de sistemas dinmicos no-lineales y el control adaptativo de los mismos. Se presenta un nuevo mtodo hbrido para la optimizacin de funciones no li neales y no diferenciables que varan con el tiempo sin la utilizacin de derivadas numricas. Esto es especialmente importante por la presencia de ruido. Este m todo est basado en los algoritmos genticos con una nueva tcnica de bsqueda que hemos denominado Optimizacin Gentica Restringida (RGO). Este mto do est especialmente indicado para su uso en la identificacin para el control de sistemas dinmicos. Este mtodo de optimizacin es el marco unificador de la tesis y al ser un mtodo bsico permite su aplicacin a multitud de problemas relacionados con la Teora de Sistemas, que precisan de una optimizacin en lnea, puesto que las funciones varan con el tiempo y sin el uso de derivadas numricas ya que estos sistemas estn expuestos a ruidos. A partir de ste algoritmo, se presenta un mtodo de altas prestaciones para la identificacin de sistemas no lineales variables con el tiempo con modelos lineales y no lineales. Este mtodo puede ser usado en lnea y en bucle cerrado, por lo que se puede utilizar en control. Este mtodo utiliza un algoritmo de identificacin en lnea que empieza calculando qu ARX se adapta mejor al sistema, lo que nos da los rdenes y el retardo del modelo. A continuacin calcula un modelo ARMAX que sirve como semilla para inicializar el RGO y crear un modelo NARMAX. El algoritmo RGO permite describir un nuevo estimador no lineal para el fil trado de sistemas con procesos y modelos de observacin no lineales, basados en la optimizacin con RGO. Los resultados de simulacin se usan para comparar el rendimiento de este mtodo con EKE (Extended Kalman Filter), IEKF (Itera ted Extended Kalman Filter), SNF (Second-order Non-linear Filter), SIF (Single-

stage Iterated Filter) y MSF (Montecarlo Simulation Filter) en presencia de dife rentes niveles de ruido. Asimismo se compara con las Redes Neuronales de tipo Backpropagation. Cuando se aplica a la identificacin en el espacio de estados se obtiene un nue vo mtodo de identificacin que comienza calculando un ARX y posteriormente utiliza RGO para mejorar la identificacin previa. Este mtodo est basado en el modelo de parametrizacin completa y las realizaciones equilibradas. De esta manera se consiguen realizaciones de baja sensibilidad y que evitan los problemas de estructura de las realizaciones cannicas. Se presentan dos aplicaciones de estos mtodos. La primera es el control pre dictivo con RGO del Sistema MIMO de Rotores Gemelos (Twin Rotor MIMO System TRMS), que es un laboratorio diseado expresamente para realizar ex perimentos de control. En ciertos aspectos su comportamiento recuerda al de un helicptero. Desde el punto de vista de control ejemplifica un sistema de orden alto con acoplamientos cruzados muy significativos. La segunda aplicacin es la localizacin de robots mediante la informacin de los distintos sensores. Para fusionar toda esta informacin y as poder corregir la posicin y orientacin del vehculo es necesario un algoritmo que en este caso es una extension del filtro de Kalman usando RGO.
-

viii

ABSTRACT
The system identification deals with the problem of estimating modeis of dy namical systems from observed data. The estimation tries to evaluate and to de sign state estimators. The two of them are supposed to operate in a stochastic environmeflt. In this thesis, It has been tried to improve the methods of identification and state estimation of non-linear dynamical systems and their adaptive control. A new optimization hybrid method of non-linear and non-differentiable, time varying functions without using numerical derivatives is presented. This is im portant because of noise. This method based on Genetic Algorithms introduces a new technique called Restricted Geneti Optimization (ROO). This optimization method unifies the thesis anddue to the fact that it is a basic method, it can be applied to a lot of problems related with non-differentiable and time-varying functions. Based on this algorithm, a high performance method for the identification of non-linear, time-varying systems with linear and non-linear modeis, is presented. This method can be used on-line and in a closed loop. For this reason, it is well adapted to control. This method uses an on line identification algorithm that be gins by calculating what ARX is the best adapted to the system. This way the order and the delay of the system are known. Then, an ARMAX that is used as a seed to start the RGO and to create a NARMAX model, is calculated. ,The RGO algorithm can describe a new non-linear estimator for filtering of systems with non-linear processes and observation modeis based on the RGO op timization. The simulation results are used to compare the performance of this method with EKF (Extended Kaiman Filter), IEKF (Iterated Extended Kaiman Filter), SNF (Second-order Non-linear Filter), SIF (Single-stage Iterated Filter) y MSF (Montecarlo Simulation Filter) with different leveis of noise. When this method is applied to the state space identification a new method is obtained. This method begins by calculating an ARX and then uses RGO in order to improve the previous identification. This method is based on the fuil parametrization and balanced realizations. This way low sensitivity realizations are obtained and the structural issues of multivariable canonical parametzatiolls

are circumvented. Two applications of this method are considered. The first application is the predictive control with RGO of the Twin Rotor MIMO System (TRMS), that is a laboratory set-up designed for control experiments. In certain aspects, its beha viour resembles that of a helicopter. From the control point of view, it exemplifies a high order non-linear system with significant cross-couplings. The second one is the robot localization based on different kind of sensor information. To fuse all the different information, an algorithm is necessary. In this case, it has been used an extension of the Kalman algorithm with RGO.

NDICE GENERAL
Agradecimientosy ResumenV Abstractix IntroduccinXXffl 1. FundamentosEstado Arte y del 1.1 Identificacin1 1.1.1 Modelos de Sistemas Dinmicos2
1.1.2 Modelos de Entrada-Salida3 1.1.3 Modelos Paramtricos Lineales4 No-lineales5 1.1.4 Modelos Paramtricos 1.1.5 ModelosNo-Paramtricos, Redes Neuronales8 .1.1.6 Identificacincon AlgoritmosGenticos15 1.1.7 Identificacinen Bucle Cerrado16 1.2 Estimacinde Estados18 1.2.1 Modelosen el Espacio de Estados18 1.2.2 Laestimacin lineal en sistemas dinmicos El Filtro de Kaiman 1.2.3 Elcaso no lineal: Filtros No-lineales 1.2.4 FiltroExtendido de Kaiman (EKF) y Filtro No-lineal de Segundo Orden (SNF) 1.2.5 Filtroextendido Iterado de Kaiman(IEKF) 1.3 Validacinde Modelos 1.4 ControlAdaptativo
-

19
20 22 22 23 25 27 27

2.

Conceptos Bsicos losA.G de


2.1 AlgoritmosGenticos 2.1.1 Algoritmo Gentico Simple

30

2.2

2.1.2 MecanismosAvanzados AlgoritmosGenticos con parmetros continuos


.

35 41

3. Estudio matemtico losA.G43 de


3.1 3.2 3.3 3.4 Introduccina los procesos de Markov43 Clasificacinde estados45 AlgoritmosGenticos y Cadenas de Markov46 Convergenciay Comportamiento Asinttico49
.

4. Mtodo Optimizacin de Gentica Restringida (RGO)


4.1 4.2 4.3 4.4 4.5 Introduccin Caractersticasde los Algoritmos Genticos OptimizacinGentica Restringida (RGO) 4.3.1 RGO Algoritmo Caractersticasde la RGO

53 53 54

54
55 57 59 61 61 62 63 63 64 67 67 68

5. Identificacin sistemas lineales de no


5.1 5.2 5.3 Introduccin Implementacindel Algoritmo Identificacinmultimodelo y multiparmetro de sistemas no li neales mediante modelos paramtricos lineales 5.3.1 Identificacincon modelos lineales 5.3.2 IdentificacinRGO para modelos lineales Identificacinmultimodelo y multiparmetro 5.4.1 ModelosNARMAX 5.4.2 IdentificacinRGO con modelos no lineales Restricciones Resultados Comparacincon las Redes Neuronales Conclusiones 81 Introduccin ElProblema de Filtrado 6.2.1 Laestimacin lineal en sistemas dinmicos El Filtro de Kalman Filtros No-lineales Tradicionales 6.3.1 FiltroExtendido de Kaiman (EKF) y Filtro No-lineal de Segundo Orden (SNF)
81 82 -

5.4

5.5 5.6 5.7 5.8

69
7
75 79

6. Estimacin Estados de
6.1 6.2

83

6.3

86
86

xii

6.3.2 6.3.3

6.4 6.5 6.6

Filtroextendido Iterado de Kaiman (IEKF) Filtro Iterado de una Etapa (Single-stage Iterated Filter (Sif)) 6.3.4 Filtrocon Simulacin Montecarlo (MSF) Elnuevo Filtro, RGO Comparacinde Filtros No-lineales Discusin

88 89 89 90 92 95 97 97 98 99 100 101 104 105 105

7. Identificacin el Espacio Estados en de


7.1 7.2 7.3 7.4 7.5 7.6 7.7 Modelosde Sistemas Lineales en el Espacio de Estados Parametrizacine Identificabilidad Modelosen el Espacio de Estados Totalmente Parametrizados RealizacionesEquilibradas (Balanced Realizations) IdentificacinRGO en el Espacio de Estados 7.5.1 ElAlgoritmo Resultados Discusin

8. Aplicaciones Control al Predictivo107


8.1 Introduccin al Control Predictivo enModelo107 Basado 8.1.1 Estrategias Control Predictivo Basado en Modelo de 109 8.1.2 Lafuncin objetivo 8.1.3 Trayectoriade referencia 8.2 ControlPredictivo GPC. 8.3 Ejemplo 8.4 Control Predictivo RGO 8.4.1 Ventajas deutilizar enun GPC RGO 8.5 Control Predictivo PID-RGO 8.5.1 Introduccin 8.5.2 Identificacinmediante Modelos Paramtricos Lineales 8.5.3 Control Predictivo PID-RGO 8.5.4 Simulacindel control adaptativo PID-RGO 8.6 Anlisis de resultados
. 110 . .

108

110

111

112

115

116

116

117

119

120

120

9. Aplicaciones TRMS 1:
9.1 9.2 9.3 9.4 Introduccin Modeladoy parmetros Identificacindel TRMS Control del PID TRMS
.

123 123 125 127 128 xiii

9.4.1 Estabilizaciny seguimiento 1-DOF vertical 9.4.2 Estabilizaciny seguimiento 1-DOF horizontal 9.4.3 Estabilizaciny seguimiento 2-DOF 9.4.4 ControladorPID con acoplamiento cruzado 9.5 Control Predictivo mediante PID y ROO 9.6135 Control predictivo del TRMS 9.7139 Control en el Espacio de Estados del TRMS 9.8140 Comparacin de los distintos mtodos
.

128 130 130 131 133

10. Aplicaciones Robot II: Mvil

143 10.1 El Filtro de Kaiman Extendido Iterado 143 10.2 Localizacin del Robot Mvil utilizando un Filtro RGO No-lineal 143 10.2.1 Consideraciones de diseo145 10.2.2 La estructura gentica146 10.2.3 La funcin de salud146 10.3 Resultados experimentales148 151 151 151 151 152

11. ConclusionesTrabajo y Futuro. 11.1 Conclusiones


11.1.1 Resumen y conclusiones 11.2 Aportaciones principales 11.3 Trabajo Futuro

xiv

NDICE DE TABLAS
2.1 2.2 2.3 2.4 3.1 3.2 Fenotipos y salud asociada Nmero de copias esperado Cruce Cruce 2.5 Mapa de dominacin Elnmero de estados N como funcin de 1 y P 31 32 33 34 38 47 48

LamatrizZparal=2yP=2
Comparacinde los mtodos de identificacin de sistemas74 Comparacin de los mtodos de identificacin: RGO y Redes Neuronales Comparacin Comparacin Comparacin Comparacin Comparacin Comparacin de BlAS para el nivel de ruido 0.1 de RMSE para el nivel de ruido 0.1 de BlAS para el nivel de ruido 0.5 de RMSE para el nivel de ruido 0.5 de BlAS para el nivel de ruido 1.0 de RMSE para el nivel de ruido 1.0 94

5.1 5.2
6.1 6.2 6.3 6.4 6.5 6.6 7.1 9.1 9.2 10.1 10.2 10.3 10.4

77 94. 95 95 95 96

Errores Cuadrticos Relativos105 Notacinusada en la figura 9.2126 Resultadosde la comparacin entre los distintos mtodos de con trol del TRMS142 Localizacin Localizacin Localizacin Localizacin en posicin con y sin RGO (1). Error en mm. angular con y sin RGO (1). Error en grados en posicin con y sin RGO (2). Error en mm. angular con y sin RGO (2). Error en grados
. .

148 149 149 149

xvi

NDICE DEFIGURAS
1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 1.11 2.1 2.2 2.3 RedFeedforward con una capa oculta y una salida RedFeedforward con dos capas ocultas10 RedRecurrente. q1 retarda la seal un tiempo de muestreo. IdentificacinSerie-Paralelo11 IdentificacinParalela12 Red con realimentacin de la Capa Oculta13 Red con realimentacin de la Capa de Salida14 Sistemaen bucle cerrado17 Diagramade flujo del filtro de Kalman21 Sistema adaptativo con identificacin de modelo (MIAS)25 Sistema adaptativo con modelo de referencia (MRAS)26 AlgoritmosGenticos27 BsquedaGentica28 Terminologade los Algoritmos Genticos29 Ciclode los Algoritmos Genticos30 Cmofuncionan los Algoritmos Genticos30 Mtodosde seleccin31 Funcinde salud32 Cruce33 Mutacin34 Mecanismode bsqueda de la Optimizacin Gentica Restringida Mecanismode seguimiento de la Optirnizacin Gentica Restrin gida58 Diagramade flujo de la Optimizacin Gentica Restringida RGO Diagramade flujo de la RGO66 Mecanismode cruce68 Mecanismode mutacin68 Montajede la Planta 271 56 9
.

10

2.4
2.5 2.6 2.7 2.8 2.9 4.1 4.2 4.3 5.1 5.2 5.3 5.4

60

5.5

5.6
5.7

5.8 5.9
5.10 5.11

5.12

5.13

5.14

Fenmenode blow-up al intentar identificar la planta 1 con el blo que ARMAX de Simulink. Este efecto se debe a que se correlan los errores c(t) y r (t) con la entrada y hace imposible la identifi cacin de este sistema mediante este mtodo72 Resultadosde la identificacin de la planta 1 con el mtodo RGO. Arriba: salida del modelo vs. salida real. Abajo: error cometido. Resultadosde la identificacin de la planta 2 con el mtodo RGO. Arriba: salida del modelo vs. salida real. Abajo: error cometido. Resultadosde la identificacin de la planta 3 con el mtodo RGO. Arriba: salida del modelo vs. salida real. Abajo: error cometido. Resultadosde la identificacin de la planta 4 con el mtodo RGO. Arriba: salida del modelo vs. salida real. Abajo: error cometido. Estructura de la Red Multicapa utilizada en la comparacin. Resultados de la identificacin de la planta 1. Subfigura 1: salida del modelo Vs. salida real para RGO. Subfigura 2: error come tido. Subfigura 3: salida del modelo Vs. salida real para la Red Neuronal. Subfigura 4: error cometido77 Resultados de la identificacin de la planta 2. Subfigura 1: salida del modelo vs. salida real para RGO. Subfigura 2: error come tido. Subfigura 3: salida del modelo vs. salida real para la Red Neuronal. Subfigura 4: error cometido78 Resultados de la identificacin de la planta 3. Subfigura 1: salida del modelo vs. salida real para RGO. Subfigura 2: error come tido. Subfigura 3: salida del modelo vs. salida real para la Red Neuronal. Subfigura 4: error cometido78 Resultados de la identificacin de la planta 4. Subfigura 1: salida del modelo vs. salida real para RGO. Subfigura 2: error come tido. Subfigura 3: salida del modelo vs. salida real para la Red Neuronal. Subfigura 4: error cometido79
. .

72 73 73 74 75

6.1 6.2 6.3

Diagramade flujo del filtro de Kalman85 Diagramade flujo de la Optimizacin Gentica Restringida apli cada a la estimacin de estados91 Ejecuciones tpicas para el modelo 5 con EKF y SRGOF para nivel de ruido 1.093 TwinRotor MIMO System (TRMS)102 Resultados de identificacin de la Planta con el mtodo ARX. Arriba: Salida del Modelo vs. Salida del Sistema. Abajo: Error. 103
.

7.1 7.2

xviii

7.3

7.4 8.1 8.2 8.3 8.4

Resultados de identificacin de la Planta con el mtodo Gauss Newton.Arriba: Salida del Modelo vs. Salida del Sistema. Abajo: 103 Error Resultados de identificacin de la Planta con el mtodo RGO. Arriba: Salida del Modelo vs. Salida del Sistema. Abajo: Error. 104

Lametodologa del control predictivo basado en modelos108 Estructurabsica del control predictivo109 Distintastrayectorias de referencia Resultadosde la identificacin de los parmetros 1yi Y2 ) 1r del control predictivo RGO114 8.5 Esquema para la identificacin de los parmetros de la ley de con trol predictivo115 8.6 Resultadosde la identificacin de los parmetros 1yi ly Y r del control predictivo RGO. El tiempo 10 corresponde al llenado del buifer 8.7 Resultados de la identificacin de los parmetros del sistema. 8.8 Esquema general dl control daptativo 8.9 8.10 Diagrama Simulink para Control 1 8.11 Resultados del Control Predictivo con RGO para = 0.12 8.12 Resultados del Control Predictivo con RGO para = 0.16 8.13 Resultados del Control Predictivo con RGO para ? = 0.20
. . . . . . .

110

115 116 117 117 121 121 122 122

9.1 9.2 9.3 9.4

123 TwinRotor MIMO System (TRMS) 124 TwinRotor MIMO System (TRMS) 125 Diagramade bloques del modelo TRMS 128 Respuestadel rotor principal del TRMS a una onda cuadrada.. 9.5 Control del sistema 1-DOF (estabilizacin y seguimiento en ver tical). Arriba: salida vs. seal de referencia. Abajo: error cometido.128 129 9.6 Diagramade bloques del sistema 1-DOF (plano vertical) 9.7 ontroldel sistema 1-DOF (estabilizacin y seguimiento en ver tical). Arriba: salida del sistema vs. seal.de referencia. Abajo: 129 error cometido 9.8 Controldel sistema 1-DOF (estabilizacin y seguimiento horizon 130 tal) 130 9.9 Diagrama de bloques del sistema 1-DOF (plano horizontal). 9.10 Control del sistema 1-DOF (estabilizacin y seguimiento en hori zontal). Arriba: salida del sistema vs. seal de referencia. Abajo: 131 error cometido.
. . . . .

xix

9.11 Control del sistema 2-DOF 131 9.12 Experimento con el controlador de estabilizacin y seguimiento 2-DOF PID. Arriba: salida del sistema vs seal de referencia en eje vertical. Abajo: error cometido132 9.13 Experimento con el controlador de estabilizacin y seguimiento 2-DOF PID. Arriba: salida del sistema vs seal de referencia en eje horizontal. Abajo: error cometido132 9.14 Diagrama de bloques del sistema de control 2-DOF PID de aco plamiento cruzado133 9.15 Experimento con el controlador de estabilizacin y seguimiento 2-DOF PID con acoplamiento cruzado Arriba: salida del sistema Vs. seal de referencia en eje vertical Abajo: error cometido 133 9.16 Experimento con el controlador de estabilizacin y seguimiento 2-DOF PID con acoplamiento cruzado Arriba: salida del sistema Vs. seal de referencia en eje horizontal Abajo: error cometido. 134 9.17 Sistema adaptativo con identificacin de modelo (MIAS)135 9.18 Control del Sistema con RGO-PID y RGO Predictivo136 9.19 Experimento con el controlador de estabilizacin y seguimiento: control predictivo-RGO en el plano vertical (con un grado de li bertad). Arriba: salida del sistema vs seal de referencia en eje vertical. Abajo: error cometido136 9.20 Experimento con el controlador de estabilizacin y seguimiento: PID-RGO (arriba) en el plano vertical (con un grado de libertad). Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido137 9.21 Experimento con el controlador de estabilizacin: Predictivo-RGO con dos grados de libertad. Arriba: salida del sistema vs. seal de referencia en eje vertical. Abajo: error cometido137 9.22 Experimento con el controlador de estabilizacin: PID-RGO con dos grados de libertad. Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido138 9.23 Experimento con el controlador de estabilizacin (seales de con trol: control predictivo y PID)138 9.24 Control del sistema 2-DOF
. . . . 139 9.25 Experimento con el controlador de estabilizacin y seguimiento: PID-RGO en variables de estado. Arriba: salida del sistema Vs.

referencia

en

eje

vertical.

Abajo:

salida

del

sistema

vs.

referencia

en

eje

horizontal140

xx

9.26 Experimento con el controlador de estabilizacin: diagrama de bloques141

xxi

xxii

INTRODUCCIN
Ha habido un gran inters por parte de la comunidad de control en aplicar los algoritmos genticos a problemas de Ingeniera de Control de Sistemas. Basa dos en modelos computacionales de la evolucin biolgica natural, los Algoritmos Genticos pertenecen a la clase de los algoritmos evolutivos, que tambin incluyen la programacin evolutiva, la evolucin de estrategias y la programacin genti ca. Comparado con los mtodos tradicionales de bsqueda y optimizacin, tales como los basados en el clculo o los basados en tcnicas enumerativas, los algo ritmos genticos son una tcnica robusta, que puede ser utilizada de forma global o semi-local y que se puede aplicar generalmente de forma ms directa a situacio nes que tienen poco o ningn conocimiento acerca del proceso a ser controlado. Para el ingeniero de control los algoritmos genticos y la programacin evoluti va, en general, presentan oportunidades de plantearse problemas que no permiten una solucin eficiente a travs de la aplicacin de tcnicas convencionales. En los ltimos aos, los algoritmos genticos han sido aplicados a muchos temas rela cionados con la Ingeniera de Control, incluyendo la optimizacin paramtrica y combinatoria y el control adaptativo. El diseo de controladores no-lineales es un problema muy importante en In geniera de Control, aunque difcil. Hoy en da, la mayora de los controladores industriales son lineales puros debido a las dificultades encontradas en el proble ma de diseo de controladores n lineales. Para construir un controlador no-lineal hemos de hacer suposiciones vlidas acerca de la estructura del controlador y del sistema a controlar. Estas suposiciones nos llevan frecuentemente al desarrollo de controladores no suficientemente robustos puesto que los efectos de la incerti dumbre no han sido tenidos en cuenta a la hora de disear el controlador. La identificacin de sistemas de dinmica desconocida ha producido un campo de investigacin llamado identificacin de sistemas. En identificacin de siste mas definimos o describimos una estructura modelo que tiene un comportamiento similar al del sistema desconocido.

Objetivos de la tesis
El principal objetivo de la tesis es el desarrollo de nuevos mtodos hbridos

de identificacin y de estimacin de estados, on une de sistemas dinmicos nolineales, basados en algoritmos genticos. Asimismo, se han estudiado sus pli caciones al control adaptativo de dichos sistemas. En la literatura, el uso de los algoritmos genticos como mtodo de optimiza cin se hace off-line y el tiempo utilizado es bastante grande, ya que usualmente los algoritmos genticos se usan como un mtodo de bsqueda global y en para lelo. Hemos utilizado nuevos mecanismos para usarlos como lo hace la Naturaleza: On-line y de una manera local o semi-local. Hemos demostrado que los algoritmos genticos se pueden usar como un m todo rpido de optimizacin de funciones que varen con el tiempo. A ste nuevo mtodo que hemos desarrollado lo hemos denominado Restric ted Genetic Optimization (RGO) y simula el mtodo del gradiente sin utilizar derivadas y puede ser utilizado cuando las seales tienen mucho ruido. El mtodo de bsqueda restringida consiste en hacer la bsqueda en un entorno del punto correspondiente al ltimo modelo identificado y tomar el punto mejor adaptado como centro del entorno de bsqueda de la nueva generacin. Los individuos de cada generacin representan los vectores de diferencia res pecto al mejor punto de la generacin anterior. El radio se toma proporcional a la incertidumbre.

Estructura de la Tesis
El contenido de la tesis se encuentra distribuido en diez captulos. Inicialmente se presenta un captulo dedicado a las distintas metodologas relacionadas con el contenido de la tesis. El dearrollo de un nuevo mtodo de optimizacin RGO (Restricted Genetic Optimization) para funciones que varen con el tiempo. Este mtodo ha probado ser muy til para minimizar o maximizar funciones posiblemente no-lineales y no-diferenciables. Este mtodo est especialmente indicado para su uso en la identificacin para el control de sistemas dinmicos. En el captulo 6 se presenta un mtodo de altas prestaciones para la identifi cacin de sistemas no lineales variables con el tiempo con modelos lineales y no lineales mediante RGO. El captulo 7 trata de nuevo estimador no lineal para la estimacin de los es tados en sistemas con procesos y modelos de observacin no lineales, basados en la optimizacin con RGO (Restricted Genetic Optimization). Los resultados de simulacin se usan para comparar el rendimiento de este mtodo con EKF (Exten ded Kalman Filter), IEKF (Iterated Extended Kalman Filter), SNF (Second-order Nonlinear Filter), SIF (Single-stage Iterated Filter) y MSF (Montecarlo Simula xxiv

tion Filter) en presencia de diferentes niveles de ruido. Asimismo se compara con las Redes Neuronales de tipo Backpropagation. En el captulo 8 mostramos un nuevo mtodo de identificacin de sistemas dinmicos con modelos en el Espacio de Estados. Este mtodo un algoritmo de identificacin que comienza calculando un ARX y posteriormente utiliza RGO para mejorar la identificacin previa. Las aplicaciones de estos mtodos al control se tratan en el captulo 9 a partir del Sistema MIMO de Rotores Gemelos (Twin Rotor MIMO System TRMS), que es un laboratorio diseado expresamente para realizar experimentos de con trol. En ciertos aspectos su comportamiento recuerda al de un helicptero. Desde el punto de vista de control ejemplifica un sistema de orden alto con acoplamien tos cruzados muy significativos. En el captulo 10 presentamos la aplicacin a la deteccin de marcas artificia les para la localizacin de robots, empleando para ello como sensores una cmara con zoom motorizado sobre una plataforma pan and tilt y un anillo perifrico de 24 sensores perifricos. Para fusionar toda la informacin y as poder corregir la posicin y orientacin del vehculo utilizamos un filtro de Kalman extendido basado en RGO. Algunas partes de esta tesis han sido publicadas previamente: La mayor parte (excepto la comparacin con las redes neuronales) del captulo 5 apareci como:
-

Garrido,S .,Moreno,L.E.,Salichs,M.A.(1998). Nonlinear On-line Iden tification of Dynamic Systems with Restricted Genetic Optimization. 6th European Congress on Intelligent Tecimiques & Soft Computing. (EUFIT98) El captulo 6 fue publicado como: Garrido,S ,Moreno,L.E.,Balaguer,C.( 1998). State Estimation for Nonlinear Systems using Restricted Genetic Optimization. 11th mt. Con ference QnIndustrial and Engineering Applications of Arti IIcial Inte lligence and Expert Systems.(IEA-AIE98)
.

El captulo 7 apareci como: Garrido,S ,Moreno,L.E. ,Salichs,M.A.(1999). Identification of State SpaceModels with RGO. 6th European Congress QnIntelligent Tech niques & Soft Computing. (EUFIT98)
.

Las aplicaciones a los Robots Mviles fueron desarrolladas junto con otros autores en: xxv

xxvi

Armingol, J.M., Moreno, L.E., Garrido, S., de la Escalera, A., Sa lichs, M.A.: Mobile Robot Localization Using a Non-Linear Evolu tionary Filter. 3rd IFAC Symp. on Intelligent Autonomous Vehicles (IAV98).

1. FUNDAMENTOS ESTADO Y DEL ARTE.


1.1 Identificacin

La identificacin de sistemas es la teora y el arte de construir modelos mate mticos de sistemas dinmicos basndonos en las entradas y salidas observadas. Como disciplina cientfica data de los primeros intentos de modelar series de tiem po usando tcnicas AR. Aunque una parte sustancial del desarrollo de las tcnicas est ligado a la Comunidad de Control, est bsicamente construida a partir de tcnicas estadsticas, en particular en los mtodos de regresin lineal y no-lineal. Construir modelos para sistemas desconocidos es un objetivo importante de la Ingeniera de control. Estos modelos necesitan simular el comportamiento real en los casos en que existe un conocimiento previo limitado de la estructura del sistema. Consideremos el motor de un coche por ejemplo. Es importante simular el comportamiento de un motor para la deteccin de fallos y para propsitos de diag nosis. Algunos factores importantes que afectan este proceso son las dificultades asociadas con el desarrollo de un modelo aceptable con un orden de complejidad mnimo y con un nmero de medidas mnimo. Estos factores hacen que el proceso de modelado de un motor de coche bastante difcil. Esto puede ser generalizado a una amplia clase de sistemas en la industria. La identificacin de sistemas no lineales se considera un problema difcil. La razn es que identificar un sistema no-lineal conlieva dos grandes etapas: la selec cin de la estructura del modelo con un cierto nmero de parmetros y la seleccin de un algoritmo que estime dichos parmetros. En la literatura han sido propuestos numerosos modelos lineales como solu cin al proceso de identificacin. Estos modelos son simples, como OE y ARX por ejemplo. En este caso podemos elegir un algoritmo sencillo para estimar ls parmetros del modelo. Aunqii muchos sistemas no-lineales pueden ser linealizados representndo los por medio de una ecuacin diferencial o en diferencias, modelar sistemas no-

FUNDAMENTOSYESTADODELARTE. 1.

lineales con modelos lineales implica muchas aproximaciones. Con frecuencia, estas aproximaciones no reflejan suficientemente el comportamiento real del sis tema no lineal.. Por tanto, el obtener un buen modelo, con una estructura que refleje la informacin real del sistema, exige un incremento en coste. Este coste es debido a la necesidad de algoritmos ms avanzados que puedan manejar mode los con estructuras complejas. Los modelos pueden ser paramtricos, que tienen la ventaja de estar dados por un conjunto pequeo de coeficientes, o bien no paramtricos como las re des neuronales, que tienen la ventaja de no estar restringidas a un cierto nmero, posiblemente pequeo, de descripciones posibles del modelo. El trmino Identificacin de sistemas fue acuado por Lofti Zadeh [109] en 1962, como: Identificacin es la determinacin, en base a la entrada y la salida, de un sistema, dentro de una clase de sistemas especificada, al cual el sistema probado es equivalente. Puede decirse que la identificacin de sistemas qued establecida como un campo de investigacin reconocido dentro del rea de control automtico a me diados de los sesenta: en el tercer congreso de la IFAC en Londres, 1966 en el que fue presentado un artculo de visin general sobre identificacin de sistemas (Eykhoffet al. 1966). Un ao despus fue organizado el primer Symposium IFAC sobre identificacin de sistemas en Praga. En la actualidad es el Sympsium con una serie mas larga de la IFAC. La teora sobre identificacin de sistemas est reunida, por ejemplo, en los libros de Ljung [69] y de Sbderstrom y Stoica [97], donde tambin se pueden encontrar numerosas referencias.

1.1.1

Modelos Sistemas de Dinmicos

Cuando trabajamos con un modelo de un sistema, tenemos una cierta idea de cmo unas variables estn relacionadas entre s. Desde un punto de vista general, podemos decir que las relaciones observadas son un modelo del sistema. Est claro que los modelos pueden venir dados por diferentes estructuras y con distintas formulaciones matemticas. El uso deseado del modelo tambin determina el grado de sofisticacin requerido. El modelado e identificacin de sistemas no lineales es, en buena medida, un problema dependiente de las aplicaciones y que frecuentemente tiene sus races en la tradicin y en. las tcnicas especficas del rea de aplicacin.
.

1.1. IDENTIFICACIN

Un problematpico Observamos las entradas u(t) y las salidas y(t) de un


sistema, con t = 1,. , N. Deseamos construir el modelo de un sistema, y podemos buscar un modelo sencillo de la forma
. .

y(t)+aly(tl)=blu(tl)+b2u(t2) Es necesario determinar los valores de los parmetros ai, b1, y b2. Esto puede ser hecho por medio del conocido mtodo de mnimos cuadrados minai,bi,b2(Y(t) +aiy(t 1) biu(t 1) b2u(t2))2 (1.2)

(1.1)

Los valores 1, , y pueden ser calculados fcilmente en este caso puesto 1.2 es una funcin cuadrtica. As obtenemos el modelo del sistema: y(t) +y(t 1)

u(t 1) +iu(t2)

(1.3)

Este sencillo problema de identificacin de sistemas es un caso especial de la amplia clase de problemas de construccin de modelos.

1.1.2 Modelos Entrada-Salida de


Un modelo de entrada-salida describe un sistema dinmico basndose en ls datos de entrada y de salida. Este tipo de modelos supone que la salida del sistema puede ser predicha a partir de las entradas y salidas pasadas del sistema. Si el sistema se supone, dems determinista, invariante en el tiempo, de una entrada una salida (SISO), el modelo de entrada-salida es:
-

y(k)=f(y(k_1),y(k_2),...,y(kn),u(kl,U(k2),...,U(1tm)) (1.4) donde u(k), y(k) representa el par de entrada-salida en el tiempo k. Los enteros positivos n y m son el nmero de salidas pasadas (tambin llamado el orden del sistema) y el nmero de entradas pasadas. En la prctica m es, normalmente, menor o igual que n. f puede ser cualquier funcin no-lineal definida desde el espacio de entradas y salidas pasadas hasta el espacio de salidas futuras. Si el sistema es lineal, f es una funcin lineal y la ecuacin anterior puede ser reescrita como:

J y(k) =aiy(kl)+a2y(k2)+...+any(kfl) 1 +biu(k_l)+b2U(k_2)+...+bm11(m)

(15)

FUNDAMENTOSYESTADQDELARTE. 1.

1.1.3 Modelos Paramtricos Lineales


El estado actual de la estimacin de parmetros en la identificacin de sistemas corresponde a la teora clsica de la regresin. Es una necesidad para el futuro de la identificacin de sistemas comprender en profundidad los relevantes desarrollos estadstics en anlisis de la regresin, como los expuestos en los libros de Carroll y Ruppert [15] y de McCullagh y Nelder [79]. Algunos de los modelos lineales mas conocidos son: ARX (Auto-Regressive with eXogenous inputs), cuya expresin es A(q1)y(t) =B(q1)u(tnk)+ek (1.6)

que puede ser visto como una manera de determinar el siguiente valor de la salida dadas las observaciones anteriores y las entradas. Aqu A (q) y B (q) son polinomios en el operador desplazamiento hacia atrs q1 e y(t), u(t), y e(t) son las salidas, entradas y ruido, respectivamente. El ruido e(t) es una sucesin aleatoria normalmente distribuida de media cero y varianza a2 O(Output Error) cuya expresin es y(t) u(t nk) + e(t)
-

(1.7)

con la fuente de error e(t) que es la diferencia (error) entre la salida real y la salida libre de ruido (terica). ARMAX (Auto-Regressive Moving Average with eXogenous inputs), cuya expresin es A(q)y(t)
=

B(q)u(t

nk) + C(q1)e(t)

(1.8)

En ste modelo la expresin A(q1)y(t) = e(t) representa la auto-regresin, y(t) = C(q1)e(t) representa la media mvil de ruido blanco, mientras que B(q1 )u(t) representa le entrada externa. Otros modelos pueden ser usados, como por ejemplo la representacin en el espacio de estados o el modelo de ceros y polos.

1.1. IDENTIFICACIN

1.1.4 Modelos Paramtricos No-lineales


La identificacin de modelos matemticos en forma de modelos lineales de una entrada una salida est bien desarrollada en cuanto a la determinacin de parmetros y determinacin de la estructura. Sin embargo, se considera difcil aplicar con precisin la identificacin de sistemas lineales a sistemas no-lineales. Un punto de vista pesimista es mirar a los sistemas no-lineales como el comple mentario de la clase de sistemas para los cuales existen mtodos sistemticos de identificacin. Algunos resultados interesantes son: el artculo de Johnson [56] sobre regre sin no-paramtrica y el libro de Grenander [39] Supongamos que se ha escogido una base del espacio de funciones {g,}, de bemos intentar aproximar la verdadera relacin por una combinacin lineal finita de las funciones de la base:
-

9(tle) g((t),e)
=

8(k)gk((t))

(1.9)

donde 4(t) estformado por las entradas u(k) y salidas y(k) pasadas:
(t)
=

[y(t

1),.. .,y(tna),U(t1),...,u(Yflb)]T

(1.10)

y hemos introducido la notacin 9(t e) para hacer hincapi en que g (4(t),) es una estimcin de y(t) dada la informacin 4(t) y un vector de parmetros dad

e.
El mejor valor de Oest determinado entonces por el conjunto de datos
ZN
=

{[y(t),(t)]t=

1,... ,N}

(1.11)

y ser:

eN =

argmin
k=s

ly(t) 9(tIO)2

(1.12)

Modelosparamtricos No-lineales Series de Volterra Las series de Volterra son desarrollos en serie que consis
ten en trminos lineales, bilineales y trilineales. Trminos de mayor orden pueden ser incluidos para algunas aplicaciones. Una serie de Volterra con un orden y un retardo apropiadamente escogidos pueden ser usados para modelar sistemas

FUNDAMENTOSYESTADODELARTE. 1.

dinmicos no-lineales. Las series de Volterra vienen descritas por la expresin: y(k) 0au(k i) +oL7obiju(ki)u(kj) +L7 ciu(k
=

(113)

i)u(k

j)u(k

1)

El vector u representa la seal de entrada, el vector y la salida del modelo. Para sistemas estables las series infinitas pueden ser truncadas sin problemas si el lmite superior de la suma es lo suficientemente alto. Entonces la ecuacin anterior puede ser simplificada como: y(k) =1au(k-i) +F.Ltobj1u(ki)u(kj) +LZI L LZI0 ciu(k i)u(k +.

114

j)u(k 1)

De hecho, la mayora de los estudios en ste rea se limitan a series de Volterra de segundo o tercer orden. Las series de Volterrapueden ser representadas en flotacin vectorial: y(k)=afxi+bx2+cx3=xTa donde el vector de datos x y el vector de coeficientes viene dado por:
xT=

(1.15)

(x(k),x(k1),...,x(kN+1), x2(k),x(k)x(k 1),.. .,x2(kN+ 1), x3(k),...,x3(kN--1))

(1.16)

y
aT
=

(ao,..

.,aN_i,boo,.

. .

1 C000,...,CN_1,N_1,N_1

(1.17)

T c3

Los

rmetros

desconocidos

de

la

serie

pueden

ser

determinados

partir

de

las

medidas

entrada-salida

resolviendo

la

ecuacin

y=Xa

(1.18)

1.1. IDENTIFICACIN

donde y (k) y(k1) y(k-N) xf (k) xf(k1) xf(kN) a= 4(k) 4(k1) 4(kN)

4(k)
x(k1) 4(kN)

/ (

ai b

C
La solucin por mnimos cuadrados viene dada por la ecuacin normal XTXa XTy que tiene como solucin:
=

(xTX)_1XTy

(1.19)

Modelos NARMAX Entrelos modelos no lineales, uno de los mas interesan


tes, es el modelo NARMAX (Non- linear Auto-Regressive Moving Average with eXogenous inputs), que es una generalizacin de las series de Volterra y que puede ser descrito como y(t)=F[ y(t 1),...,y(tny),u(td),...,u(tdnu+1), 1),... ,c(t ne)] +a(t)

donde t representa el tiempo discreto, y(t), u(t) y E(t) son la salida, la entrada, y el error de prediccin, respectivamente, n, n y ncson los rdenes correspondientes, F[.]es una funcin no lineal y d es el mnimo retardo de la entrada [Leontaritis 85]. El modelo polinomial NARMAX tiene como expresin y(k) =ao+1ay(k_i)+1bju(k_i)+E11CijY(k_i)U(k_J) (1.21) nos permite una descripcin buena y sencilla de una amplia clase de sistemas no lineales. Por ejemplo, si el modelo exacto NARMAX es y(k) =y(k 1)e_1_1) (1.22)

FUNDAMENTOS 1. Y ESTADO ARTE. DEL

podemos desarrollar en serie la exponencial exp(x)=0) y emplear un modelo polinomial aproximado NARMAX y(k)
=

(1.23)

y(k 1) y(k l)u(k 1) + y(k l)u2(k1) y(k l)u3(k 1)


(1.24)

1.1.5 Modelos No-Paramtricos, Redes Neuronales


Los modelos de Redes Neuronales artificiales han sido estudiados durante mu chos aos con el nimo de conseguir prestaciones parecidas a las humanas en campos como el reconocimiento del habla o de imagen. Estos modelos estn compuestos por muchos elementos computacionales trabajando en paralelo y or ganizados en patrones que recuerdan a las redes neuronales biolgicas. Los elementos computacionales o nodos estn conectados mediante pesos que son adaptados a lo largo del proceso para mejorar sus prestaciones. Es imposible cubrir todos los tipos de redes neuronales y so1amnte vamos a considerar las llamadas Feedforward y Recurrentes, que son las ms utilizadas en identificacin de sistemas.

Redes Feedforward
El paso desde el desarrollo general 1.9 de una funcin en la base {gj} a lo que es una red neuronal no es grande. Basta escoger gk() = aka (13 + Yk) donde 13k k4 es un vector de parmetros y Yky ak son parmetros escalares para obtener (1.25) donde a0 es el valor correspondiente al nivel medio. A este modelo se le denomina Red Feedforward con una capa oculta y una salida. Las funciones de la base, llamadas nodos o neuronas, son funciones uniwi luadas que convierten la red neuronal e un desarrollo en funciones simples. La eleccin especfica de c(.) es denominada funcin de activacin y suele ser esco gida igual para todos los nodos. El nombre feedforward est explicado por la figura; hay una direccin espe cfica en el flujo de los clculos cuando se calcula la salida g. Primero se calculan

1.1. IDENTIFICACIN

LiJ

Fig. 1.1: Red Feedforward con una capa oculta y una salida.

las sumas con peso en la entrada de cada unidad, despus estas sumas son pasadas por la funcin de activacin y forman las salidas de las capas ocultas. Para calcu lar g se forma una suma con pesos de las salidas de los nodos de la capa oculta. Si g es una funcin vectorial, hay varios nodos de salida formando la capa de salida. La entrada 4)se denomina, a veces, capa de entrada. Los pesos de las diferentes sumas son los parmetros de la red. La funcin a(x) se toma de tipo sigmoide, es decir es una funcin continua que verifica lima(x) = a y lim_(x) = b con a, b E R y b < a. La red neuronal de una capa oculta 1.25 se puede generalizar a varias capas ocultas. La salida de la primera capa oculta alimenta la segunda capa y as sucesi vamente, y la ltima capa oculta alimenta a la capa de salida, como se puede ver en la figura. La frmula para dos capas ocultas ser g(4)) = i (1.26)
j m

Redes Recurrentes
Si alguna de las entradas de la red feedforward consiste en salidas retardadas de la red, o bien en algn estado interno retardado, la red recibe el nombre de red recurrente o red dinmica. ste tipo de redes es especialmente interesante para identificacin.

lo

1. FUNDAMENTOS Y ESTADO ARTE. DEL

Capadeentrada

Capasocultas

Capa desalida

Fig. 1.2: Red Feedforward con dos capas ocultas.

J
A

Fig. 1.3: Red Recurrente. q1 retardala seal un tiempo de muestreo.

AspectosAlgortmicos
Los pesos de la red deben ser escogidos de forma que la salida se ajuste lo mejor posible a los datos observados, para ello hay que minimizar el funcional: VN(O)

y(t) g((t),8)2

(1.27)

Como no hay solucin analftica a este problema, es necesario emplear algn mtodo numrico de optimizacin. Las rutinas de bsqueda ms eficientes estn

1.1. IDENTIFICACIN

11

basadas en bsqueda local en una direccin de mayor pendiente desde el punto actual. Tenemos, por tanto, un esquema iterativo del tipo
(i+1)
=

(i)

piRT1Vj

(1.28)

dondep es el paso, Vj es una estimacin del gradiente vk(()Res una matriz y que modifica la direccin de bsqueda.

Identificacin Redes con Neuronales


Los dos esquemas tradicionales de identificacin para sistemas dinmicos, lla mados serie-paralelo y paralelo, son los representados en las figuras 1.4 y 1.5, respectivamente.

Fig. 1.4: Identificacin Serie-Paralelo

El esquema de identificacin serie-paralelo utiliza las entradas y salidas de la planta y deja que internamente la red deduzca el error existente. Este esque ma, tambin llamado teacherforcing puede ser usado con cualquier algoritmo de aprendizaje. La idea es que durante la fase de entrenamiento, para calcular los nuevos esta dos de la red neuronal, se utilicen en el lazo de realimentacin las salidas actuales de la planta en lugar de las salidas de la red. Su implementacin puede ser muy sencilla con cualquier algoritmo. El serie-paralelo es til al inicio del aprendizaje para que los valores de la red no se alejen mucho y converja ms rpido. En el esquema de identificacin paralela, la red no tiene informacin directa acerca de las salidas de la planta, slo las entradas y el error entre las salidas de la planta y la red.

12

1. FUNDAMENTOS Y ESTADO ARTE. DEL

Fig. LS: Identificacin Paralela

Redesneuronales paralelizacin tiempo La representacin del con del


tiempo y su influencia en el comportamiento de los sistemas es uno de los proble mas mas difciles en las aplicaciones de modelado y control. Una forma de representar eventos temporales es su representacin directa co mo una dimensin explcita en un vector del espacio de entrada. El primer ele mento representa el primer evento temporal, el segundo elemento de cada vector representa el segundo evento temporal y as sucesivamente. La representacin del tiempo en las redes neuronales utilizadas en aplicaciones de sistemas dinmicos se pueden clasificar en dos grupos de mtodos distintos. El primer grupo tiende a disear su propia arquitectura de red dinmica en aplicaciones especficas. El segundo grupo lo forman las modificaciones a las estructuras y a los algoritmos de aprendizaje esttico, para incluir en ellos de manera explcita el nuevo parmetro tiempo y as poder representar la dinmica del sistema. Los retardos pueden ser introducidos en la capa de entrada o en las capas internas. Ejemplos de estas arquitecturas son: Time Delay NeuralNetworks (TDNN): Hopfield y Tank [451(1986) , Toma de decisiones y Optimizacin. Guyon y Albrecht [40] (1990), Reconocimiento de caracteres escritos a ma no. Redes Neuronales Recurrentes Rumelhart, Hinton y Williams [94] (1986), Completar secuencias. Williams y Zipser (1989), Reconocimiento de caracteres. Robinson y Failside (1988), Reconocimiento de voz.

1.1. IDENTIFICACIN

13

Memory NeuronNetworks Poddar [89] (1991):Reconocimiento de caracteres.


El segundo grupo est formado por las modificaciones a las estructuras y a los algoritmos de aprendizaje estticos para incluir en ellos el tiempo. Una de las ms conocidas es la red de la figura 1.6 que fue propuesta por Elman (1990). En ella se aprecia que la capa de entrada est dividida en dos partes ; el conjunto de entradas externas y una copia de la activacin de la capa oculta en el instante anterior.

Capa de entrada

Capa de salida y1

Neuronas auxiliares

y3

Fig. 1.6: Red conrealimentacin la CapaOculta. de

La red es de propagacin hacia adelante y al ajustar los pesos hay que tener en cuenta los pesos que van desde las entradas auxiliares a la capa oculta. Este tipo de red puede reconocer reproducir secuecias de periodos cortos de tiempo. Este tipo de red se utiliz para el reconocimiento de palabras generadas por una gramtica formal. Jordan propuso una arquitectura 1.7 donde la capa de entrada est dividida en dos partes: el conjunto de entradas exteas y la realimentacin de la activacin de la capa de salida a travs de conexiones de valor fijo.

14

1. FUNDAMENTOS ESTADODEL ARTE. Y

Capade entrada

Capa Oculta

y1 y2

y3

Fig. 1.7: Red con realimentacin de la Capade Salida.

Este tipo de red es utilizada para el reconocimiento y clasificacin de secuen cias. Fue sugerida por Jordan para su empleo en la generacin de trayectorias de robots. Ejemplos de otras arquitecturas dentro de ste grupo son:
.

Backpropagation in Dynamic Systems (BPD): [Narendra [84] (199 1)]:Identificaciny Control, Control por Modelo de Re ferencia. Propone la construccin de una segunda red llamada sensitivity model para el clculo en lnea de las derivadas de las salidas con respecto a los parmetros (matriz Jacobiana) y de las derivadas con respecto a las entradas. En el artculo, por lo dems explica con detalle el esquema propuesto para generar el gradiente.

Backpropagation through time (BTT): [Werbos [104] (1990)]: Identificacin, Camin remolque.

1.1. IDENTIFICACIN

El fundamento consiste en permitir a la red observar lo que ocurrir con el sistema durante un tiempo T de pasos futuros, para que pueda adaptar sus pesos en consecuencia. Debido a la duplicacin de unidades, los pesos y el coste computacional del entrenamiento, hacen que esta arquitectura no sea muy popular.

1.1.6 Identificacin Algoritmos con Genticos


La mayora de los mtodos usuales en la identificacin de sistemas estn basa dos en mnimos cuadrados o en el mtodo de mxima verosimilitud que son m todos locales guiados por el gradiente y necesitan una funcin de prdidas (loss function) diferenciable y un espacio de bsqueda suave. Esto tiene el inconveniente de que si las seales tienen ruido coloreado, como suele ser habitual en la prctica, los mtodos basados en mnimos cuadrados tienen el fracaso asegurado. Si adems estamos implementado el mtodo en lnea el ruido estar corre lacionado con los regresores y el mtodo explotar, fenmeno conocido como blow-up. Para evitar esto en algunos casos sencillos, se puede usar un factor de olvido muy prximo a la unidad, pero en la mayora de los casos de sistemas no lineales variantes en el tiempo esta tcnica falla. A menudo fallan en la bsqueda de ptimos globales cuando ste espacio de bsqueda es no diferenciable, o no lineal en sus parmetros. Los mtodos de op timizacin basados en algoritmos genticos pueden mejorar los resultados porque no utilizan las propiedades de diferenciabilidad o de ser lineal en los parmetros. En 1992, Kristinsson y Dumont [64] hicieron un primer estudio de la identi ficacin de sistemas y del control off-line.con algoritmos genticos de sistemas dinmicos continuos y discretos. Comprobaron que los algoritmos genticos son efectivos en ambos dominios y que es posible identificar directamente parmetros fsicos, o bien, polos y ceros. Hicieron simulaciones con sistemas de fase mnima y no mnima y de un sistema con dinmica no modelada. En 1993, Flockton y White [25] utilizan los algoritmos genticos para hacer otra identificacin off-line de polos y ceros con algunas pequeas mejoras. Posteriormente, en 1995, Tan, Li y Murray-Smith [99] usan los algoritmos ge nticos con simulated annelingpara hacer una identificacin off-line y la linea lizacin de sistemas no lineales, invariantes del tiempo con un modelo ARMAX. Utiliza esta tcnica de bsqueda para identificar los parmetros de un sistema des crito por un modelo ARMAX en variables de estado, en presencia de ruido blanco y para aproximar un sistema no lineal multivariable por un modelo en el espacio

16

FUNDAMENTOS ESTADODEL ARTE. 1. Y

de estados, lineal e invariante en el tiempo. En este mismo ao, Iba, de Garis y Sato [50] usan una tcnica numrica off une, que integra una bsqueda adaptativa de una estructura de rbol basada en programacin gentica y un mecanismo de ajuste local de parmetros empleando bsqueda estadstica. En la programacin gentica tradicional, la recombinacin causa frecuentes rupturas de los bloques de construccin y la mutacin puede causar abruptos cambios en la semntica. Para superar estas dificultades ellos implementan la programacin gentica tradicional con una bsqueda local hill climbing, usando un procedimiento de ajuste de parmetros. Todos estos mtodos trabajan off-line y precisan que el sistema sea invariante del tiempo. El ltimo adems utiliza un mtodo no paramtrico.

1.1.7 Identificacin Bucle en Cerrado


La Identificacin para el Control ha tenido notable inters en los ltimos aos (ver, por ejemplo, los artculos de Gevers [34], Lee [67], Van den Hof [23] y la tesis de Forssell [27]). El objetivo es encontrar modelos vlidos para un control adaptativo. El uso de experimentos en bucle cerrado es una de las caractersticas de stos mtodos. Otra de las razones para su utilizacin puede ser la inestabilidad de la planta. La finalidad de la identificacin en Bucle Cerrado es obtener buenos modelos del sistema en bucle abierto, a pesar de la realimentacin. Varios mtodos que dan estimaciones consistentes para datos en bucle abierto pueden fallar cuando se aplican de manera directa a la identificacin en bucle cerrado. Estos incluyen los anlisis espectral y de correlacin, el mtodo de la variable instrumental, los mtodos de subespacios y los OE (output error) con modelo de ruido incorrecto (ver la tesis de Forssell [27] y el artculo de Forssell y Ljung [28]). Consideramos el sistema y(t)
=

Go(q)u(t) +Ho(q)e(t)

(1.29)

con e(t) ruido blanco de varianza Xoy el regulador es u(t)


=

r(t)

F,(q)y(t).

(1.30)

El sistema en bucle cerrado puede ser escrito como:

y(t)

G0(q)S0(q)r(t) +S0(q)H0(q)e(t)

(1.31)

1.1. IDENTIFICACIN
y

17

Fig. 1.8: Sistema en bucle cerrado.

donde S0(q) es la funcin de sensibilidad, S0(q) = 1 1 +F(q)G0(q) (1.32)

Es importante saber que el mtodo de error de prediccin puede ser aplicado directamente, como si la realimentacin no existiera, y el resultado dar una pre cisin ptima si el sistema verdadero puede ser descrito dentro de la estructura de modelo escogida. Sin embargo, debido a las trampas a que nos puede llevar la identificacin en bucle cerrado, han sido sugeridos diversos mtodos alternativos. Se pueden clasificar en (ver el artculo de Gustafsson [41]): Procedimiento Directo: aplica el mtodo de error de prediccin y se Se identifica el sistema en bucle abierto usando medidas de la entrada y la salida. Procedimiento indirecto: Se identifica el sistema en bucle cerrado utilizan do medidas de la seal de referencia r y de la salida y y se usa esta esti macin para hallar los parmetros del sistema en bucle abierto utilizando el conocimiento del controlador. Procedimiento de Entrada-Salida conjuntas: Se identifican las funciones de transferencia de r a y y de r a u y se utilizan para hallar una estimacin del sistema en bucle abierto. y(t) _-G0q)S0(q)r(t)+S0(q)H0(q)e(t) u(t)= So(r(t) F(q)S0(q)H0(q)e(t)

(133)

El procedimiento de IdentificacinDirecta es el mtodo mas natural para hacer identificacin en bucle cerrado. Las principales razones son:

18

FUNDAMENTOS ESTADO 1. Y DEL ARTE.

Funciona bien a pesar de la complejidad del regulador y no requiere cono cimiento de la realimentacin. No se necesitan algoritmos ni software especiales. Se asegura la consisten cia y la precisin ptima siempre que la estructura del modelo contenga al sistema verdadero. Los problemas que plantea ste procedimiento son: Es necesario tener buenos modelos del ruido (ver teorema 8.4 en el libro de Ljung [69]). Un pre-filtro/model de ruido que cambie las caractersticas del ruido ver dadero produce sesgo. El problema bsico de los datos en bucle cenado es que contienen menos in formacin que cuando se toman los datos en bucle abierto, puesto que un impor tante propsito de la realimentacin es hacer al sistema en bucle cerrado insensible a los cambios del sistema en bucle abierto. Los mtodos de error de prediccin, aplicados de una manera directa, con modelo de ruido que puede describir las propiedades del ruido verdadero dan es timaciones consistentes y precisin ptima. Adems no se necesita conocimiento de la realimentacin. Por esto deben ser vistos como los mtodos de primera eleccin. Este procedimiento de Identificacin directa es el utilizado en esta tesis, te niendo en cuenta las precauciones anteriores.

1.2 Estimacin Estados de


Cuando el estado de un sistema tiene que ser estimado a partir de informacin sensorial con ruido, se necesita emplear algn tipo de estimador de estados para fusionar los datos de los diferentes sensores y producir una estimacin precisa del verdadero estado del sistema. Si la dinmica del sistema y el modelo de observacin son lineales, entonces el estimador de mnimos cuadrados puede ser calculado usando elfiltro de Kaiman.

1.2.1

Modelos el Espacio Estados en de

Un sistema dinmico puede ser tambin descrito por un modelo en el espacio de estados. El modelo en el espacio de estados de orden n de mltiples entradas y

1.2. ESTIMACIN ESTADOS DE

mltiples salidas (MIMO), no-lineal e invariante en el tiempo tiene la forma:

J
donde:

x(k+1)

=4(x(k),u(k)) y(k) =q(x(k))

(134

( (

x(k) =(xi(k),x2(k),...,x(k))T u(k) =(ui(k),u2(k),...,um(k))T y(k) =(yi(k),y2(k),...,yi(k))T

(1.3

x(k),u(k),y(k)son vector de estados, el vector de entradas y el vector de e el salidas, respectivamente. Si el sistema es lineal,

x(k+ 1)

Ax(k) +Bu(k)

36

y(k) =Cx(k)+Du(k)

)L

donde A, B, C y D son matrices(nxn), (mxn), (nxl) y (mxl) respectivamente. Estas estructuras sirven para modelar tanto sistemas lineales como no-lineales.

1.2.2 Laestimacin linealensistemas dinmicos El


-

Filtro de Kaiman
El problema estimacin de dinmica
Consideremos un sistema dinmico lineal en tiempo discreto descrito por una ecuacin vectorial en diferencias con ruido blanco Gaussiano aditivo que modela perturbaciones no predecibles. La ecuacin de estado es x(k+1) =F(k)x(k)+G(k)u(k)+v(k), k=O,1,... (1.37)

donde x(k) es el vector de estado de dimensin n, u(k) es el vector de entrada de dimensin nu(que es conocido), y v(k), k = 0, 1,..., es la secuencia de ruido blanco Gaussiano de media cero con covarianza E[v(k)v(k)] La ecuacin de medida es
-

Q(k)

(1.38)

z(k)=H(k)x(k)+w(k),

k=1,2,...

(1.39)

con w(k) secuencia de ruido de medida blanco Gaussiano de media cero con co varianza E[w(k)w(k)]=R(k) (1.40)

20

FUNDAMENTOS ESTADODELARTE. 1. Y

Las matrices F, G, H, Q,y R se suponen conocids y que pueden cambiar con el tiempo. En otras palabras, el sistema puede cambiar con el tiempo y los ruidos son no estacionarios. El estado inicial x(O)es en general desconocido y se modela como una variable aleatoria Gaussiana con media y covarianza conocidas. Las dos secuencias de ruido y el estado inicial se suponen mutuamente independientes. Las anteriores condiciones se llaman lineales-Gaussianas.

El algoritmo estimacin algoritmode estimacin comienza con una de El


estimacin inicial (OO) de x(O) y la covarianza inicial asociada P(OO) , que se supone disponible. Un ciclo del algoritmo de estimacin dinmica (filtro de Kalman) consiste en estimar a partir (kIk)=E[x(k)Z] que es la media condicional del estado en el tiempo k. dadas las observaciones hasta el tiempo k inclusive, y de la matriz de covarianza asociada P(kk) = E[[x(k) (kk)J[x(k)

(1.41)

kIk)]IZ]

(1.42)

las correspondientes variables del siguiente paso, (k + 1 k + 1) y P(k + 1 k + 1). Esto se puede hacer puesto que las variables Gaussianas quedan caracterizadas por sus dos primeros momentos.

1.2.3 El casono lineal:Filtros No-lineales


En el caso no lineal el problema de filtrado en el espacio de estados viene dado por x(k)=g(k,x(k1),a(k)),

z(k)=
donde (k) y ii(k) son los ruidos, que se suponen vectores aleatorios, indepen dientemente distribuidos:

(1.44)

(a(k) i(k)

((O (Q(k) O o O R(k)

(1.45)

1.2. ESTIMACIN ESTADOS DE

Estado Real

Entrada conocida

Estimacin del estado n estado del en [1maci

Clculo covarlanza de la
Covarianza estado del en P(klk)

Estado tk en x(k)

Control tk en

___________

u(k)

Transicintk+1 a x(k+1) 1 F(k)x(k) +G(k)u(k)

1
i

delestado Covarianza dela Prediccin (k+1lk) prediccin del estado P(k+lik)= F(k)x(klk) +G(k)u(k) F(k)P(klk)F(k)+Q(k)

Prediccin la de jnedida z(k+lIk)= H(k+1)x(k+lIk)

Innovacin dela covarianza S(k+1)= H(k+1)P(k+1)H(k+1)

1 1
-

Medida tk+1 en z(k+1) 1 H(k+1)x(k+1) 1 +w(k+1)

1 1
Actualizacinla de estimacin estado del (k+1lk+1) x(k+1 lk)+W(k+1)(k+1)

Innovacin Ganancia del W(k+1) Filtro n(k+1) k+llk)H(k+1)S(k+1) P(

z(k+1)-z(k+llk

dela Acalizadn covarianza estado del P(k+lik+1) 1k) P(k+1 -W(k+1)S(k+1)W(k+l)

Fig. 1.9: Diagrama de flujo del filtro de Kaiman.

La estimacin ptima implica la descripcin de la densidad de probabilidad condicional MMSE(kIk)


=

E(x(k) Zk)

x(k)p(x(k) Zk)dx.

(1.46)

Desafortunadamente, esta descripcin necesita un nmero infinito de parmetros. Por esta razn, un nmero importante de aproximaciones subptimas han sido propuestas. Estos mtodos utilizan aproximaciones analticas de las distribucio nes de probabilidad, la ecuacin de transicin de estados o la ecuacin de medida. Existen otros mtodos, tales como el mtodo de Montecarlo, que necesitan miles de puntos para aproximar la densidad de probabilidad condicional. En aplicacio nes con muchas dimensiones, stos ltimos mtodos no son prcticos. Por esta razn son necesarios mtodos con un nmero razonable de operaciones, tales co mo los estudiados en este trabajo.

22

FUNDAMENTOSYESTADODELARTE. 1.

1.2.4 Filtro Extendido Kaiman de (EKF)y Filtro No-lineal Segundo de Orden (SNF)
El filtro Extendido de Kaiman es similar a un filtro de Kaiman linealizado, con la excepcin de que la linealizacin es realizada en la trayectoria estimada en vez de hacerlo en una trayectoria nominal previamente calculada. Por esta razn, las funciones g(k, x(k 1), c(k))h(k, ,i(k)) desarrolladas en serie de Taylor y x(k) son alrededor de (klk) contrminos hasta primer o segundo orden para obtener l EKF o SNFrespectivamente. El desarrollo con trminos de segundo orden de la ecuacin de transicin es:

x(k) =g(k,x(k l),E(k)) g(k,(kk 1),O) +g(k,x(k l),E(k))(x(k 1)(k 11k1))+g(k,x(k 1),E(k))E(k) +e(x(k1)-x(k- 11k-l))g(k,x(kl),E(k))(x(k1)-(kl),c(k))e(k) 11k-1))

+ejc(k)(k,xk-

(1.47) y el desarrollo con trminos hasta segundo orden de la ecuacin de medida es: z(k) = h(k,x(k),Ti(k) h(k,(kk l),O) +h(k,x(k l),ri(k))(x(k 11k1))+h1(k,x(k 1) (k l),11(k))1(k) +ej(x(k1)-(k

11k-l))h(k,x(kl),i(k))(x(k1)-(k-

11k-1))

+Lej(x(k1)(k1Ikl))h(k,x(k1),(k)(k) (1.48) donde e es el 1th vector de la base Cartesiana.

1.2.5 Filtro extendido Iterado Kalman de (IEKF)


La prdiccin de la medida, hasta primer orden, es 2(klk 1) = h(k, (kIk 1). Hay errores-en -prediccinen usar x(klk 1) para x(k). Otros errores adicionales

1.3. VALIDACIN MODELOS DE

son debidos a la no linealidad en la medida. Es posible disminuir estos errores si el estado actualizado no es calculado como una aproximacin a la esperanza condicional sino como un estimador del tipo maximum a posteriori. La funcin de densidad de probabilidad condicional, PDF, de x(k) dado si todas las variables aleatorias son Gaussianas, es

p(x(k)Z)

= = =

p(x(k)lz(k),Zk_l) ip(z(k)Ix(k))p(x(kIZk_l))
9VXz(k);h(k,x(k)),R(k)) N(x(k);(kIk l),P(klk 1)) (1.49)

Maximizar esta funcin es equivalente a minimizar la siguiente

V(x(k))

(z(k)-h(k,x(k)))R(k)1(z(k) -h(k,x(k))) +(x(k)_(kIk_l))(P(kk_lY1(x(k)(kIkl))


=

(150)

El Filtro de Kaiman Extendido Iterado (IEKF) usa un algritmo Newton Raphson para estimar (kk). DesarrollandoV en srie de Taylor hasta segudo orden alrededor de la i-sima estimacin de x(k)da como resultado:

V=V+V(xx)+(xX)V(XX)
Poniendo el gradiente a cero:

(1.51)

=x (V)V

(1.52)

Esto da lugar a la ecuacin IEKF:

.!(kIk) =f(klk) +P(kIk)H(k)R(k){z(k) h(k,(kk))} P(kIk)P(kIk 1)((kk)(klk 1)), (1.53) withH(k),= h.(k,(klk))

1.3

Validacin Modelos de

Despus de la estimacin, la pregunta obvia es si el modelo que se ha deriva do s adecuado para el uso que se le pretende dar. ste es el difcil y subjetivo problema de la validacin. De acuerdo con Bohlin la mejor manera de atacar el

24

FUNDAMENTOS ESTADO 1. Y DEL ARTE.

problema es confrontar al modelo con todas las fuentes de informacin disponi bles, incluyendo el conocimiento previo, los datos experimentales y la experiencia usando el modelo. Para tener ms confianza en el modelo el consejo general es emplear tantas herramientas de validacin como sea posible. La primera forma concebible es el uso del sentido comn. Si, por ejemplo, un parmetr estimado representa la longitud de un eje, sta debe ser positiva. Otro ejemplo puede ser el nivel de un depsito. Los tests de ste tipo pertenecen a la categora del conocimiento previo y son especialmente importantes cuando los parmetros tienen algn significado fsico. La gran mayora de los mtodos estn basados en datos experimentales. Un test bsico consiste en calcular la varianza de los parmetros estimados. Una va rianza grande comparada con el valor del parmetro indica que algo est mal. Otra posibilidad es estimar varios modelos en paralelo. La respuesta en frecuencia del modelo paramtrico puede ser comparada con la respuesta espectral, por ejemplo. La herramienta de validacin ms verstil, en todas las categoras, es la si mulacin. El sistema verdadero y el sistema derivado se alimentan con la misma seal de entrada y se comparan las salidas. Para una buena comparacin es desea ble que el experimento se base en datos nuevos, es decir que no se hayan utilizado para la estimacin. Esto recibe el nombre de validacin cruzada. Tambin suele ser valioso investigar la secuencia de residuos {a(9jy)}, espe cialmente con datos nuevos. Una manera muy sencilla es representar grficamente estos residuos y comprobar si la secuencia resultante muestra el patrn de ruidos esperado. Conjuntamente con esto, para saber si los residuos son ms o menos blancos, puede ser estudiada su covananza muestral

R(t)

N-t

E(t,N)E(t+tN),

que para t> Odebe ser pequeo, al menos si N es grande. Adems la inde pendencia entre la entrada y la salida puede ser comprobada representando

R(t)=

min(N,Nt) t=max(1,1t)

para varios retardos t. stos deben ser tambin pequeos, puesto que de lo contrario, hay ms informacin en la salida del sistema real, originada por la en trada. Lo que significa que todava existen dinmicas no modeladas.

1.4. CONTROL ADAPTATIVO

25

1.4 Control Adaptativo


Los roblemas de control en los sistemas no-lineales han sido extensivamente estudiados el pasado. No obstante, existe un gran inters en la comprensin de la conducta de los sistemas no-lineales en cuanto a la modelizacin e identifi cacin de la estructura y de los parmetros de tales sistemas cuando se disea un controlador adaptativo.

Fig. 1.10: Sistema adaptativo con identificacin de modelo (MIAS)

El Control adaptativo trata el problema de controlar la salida de la planta en presencia de incertidumbres paramtricas o estructurales. En el control adaptativo tradicional, para conseguir que un problema fuera tratable, la planta se supona lineal con parmetros desconocidos. Se escoga una estructura de controlador, y los parmetros se ajustaban escogiendo una ley adaptativa, de modo que la salida de la planta siguiera a la referencia asintticamente. Desde el principio de la tecnologa de control adaptativo, se han propuesto dos clases distintas de controladores adaptativos. En el indirecto, los parmetros de la planta se estiman y se ajustan en base a los datos de entrada-salida. En el directo, los parmetros del controlador se ajustan directamente en base a los datos de entrada -salida. Existen una gran variedad de esquemas adaptativos dentro de estas dos clases, tales como el Model Reference Adaptive Control (MRAC), Self-Tuning Adaptive Control (STAC), Self-Organizing Fuzzy Logic (SOFLIC), Neural Networks (NN), y Neurofuzzy Adaptive Control (NAC). Para los procesos cuyos parmetros varan lentamente en el tiempo, los con troladores adaptativos con realimentacin pueden ser divididos en dos grandes grupos. Los sistemas adaptativos con identificacin de modelo (MIAS) determi

26

1. FUNDAMENTOS ESTADO Y DEL ARTE.

Fig. 1.11: Sistema adaptativo con modelo de referencia (MRAS)

nan un modelo del proceso las medidas de entrada-salida y mtodos de identifica cin. Aqu los parmetros son calculados de acuerdo con el mtodo de diseo del controlador que ha sido programado con anterioridad. Esta clase de reguladores adaptativos tambin es denominada self tuning regulators. Los sistemas adaptativos con modelo de referencia (MRAS) intentan obtener una respuesta en bucle cerrado prxima a la dada por el modelo de referencia para la seal de entrada. Aqu una seal externa, por ejemplo la variable de referencia, es medida y la diferencia entre las seales se forma usando las seales del bucle de control y del modelo de referencia y cambiando los parmetros del controlador por medio de un mtodo adaptativo. A lo largo de esta tesis hemos utilizado controladores adaptativos con identi ficacin de modelo(MIAS).

2. CONCEPTOS BSICOS LOSA.G. DE


2.1 Algoritmos Genticos

Introduccin Los algoritmos genticos son mecanismos de bsqueda basados en las leyes de la seleccin natural y de la gentica. Combinan la supervivencia de los individuos mejor adaptados junto con un intercambio aleatorio de informacin, lo que le da al algoritmo un aire de bsqueda biolgica. Los algoritmos genticos hansido desarrollados por John Holland y su equipo de estudiantes de la universidad de Michigan. Las metas que se proponan eran: explicar rigurosamente los procesos adaptativos y disear nuevos sistemas artifi ciales que sigan manteniendo los mecanismos de los sistemas naturales. Para ms detalles se pueden consultar [Goldberg 91] y [Davis 89]. Se parte, inicialmente, de un conjunto de individuos, la poblacin, y de una funcin que evala su eficacia para el problema concreto y que es la funcin que se desea optimizar. Al valor que se asigna a cada individuo a partir de esta funcin se le denomina salud.

John Holland, (1975).Adaptation in naturaland artificial systems. Algoritmos que manejan poblaciones consistentes en

soluciones codificadasde problemas. La bsqueda de buenas soluciones es realizada en el espacio de solucionescodificadas. Manipulacin de poblaciones: seleccin, cruce y mutacin.

Fig. 2.1: Algoritmos Genticos.

En cada generacin un conjunto de nuevos individuos se forma utilizando par-

28

2. CONCEPTOS BSICOS LOSA.G. DE

tes de la informacin de los cromosomas de los individuos mejor adaptados de la generacin anterior. Los algoritmos genticos no son slo una simple bsqueda aleatoria, ya que utilizan de forma eficiente la informacin histrica de las g neraciones anteriores para indagar nuevos caminos de bsqueda que mejoren los resultados anteriores. Las caractersticas principales son: Los algoritmos genticos no trabajan directamente con los objetos, sino con la codificacin de esos objetos, que pueden ser un nmero, un conjunto de parmetros, etc. A esta codificacin le llamamos cromosoma. Concreta mente, en nuestro trabajo, hemos representado a cada individuo por un cro mosoma definido por una sucesin de Oy 1, que representan los coeficientes del modelo paramtrico. Los algoritmos genticos realizan la bsqueda mediante toda una genera cin objetos, no buscan un nico elemento.

Los algoritmos genticos utilizan una funcin objetivo que nos da la infor macin de lo adaptados que estn los individuos, y no las derivadas u otra informacin auxiliar.
Espacio de b(isqeda de soluciones

Fig. 2.2: Bsqueda Gentica.

Las reglas de transicin son probabilsticas, no determinsticas.

Los mecanismos de los algoritmos genticos simples son sorprendentemen te fciles, dado que los mecanismos que utiliza son el mecanismo de copia y el de intercambio de partes de las cadenas de cromosomas.

2.1. ALGORITMOS GENTICOS

El por qu este mecanismo funciona es algo ms sutil, y el efecto combinado de simplicidad de la operacin y la potencia de su efecto son dos de las principales atracciones de la aproximacin mediante algoritmos genticos. Algunos de los principales atractivos de los algoritmos genticos como mtodo de optimizacin son: Se pueden utilizar como mtodo de optimizacin global o semi-local, segn interese.

Cromosoma

Fenotipo

Poblacin

r 1

1I11 1t111111111Decodificacin 1 Evaluacin

2.9865

1
t

Funcin de salud

Fig. 2.3: Terminologa de los Algoritmos Genticos.

No hace uso de ningn gradiente, ni conceptos similares. Por lo que se pue de usar con seales con mucho ruido, en las que no tiene sentido las ideas asociadas a la derivada. No obstante, si las funciones son derivables, los al goritmos genticos se pueden usar en la primera fase de minimizacin, para encntrar las cuencas de atraccin, y a continuacin utilizar, por ejemplo, un mtodo basado en el gradiente. Se pueden utilizar en lnea.

Los principales inconvenientes son:

El nmero de operaciones y por tanto el coste computacional puede ser muy alto si no se toman precauciones. No hay ninguna teora matemtica hasta el momento, que nos asegure l convergencia. Se puede emplear fcilmente computacin en paralelo.

30

2. CONCEPTOS BSICOS LOSA.G. DE

SeIecin

Fig. 2.4: Ciclo de los Algoritmos Genticos.

Como es lgico, este tipo de mtodos son apropiados cuando trabajamos con funciones que no son suaves y no son convexas y que no se deben aplicar a casos sencillos en que son ms rpidos y precisos otros mtodos, como los basados en el gradiente. Son los AG un intercambioaleatoriode bits?Quhay detrs? Holland cre un teoremallamado teoremade los esqumes de Holland. Existen ofros teoremas,algunos de ellosbasados en el
anlisis de las cadenas de Markov: Es una cadena de diferentessolucionesque 1)ennite encontrar la

solucin ptima?

Fig. 2.5: Cmo funcionan los Algoritmos Genticos?

2.1.1 vAlgoritmo Gentico Simple


En un algoritmo gentico la informacin ha de codificarse para poder trabajar adecuadamente con ella. Existen numerosos sistemas de codificacin, aunque nosotros utilizaremos uno de los ms sencillos: el cdigo binario natural. Este cdigo a pesar de su simplicidad cumple la teora de los esquemas de Holland en cuanto a tener el menor nmero posible de caracteres (o alelos): nicamente dos. Una vez definido el sistema de codificacin a emplear vamos a ver como actan los operadores bsicos de seleccin, cruce y mutacin sobre este cdigo.

2.1. ALGORITMOS GENTICOS

31

Seleccin: Supongamos una poblacin de puntos codificados en cadenas bina


rias (limitamos el tamao de la poblacin a cuatro muestras):

2*7

1,5,2,8,2,1,1,7

Fig. 2.6: Mtodos de seleccin.

Individuo Codificado Valor(Fenotipo) Salud asociadj


01101 10100 13 20 4 7 169 400 16 49

00100
00111

Tab. 2.1: Fenotipos y salud asociada.

El valor decimal (fenotipo) de cada cadena codificada as como la salud que nos devuelve la funcin problema F(x)=x2 estn reproducidas en la tabla anterior. Vamos a definir la probabilidad de seleccin de cada individuo como el cociente entre su salud y la suma de la salud de todos los individuos (salud global, de manera que aquellos individuos con mayor salud tengan un mayor porcentaje de seleccin. El nmero de veces esperado que cada cadena sea seleccionada para reproducirse no es ms que su probabilidad por el tamao de la poblacin (as el tamao de la poblacin generada ser igualmente de cuatro muestras.

32

2.

CONCEPTOS BSICOSDE LOS A.G.

Individuo Probabilidad N Copias Esperad5] 01101 169/634= 0,27 1,1 10100 400/634= 0,63 2,5 00100 16/634= 0,02 0,1 00111 49/634= 0,08 0,3

Tab. 2.2: Nmerode copiasesperado.

El mecanismo de seleccin, de manera grfica, es como sigue: supongamos una ruleta dividida en cuatro porciones proporcionales a la probabilidad de cada individuo, donde al individuo de mayor salud (mayor probabilidad) se le asigna la mayor porcin. Si elegimos un punto de la ruleta al azar, s te estar comprendido dentro de una de las porciones (cuanto ms grande sea la porcin ms probable es que el punto elegido al azar caiga dentro de ella), seleccionando para la reproduccin al individuo asociado a la misma. As, los individuos de mayor salud (mayor porcin) tienen una mayor pro babilidad de ser seleccionados, mientras los de poca salud (poca porcin de ruleta) corren una suerte contraria.

DInd: 10100 Ind: 01101 DInd: 00111 DInd:00100

Fig. 2.7: Funcinde salud.


El nmero de veces que debemos repetir el proceso de la ruleta es igual al tamao de la poblacin que deseamos generar, dado que por cada pareja de padres seleccionados obtendremos en la reproduccin una pareja de hijos. Cruce Una vez seleccionados dos padres, el cruce ocurre con una probabilidad Pc (entre Oy 1, normalmente 0,4 a 0,6) fijada de antemano en el algoritmo. Si se cumple Pc hemos de elegir al azar un punto de cruce en las cade nas binarias que representan a los padres, de manera que obtengamos por combinacin dos individuos hijos con la misma longitud de cadena que los padres. En el caso de no cumplirse la probabilidad de cruce tendramos dos hijos exactos a los padres.

2.1. ALGORITMOS GENTICOS

33

1-puntodeCmce

Cruceuniforme

LS III 1 fi fil III


111001011001

lIlfihlIfilMIl

H fil

SI

rl

fi H i

LS

i i

Fig. 2.

Cruce.

Por ejemplo, si en la seleccin tenemos como padres a los individuos 10100 y 00111, con una probabilidad de cruce Pc=0,6 y en una tirada al azar entre O y 1 obtenemos un 0,3 ponemos en marcha el mecanismo de cruce, de biendo elegir al azar un punto de cruce en las cadenas (en nuestro caso ste debe limitarse entre las posiciones 1 y 4, donde existe cadena binaria). Si conseguimos, por ejemplo, un 3 al azar y contamos de derecha a izquierda, los padres quedaran divididos en dos subcadenas por el tercer bit:

l0l0O*101100PADRE1

II

r00l11001111PADREfl Tab. 2.3: Cruce

Los hijos resultarn de una combinacin de estas cuatro subcadenas: el primer hijo contendr los tres primeros bits del Padre 1 y los dos ltimos del Padre 2, mientras el segundo hijo llevar la informacin relativa a los tres primeros bits del Padre 2 y los dos ltimos del Padre 1.

Hay que notar que en este mecanismo no se consideran como posibles pun tos de cruce el bit Oy el bit 5 (extremos de las cadenas), ya que tendramos

34

2.

CONCEPTOS BSICOSDE LOS A.G.

Hijo 1 + Hijo2+

PADRE 1 PADRE2 +OOL.. 100 +.j111 10 Tab. 2.4: Cruce

00100 10111

como hijos copias idnticas de los padres, lo que equivaldra a no haber cruce. Mutacin: El operador de mutacin, encargado de mutar alelos para conseguir una mayor riqueza gentica y no perder informacin, acta en nuestro al goritmo gentico bsico bajo una probabilidad de mutacin Pm fijada de antemano (de valor muy bajo). Cada vez que generemos nuevas poblaci nes, tras el mecanismo de cruce debemos correr el de mutacin para todos los alelos de cada individuo. Si se cumple Pm el alelo cambia de valor, de O a 1 y viceversa.

IE

Fig. 2.9: Mutacin.

Supongamos uno de los individuos generados en el ejemplo del mecanismo de cruce bsico: 00100, mediante tiradas al azar chequeamos una posible mutacin en cada alelo con una Pm dada (por ejemplo de 0,01). Si se produce mutacin en el alelo 1 y en el 3, la cadena binaria quedara modificada como sigue: 00001, cambiando as el fenotipo del individuo (originalmente corresponda al valor 4; tras la mutacin ha pasado al valor 1). Esto habra que repetirlo con toda la poblacin generada.

2.1. ALGORITMOS GENTICOS

2.1.2

Mecanismos Avanzados

Reescalado:Un problema frecuente en los algoritmos genticos es el de la con


vergencia prematura, donde se tiende a alcanzar un valor muy cercano al ptimo buscado en las primeras generaciones, para mantener despus este valor a lo largo de la simulacin sin llegar al mejor resultado posible. Es te fenmeno es debido a una alta competitividad inicial entre individuos, permitiendo a aquellos con una salud excepcional dominar sobre el resto, y a un decremento de sta en generaciones posteriores, al irse hacinando la poblacin en intervalos cada vez ms reducidos. Contra esta convergencia prematura existen mecanismos de reescalado con sistentes en modificar la salud de los individuos para optimizar en cada mo mento su competitividad, a fin de lograr una solucin de equilibrio entre competitividad y eficiencia.

Rescalado lineal: es el ms utilizado y simple. La salud escalada viene defini


da por:

f=af+b
con f la antigua funcin de salud. Siendo Cmuit nmero esperado de el copias del mejor individuo de cada poblacin, las constantes a y b se eligen segn:

(2.1)

Cmuit fmedia

(2.2)

f,nedia

fmedia

(2.3)

De esta manera reducimos el intervalo de salud en las primeras generaciones (disminuyendo su alta competitividad) y lo aumentamos en las ltimas (ele vando la baja competitividad), logrando una mayor eficiencia y retardando la convergencia. El problema del reescalado lineal aparece en aquellas situaciones en que es necesario disminuir la salud de individuos con una salud de por s baja respecto a la media. En este caso puede ocurrir que los nuevos valores escalados sean negativos. Para prevenir esto limitamos la salud escalada mnima a cero.

36

CONCEPTOS BSICOSDE LOSA.G. 2.

Reescalado por desviacin tpica: sugerido Forresten 1985,utiliza la des por viacin tpicade la poblacinparadefinir la funcinde reescalado:
=

f (f

c a)

(2.4)

donde la constantec toma un valor mltiplo de la desviacintpica a, nonnalmente entre1 y 3. Reescalado por potencias: Gules,en 1985,experimentcon otro mtodode reescaladodondela saludescalada quedaba comopotenciade la saludori ginal: La variablek depende problemaen particular,siendonecesario del modifi carla a lo largode la simulacin.

OtrosMtodos SeIeccn de
Adems del mecanismo bsicode seleccin,implementadoen el algoritmo gentico simple, existenotrasversionesmscomplejasy especializadas. Entre ellas cabedestacar:

Muestreo estocstico reemplazo: esel mtodode seleccinexperimenta sin do por De Jongen su algoritmode pruebaR3,basadoen valoresesperados de seleccin. Muestreo determinstico: cadaindividuo es seleccionado nmerode veces un igual a la parteenterade su valor de copiasesperado (pseieccjonfl), comple tando la poblacincon aquellosindividuoscuya parte fraccionariade este valor seamayor. Muestreo estocstico permanente con/sin reemplazo: tienengranparecido al mtodoanterior(determinstico) aunque difierenen el modode completar la poblacindeseleccin.Enel muestreo estocstico permanente reem con plazo la parte fraccionariadel valor esperado copiassirve para calcular de el pesoque cadaindividuo tendren una seleccinbsicapor ruleta. Por otra parte,en el muestreo estocstico permanente reemplazo, sin estas par tes fraccionarias utilizan directamente se comoprobabilidades seleccin de a la horade completar poblacin. la

2.1. ALGORITMOS GENTICOS

Muestreo estocsticopor competicin:sugeridoBrindieporWetzel 1983. a en


Inicialmente se realiza una seleccin de pares de individuos por el mecanis mo bsico, calculando las probabilidades de seleccin de la manera habi tual, para despus introducir en la nueva poblacin el individuo con mayor salud de cada pareja, desechando el otro. Aunque Brindle en sus estudios no pudo concluir cul de los anteriores era el mejor mtodo (todos tenan parecida eficiencia, aunque siempre superior al mecanismo bsico de seleccin), Booker (1982) demostr en investiga ciones sobre aprendizaje automtico la superioridad del muestreo estocsti co permanente sin reemplazo.

Representacin y Dominancia Dual


Si observamos la naturaleza gran parte de las especies asocian su genotipo a un par de cromosomas, donde ciertos alelos (dominantes) dominan sobre otros (recesivos), de manera que el fenotipo se dtermina por combinacin de estos dos cromosomas y por predominio de alelos. Esta representacin dual permite a los individuos tener memoria de informacin gentica pasada, y que puede ser de utilidad en cualquier otro momento. La dominancia se encarga de seleccionar de entre esta informacin la que se precisa en el momento actual. As, si se produjera un cambio brusco en el medio ambiente de una especie, ciertas combinaciones genticas que la sirvieron en el pasado podran ser de nuevo las que determinasen su supervivencia. En el siguiente ejemplo hemos representado los dos cromosomas que definen al individuo como una cadena de genes que pueden tomar valores dominantes (G mayscula) o recesivos (g minscula). El nmero que los acompaa marca su posicin dentro del cromosoma.
/

Cromosoma 1: {... g4 G3 G2 gil


*

Individuo Cromosoma 2: {... G4 g3 G2 gil /

dominacingil {G4 G3 G2 expresado) (Crom.

El cromosoma expresado es aquel que resulta de combinar el cromosoma 1 y el 2 aplicando el mecanismo de dominacin: G4 del cromosoma 2 domina frente a g4 del cromosoma 1, resultando que en la posicin 4 del cromosoma expresado tendremos G4 En el caso de los genes de la posicin 1 los dos son recesivos por lo que no dominara ninguno de ellos, resultando que el primer gen del cromosoma expresado sera el gi.

38

CONCEPTOS2. BSICOSDE LOSA.G.

La representacin dual es de gran efectividad en entornos cambiantes con el tiempo, donde aumenta la eficiencia y adaptacin del algoritmo, mientras en entomos invariables no se perciben cambios significativos con el uso de este meca nismo gentico. En la historia de los algoritmos genticos, estos operadores fueron utilizados por Bagley, Holistien, Holland y Brindie. Bagley incluy en cada gen de la pareja de cromosomas un indicador de do minacin junto a la informacin codificada del fenotipo del individuo. Holistien (1971) desarroll un sistema de dominacin triallico para cdigos binarios intro duciendo tres alelos, el 1, equivalente a un 1 dominante, el -1, equivalente a un 1 recesivo y el Oque tambin es recesivo. El mapa de dominacin es el siguiente:

0 0 0 -1 0 1 1

-1 0 1 1

1 1 1 1

Tab. 2.5: Mapa de dominacin.

Brindie experiment con otros modelos de dominacin: Dominacin variable y global: la probabilidad de dominacin de un 1 O se determina a partir de su proporcin en la poblacin actual. Con estas proba bilidades y mediante pruebas de Bemouilli obtenemos los alelos resultantes para cada gen de los cromosomas. Dominacin determinstica. variable y global: el alelo dominante es aquel con mayor proporcin en la poblacin actual. Seleccin aleatoria de un cromosoma: se seleccionan como alelos dominan tes en sus respectivas posiciones todos los de un cromosoma elegido al azar de entre la poblacin. Dominacin del mejorcromosoma : de cada pareja de cromosomas de un in dividuo tomamos como alelos dominantes los de aquel cromosoma con ma yor salud.

2.1. ALGORITMOS GENTICOS

Dominacin controladapor un tercer cromosoma:el mapa dominacin de se


incluye para cada individuo en un tercer cromosoma, de manera que se pue da adaptar en las sucesivas generaciones. Este modelo tiene el inconvenien te de no tener en cuenta las relaciones que pudieran establecerse entre los genes funcionales (correspondientes al genotipo) y aquellos que determinan la dominacin. En los sistemas biolgicos las leyes que rigen qu alelos y en qu momento son dominantes/recesivos estn ntimamente ligadas a la informacin gentica del individuo, y por tanto resulta inadecuado separar los genes de dominacin de los funcionales. Inversin: El operador de inversin acta permutando las posiciones de los ge nes dentro de las cadenas codificadas de informacin que representan a los individuos. Se trata de un mecanismo de reordenacin que intenta encori tiar las mejores combinaciones posicionales de alelos, evitando la prdida de informacin. Su implementacin en los algoritmos genticos consiste en invertir la po sicin de un par de alelos seleccionados a partir de puntos de cruce. As, elegimos al azar dos puntos de inversin de la cadena binaria, que queda dividida en tres subcadenas, permutando las posiciones del primer y ltimo alelo de la cadena central.
puntos de cruce Cromosoma: (...g6IgSg4g3Ig2gl}
{...1IO11I1O}
*

inversin

-+

(...g6Ig3g4g5Ig2gl} {...1I11OI1O}

Hay que notar que, aunque debido al cdigo de representacin utilizado en nuestro algoritmo gentico la inversin modifica el fenotipo del individuo, en los sistemas naturales la informacin contenida en los genes es independiente de su posicin en el cromosoma y la inversin no tiene efecto alguno sobre su salud. Un problema asociado al mecanismo de inversin en cdigos binarios es el de cruce entre cromosomas no homlogos. Si cruzamos dos cromosomas no ho mlogos a los que se haya aplicado la inversin, puede ocurrir que las cadenas resultantes no contengan el mapa gentico completo, reduciendo as la efectivi dad del mecanismo de cruce.
Cromosomal(invertido):(...g6g3g4g5g2g1) Cruce Cromosoma2(invertido): ... g6g5g3g4g2g1)
/ {... /

g6g3g3g4g2gl}

{...g6g5g4gSg2gl)

En este ejemplo, debido a la recombinacin de los genes por la inversin, los cromosomas resultantes tras el cruce no contienen a todos los genes (del gi

40

CONCEPTOS 2. BSICOS LOSA.G. DE

al g7) sino que algunos se encuentranrepetidos. As, podemos haber perdido informacin dado que estos cromosomas poseenel mapa genticocompleto. no Bagley (1967)propuso restringirlos cruces a cromosomashomlogospara evitar este efectoindeseado.En 1972Frantz estudidos modelosde inversinen funciones con distintosgradosde no linealidad:

Inversin lineal: inversinsimple(anteriormente explicada). Inversin lineal y extrema: asignuna probabilidadde 0,75 a la inversin lineal, si sta no se cumpla poda sucederuna inversinde los alelos ex tremos del cromosoma(primeroy ltimo)con probabilidad 0,125. Esta va riante intentabacontrarrestar hechode que la inversintiende a permutar el alelos centralesfrente a los situadoscerca de los extremos. Frantz utilizestos modelossegndos modosde funcionamiento: Inversin continua:el mecanismode inversinse activasegnuna ciertaproba bilidad pj y se aplicaa cadanuevoindividuoen cuantoes generado. Inversin masiva: no se aplica la inversin hasta que se ha generado toda la poblacin, para despusutilizarlos dos mismospuntosde cruce (inversin simple) en la mitadde sta. Para evitar los problemasde cruce entre cromosomasno homlogos,Frantz experiment con cuatro sistemas: Cruce restringido: limitamosel cruce, tal como Bagleysugiri, a cromosomas homlogos. Cruce por viabilidad: no se restringeel cruce,aunque si las cadenasresultantes no incluyentodo el mapa genticose desechan. Cruce por patrones: tras seleccionardos cromosomasse aplica la inversin a uno de ellos (al azar), y segn el patrn de ste se invierteel segundo. El cruce se realiza,posteriormente, la manerahabitual. de Cruce por patrn del mejor cromosoma: parecidoa la varianteanterior,pero el cromosoma defineel patrn de inversines el de mayor salud. que

2.2.ALGORITMOS GENTICOS CONPARMETROS CONTINUOS41

2.2 Algoritmos Genticos parmetros con continuos


Esta tcnica ha tenido en los ltimos aos una gran difusin y resuelve el problema de la cuantizacin que se daba en los algoritmos tradicionales. Con la codificacin binaria en los algoritmos genticos es que normalmente no se aprovecha toda la precisin del ordenador. Cada parmetro necesita muchos bits para representarlo completamente. Que se puede hacer si se quiere usar toda la precisin posible? Una posible respuesta es representar los parmetros en coma flotante. Cuando la variable es continua, sta es la manera ms natural de representar los nmeros. Adems se tiene la ventaja de que se requiere un menor tamao de memoria que para el almacenamiento en binario. Uno puede, en principio, utilizar cualquier representacin concebible para re presentar los parmetros. Cuando los parmetros estn naturalmente cuantizados, los algoritmos genticos binarios se ajustan bien al problema. Sin embargo, cuan do los parmetros son continuos es mas lgico representarlos por nmeros en coma flotante. Adems, como los algoritmos genticos binarios tienen su representacin li mitada a la representacin binaria de los parmetros, utilizando nmeros reales se consigue la precisin de la mquina de manera senilla. Otra de las principales ventajas de los algoritmos genticos con parmetros continuos es la rapidez, ya que los operadores no suelen trabajar a nivel de bit como en el caso binario, sino que se trabaja a nivel de todo el nmero en coma flotante: Seleccin Se ordenan los cromosomas con arreglo a su salud y nos quedamos con los mejores miembros de la pblacin. Cruce En los mtodos ms simples se escogen uno o ms puntos en el cromosoma para marcar los puntos de cruce. Entonces los parmetros entre estos puntos simplemente se intercambian entre los dos padres. Mutacin Con una cierta probabilidad, que suele estar comprendida entre un 1% y un 20% se seleccionan los cromosomas que van a ser mutados. A continua cin se seleccionan aleatoriamente los parmetros del cromosoma que van a ser mutados. Finalmente cada parmetro a mutar es reemplazado por otro nuevo parmetro aleatorio o bien se le suma otro nuevo parmetro aleatorio.

42

CONCEPTOS2. BSICOSDE LOS A.G.

3 ESTUDIOMATEMTICO LOS A.G. DE


Es natural modelar los Algoritmos Genticos como procesos o cadenas de Markov en los que el estado de un Algoritmo Gentico est dado por el contenido de la poblacin actual. Uno puede imaginar el espacio de estados de todas las posibles poblaciones y estudiar las caractersticas de las trayectorias de la poblacin (las cadenas de Markov) que un Algoritmo Gentico produce a partir de poblaciones generadas aleatoriamente.

3.1

Introduccin procesos Markov a los de


. .

Consideremos un proceso que puede ser descrito en cada paso por uno de los N estados distintos i1,j2,. , i. En cada paso el sistema puede cambiar de estado (o permanecer en el mismo) de acuerdo con un conjunto de probabilidades de transicin. Cuando estas probabilidades slo dependen del estado de partida y de llegada y no de los estados anteriores, se dice que el proceso es de Markov.

Definicin 3.1 .1: Un proceso estocstico {Xk}, k=l,2,... con un espacio de esta
dos .5 = {i1, j2 i3,... los estados i1, i2,. p(X
=
. .

iN} N

es un proceso (cadena) de Markov si para cada ny todos

es cierto que
= =

i1)

p(X

i_1) =

(3.1)

Esta propiedad es equivalente a la ecuacin p(Xo


=

i0,...,X

if1) =p(Xo=

io)p(Xi

=iiIXo = i0)...p(X

iIx_i

(3.2) y tambin a la ecuacin

p(ABXn

j)

p(AX

j)p(BlX

i)

(3.3)

44

ESTUDIO 3. MATEMTICO LOSA.G. DE

donde A es un suceso arbitrario definido por los resultados de los pasos 0, 1,.. , n 1 y B es un suceso definido por los resultados de los pasos n + 1,n +2Esta ecuacin se describe a menudo como la independencia entre elfuturo y el pasado si el presente es conocido. En el caso de la caso de las cadenas de Markov, el sistema est descrito por una matriz P de dimensiones N x N que da la probabilidad de transitar del estado i en el tiempo t 1 al estado j en el tiempo t.
.

P(i,j)(t)

= p,(t)

P(X

i)=

(.4)

donde X es la variable aleatoria de la cadena de Markov. Los valores Pi,j(t) definen la matriz P(i, j) (t) de probabilidad de transicin de un estado a otro en un paso de tiempo. Definicin 3.1 .2: La probabilidad de ir del estado i al estado j en el paso t se llama probabilidad de transicin Pu (t). Si la probabilidad de transicin es inde pendiente de t, la cadena de Markov de llama homognea. Vamos a estudiar solamente cadenas de Markov homogneas en un espacio S = { u , j2,. , i, } finito,por tanto, las probabilidades de transicin vienen dadas por una matriz de transicin P = (pij) que verifica Puf 0, Vi = 1,2,. , n, Vj = 1,2,.. , n. A las matrices con estas propiedades se las denomina estocsticas. La mtriz de transicin en n pasos es la n-sima potencia de P:
.. . . .

(n)
=

(n)
=

PX1

= 1)

(3.5)

Se verifica la ecuacin
(n+m)
=

Vn Vm 0,

(3.6)

que es llamada ecuacin de Markov. Tambin puede ser escrita en forma matricial como
p(ln+n)
=

p(m)p(n)

(3.7)

Es tambin posible calcular las probabilidades condicionales sobre un conjun to de estados J: p) =p(X1 EJlXt_=i)=

LY
jEJ

(3.8)

3.2. CLASIFICACIN ESTADOS DE

3.2 Clasificacin estados de


Definicin 3.2.1: Un estadoj es accesible desde un estado i cuando se puede ir de i aj en un nmero finito de pasos. Desde el punto de vista de la matriz de transicin, esta definicin implica ijsiparaalgnn,P17 z +j

>0.
(n)

si para algun n y algun m,

Oy P, >

(m)
>

0.

En ste ltimo caso se dice que los estados i y j se comunican. Proposicin cia. 1. Reflexividad: i

3.2.1: La relacin de comunicacin es una relacin de equivalen

j, j

ya que p
-+

2. Simetra: Si i +4

entonces j
+

i. Es inmediato, a partir de la definicin. k entonces i


-*

3. Transitividad: Si i j y j inmediata de la definicin.

k. Tambin es aplicacin

Definicin 3.2.2: Si una cadena de Markov tiene todos sus estados en la misma clase de equivalencia, se dice que es irreducible. En una cadena de Markov irreducible hay una probabilidad positiva de un estado a cualquier otro estado. Definicin 3.2.3: Una cadena de Markov es aperidica si el mximo comn divisor de m para Pm(j,

j)

> 0,Vx

es 1. El complementario es llamado cadena

de Markov peridica, y en tales procesos existen estados que no comunican para ciertos nmeros de pasos.

46

ESTUDIOMATEMTICO LOSA.G. 3. DE

Definicin 3.2.4: Una cadena esa la vez aperidica e irreducible se llama que regular. Definicin 3.2.5: Un estado llamatransitoriosi hay unaprobabilidadpositiva se de que el procesono vuelvaal estadoi. Definicin 3.2.6:

f=

probabilidad queempezando el estado el proce de en i,

so vuelvaa i por primeravezen n pasos. Definicin 3.2.7:

(3.9) Definicin 3.2.8: Un estadosellamarecurrente cuandoel regreso l esel su a ceso seguro. Definicin 3.2.9: La esperanza matemtica nmerode pasosque senecesi del tan paravolver al mismoestadosellamatiempode recurrencia.
,1u

(3.10)

Definicin 3.2.10: UnestadoesabsorbentecuandoP= 1. Est claro quesi un estado absorbente, es entonces recurrente. es

3.3 Algritmos Genticos Cadenas Markov y de


Los algoritmosgenticos mssencillosy extendidos consisten una po en blacin de n cadenas bits de longitud 1,a la que aplicamoslos operadores de de seleccin,mutaciny cruce. Sea N el nmerode posiblespoblaciones.El nmerode posiblescadenas es r = 21.

3.3.ALGORITMOS GENTICOS CADENASDEMARKOV47 Y

Vamos a considerar el algoritmo gentico como cadena de Markov, para lo cual cada estado va a estar formado por (Xl ,X2, ,Xr), siendo x el nmero de soluciones de tipo i en la poblacin en el tiempo t. Se debe cumplir que xi + + Xr = N, siendoN el nmero de elementos de la poblacin. El espacio muestra! ser
...

S[1]=X(xl,x2,...,xr): xi+...+Xr=NyXiEN,Vi=l,...,1 (N+rl

(3.11)

Proposicion
21.

3.3.1: El cardinal de S[l] es (S[1])=

siendo r J

r1

Tab. 3.1: El nmerode estadoscomo funcin de ly P. N


a Longitud de la caden (1) P 1 2 3 4 1 2 3 4 5 6 7 8 9 2 4 10 20 35 56 84 120 165 3 8 36 120 330 792 1716 3432 6435 11440 4 16 136 816 3876 15504 54264 170544 490314 1307504 5 32 528 5984 52360 376992 2324784 12620256 61523748 273438880 1121099408

5
6 7 8 9 10

10 220 11 286

19448 3268760

Desafortunadamente, el tamao N x N de la matriz Q para las aplicaciones tpicas es inmanejable ya que el nmero de estados N crece rpidamente con la poblacin P y la longitud de la cadena 1.

48

ESTUDIO 3. MATEMTICO LOSA.G. DE

Las poblaciones posibles vienen descritas por la matriz Z, que es una matriz N x r. La i-sima fila 4j = Zj,Q,. ,Zj,r1 de Z es el vector de incidencia de la poblacin i-sima. En otras palabras, Zi,y es el nmero de veces que aparece la cadena y en la poblacin i-sima, donde y es la representacin entera de la cadena binaria. Por ejemplo, supongamos 1 = 2 y P = 2. Entonces r 4, N = 10, y la matriz Z sera la que se muestra en la tabla 3.2
. .

Tab. 3.2: LamatrizZparal

= 2 yP = 2.

Cadena binaria Estado Pl P2 P3 P4 P5 P6 P7 P8 P9 P10 00 0 0 0020 0 0 0 1 1 1 2 1 1 2 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 01 0 0 10 0 1 11 2 1

Nix y Vose definieron dos operadores matemticos, 5 y M, donde F viene determinado por la funcin de salud, y !M depende del coeficiente de mutacin p, el coeficiente de recombinacin y de la forma de mutacin y recombinacin usada (en su artculo suponen que el operador de mutacin es el estndar (bit flipping) y que la recombinacin se hace por un slo punto y que produce un nico descendiente). Con .F y 7( definidos, es posible calcular la probabilidad de transicin Pij desde el estado i al estado j como Q(i,j)=p=P!JJ

f 1Zjy LIJY

(3.12)

3.4.CONVERGENCIA Y COMPORTAMIENTO ASINTTICO49

Esto es, dadosF y 9(, Pij especifica tan probableesque un Algoritmo Ge qu ntico en estadoi pasea estadoj enla siguiente generacin. puedever en esta Se ecuacin que seha supuesto la seleccinsehacede maneraproporcionala la que salud. Si el coeficientede mutacinji no escero,todos los estados tienenprobabili dad no cero de seralcanzados.

3.4 Convergencia y Comportamiento Asinttico


Se puede conservarel mejor elementode una generacine introducirlo en la siguientede forma automtica (elitismo) o bien hacer que los operadores de mutacin y cruce sean elitistas. El operador mutacinsedicequeeselitistacuandoseescoge de parala nueva generacinel individuo con mejor saludentreel original y el mutado. El operadorcruce es elitista cuando se escogepara la nuevageneracin el individuo de mejor salud,entrelos dospadres los doshijos del cruce. y El operadorseleccinutiliza como funcin de probabilidadla raznentrela salud del individuo y la saludglobaly se sueledenominar saludproporcional,

f(b)
) 14=1
1-.

donde f esuna funcinpositivay por tanto,P(b) > O,V i = 1, .N. Si consideramos solamente operadorseleccin, puedecomprobarque: el se
..

Teorema 3.4.1: Sea el punto de la poblacincon mayorsalud, b*


=

arg max{f(b)/b

E P}.

Entonces p(k)
k*oo

(O,...,O,N,O,...,O).

(3.13)

Siendo p(k) =vectorde distribucinde probabilidady N ocupala posicini. Utilizando los tresoperadores, seleccin, mutaciny cruce,en la formausual tenemosque:

50

ESTUDIOMATEMTICO LOS A.G. 3. DE

Teorema 3.4.2: Todoslos estados S[k]sonrecurrentes. de Para comprobarlo bastadarsecuentade quemedianteel operador mutacinse puede pasarde un estado otro cualesquiera, decir,p(X,X) > O. a es Esto estantocomodecir quela cadenaesirreducible. Teorema 3.4.3: Consideremos cadena Markov X enel espaciode esta una de dos 3, con probabilidadde transicinP(i, j). Si la cadenade Markov es regular entoncesexisteunanicadistribucinde probabilidad i hm Prob(Xm = jJXo

(j), j

E $ tal que

moo

i)= lt(j) > O, j E3

(3.14)

o en trminosde la matrizde probabilidada m pasos Pm 1imm+oPm(i,j)


=

lr(j) > 0,

E 3

(3.15)

Esta distribucinlmite t se llama distribucinestacionaria la cadenade de Markov, y i(j) puedeser vistacomo la probabilidadde estara largoplazoen el estado j.

Proposicin3.4.1: Comotodoslos estados accesibles, algoritmono con son el


verge, aunquela distribucinde probabilidadseestabilizaen el tiempo. Podemosplantearnos debemos qu hacerparaasegurar el algoritmocon-, que verge al punto ptimo. Estoes tantocomo decir que debehaberdos clases:una absorbenteformadapor todoslos elementos la poblacinigualesal ptimo y de la otra claseformadapor todaslas dems configuraciones. Para conseguirestobastaasegurar el mejor elementode una generacin que siempre pasaa la generacin siguiente, deciresnecesario es introducir ehitismo. Supongamosque nuestrooperadorde mutacines elitista, es decir, que se muta al individuo y se escoge de mayor saludentreel antiguoy el nuevo.Su al pongamostambinqueel operador cruceesehitista,esdecir,quecruzamos de los dos elementos elegidosy escogemos parala nuevapoblacinel individuo mejor de los cuatro(los dospadresy los doshijos).

3.4.CONVERGENCIA COMPORTAMIENTO Y ASINTTICO51

Proposicin 3.4.2: Si losoperadores mutacin y cruce elitistas, de son entonces la cadena Markovestformada unaclaseabsorbente de por formada X por que estransitoria formada losdems por estados. Corolario 3.4.1: En estecaso podemos asegurar el algoritmo que converge la a solucinptima. Es decir, si utilizamos algoritmo que un gentico mutacin cruce con y elitis tas, tenemos asegurado el algoritmo que converge puntoptimodel espacio, al ya que hayunaclaseabsorbente correspondientepuntoptimoy otraclase al transi toria formada todos dems por los puntos.
=

(0,0, ...,O,N,O, donde ocupa posicin la solucin ...0) N la de ptima otraclase y

52

ESTUDIOMATEMTICO LOS A.G. 3. DE

4. MTODO OPTIMIZACIN DE GENTICARESTRINGIDA (RGO)


4.1 Introduccin

Los algoritmos para la optimizacin de funciones estn limitados generalmen te a funciones regulares y unimodales. Sin embargo, muchas funciones son mu! timodales, discontinuas y no diferenciables. Para optimizar este tipo de funciones se han empleado mtodos de muestreo estocstico. Mientras que las tcnicas tra dicionales de bsqueda utilizan caractersticas del problema para determinar el siguiente punto muestral (por ejemplo, gradientes, Hessianos, linealidad, y con tinuidad), las tcnicas de bsqueda estocstica no hacen tales suposiciones. En cambio el siguiente punto (o puntos) se determina basndose en reglas de mues treo y decisin estocsticas, en vez de reglas de decisin determinsticas. Los algoritmos genticos han sido usados para resolver problemas difciles con funciones objetivo que no poseen buenas propiedades, tales como continui dad, diferenciabilidad, condicin de Lipschitz, etc) [Davis [21], Goldberg [35], Holland [44],Michalewicz[81]]. Estos algoritmos mantienen y manipulan una familia, o poblacin, de soluciones e implementan una supervivencia de los me jor adaptados como estrategia de bsqueda de mejores soluciones. Esto provee un paralelismo implcito y explcito que permite la explotacin de varias regiones prometedoras al mismo tiempo. El paralelismo implcito es debido a la teora de esquemas desarrollada por Holland, mientras que el paralelismo explcito es de bido a la manipulacin de una poblacin de puntos (la evaluacin de la salud de estos puntos es fcil de realizar en paralelo). Un problema que ha sido poco estudiado en la literatura de optimizacin es el de la optimizacin dinmica, es decir de funciones que varen con el tiempo. Este es un problema especialmente interesante para la Teora de Control, puesto que, en mayor o menor medida, los sistemas con los que trabajamos varan con el tiempo, adems de presentar los problemas anteriores.

544.MTODODE

OPTIMIZACINGENTICARESTRINGIDA (RGO)

4.2 Caractersticas losAlgoritmos de Genticos


Para realizar esta optimizacin de funciones objetivo que no poseen buenas propiedades y que adems varan con el tiempo hemos considerado que el mejor punto de partida eran los algoritmos genticos. Sobre estos algoritmos se pueden realizar una serie de modificaciones para la optimizacin de las funciones que nos interesan. Las caractersticas principales de los algoritmos genticos son:

Los algoritmos genticos no trabajan directamente con los objetos, sino con la codificacin de esos objetos, que pueden ser un nmero, un conjunto de parmetros, etc. A esta codificacin le llamamos cromosoma. La optimizacin se puede realizar con parmetros continuos o discretos. Los algoritmos genticos realizan la bsqueda mediante toda una genera cin objetos, no buscan un nico elemento. Los algoritmos genticos utilizan una funcin objetivo que nos da la infor macin de lo adaptados que estn los individuos, y no las derivadas u otra informacin auxiliar. Las reglas de transicin son probabilsticas, no determinsticas. Optimizan parmetros con superficies de coste extremadamente complejas. Pueden saltar fuera de un mnimo o mximo local. Trabajan con datos generados numricamente, datos experimentales o fun ciones analticas.

4.3 Optimizacin Gentica Restringida (RGO)


En la literatura, el uso de los algoritmos genticos como mtodo de optimiza cin se hace off-line y el tiempo utilizado es bastante grande. Hemos utilizado nuevos mecanismos para usarlos como lo hace la Naturale za: on-line y de una manera local o semi-local. Hemos demostrado que los algoritmos genticos se pueden usar como un mtodo aceptablemente rpido de optimizacin de funciones que varen con el tiempo. Usualmente los algoritmos genticos se usan como un mtodo de bsqueda global y en paralelo. Se evalan simultneamente muchos puntos, aumentando la probabilidad de encontrar el ptimo global.

4.3.OPTIMIZACIN GENTICARSTRINGIDA (RGO)55

En optimizacin de funciones que varan con el tiempo, esta caracterstica es interesante en las primeras generaciones, para encontrar la cuenca de atraccin correcta, pero no es interesante despus y adems consume mucho tiempo de cmputo. Por esta razn, es deseable un mtodo que funcione como mtodo de optimiza cin global en las primeras etapas, para encontrar la cuenca de atraccin correcta y que posteriormente se comporte como un mtodo de optimizacin local o semi local. Sera deseable tambin que tuviera propiedades parecidas a las de los mto dos basados en el gradiente, pero sin los inconvenientes de que sea necesaria la existencia de derivadas y su sensibilidad al ruido. Los algoritmos para la optimi zacin de funciones estn generalmente limitados a funciones regulares convexas. Sin embargo muchas funciones son multi-modales, discontinuas, y no diferencia bles. Mientras que los mtodos tradicionales de bsqueda utilizan caractersticas delproblema para determinar el siguiente punto (gradientes, hessianos, linealidad, y continuidad) la bsqueda gentica no hace estas suposiciones. Cuando queremos optimizar funciones que varan con el tiempo las cosas se complican an ms porque necesitamos un mtodo que sea lo suficientemente rpido para seguir las variaciones de los puntos ptimos de la funcin.

4.3.1

RGO

El mtodo de bsqueda restringida consiste en hacer la bsqueda en un en torno del punto correspondiente al ltimo modelo identificado y tomar el punto mejor adaptado como centro del entorno de bsqueda de la nueva generacin. A continuacin se vuelve a tomar el individuo con mejor salud como centro del nuevo entorno de bsqueda y as sucesivamente. La codificacin d cada cromosoma corresponde al vector diferencia con res pecto al centro del entorno. ste punto tambin se introduce en la siguiente ge neracin (es la cadena formada por ceros). El punto correspondiente al mejor de cada generacin y que se va a guardar como centro del entorno de la generacin siguiente se guarda aparte de la generacin y representando coordenadas absolu tas.. Para evaluar la funcin de salud, consideramos el centro del entorno ms la decodificacin de cada uno de los cromosomas. Es decir, el mtodo trabaja de un modo incremental. Este comportamiento pretende simular el mtodo del gra diente, pero sin utilizar derivadas y puede ser utilizado cuando las seales tienen mucho ruido.Vamos teniendo nuevas generaciones orientadas en la direccin de mayor decrecimiento de la funcin de coste, y con una distancia al centro prxima

56

4. MTODODEOPTIMIZACIN GENTICARESTRINGIDA (RGO)

Fig. 4.1: Mecanismo de bsqueda de la Optimizacin Gentica Restringida.

a la correspondiente a la velocidad de cambio del sistema. Podemos hacer una bsqueda en un entorno grande al principio y despus reducir su radio. De hecho se realiza una bsqueda global al principio y local al final. Este mtodo reduce la probabilidad de encontrar un mnimo local. El radio se ha tomado proporcional a la incertidumbre de la estimacin con extremos superior e inferior. La manera de calcular la incertidumbre depende de la aplicacin que se hace de la optimizacin, por ejemplo, en el caso de la estimacin de estados, usamos la distancia de Mahalanobis 6.43 d
=

(x(kk 1) .(k lk l))P1 (kk)(x(kk 1) (k flk 1))

(4.1)

que mide la incertidumbre de la estimacin (k). En el caso de la identificacin de sistemas el radio se ha tomado proporcional al criterioMDL (Minimum Descrip tion Length) con extremos superior e inferior. Tambin se pueden utilizar otros criterios como el AIC (Akaikes Information theoretic Criterion) o el FPE (Final Prediction-Error criterion)(ver Ljung[69]). En nuestro algoritmo hemos implementado los siguientes operadores: repro duccin, cruce, mutacin, elitismo, inmigracin, ranking y bsqueda restringida. Hemos utilizado el mecanismo de ranking para regular el nmero de descen dientes que un individuo puede tener, porque si un individuo es muy bueno, puede tener demasiados descendientes y hacer que la diversidad gentica descienda mu cho.

4.4. ALGORITMO

En caso de que el sistema vaya variando rpidamente en el tiempo, podemos incluir los mecanismos de reescalado, dominancia triallica e inmigracin. Este mecanismo se ha implementado utilizando como funcin de salud F(i) =
cte+Vn(i) donde V(i) = L!((ynk 9n k)2 es la funcin de prdida (loss func tion) y ctees una constante suficientemente grande (108). Es importante destacar que el mtodo RGO realiza la bsqueda con ms nfa sis en una direccin preferente, la direccin de mxima pendiente y a una distancia preferente Este hecho permite reducir la bsqueda de 50 100 dimensiones a 1 2. Por sta razn ste mtodo es comparable al mtodo del gradiente en preci sin y velocidad, con la ventaja de que es aplicable cuando las expresiones no don diferenciables y las seales contienen ruido.

4A

Algoritmo

1. Se obtiene un primer conjunto de datos. 2. Se crea la poblacin inicial para deducir el tipo y las caractersticas del sistema. 3. Se evala la salud de los individuos. 4. Se hallan las caractersticas del sistema, por ejemplo, en el caso de identifi cacin, nos interesan el tiempo de retardo y el orden, o tambin nos puede interesar la eleccin de modelo. 5. Se ecogen datos u(k), y(k). 6. Se obtiene una primera estimacin del modelo utilizando mnimos cuadra dos extendidos o alguna otra tcnica. 7. Hacemosk=1 8. Se crea la poblacin inicial, tomando los individuos como diferencia res pecto al modelo anterior. 9. Se evala la salud de los individuos. 10. Comienzo del buce. 11. Se aplican los mecanismos d seleccin, cruce y mutacin. 12. Se clona el mejor individuo de la generacin anterior.

58

MTODO OPTIMIZACIN 4. DE GENTICA RESTRINGIDA (RGO)

Los distintos puntos representan los posibles cambios respecto del estimador,que es el centro de la bola.

Regin de bsqueda con radio proporcionala la incertidumbre

/in

del Sistema

Fig. 4.2: Mecanismode seguimiento la OptimizacinGentica de Restringida.

13. Aplicamos el mecanismo de inmigracin. 14. Se evala la salud de los individuos de la nueva generacin.

15. Seleccionamos el individuo que optimiza el criterio deseado argmin VN(O).

(4.2)

16. Sumamos el mejor individuo al modelo previo. 17. Calculamos la incertidumbre para utilizarla en el clculo del nuevo radio de la regin de bsqueda. 18. Se recogen datos u(k), y(k). 19. Hacemos k = k+ 1 y repetimos los pasos 10-19.

4.5. CARACTERSTICAS LARGO DE

45

Caractersticas la RGO de
Se ueden utilizar como mtodo de optimizacin en una bola de radio que vaya variando segn la incertidumbre de las estimaciones, con lo que evi tamos buscar en una regin excesivamente amplia como hacen los mtodos de bsqueda global y evitamos la posibilidad de caer en un ptimo local como hacen los mtodos de optimizacin local. ste mtodo est especialmente pensado para utilizarlo en la optimizacin de funciones variantes en el tiempo. Lo que permite usarlo en la identifi cacin de sistemas, ya sea en la forma de la funcin de transferencia o en variables de estado y para la estimacin de estados por medio de un filtro de Kalman Generalizado.

..

60

4. MTODO OPTIMIZACIN DE GENTICA RESTRINGIDA (RGO)

Llenar elbuifer conlosdatosu(k)ey(k)J [Crear lapoblacininicial] Encontrar las caractersticas del sistema: orden, retardo,etc.

(
(

Evaluar saludde cadaindMduo la

Hallarlas caracteristicas sistema: ejemplo, del por tiempode retardo,orden,etc.mediante algoiitrnosgenticos.

CRecoger datos:u(k),y(k)

Calcular un primermodeloutilizando mtodoprevio:por un ejemplo. mnimoscuadrados extendidos

Encontrar un primer modelo de partida

(tos:u(k),y(k

como individuosla diferencia l modeloprevio__) a Crear pob la ladn inicial,tomando r

Evaluar la saludinicialde loscromosomas

TI)

Aplicarlosmecanismosdeseleccin,crucey

mutacin

J
,

( C

Clonarelmejor delageneracinanterior (car elmecanismodeinmigracin

II) )

Mejorar el modelo y hacer seguimiento del sistema

Evaluar salud delos individuosde la nuevageneracin la (Seleccionarelmejor cromosoma]

Sumar mejorindividuoal modeloprevio el

1
]

[Calcularlanuevaincertidumbrecomoradiodelaregindebsqueda (Recoger datos:u(k)y(k)J

Fig. 4.3: Diagrama de flujo de la Optiinizacin Gentica Restringida RGO

5. IDENTIFICACIN SISTEMAS DE NO LINEALES


5.1 Introduccin

La idntificacin de sistemas no lineales mediante modelos lineales o no li neales es un trabajo difcil y complicado. La mayora de las veces debemos partir de los conocimientos humanos sobre la dinmica del sistema. La identificacin posterior de los parmetros la realizamos a mano, utilizando las propiedades heu rsticas de cada familia de modelos. Los mtodos ms usuales en la identificacin de sistemas estn basados en mnimos cuadrados o en el mtodo de mxima verosimilitud que son mtodos lo cales guiados por el gradiente y necesitan una funcin de prdidas (loss function) diferenciable y un espacio de bsqueda suave. A menudo fallan en la bsqueda de un ptimo global cuando el funcional no es diferenciable o es no lineal en sus parmetros. Esto tiene el inconveniente de que si las seales tienen ruido coloreado, como suele ser habitual en la prctica, los mtodos basados en mnimos cuadrados tienen el fracaso asegurado. Si adems estamos implementado el mtodo en lnea el ruido estar correlacio nado con.los regresores y el mtodo explotar, fenmeno conocido como blow-up. Para evitar esto en algunos casos sencillos, se puede usar un factor de olvido muy prximo a la unidad, pero en la mayora de los casos de sistemas no lineales variantes en el tiempo esta tcnica falla. A menudo fallan en la bsqueda de ptimos globales cuando ste espacio de bsqueda es no diferenciable, o no lineal en sus parmetros. Los mtodos de op timizacin basados en algoritmos genticos pueden mejorar los resultados porque no utilizan las propiedades de diferenciabilidad o de ser lineal en los parmetros. En 1992, Kristinsson y Dumont [64] hicieron un primer estudio de la identi ficacin de sistemas y del control off-line con algoritmos genticos de sistemas dinmicos continuos y discretos. Comprobaron que los algoritmos genticos son efectivos en ambos dominios y que es posible identificar directamente parmetros

625.IDENTIFICACINDESISTEMASNOLINEALES

fsicos, o bien, polos y ceros. Hicieron simulaciones con sistemas de fase mnima y no mnima y de un sistema con dinmica no modelada. En 1993, Flockton y White [25] utilizan los algoritmos genticos para hacer otra identificacin off-line de polos y ceros con algunas pequeas mejoras. Posteriormente, en 1995, Tan, Li y Murray-Smith [99] usan los algoritmos ge nticos cn simulated annelingpara hacer una identificacin off-line y la linea lizacin de sistemas no lineales, invariantes del tiempo con un modelo ARMAX. Utiliza esta tcnica de bsqueda para identificar los parmetros de un sistema des crito por un modelo ARMAX en variables de estado, en presencia de ruido blanco y para aproximar un sistema no lineal multivariable por un modelo en el espacio de estados, lineal e invariante en el tiempo. En este mismo ao, Iba, deGaris y Sato [50] usan una tcnica numrica off line, que integra una bsqueda adaptativa de una estructura de rbol basada en programacin gentica y un mecanismo de ajuste local de parmetros empleando bsqueda estadstica. En la programacin gentica tradicional, la recombinacin causa frecuentes rupturas de los bloques de construccin y la mutacin puede causar abruptos cambios en la semntica. Para superar estas dificultades ellos implementan la programacin gentica tradicional con una bsqueda local hill climbing, usando un procedimiento de ajuste de parmetros. Todos estos mtodos trabajan off-line y precisan que el sistema sea invariante del tiempo. El ltimo adems utiliza un mtodo no paramtrico. Este captulo describe un mtodo de identificacin on-line de sistemas no li neales, variantes en el tiempo que tiene altas prestaciones. Hemos utilizado mo delos OE, ARMAX y NARMAX como semillas para el mtodo RGO y se puede extender a otros modelos similares, como Box-Jenkins, el Lineal General, Mode los de Polos y Ceros o la descripcin en el Espacio de Estados, utilizando para ello optimizacin gentica restringida. Las principales diferencias del ROO con los anteriores mtodos es que ste trabaja en lnea, identifica modelos lineales y no lineales, variantes en el tiempo y usa modelos paramtricos convencionales.

5.2 Implementacin Algoritmo del


El mtodo realiza la bsqueda en un entorno del punto correspondiente al lti mo modelo identificado y toma el punto mejor adaptado como centro del entorno de bsqUeda de la nueva generacin. Este ltimo punto se guarda aparte de la generacin. La codificacin de cada cromosoma corresponde al incremento con respecto al centro del entorno.

5.3. IDENTIFICACIN MULTIMODELO MULTIPARMETRO SISTEMAS Y DE NOLINEALES MEDIANTEMODELOSPARAMTRICOS LINEALES.63 Para evaluar la funcin de salud, consideramos el centro del entorno ms la decodificacin de cada uno de los cromosomas. Es decir, el mtodo trabaja de un modo incremental. Este comportamiento simula el mtodo del gradiente sin utilizar derivadas y puede ser utilizado cuando las seales tienen mucho ruido. Vamos teniendo nuevas generaciones orientadas en la direccin de mayor de crecimiento de la funcin de coste, y con una distancia al centro prxima a la correspondiente a la velocidad de cambio del sistema. Podemos hacer una bsqueda en un entorno grande al principio y despus reducir su radio. De hecho se realiza una bsqueda global al principio y local al final. Este mtodo reduce la probabilidad de encontrar un mnimo local. El radio se ha tomado proporcional al criterio MDL (Minimum Description Length) con extremos superior e inferior. Tambin se pueden utilizar otros cri terios como el AIC (Akaikes information theoretic criterion) o el FPE (Final prediction-error criterion)(ver [69]). En nuestro algoritmo hemos implementado los siguientes operadores: repro duccin, cruce, mutacin, elitismo, inmigracin, ranking y bsqueda restringida. Hemos utilizado el mecanismo de ranking para regular el nmero de descen dientes que un individuo puede tener, porque si un individuo es muy bueno, puede tener demasiados descendientes y hacer que la diversidad gentica descienda mu cho. Este mecanismo se ha implementado utilizando como funcin de salud F (i) =
cte+V(i) donde V(i) = (ynk 9n k) es la funcin de prdida (loss func tion) y ctees una constante grande (108).

5.3 Identificacin multimodelo yrnultiparmetro de sistemasnolineales mediant modelos paramtricos lineales. 5.3.1 Identificacin modelos con lineales
Un modelo de entrada-salida es un modo de describir un sistema dinmico basndose exclusivamente en la relacin entre las entradas y salidas del sistema. Algunos de los modelos lineales mas conocidos son: RX (Auto-Regressive with eXogenous inputs), cuya expresin es A(q1)y(t) =B(q1)u(tnk)+ek que puede ser visto como una manera de determinar el siguiente valor de la salida dadas las observaciones anteriores y las entradas. Aqu A(q1) y B(q) (5.1)

645.IDENTIFICACINDESISTEMAS

NOLINEALES

son polinomios en el operador desplazamiento hacia atrs q1 e y(t), u(t), y e(t) son las salidas, entradas y ruido, respectivamente. El ruido e(t) es una sucesin aleatoria normalmente distribuida de media cero y varianza a2. OE (Output Error) cuya expresin es
y(t) u(t + e(t) nk)
-

(5.2)

con la fuente de error e(t) que es la diferencia (error) entre la salida real y la salida libre de ruido (terica). ARMAX (Auto-Regressive Moving Average with eXogenous inputs), cuya expresin es A(q1)y(t)
=

B(q1)u(t

nk) + C(q1)e(t)

(5.3)

En ste modelo la expresin A(q)y(t) = e(t) representa la auto-regresin, y(t) = C(q )e(t) representa la media mvil de ruido blanco, mientras que B(q1 )u(t) representa le entrada externa. Otros modelos pueden ser usados, como por ejem pio la representacin en el espacio de estados o el modela de ceros y polos.

5.3.2 Identificacin paramodelos RGO lineales


La entrada excitadora u(t) se ha escogido como una secuencia binaria pseudo aleatoria (PRBNS), con ruido coloreado. Como primer paso, para hacer esta identificacin paramtrica, realizamos una primera identificacin de mltiples modelos de tipo ARX, A (q )Yk = zB (q ) uk+ e(t), mediante el mtodo de mnimos cuadrados y por medio de los algoritmos ge nticos decidimos qu grados de los polinomios numerador y denominador y qu retardo son ms convenientes para nuestros propsitos. Es decir, queremos un modelo que se ajuste lo ms posible al sistema, pero que no tenga unos grados innecesariamente grandes, para ello se pueden utilizar los criterios MDL, AIC o FPE. En particular nosotros hemos utilizado el criterio MDL. En ur segundo paso, calculamos un modelo, OE y(t) = u(t nk) + e(i) y ARMAX, A(q)yk = q_dB(q_l)u + C(q1)e(t)cok, por medio de regresin seudo-lineal. Este modelo todava no se ajusta lo suficiente porque se ha supuesto en el clculo que el sistema es lineal, cosa que en general no es cierta. Para mejorar esta estimacin realizamos una bsqueda de modelos ARMAX, A (q,1 )Yk q_dB(q_l )Uk+ C(q1 )ek, cuyos coeficientes sean prximos al calcu lado anteriormente y que tengan una funcin de prdida lo ms pequea posible.

5.3. IDENTIFICACIN MULTIMODELO MULTIPARMETRO SISTEMAS Y DE NOLINEALESMEDIANTEMODELOSPARAMTRICOSLINEALES.65 Esta bsqueda la realizamos por medio de un algoritmo gentico. En paralelo, vamos haciendo una bsqueda de modelos OB , y(t) = u(t nk) + e(t) utilizando la misma tcnica. Para hacer la funcin de prdida V(i) = 9n k)2 lo ms peque a posible, se ha utilizado como funcin de salud F(i) = cte+1,,(i) donde ctees una constante suficientemente grande (108) para mantener la diversidad de la po blacin. La probabilidad de reproduccin se ha calculado como F(t) = F(t)/1. En cada generacin, sustituimos el modelo anterior por el mejor de la nueva generacin como centro del entorno donde se realiza la bsqueda, de esta manera ,en caso de un sistema LTI, el mejor modelo debe ir tendiendo al valor que mini miza el funcional y la poblacin ira tendiendo a cero. A continuacin realizamos una nueva lectura de la entrada y la salida del sistema. De esta manera conseguimos un conjunto de aproximaciones sucesivas a me jores modelos en caso de el sistema sea invariante en el tiempo y si el sistema es variable, pero de variacin lo suficientemente lenta, entonces el modelo va si guiendo al sistema en sus variaciones. Podemos adems aprovechar las caractersticas convenientes de la convergen cia global si al principio tomamos una bola lo suficintemente grande, de manera que reduzcamos la probabilidad de quedarnos en un mnimo local. Una vez que sepamos que seguimos al mnimo adecuado, podemos reducir el tamao de la bo la y al mismo tiempo de la poblacin, para conseguir una mayor velocidad de ejecucin del algoritmo. Para que el algoritmo no tenga una convergencia prematura y se homogenei ce demasiado la poblacin, podemos aumentar el parmetro de probabilidad de mutacin. Aunque este algoritmo es costoso n cuanto a operaciones, es lo suficiente mente rpido como para ser empleado en lnea, ya que el clculo de un modelo con 35 coeficientes tarda una dcima de segundo en un PC (120 MHz). A esto hay que aadir que las aplicaciones a que tpicamente se desea aplicar este identifica dor, es decir a los sistemas de control adaptativo, poseen dos bucles, uno rpido, que es el de control, y otro lento que es el identificador. Por tanto se puede aplicar a sistemas con una constante de tiempo de orden de las centsimas de segundo. Debemos damos cuenta de que los algoritmos genticos hacen una bsqueda preferentemente en una direccin, la de mximo decrecimiento, mientras que el mtodo Montecarlo la hace con igual densidad en todas las direcciones, con lo que si estamos buscando en un espacio de 50 a 100 dimensiones, es evidentemente superior.

66

5. IDENTIFICACIN SISTEMAS LINEALES DE NO

Llenarelbufferconlosdatosu(k)ey(k) Crear la poblacin inicial

1
Encontrar las caractersticas del sistema: rdenes, retardo, etc.

Encontrar los rdenes y el retardo que ajustan mejor con el sistema

Tomar los nuevos datos u(k) e y(k)


,

Calcular modelos OE, ARMAX y NARMAX por mediodemnimoscuadradosextendidos Tomar los nuevos datos u(k) e y(k) Crear la poblacin inicial, tomandocomo individuos la diferencia con el modelo previo Evaluar la salud inicial de los cromosomas Aplicar los mecanismos de seleccin, cruce, mutacin, etc. Clonar el mejor individuo de la generacin anterior y aplicar la inmigracin Evaluar la salud de los individuos de la nueva generacin Seleccionar el mejor cromosoma Sumarelmejor individuoalmodeloprevio

Encontrar un primer modelo de partida

Mejorar el modelo y hacer el seguimiento del sistema

Calcular la nueva incertidumbre para usarla como nuevoradio de la bola de bsqueda

Tomar nuevos datos u(k) e y(k) los


/

Fig. 5.1: Diagrama de flujo de la RGO.

5.4. IDENTIFICACIN MULTIMODELO Y MULTIPARMETRO

67

5.4 Identificacin multimodelomultiparmetro y de sistemas lineales no mediante modelos paramtricos no lineales.


Usualmente, modelamos el sistema basndonos en el conocimiento fsico del sistema y despus intentamos calcular los parmetros desconocidos a mano. ste mtodo tiene dos problemas: necesitamos conocimiento previo del sistema, y si las seales tienen ruido coloreado, los mtodos basados en mnimos cuadrados n funcionan satisfactoriamente.

5.4.1

Modelos NARMAX

Entre los modelos no lineales, uno de los mas interesantes, es el modelo NAR MAX (Non-linear Auto-Regressive Moving Average with eXogenous inputs), qe puede ser descrito como y(t)

F{y(t

1),... ,y(t nr), u(t d),... , u(t d n + 1),c(t


1),... , (t

ne)]+ E(t)
(5.4)

donde t representa el tiempo discreto, y(t), u(t) y (t) son la salida, la entrada, y el error de prediccin, respectivamente, fly, n y neson los rdenes correspondientes, F[.]es una funcin no lineal y dd es el mnimo retardo de la entrada [Leontaritis 85] El modelo polinomial NARMAX tiene como expresin y(k) =ao+ 1ay(ki)+E (5.5)

nos permite una descripcin buena y sencilla de una amplia clase de sistemas no lineales. Por ejemplo, si el modelo exacto NARMAX es y(k) =y(k 1)e_u(_l) podemos desarrollar en serie la exponencial
exp(x)=Y0

(5.6)

(5.7)

y emplear un modelo polinomial aproximado NARMAX y(k)=y(k_1)_y(k_1)u(k_1)+y(k_1)u2(k_1)_y(k_1)u3(k_l) (5.8) Podemos comprobar que ste modelo tiene obvias ventajas sobre las series fun cionales tales como las series de Volterra.

685.IDENTIFICACINDE

SISTEMASNOLINEALES

Cruce: Puntode

000000
ccKD11 Padre2 AntesdelCruce

Padre 1

ruce

000fl

1 Hijo

1)( 1)

oxoo
Fig. 5.2: Mecanismo de cruce

Hijo2

delCruce Despus

Mutacin: Antes de la mutacin

$4
Despus la mutacin de Fig. 5.3: Mecanismo de mutacin

5.4.2 Identificacin conmodelos lineales RGO no


La entrada excitadora u(t) se ha escogido como una secuencia binaria pseudo aleatoria (PRBNS), con ruido coloreado. Como primer paso, para hacer esta identificacin paramtrica, realizamos una primera identificacin de mltiples modelos de tipo ARX, A (q )Yk= zB(q1 )uj + e(t), mediante el mtodo de mnimos cuadrados y por medio de los algoritmos ge nticos decidimos qu grados de los polinomios numerador y denominador y qu retardo son ms convenientes para nuestros propsitos. Es decir, queremos un modelo que se ajuste lo mas posible al sistema, pero que no tenga unos grados innecesariamente grandes, para ello se pueden utilizar los criterios MDL, AIC o FPE. En particular nosotros hemos utilizado el criterio MDL (Minimum Description Length)(ver Ljung[69] para ms detalles). En un segundo paso, calculamos un modelo ARMAX, A (q )Yk = q_dB (q )uk+ C(q)e(t)wk, por medio de regresin seudo-lineal. Este modelo todava no se ajusta lo suficiente porque el sistema es no lineal y adems la seal de salida con tiene ruido coloreado y estos mtodos solamente son buenos con sistemas lineales con ruido blanco.

5.5. RESTRICCIONES

Para mejorar esta estimacin realizamos una bsqueda de modelos NARMAX, y(k)
=

fly a + _1ay(k EL1E1cy(k

i)

n + 1bju(k i)u(k 1)
.

i)+

cuyos coeficientes sean prximos al calculado anteriormente y que tengan una funcin de prdida lo ms pequea posible. En cada generacin, el ltimo modelo es sustituido por el mejor de la nueva generacin como centro del entorno donde se realiza la bsqueda De esta manera nuestro modelo va siguiendo al modelo real. En ste entorno los individuos de las nuevas generaciones estarn orientados principalmente en la direccin de mxima pendiente de la funcin de prdida (usando el criterio MDL, o bien AIC o FPE) y a la distancia que corresponde a la velocidad de cambio del sistema real. Para hacer la funcin de prdida V(i) = 9n k)2 lo ms peque a posible, se ha utilizado como funcin de salud F(i) = cte+(i) donde ctees una constante suficientemente grande (18) para mantener la diversidad de la po blacin. La probabilidad de reproduccin se ha calculado como F(t) = F(t)/. El nmero de coeficientes del modelo NARMAX

ny

nu

y(k)

a + E_1ay(k 1E1c1y(k

i)

+ _1b1u(k i)u(k j)

)+

10) (5

crece exponencialmente con el orden de desarrollo. Por este motivo, se ha utili zado una expansin de orden dos, con sistemas de orden menor que ocho y con cinco coeficientes para modelar el ruido.

5.5 Restricciones
Un problema del que adolecen la mayora de los mtodos de identificacin es no permiten introducir fcilmente el conocimiento previo que tenemos del siste ma. En la mayora de los casos slo se puede elegir el tipo de modelo (ARX, OE, ARMAX, BJ, etc.) procurando adems que sea lineal porque de lo contrario no se pueden aplicar los mtodos habituales. Sin embargo, enel mtodo de algoritmos genticos lo que hacemos es optimi zar numricamente una funcin V=E0(y(tk)y(tk))2 y no nos cuesta ningn trabajo aadir restricciones duras de desigualdad, como a1 > 0, asignando salud cero a los individuos que estn en la regin factible. Las (5.11)

705.IDENTIFICACINDESISTEMASNOLINEALES

restricciones blandas se pueden tratar, aadiendo un trmino de penalizacin al funcional V. Por ejemplo, si deseamos introducir la restriccin al > Ocomo una restriccin blanda, podemos aadir a la funcin de prdida el trmino a, cuando al> 0.

5.6 Resultados
Para poder contrastar los resultados con otros mtodos, vamos a utilizar como ndices de funcionamiento los siguientes: Error RMS: RMSerror= Error relativo RMS: Relative RMS error = yN VN Estudiaremos los resultados obtenidos al aplicar nuestro mtodo con modelos OE, ARMAX y NARMAX a varios sistemas no lineales: Planta 1: y(k)0.6y(k 1)+0.4y(k2)= (u(k)0.3u(k 1)+0.05u(k2))sin(0.Olk) +e(k) 0.6e(k 1)+O.4e(k2) (5.14) con condiciones iniciales nulas. Esta planta corresponde a un sistema lineal y(k) = 1 + 10.61+0.4c[2e(k) (5.15) x100% (5.13) (5.12)

con una pequea oscilacin sinusoidal en la gananciai Planta 2: Esta planta consiste en un primer bloque lineal: y(k) 0.6y(k 1) +0.4y(k 2) = u(k) 0.3u(k 1) +O.05u(k 2) +e(k)0.6e(k1)+0.4e(k2) 5 16

puesto en serie con una zona muerta de 0.1, con condiciones iniciales nulas.

5.6. RESULTADOS

71

Fig. 5.4: Montaje de la Planta 2.

Planta 3: y(k)
=

A1 +0.O2sin(0.lk)y(k 1)+A2y(k2)+A3y(k3) +Biu(kl)+B2u(k2)+B3u(k3)


=

5 17)

con A1 = 2.627771, A2 = 2.333261, A3 0.030862 y B3 = 0.014086. Planta 4: y(k)

0.697676, B1

0.017203, B2

(O.8_0.5eY(1)y(k_ 1) (O.3+0.9eY2(1c_1))y(k_2) +0.lsin(ity(k 1))+u(k)

(5 18)

con condiciones iniciales nulas. Nota: Las plantas 3 (sin la no-linealidad) y 4 han sido elegidas por haber sido utilizadas en el proyecto Psycho de identificacin y control con redes neuronales. El montaje es el mismo para todas las plantas, tenemos una entrada al sistema principal consistente en una seal prbns de amplitud 1. A la salida de ste le sumamos un ruido coloreado que es la salida que obtenemos al filtrar un ruido blanco de pico 0.1 con el filtro 1+0.7q+O.2q2 1 0.6q1 + 0.4q2

519

La entrada prbns al sistema principal y la salida del sistema total las llevamos al bloque de identificacin, que nos va dando los coeficientes del sistema para los modelos OE, ARMAX y NARMAX, as como los errores RMS (absoluto y relativo) y los ndices AIC, FPE y MDL. Los resultados obtenidos se pueden resumir en la siguiente tabla:

72

5. IDENTIFICACIN SISTEMAS LINEALES DE NO

10 0 10 -20 -30

Actual

output

va. predicted
uTr

model

output

IJUIAIIJ.iilJIui

14 10 0 10 -20 -30 14

16 Error

18 20 Time (secs) in predicted model

22

24

26

16

18 Time

20 (seca)

22

24

26

Fig. 5.5: Fenmeno de blow-up al intentar identificar la planta 1 con el bloque ARMAX de Simuliik. Este efecto se debe a que se correlan los erro res E(t) y 1(t) con la entrada y hace imposible la identificacin de este sistema mediante este mtodo.

Time Error

o
1 50 100 150 200 250

Time

Fig. 5.6: Resultados de la identificacin de la planta 1 con el mtodo RGO. Arri ba: salida del modelo vs. salida real. Abajo: error cometido.

5.6. RESULTADOS

73

FeI 10 5

L,tput

vs.

Model

cDutpilt

o
-5 Time Error 10 5

o
50 100 Time 150 200 250

Fig. 5.7: Resultados de la identificacin de la planta 2 con el mtodo RGO. Arri ba: salida del modelo vs. salida real. Abajo: error cometido.

0.2 0.1

Real

output

v.

IVIo del

output

o
0.1 0. 2
50

1 00 flrne Error

1 50

200

0.1

o
0.1

0.2o-

50

1 00 Time

1 50

200

250

Fig. 5.8: Resultados de la identificacin de la planta 3 con el mtodo RGO. Arri ba: salida del modelo vs. salida real. Abajo: error cometido.

74

5. IDENTIFICACIN SISTEMAS LINEALES DE NO

Tab. 5.1: Comparacin los mtodos de identificacin sistemas. de de

1
Planta 1 ARMAX Simulink 0.050 QE RGO 0.050 ARMAXRGO 0.018 NARMAX RGO 0.017

RMS Error Planta 2 Planta 3 Planta 4 1.330 209.200 10.780 0.030 0.009 0.050 0.010 0.0008 0.050 0.003 0.0003 0.040

flme 6rrar
4 2

-2 50 1 00 150 200 250

flm

Fig. 5.9: Resultadosde la identificacin la planta4 con el mtodo RGO. Arri de ba: salidadel modelo vs. salida real.Abajo: error cometido.

5.7. COMPARACIN CON LASREDESNEURONALES

75

5.7 Comparacin lasRedes con Neuronales


Para comparar los resultados de la identificacin del mtodo RGO-Narmax con las Redes Neuronales hemos utilizado una Red Feedforward de tipo Percep trn Multicapa que usa como mecanismo de aprendizaje Backpropagation (que usa la regla Delta generalizada cmo algoritmo de entrenamiento) y con la sig moide como funcin de activacin. La red consta de una capa de entrada (formada por 3 neuronas: entrada, salida-1 y salida-2), 16 neuronas en la capa oculta y capa de salida (con 1 neurona, que representa la salida estimada del sistema). En las redes Feedforward la activacin de la salida b se calcula de acuerdo a la ecuacin
N

b=F(Lcojaj+8
i= 1

(5.20)

donde a son los niveles de activacin de las entradas, o el peso de conexin de la entrada i-sima al elemento de salida, 8 es un valor umbral y F es la funcin de activacin, en ste caso la sigmoide F(x) = El mecanismo de aprendizaje Backpropagation consiste en propagar hacia atrs, partiendo de la salida de las seales de error para calcular los ajustes,que se deben.aplicar a los pesos de todas las conexiis de la red. Este mecanismo es utilizado para ajustar los pesos y sesgos de las redes neuronales para minimizar la suma cuadrtica de los errores de la red. Esto se realiza cambiando continuamente los valores de los pesos de la red y los sesgos en la direccin de mximo decrecimiento con respecto al error (regla Delta).
,

Capd entrada

Capa Cauta

y1 Y2

Y3

Fig. 5.10: Estructura de la Red Multi capa utilizada en la comparacin.

765.IDENTIFICACINDESISTEMASNOLINEALES

La regla Delta es el algoritmo de entrenamiento del perceptrn para entradas y salidas continuas y se basa en que el ajuste del peso o, sea proporcional a la derivada, respecto del peso, del error cuadrtico medio E medido en el patrn actual p, (5.21) Desarrollando esta expresin, se obtiene,
=

y&xi

(5.22)

donde P = d o es la diferencia entre la salida deseada d y la salida actual 0P para el patrn p. La regla de actualizacin es

+ 1pO)i. (5.23) Las redes Backpropagation entrenadas tienden a dar respuestas razonables cuando se le presentan entradas que no han visto nunca. Tpicamente, una nueva entrada debe llevar al sistema a una salida similar a la correcta para vectores de entrada parecidos a los utilizados en el entrenamiento. El montaje es el mismo para todas las plantas, tenemos una entrada al sistema principal consistente en una seal prbns de amplitud 1 mas una onda cuadrada de amplitud 0.4 y frecuencia 0.1. A la salida de ste le sumamos un ruido coloreado que es la salida que obtenemos al filtrar un ruido blanco de pico 0.1 con el filtro
0i,o1d

z2+0.7z+0.2 z20.6z+0.4 Los principales problemas bservados en las redes son: la fuerte dependencia de las seales utilizadas para el entrenamiento y que los sistemas deben ser inva riantes en el tiempo o, a lo sumo, con variaciones pequeas. Para poder utilizarlas en control adaptativo es necesario que la red sea capaz de aprender rpidamente en lnea. Otro problema de las Redes Neuronales es que no dan un modelo explcito del sistema. Los resultados obtenidos se pueden resumir en la siguiente tabla:

524

57.COMPARACINCONLASREDESNEURONALES77

Tab. 5.2: Comparacin de los mtodos de identificacin: RGO y Redes Neuronales. ErrorRMS Planta 1 Planta 2 Planta 3 Plantaj 0.1678 NARMAX RGO 0.0293 0.02284 0.02201 0.07069 0.407 Red Neurona! 0.0335 0.04419

II II

1E

flr4S

rrorO.OOS

Fig. 5.11: Resultados de la identificacin de la planta 1. Subfigura 1: salida del modelo vs. salida real para RGO. Subflgura 2: error cometido. Subfl gura 3: salida del modelo vs. salida real para la Red Neuronal. Subfl gura 4: error cometido.

785.IDENTIFICACINDE

SISTEMASNOLINEALES

i;
1 00 0 nr,,S .-.-o.-..o.0000a 1 000

rvrLvJj
Fig. 5.12: Resultados de la identificacin de la planta 2. Sub figura 1: salida del
modelo vs. salida real para RGO. Subfigura 2: error cometido. Subfi gura 3: salida del modelo vs. salida real para la Red Neuronal. Subfi gura 4: error cometido.

-I 00 flI.#IS 0.0.00001

0 1

000

OLOJC

flrns

.-o.-ooroee

Fig. 5.13: Resultados de la identificacin de la planta 3. Subfigura 1: salida del


modelo VS. salida real para RGO. Subfigura 2: error cometido. Subfi gura 3: salida del modelo vs. salida real para la Red Neuronal. Subfi gura 4: error cometido.

5.8. CONCLUSIONES

=E!1iVVVV/VVVNVVV&AA

AMWAAtWAANVMVN
IS .-roro.aO,

Fig. 5.14: Resultados de la identificacin de la planta 4. Subfigura 1: salida del modelo vs. salida real para RGO. Subfigura 2: error cometido. Subi gura 3: salida del modelo vs. salida real para la Red Neuronal. Subfi gura 4: error cometido.

5.8 Conclusiones
En este captulo se ha desarrollado un nuevo algoritmo para la identificacin de sistemas dinmicos basado en RGO. Se han utilizado modelos OE, ARMAX y NARMAX, pero el mtodo se puede utilizar igualmente con cualquier otro mto do paramtrico. En las simulaciones realizadas, los mtodos basados en RGO mejoran consi derablemente los resultados obtenidos por los mtodos basados en mnimos cua drados e incluso los de Redes Neuronales Backpropagation. Los resultados obtenidos prueban que el mtodo RGO puede ser utilizado para mejorar los resultados obtenidos con otros mtodos de identificacin de sistemas. En especial cuando el sistema no es lineal en los parmetros y cuando las seales de entrada y salida contienen ruido coloreado.

80

IDENTIFICACIN SISTEMAS LINEALES 5. DE NO

6. ESTIMACIN ESTADOS DE
6.1 Introduccin

El filtro de Kalman da una solucin efectiva al problema de filtrado lineal Gaussiano. Sin embargo, cuando hay no linealidades, tanto sea en la especifica cin del modelo como en el proceso de observacin, se requieren otros mtodos. Cuando el estado de un sistema tiene que ser estimado a partir de informacin sensorial con ruido, se necesita emplear algn tipo de estimador de estados para fusionar los datos de los diferentes sensores para producir una estimacin precisa del verdadero estado del sistema. El mtodo mas frecuentemente utilizado para la fusin de la informacin dada por los sensores en aplicaciones de robtica mvil es el Filtro de Kalman [61] y sus diferentes variaciones. Este filtro se utiliza para combinar todos los datos de medidas (por ejemplo, para fundir los diferentes datos de los distintos tipos de sensores) para obtener una estimacin ptima en sentido estadstico. Si la dinmica del sistema y el modelo de observacin son lineales y tanto el error del sistema como el error de medida (de los sensores) son Gaussianos, entonces el estimador de mnimos cuadrados puede ser calculado usando el filtro de Kalman. Es decir el Filtro de Kalman da una estimacin ptima desde el punto de vista estadstico. El clculo del Filtro de Kalman se hace recursivamente, es decir, en cada itera cin, slo la nueva medida y la ltima estimacin son usadas en el clculo actual, por tanto no hay necesidad de guardar las estimaciones y medidas previas. Es ta caracterstica hace que no necesite ni una gran potencia de clculo ni un gran almacenamiento. Las medidas de un grupo de sensores pueden ser fundidas utilizando el filtro de Kaiman para estimar el estado actual y para hacer una prediccin del estado futuro del sistema. En el caso no lineal el problema de filtrado en el espacio de estados viene dado por

82

ESTIMACIN 6.ESTADOS DE

x(k) =g(k,x(kl),E(k)) z(k)


=

(6.1) (6.2)

h(k,x(k),i(k))

donde 2(k) y r(k) son los ruidos, que se suponen vectores aleatorios, indepen dientemente distribuidos: 2(k) ((O (Q(k) O (k) O O R(k)

(6.3)

La estimacin ptima implica la descripcin de la densidad de probabilidad condicional MSE(kk) E(x(k)IZk) fx(k)p(x(k)IZk)dx. = Desafortunadamente, esta descripcin necesita un nmero infinito de parmetros. Por esta razn, un nmero de aproximaciones subptimas han sido propuestas. Estos mtodos utilizan aproximaciones analticas de las distribuciones de proba bilidad, la ecuacin de transicin de estados o la ecuacin de medida. Existen otros mtodos, tales como el mtodo de Montecarlo, que necesitan miles de pun tos para aproximar la densidad de probabilidad condicional. En aplicaciones con muchas dimensiones, stos ltimos mtodos no son prcticos. Por esta razn son necesarios mtodos con un nmero razonable de operaciones, tales como los es tudiados en este trabajo. Para el problema de filtrado no-lineal, la aproximacin ms sencilla e intuitiva es utilizar el desarrollo en serie de Taylor y utilizar las funciones de medida y de transicin no-lineales en el algoritmo del filtro lineal recursivo de Kalman. Los filtros no-lineales tradicionales incluyen el Filtro Extendido de Kalman (EKF), el Filtro No-lineal de Segundo orden (SNF) y el Filtro Iterado de una etapa (Single stage Iteration Filter (SIF)), que estn descritos en Wishner, Tabaczynskiy Athans [106J. Para reducir el sesgo de las estimaciones del filtro y obtener el valor esperado de las distribuciones de probabilidad ms correctamente, fue desarrollado el Filtro de Simulacin Montecarlo por Tanizaki y Mariano [100, 1011

(6.4)

6.2

El Problema Filtrado. de

El problema consiste en hallar una estimacin del estado x(k) del sistema de inters, con una dinmica discreta no lineal dada por x(k)=g(k,x(k1),E(k))
.

(6.5)

6.2. EL PROBLEMA FILTRADO. DE

83

donde g la funcin de estado del modelo, x(k) es el estado del sistema en el tiempo k y c(k) es el ruido del proceso. La nica informacin disponible del sistema es la observacin con ruido dada por la ecuacin no lineal de medida

z(k)=h(k,x(k),1i(k))

(6.6)

donde z(k) es el vector de observacin, h es el modelo de observacin que trans forma el espacio de estados en el espacio de observacin y 11(k) es el ruido de medida. El estimador MMSE coincide con la media condicional. Sea (iIj) E[x(i)ZJ] con = {z(1),z(2),...,z(j)}T. La covarianza estimada es P(iIj) = E[{x(i) x(iIj)}{x(i) _(ij)}Tzi] Estas ecuaciones son difciles de evaluar en la prctica. Por esta razn se emplean estimadores recursivos. En el caso li neal con ruido aditivo gaussiano el MMSE es el filtro de Kalman. Las ecuaciones lineales son , en este caso:
.

(kIk)=(klk1)+W(k)v(k), P,(kIk) =P(kk l)W(k)P(klk 1)WT(k)


.

(6.7)
(6.8)

El vector y (k) se llama innovacin, y es la diferencia entre la observacin y la prediccin:

v(k)=z(k)2(kkl)
La covarianza de esta magnitud es

(6.9)

P(kk

1) =P(kIk l)+R(k),

(6.10)

y W(k) esla ganancia de Kalman y su valor es

W(k) =P(klk l)P (klk 1)

(6.11)
-

6.2.1

La estimacin lineal sistemas en dinmicosEl Filtro de Kalman

El problema estimacin de dinmica


Consideremos un sistema dinmico lineal en tiempo discreto descrito por una ecuacin vectorial en diferencias con ruido blanco Gaussiano aditivo que modela perturbaciones no predecibles. La ecuacin de estado es

x(k+1)=F(k)x(k)+G(k)u(k)+v(k),

k=0,1,...

(6.12)

84

ESTIMACIN 6. DE ESTADOS

donde x(k) es el vector de estado de dimensin n, u(k) es el vector de entrada de dimensin nu(que es conocido), y v(k), k = 0, 1,..., es la secuencia de ruido blanco Gaussiano de media cero con covarianza E[v(k)v(k)] La ecuacin de medida es z(k)=H(k)x(k)+w(k) k=l,2,...
=

Q(k)

(6.13)

(6.1

con w(k) secuencia de ruido de medida blanco Gaussiano de media cero con co varianza E[w(k)w(k)J R(k) (6.15)

Las matrices F, G, II, Q,y R se suponen conocidas y que pueden cambiar con el tiempo. En otras palabras, el sistema puede cambiar con el tiempo y los ruidos son no estacionarios. El estado inicial x(0) es en general desconocido y se modela como una variable aleatoria Gaussiana con media y covarianza conocidas. Las dos secuencias de ruido y el estado inicial se suponen mutuamente independientes y adems los ruidos son independientes. Las ateriores condiciones se llaman lineales-Gaussianas.

El algoritmo estimacinEl algoritmo de estimacin comienza con una de


estimacin inicial dex(0) lacovarianzainicial asociada P(0I0) , que se i(0O) y supone disponible. Un ciclo algoritmoestimacindinmica (filtro de Kaiman) consiste en del de estimar partir a x(kk)
=

E{x(k)JZ]

(6.16)

que eslamedia condicional del estado en el tiempo k, dadaslas observaciones hastaeltiempo k inclusive , y dela matriz covarianza de asociada P(kk)
=

E[[x(k) (kIk)][x(k) (kIk)]lZ]

(6.17)

las correspondientes del variablessiguiente paso, (k+ ljk+ 1) y P(k+ 1k+ 1). Esto sepuedehacer puesto que las variables Gaussianas quedan caracterizadas por sus dos primerosmomentos.

6.2.

EL

PROBLEMA

DE

FILTRADO.

85

Estado Real Estado en tk x(k)

Entrada conocida

Estimacin del estado u(k) Estimacindelestadoent1j 2(klk)

Clculo covananza de la Covajjapza del estadoen P(klk)


_____________________

Controltk en

_________

Transicin a tk+1 x(k+1)= F(k)x(k) +G(k)u(k)

Prediccindel es (k+1 Jk)= F(k)x(klk) +G(k)u(k)

Covarianzado la prediccindel estado P(k+lIk)= F(k)P(klk)F(k)+Q(k)

1
1

1
Medida tk+1 en
z(k+1)

Prediccin do la medida 2lc+ii)= H(k+1)x(k+1 1k)

Innovacin do la

covananza
S(k1)= )P(k+1 H(k+1 )H(kl) +R(k1)

n(k+1) Innovacin z(k+1)-z(k+1 1k)

Ganancia del Filtro P(k+1 k)H(k+l)S (k+1)

W(k+1)

1
1

Actaalizacinde la estimacin estado del Q(kik+i)= x(k+1 lk)+W(k+1)(k+1]

Actualizacin k covarianza 1 1

de la del estado PQ(+lIk+1)= P(kllk) -W(k+1)S(k+1)W(k+1)

Fig. 6.1: Diagrama de flujo del filtro de Kalman.

Derivacin del Algoritmode EstimacinDinmica


La prediccin del estado (k + 11k)= E{x(k + 1) IZ] se sigue de aplicar a la ecuacin de estado x(k + 1) = F(k)x(k) + G(k)u(k) + v(k) el operador de espe ranza condicionada por Zk, E[x(k+ l)IZ]
=

E[F(k)x(k) +G(k)u(k) +v(k)IZ]

(6.18)

Como el ruido del proceso v(k) es blanco y de media cero, entonces

2(k+llk) =F(k).e(kIk)+G(k)u(k)
Restando de la ecuacin de estado obtenemos el error de prediccin de estado,

(6.19)

(k+lIk)

=x(k+1)(k+

11k)=F(k)(kIk)+v(k)

(6.20)

86

ESTIMACIN 6.ESTADOS DE

La covarianza de la prediccin de estado

P(k+ 11k)= cov[x(k+ l)IZ] = cov[2(k+ 1lk)IZ]


se obtiene 6.20, de

(6.21)

S(k+l)=H(k+l)P(k+llk)H(k-I-i)+R(k+1)
La covarianza entre el estado y la medida es , usando 6.20

(6.2)

E[i(k+ lIk)(k+llk)lZk} =E[(k+ llk)[H(k+ 1)i(k-flIk)+w(k+ l)]IZ] =P(k+lJk)H(k+ 1) (6.23) La ganancia del filtro, PP1 es
=

W(k+ 1) = cov[x(k+ 1),z(k+ 1)Z]S(k+ l)


(6.24)

W(k+ 1) = P(k+ llk)H(k+ 1)S(k+ 1)_1


Por tanto, la estimacin actualizada del estado puede ser escrita como (k+1Ik+1)=(k+1lk)+w(k+1)v(k+1) donde

(6.25)

v(k+1)=z(k-I-1)--2(k+1Ik)=(k+1Ik)
es la innovacin. Finalmente, la covarianza actualizada es

(6.26)

P(k+ lIk+ 1) =P(k+ llk)P(k+ lIk)H(k+ 1)S(k+ 1)H(k+ 1)P(k+ 11k) = [IW(k+1)H(k+l)]P(k+llk)
(6.27) o, en forma simtrica P(k+1lk+1)=P(k+1lk)W(k+1)S(k+1)W(k+1) (6.28)

6.3

FiltrosNo-lineales Tradicionales

6.3.1 FiltroExtendido Kalman de (EKF)y Filtro No-lineal de Segundo Orden(SNF)


El filtro Extendido de Kaiman es similar a un filtro de Kaiman linealizado, con la excepcin de que la linealizacin es realizada en la trayectoria estimada en vez

6.3. FILTROS NO-LINEALES TRADICIONALES

87

de hacerlo en una trayectoria nominal previamente calculada. Por esta razn, las funcionesg(k,x(k 1),E(k)) y h(k,x(k),ti(k)) son desarrolladas en serie de Taylor alrededor de x(kIk) con trminos hasta primer o segundo orden para obtener el EKF o SNF respectivamente. El desarrollo con trminos de segundo orden de la ecuacin de transicin es:

x(k)

g(k,x(k1),(k)) g(k,(kk 1),O) +gx(k,x(k1),c(k))(x(k 1)(k 11k l))+gE(k,x(k l),(k))E(k)


=

+e(x(k-

1)-x(k- 11k1))g{(k,x(kl),E(k))(x(k1) -(k

11k-1))

ejE (k)g(k,x(k (k))E(k) 1), +ex(k 1)(k 11kl))g(k,x(k 1),E(k))(k)

(6.29)
y el de aollo con trminos hasta segundo orden de la ecuacin de medida es:

z(k) = h(k,x(k),i1(k) h(k,(kk l),0) +h(k,x(k l),(k))(x(k 1)(k 1k1)) +h1(k,x(kl),i(k))i(k) +ej(x(k1) -x(k- 11k-1))h(k,x(k1),i(k))(x(k1)-(k11k-1))

+Lej11(k)hi(k,x(kl),T(k))T(k) -i-ej(x(k 1) (k
j=1

11k 1))h(k,x(k 1),i(k))ri(k)


(6.30)

donde ej es el vector de la base Cartesiana. Las tcnicas basadas en el Filtro de Kaiman Extendido han demostrado ser robustas y mantener el seguimiento de la posicin robot de forma precisa. Sin em bargo el Filtro de Kaiman Extendido no puede representar ambigedades (como las simetras) y no es capaz de relocalizar al robot en caso de fallo en la localiza cin. Muchas de estas dificultades estriban en asumir la restriccin Gaussiana del Filtro de Kalman.

88

ESTIMACIN 6.ESTADOS DE

6.3.2 Filtroextendido Iteradode Kaiman(IEKF)


La prediccin de la medida, hasta primer orden, es 2(klk 1) = h(k, (k k 1). Hay errores en la prediccin al usar (kIk 1) para estimar x(k). Otros errores adicionales son debidos a la no linealidad en la medida. Es posible disminuir estos errores si el estado actualizado no es calculado como una aproximacin a la esperanza condicional sino como un estimador del tipo maximum a posteriori. La funcin de densidad de probabilidad condicional, PDF, de x(k) dado Zk, si todas las variables aleatorias son Gaussianas, es

p(x(k)Z)= p(x(k)Iz(k),Zc_l) = 1p(z(k)x(k))p(x(kZ)) = 9(z(k);h(k,x(k)),R(k)) x(k);(kk1),P(klk1)).


(6.31) Maximizar esta funcin es equivalente a minimizar la siguiente

V(x(I))

(z(k)h(k,x(k)))R(k)(z(k) h(k,x(k))) +(x(k) (kIk 1))(P(kk 1)(x(k) (kIk 1))


=

(632)

El Filtro KaimanExtendido de Iterado (IEKF) un algoritmo usa Newton Raphson para estimar (kIk). Desarrollando serie Taylor segundo Ven de hasta orden alrededor de la i-sima estimacin de x(k)da como resultado:

V+V(xx)

+ (xx)V(xx)

(6.33)

Poniendo el gradiente a cero: (6.34) Esto da lugar a la ecuacin IEKF:

(kk) P(kk)P(kk 1)((klk) (kk 1)), (6.35)


with H(k) = h(k,(kk))

6.3. FILTROS NO-LINEALES TRADICIONALES

89

6.3.3 FiltroIterado unaEtapa de (Single-stage Iterated Filter (SIF))


Esta tcnica trata de maximizar la densidad de probabilidad a posteriori. En el mtodo EKF, la trayectoria nominal es linealizada alrededor de la trayectoria nominal determinada por (k 11k 1) y el estado nominal (kIk 1). Si la trayectoria y el estado nominales no estn cerca de la trayectoria verdadera, los desarrolls truncados del EKF presentarn pobres aproximaciones. La ecuacin z(k) = h(k,x(k),(k)) puede ser reescrita como q(k,z(k),x(k)) = Con esta expresin y x(kIk 1) = x(k) donde

((k)_((0

(k))O)

(R(k) O

P(klk-1)))

es posible minimizar la siguiente suma de cuadrados de los residuos con pesos:

q(k,z(k),x(k))R1 (k)q(k,z(k),x(k)) +(kk 1) x(k))Pxz(klk 1)((kIk 1) x(k))


usando el mtodo de optimizacin de Newton-Raphson.

(klk 1) = gi((kk) +g(k,x(kk 1),E(k)))(k 1)(kIk 1), 11k P(kIk 1) = g(k,x(kk),E(k))P(kk l)g(k,x(kk 1),E(k))+Q(k), 2(kIk 1) h(k,x(klk 1),i(k)), = P(k) = Hu(k,(kIk),x)P(k, k 1)(Hu(k,x(kk),x)) + R, (k) =z(k)2(kIk 1), W(k) = P(k,k 1)h(k,(kIk),x)P(k), P(k,k) = P(k,k 1) W(k)P(k)W(k), x(klk)=x(k,k1)+W(k)(k)

6.3.4 FiltroconSimulacin Montecarlo (MSF)


Tanizaki y Mariano [101] propusieron un algoritmosimulacionesestocs en ticas Montecarlo, donde las variables aleatorias normales estn generadas por los trminos de error E(k) y i (k) y las variables de estado x(k) y x(k 1) para evaluar los valores esperados mas exactamente. Esta aproximacin est basada en las ecuaciones:

x(k) =g(k,(kki),O)
+g(k,x(k_1),c(k))(x(k_l)_(k_1k_1)),

(636)

90

ESTIMACIN 6. DEESTADOS

z(k) =h(k,(kki),0) +hx(k,x(k-l),11(k))(x(k-l)(k-lIk-l)).


que son lineales en las variables de estado x(k) y x(k- 1). Por tanto, este algoritmo es una combinacin del Filtro Extendido de Kalman y la simulacin estocstica Montecarlo. Este algoritmo es una combinacin del EKF y de las simulaciones estocsticas Montecarlo. Las aproximaciones del Filtro de Kaiman se aproximan por caminos aleato rios:

.(kIk1)= 1), P(kk l)= 1((kIk 1) (kk l))((kjk 1) (kk 1)), 2(kjk1)= L12(kIk 1), P(kk 1) L1(2(kIk 1) = 2(kk l))(2(kk 1) 2(kk 1)), P(kIk1)= w(k) =Pxz(kIkT l)P(kJk 1), P(kk) =P,(kIk l)W(k)P(kIk l)W(k),
and

x(kk) =(kk 1)+w(k) (2(kIk1) 2(kk 1)),

(6.38)

where (kIk 1)= g(k,(k l,kl),c(k)), and 2(k,k 1)= h(k,(k,k l),i(k))

6.4

El nuevoFiltro,RGO
...,

Los algoritmos genticos son un proceso probabilstico de bsqueda basado en la seleccin natural y en las leyes genticas. La poblacin 9 = (9i ,92, 9) E jN es modificada de acuerdo con los procesos evolutivos naturales: despus de la inicializacin, son ejecutados la seleccin w : jN jN, cruce : jN jN , mutacin : jN recursivamente en un bucle. Cada ejecucin del bucle es llamada generacin y 9 representa la poblacin en la generacin t. El operador de seleccin tiene como fin mejorar la calidad media de la pobla cin dando a los individuos de mayor calidad una alta probabilidad de ser copiados en la nueva generacin. La seleccin, por lo tanto, enfoca la bsqueda hacia regio nes prometedoras del espacio de bsqueda. La calidad de un individuo es medida

6.4. EL NUEVOFILTRO,RGO

por la funcin de salud f : J donde J representa el espacio de todos los posibles individuos. Los algoritmos genticos se utilizan usualmente como mtodo de optimiza cin global de funciones invariantes en el tiempo, y usualmente se ejecutan off une. Sin embargo, la seleccin natural de los seres vivos es un proceso local o semi local en el que las especies se adaptan por s mismas al entorno, que a su vez es dependiente del tiempo (es on une).
+

Iniciar la poblacin

Calcular la funcin de salud

Aplicar los operadores: seleccin, cruce, mutacin, elitismo e inmigracin para construir la nueva poblacin

Calcular la funcin de salud

Escoger el mejor valor para mandarlo al algoritmo de filtrado

Calcular la distancia de Mahalanobis para tomarla como nuevo radio de bsqueda

Fig. 6.2: Diagrama de flujo de la Optimizacin GenticaRestringida aplicadaa la estimacin de estados. Es posible adaptar el mtodo de algoritmos genticos si se restringe la bsque da a un entorno de la estimacin previa usando como funcin de salud:

con=

P(klk1)l,

cte+V((kIk1))

92

ESTIMACIN 6. DEESTADOS

donde cte es una constante grande y

V(x(k)) (z(k)h(k,x(k)))R(k)(z(k) h(k,x(k))) = L )


Por lo tanto el algoritmo actualiza las estimaciones de los estados y la matriz de covarianza y el bucle es repetido de nuevo, como se ilustra en la figura 6.2. La funcin de densidad de probabilidad de x(k) dado Zk viene dada como p(x(k)Z)

640

=p(x(k)z(k),zk_l)
= =

1p(z(k) x(k))p(x(kJZ)) N(z(k);h(k,x(k)),R(k))N(x(k);(kIk-

l),P(klk-

1)). (6.41)

Maximizar la funcin anterior es equivalente a calcular una estimacin maxi mum a posteriori (MAP). Esto es tambin equivalente a minimizar V(x(k)) , i.e. maximizar la funcin de salud f(J). La funcin de salud estndar (i.e. dividida por la suma de las saludes) es una aproximacin de la funcin de densidad condicional (PDF). Zk p(z(k)Ix(k))p(x(k)Zk_l) p(x( k )I ) fp(z(k)x(k))p(x(k)z1)
-

( 642

De todo lo anterior queda claro que es posible calcular precisamente las no linealidades de las funciones f y g, sin embargo la introduccin de la hiptesis de ruido gaussiano no se puede evitar. Para determinar el radio de la zona de bsqueda, usamos la distancia de Mahalanobis d= ((kjk 1) (k lJk 1))P1(kIk)(kk 1) (k 1k 1)) (6.43)

que mide la incertidumbre de la estimacin (k). Todosestos procesos pueden ser aplicados al Filtro Extendido de Kalman (pa ra obtener el Filtro de Optimizacin Gentica Restringida, RGOF) o al Filtro Nolineal de Segundo Orden, SNF (para obtener el Filtro de Optimizacin Gentica Restringida de Segundo Orden, SRGOF).

6.5 Comparacin Filtros de No-lineales.


La comparacin de filtros no-lineales la realizamos por medio de simulaciones Monte-Carlo.Un conjunto de datos x(k) z(k) simulados artificialmente y la y son

6.5. COMPARACIN FILTROS DE NO-LINEALES.

93

EKF FILTER

3.5
3

9lGcF FILTER

2.5 2 1 .5

0.5

50

100

150

200

Fig. 6.3: Ejecuciones tpicas para el modelo 5 con EKF y SRGOF para nivel de
ruido 1.0. estimacin (k). es comparada con x(k) y el BlAS y el RMSEentre el valor esti mado (k) y el simulado x(k) se calcula para cada tiempo k. Este procedimiento se realiza 6000 veces (30 ejecuciones de 200 puntos cada una). Para comparar los distintos mtodos de estimacin, considerar cinco ejemplos conocidos en orden ascendiente de no linealidad y con tres niveles diferentes de ruido. En todos los casos c(k) y r(k) se suponen normalmente distribuidos como

()((g)1(
J
)(
1 x(k)=x(k1)+E(k)
.

g))1
(645)

(6.44)

donde C es una constante y el valor inicial x(0) est distribuido como una variable aleatoria normal. El primer modelo es lineal:

1..z(k)=x(k)+n(k)
El segundo elmodelo es Logstico:
Xk..) k Z )

exp(x(k1))+exp(E(k)) exp(x(k1) exp(x(k)) exp(x(k))+exp((k))

El tercero es el modelo ARCH:

x(k) (1 -b+b(x(k- 1))2)1/2+i(k) = 1. z(k)=x(k)+E(k)


.

47)(6

El cuartoes el modelo de Crecimiento No-estacionario de Kitagawa (1987) y Carlin et al. (1992).

94

ESTIMACIN 6.ESTADOS DE

x(k)= 0.5x(k + 1)

+8cos(1.2(t 1)) +E(k)

1 z(k)=-0+i1(k).
El ltimo corresponde al seguimiento de un mvil con un sensor que mide solamente el ngulo, dado por Bar-Shalom y Fortmann [9] en 1988.

x(k)=(

)x(k_1)+E(k) atan
((X(1,kX(k)))

(6.49)

1 z(k)

+i(k)

Tab. 6.1: Comparacin de BlAS para el nivel de ruido 0.1. Model 1 Model 2 Model 3 Model 4 Model 5 EKF -0.2062 0.0058 -0.1275 0.7118 -0.2342 IEKF -0.7654 0.0250 -1.2593 0.4796 -0.2488 SNF -0.2063 0.0109 -0.1210 0.4796 -0.4361 SIF 0.1955 8.5E-05 -0.1812 0.5861 -0.3238 MSF -4.9743 0.0057 -0.1397 0.4487 -0.2453 RGOF -0.1889 0.0076 -0.1142 0.2688 0.2411 SRGOF 0.6469 0.0078 -0.1198 0.3893 0.0938

Tab. 6.2: Comparacinde RMSE para el nivel de ruido 0.1. Model 1 Model 2 Model 3 Model 4 Model5 EKF 0.9616 0.0876 0.9162 10.9863 1.1963 IEKF 2.0934 0.0822 2.1868 10.8942 1.0293 SNF 0.9638 0.0536 0.8812 10.8942 0.9003 SIF 1.9693 0.0690 1.0947 13.1817 0.8980 MSF 36.5653 0.0786 0.8718 11.3058 0.8828 RGOF 0.9515 0.0532 0.8695 10.3893 1.1523 SRGOF 1.3145 0.0543 0.8554 10.1435 0.8511

6.6. DISCUSIN

Tab. 6.3:_Comparacinde BlAS para el nivel de ruido 0.5. Model 1 Model 2 Model3 Model4 Model5 EKF -1.9802 0.2251 -0.1691 0.2727 0.1648 IEKF -6.7135 0.2233 -0.7962 0.1858 -0.1300 SNF -0.7908 02275 -0.1250 0.1858 -0.0797 SIF 0.4687 0.2269 -0.1911 0.8650 0.1989 MSF -59.0465 0.2236 -0.0628 0.5375 -0.0202 RGOF -0.8040 0.2209 -0.1453 0.4761 0.3438 SRGOF -1.1171 0.2055 -0.1603 -1.2549 -1.0691

Tab. 6.4: Comparacin de RMSE para el nivel de ruido 0.5. Model 1 Model2 Model 3 Model 4 Model 5 EKF 4.996 1.5537 0.8632 14.7955 5.5196 IEKF 10.068 1.5561 1.7991 14.7742 5.0794 SNF 4.354 1.5546 0.8463 14.7742 4.6296 SIF 8.767 1.5494 1.0864 17.9635 4.4094 MSF 154.528 1.5540 0.8523 14.8041 5.1212 RGOF 3.847 1.5525 0.8573 10.3697 5.9636 SRGOF 4.2704 1.5063 0.8611 6.0052 4.8815

________

Tab. 6.5: Comparacin de BlAS para el nivel de ruido 1.0. Model1 Model2 Model 3 Model 4 Model 5 EKF -1.0107 0.0811 -0.1275 0.28454 0.2183 IEKF -4.01 17 0.1628 -1.2593 0.19430 0.2765 SNF -1.0325 0.0859 -0.1210 0.19430 0.0084 SIF 0.9615 0.0369 -0.1812 0.52118 -1.6102 MSF -17.5458 0.0810 -0.1397 0.43729 0.6963 RGOF -2.3808 0.0524 -0.1146 0.01695 0.3160 SRGOF -2.1398 0.0529 -0.1198 0.11951 1.7845

6.6 Discusin
En este captulo se describe un nuevo mtodo de filtrado no lineal. Este mto do utiliza la Optimizacin Gentica Restringida para reducir el error de estimacin

96

ESTIMACIN 6. DEESTADOS

Tab. 6.6: Comparacin de RMSE para el nivel de ruido 1.0.


EKF IEKF SNF SIF MSF RGOF SRGOF Model 1 Model 2 Model 3 4.8071 0.2457 0.9162 9.7702 0.2791 2.1868 4.8194 0.2374 0.8812 9.8352 0.3276 1.0947 173.3967 0.2417 0.8718 5.5300 0.2286 0.8696 5.9861 0.2287 0.8554 Model 4 Model 5 14.5453 11.0601 14.5721 9.7927 14.5721 8.2852 15.6697 8.2340 14.6868 8.1326 10.1305 10.2766 9.9886 9.1265

de las estimaciones previas EKF o SNF. Las tablas 1-3 sumarizan los resultados de cinco modelos con tres niveles de ruido: JEI = = 0.1, 0.5 y 1.0. Cada nmero mostrado en las tablas repre senta la media de treinta ejecuciones de doscientos puntos cada una. Queda claro de los siguientes resultados que la precisin (basada en el criterio RMSE) de las estimaciones del SRGOF son ciertamente superiores a las de los otros algoritmos, especialmente en las situaciones con ms ruido y ms no lineali dades. Juzgando a partir del criterio de los BlAS no hay grandes diferencias entre los diferentes mtodos, aunque algunos algoritmos (MSF, SIF y IEKF) son menos robustos en ciertas situaciones. Finalmente, la caracterstica ms importante del mtodo propuesto SRGOF es su robustez en las situaciones de alto ruido y fuertes no linealidades, que son las caractersticas deseadas de tales filtros.

7. IDENTIFICACIN ELESPACIO EN DE ESTADOS


7.1 Modelos Sistemas de Lineales el Espacio en de Estados

Un sistema lineal general discreto e invariante en el tiempo puede ser descrito como y(t)
=

Go(q)u(t) +Ho(q)eo(t),

(7.1)

donde y(t) es el vector de salida de dimensin p, u(t) es el vector de entrada de dimensin m y que se suponen conocidos. Las perturbaciones desconocidas que actan en la salida se suponen generadas por el segundo trmino, donde eo(t) es el vector deiiiido de dimensin p. Se supone que eo(t) es una secuencia de variabls estocsticas independientes que cumplen E[eo(t)]
=

O,

E[eo(t)eo(t)T] = A0

(7.2)

donde E es el operador esperanza matemtica. Como el sistema es de orden finito, puede ser descrito tambin en el espacio de estados, introduciendo el vector auxiliar de estados x(t) de dimensin n, siendo n la dimensin del sistema. La relacin de entrada-salida puede ser descrita por x(t+1) =Ax(t)+Bu(t)+Keo(t) y(t) = Cx(t) +eo(t). dondeA E Rnxn B E Rnx, K E RnXP y CE RPXn. La manera representar en 7.3 se dice est forma innova de elruido que en de ciones. El modelo en espacio de estados 7.3 es igual al sistema 7.1 si las matrices A, B, C yK cumplen Go(q)= C(qIA)B, yHo(q)
=

73)

C(qIA)1K+I.

(7.4)

987.IDENTIFICACINENELESPACIODEESTADOS

Las matrices A, B, C y K no son nicas. Es posible un cambio de base para los estados x(t)
=

T1x(t)

(7.5)

donde T e R<2 una matriz no singular, y el sistema en las nuevas variables de es estado son x(t+l) =Ax(t)+Bu(t)+Keo(t) y(t)=Cx(t)+eo(t). ) Donde A = T1AT, B= T1B, K = T1K y C = CT. Es fcil ver que C(qIA)B = C(qIA)1B C(qIA)K+I=C(qIA)1K+I

76

7.2 Parametrizacin e Identiticabilidad


Para la identificacin de sistemas es deseable frecuentemente utilizar modelos paramtricos, es decir, modelos que pueden ser descritos por un cierto nmero de parmetros con valores reales, que pueden ser considerados como un vector de parmetros e IR1.Un modelo en particular viene descrito por un valor del vector d-dimensional 0. La correspondencia del espacio de parmetros iR al espacio de modelos lineales se le llama estructura de modelos 9. Consideramos, por tanto, las estructuras de modelos el espacio de estados en y en la forma de innovaciones:

J(t+

1) =A(8)(t)

+B(9)u(t) +K(0)e(t)

8)

Y(t)= C(e)e(t) + e(t). donde las matrices A,B, C y K estn construidas a partir del vector O de acuerdo con la estructura de modelos M. Una estructura de modelos !M esglobalmente identificable si M(0) = M(0*) e = 0*. Es decir, dos vectores de parmetros distintos Oy 9 no pueden dar el mis mo modelo. Las estructuras de modelos identificableshan sido muy utilizadas para la iden tificacin de sistemas debido a la correspondencia biunvoca entre los modelos y los valores del vector de parmetros. Sin embargo, para algunos sistemas es difcil encontrar una parametrizacin bien condicionada. Las estructuras de modelo identificables 9v!1fueron introducidas en [88] y pueden ser definidas como:
.

7.3. MODELOSEN EL ESPACIO ESTADOS DE TOTALMENTE PARAMETRIZADOS Definicin 7.2.1: SeaA(O) unamatrizrellenadecerosy conunosen la lneasu perior a la diagonal.Seanlas filas numeradas ra,.. , r, donder rl, n, rellenas con parmetros. Sean B(O)y K(9) rellenas parmetros C(O)con cerosy con con y unos en la fila i, columnar_ 1 + 1. (Seconsiderar = 0 y que p esla dimensin de y(t)).
.

Ejemplo Una parametrizacin identificableen variablesde estado un siste de


ma con catroestados, entrada unasalidacon ndices1,4estdadapor una y 9i x(t + 1) = 95 06 97
98 92

93 94 +
(t)

99 +u(t)
12

914913

e(t)

99 920 (7.9)

)t)+e(t). Ljung [69] demuestra siguienteteorema, el 4A.2.

(7.10)

Teorema 7.2.1: La estructura modelosen el espaciode estados anterior de lvLTj


mente definidaesglobalmente identificableen 9* siy slosi {A(9*), [B(9*)K(9*)]} es controlable.

7.3 Modelos el Espacio Estados en de Totalmente Parametrizados


Si consideramos modelo7.3 con todaslasmatricesA, B, C y K rellenascon el parmetros,estamossobre-parametrizando sistemay perdiendoidentificabili el dad. Ms exactamente, parala estructurade modelosidentificable se necesitan 2np + nm parmetros el nmerode parmetros y parala estructurade modelos totalmente parametrizada es d=n2+2np+nm. Es decir, parala estructura modelostotalmente de parametrizada necesitan se parmetros msqueparala estructurade modelosidentificable. No o1stante, estructura modelosen el espaciode estados esta de tienelas ven tajas de que no tenemosque buscarcul de todaslas diferentesformasde los (7.11)

1007.IDENTIFICACINENELESPACIODEESTADOS

multi-ndices se ajusta mejor a nuestro sistema puesto que la estructura totalmen te parametrizada contiene a todas las dems. Adems la calidad del modelo puede aumentar al elegir una estructura ms flexible. Esto nos permite adems hacer transformaciones para obtener una descripcin que est bien condicionada num ricamente. Basndonos en las realizaciones balanceadas, introducidas por Moore [82], Kabamba [59] describe una parametrizacin cannica identificable para sistemas en tiempo continuo con valores singulares de Hankel distintos. Este resultado fue generalizado por Ober a sistemas arbitrarios en [86] incluyendo una exten sin a sistemas en tiempo discreto utilizando la transformacin bilineal. con sta parametrizacin los parmetros pueden ser variados de forma continua sin que el sistema resulte no mnima. Otra ventaja, en comparacin con la forma observable, es que las parametrizaciones balanceadas tienen mejores propiedades numricas. Sin embargo, los ndices estructurales deben ser conocidos tambin para este tipo de parametrizacin. Chou [17] usa la parametrizacin equilibrada para la identifi cacin de sistemas.

7.4 Realizaciones Equilibradas (Balanced Realizations)


En las realizaciones no equilibradas, pequeos cambios en un parmetro pue den dar grandes cambios en el comportamiento del sistema. Esto debe ser evitado en cualquier mtodo de identificacin. Un ejemplo de realizacin no equilibrada es el siguiente. Consideremos el sistema G(q) = (q_01.99)4que en forma de estructura identificable tiene una matriz A igual a:

A(O)

0.9606

3.8812

5.8806 3.9600

Los valores propios, que son todos ellos iguales a 0.99, son extremadamente sensible a perturbaciones en los parmetros. Un cambio aditivo de 2x108 en cual quiera de los parmetros puede perturbar a uno de los autovalores y convertirlo en mayor que uno.Por esta razn es necesario introducir el concepto de realizacin equilibrada. La matriz
W

0= L(AT)!cCTCA1

7.5.IDENTIFICACINRGO ENEL ESPACIO DEESTADOS101

es conocida como el Gramiano de observabilidad parael sistema en el espacio de estados. Los autovalores de esta matriz describen cmo la variable de estado inicial x(O) influencia la seal de salida y(t) cuando u(t) 0. Esta matriz tambin satisface la siguiente ecuacin de Lyapunov

Wo =ATWOA+CTC. La matriz dual


WC = AkBBT(AT)k

es llamada el Gramiano de controlabilidad. Esta matriz describe cmo la entrada u influencia al vector de estado x. W tambin satisface

=AWAT+BBT.

Las matrices Gramianas son simtricas por construccin. Definicin. Una realizacin en el espacio de estados es equilibrada si

W0 =W==diag coni>,...a>0.

(i

...

,n)

7.5 Identificacin enel Espacio Estados RGO de


La entrada excitadora u(t) se ha escogido como una secuencia binaria pseudo aleatoria (PRBNS), con ruido coloreado. Como primer paso, para hacer esta identificacin paramtrica, realizamos una primera identificacin de mltiples modelos de tipo ARX, A (q1 )yk = zB(q1 ) Uk+ e(t), mediante el mtodo de mnimos cuadrados, y despus se transforma en una realizacin en el espacio de estados. La estimacin es transformada en una realizacin balanceada para tener un modelo mejor condicionado numricamente. A continuacin realizamos la bsqueda de modelos que se vayan adaptando mejor al sistema por medio de un algoritmo gentico. Para hacer la funcin de prdida V(i) = !Rynk 9nk)2 lo ms pequea posible, se ha utilizado como funcin de salud F(i) = cte+,,(i) , donde ctees

102

7. IDENTIFICACIN EL ESPACIO ESTADOS EN DE

una constante suficientemente grande (108) para mantener la diversidad de la po blacin. La probabilidad de reproduccin se ha calculado como F(t) = F(t)/I. La bsqueda es llevada a cabo usando matrices completamente parametrizadas y a cada generacin la estimacin es transformada en una realizacin balanceada para conseguir un modelo bien condicionado numricamente. En cada generacin, sustituimos el anterior modelo por el mejor de la nueva generacin como centro del entorno donde se realiza la bsqueda, de esta manera ,en caso de un sistema LTI, el mejor modelo debe ir tendiendo al valor que mini miza el funcional y la poblacin ira tendiendo a cero. A continuacin realizamos una nueva lectura de la entrada y la salida del sistema.

Fig. 7.1: Twin Rotor MIMO System (TRIVIS). De esta manera conseguimos un conjunto de aproximaciones sucesivas a me jores modelos en caso de el sistema sea invariante en el tiempo y si el sistema es variable, pero de variacin lo suficientemente lenta, entonces el modelo va si guiendo al sistema en sus variaciones. Podemos adems aprovechar las caractersticas convenientes de la convergen cia global si al principio tomamos una bola lo suficientemente grande, de manera que reduzcamos la probabilidad de quedarnos en un mnimo local. Una vez que sepamos que seguimos al mnimo adecuado, podemos reducir el tamao de la bo la y al mismo tiempo de la poblacin, para conseguir una mayor velocidad de ejecucin del algoritmo. Para que el algoritmo no tenga una convergencia prematura y se homogenei ce demasiado la poblacin, podemos aumentar el parmetro de probabilidad de mutacin.

7.5.IDENTIFICACINRGOENELESPACIODEESTADOS103

Aunque este algoritmo es costoso en cuanto a operaciones, es lo suficiente mente rpido como para ser empleado en linea. A esto hay que aadir que las aplicaciones a los que tpicamente se desea aplicar este identificador, es decir a los sistemas de control adaptativo, poseen dos bucles, uno rpido, que es el de control, y otro lento que es el identificador. Por tanto se puede aplicar a sistemas con una constante de tiempo del orden de las centsimas de segundo.

) 0 1

4O

YeI,:

X)

Moe

ou tpul.

ic

Mugen

tu: Meus

12)

14 ured

output

ic

1&0

.o

::/hY(1
0 0 4O Modelo 5(X) rtpu.

Qutput# O14 1 Fit:

ICXC, Meueu

1t0 14C0 red output

ISCO

-ISCO

Fig. 7.2: Resultados de identificacin de la Planta con el mtodo ARX. Aruba: Salida del Modelo vs. Salida del Sistema. Abajo: Error

4 Vellow:

SCO 5(X) Modeloutput.

15(X) 1) 14CX) 15(X) Mugento: Meuured outpot

IECO

0.5

o
0 -ICO Model EcO output 1)

lEcO Meusu

l-4c0

lECO

EcCO

,od outpul

Fig. 7.3: Resultados de identificacin de la Planta con el mtodo Gauss Newton.Arriba: Salida del Modelo vs. Salida del Sistema. Abajo: Error

1047.IDENTIFICACINENELESPACIODEESTADOS

200

.4

Vov:

1odeIotpt.

&X

1cO M9ontr

121

Mourod

14X)

otpfl

1&

1&X

20

1
0.5

1 utput# Fft; 003425

c
0.5 0

20

403 MOdel

503
output

105)

123)

1403

105)

105)

Measu

rod OulpUt

Fig. 7.4: Resultados de identificacin de la Planta con el mtodo RGO. Aruba: Salida del Modelo vs. Salida del Sistema. Abajo: Enor

7.5.1

E Agortmo

1. Se obtiene una primera estimacin utilizando mnimos cuadrados de un mo delo ARX y se pasa al espacio de estados. 2. Convertimos el sistema en una realizacin balanceada. 3. Hacemos k
=

4. Resolvemos el problema de minimizacin

k=argmnviv(e)
empleando RGO (Restricted Genetic Optimization) con matrices completa mente pararnetrizadas. 5. Convertimos la estimacin obtenida en una realizacin balanceada. 6. Hacemos k = k+ 1 y repetimos los pasos 4-6 hasta que
VN(B2)VN(8)<E

(7.13)

(7.14)

donde e es una constante dada a priori.

7.6. RESULTADOS

105

7.6

Resultados

Para poder contrastar los resultados con otros mtodos, vamos a utilizar como ndices de funcionamiento.los siguientes: Error RMS: RMS error= Error relativo RMS: Relative RMS error =
VN
(_)2 N

(7.15)

x 100%

(7.16)

Para comparar los varios mtodos de identificacin, consideramos la aplica cin a sistemas reales: al Twin Rotor Mimo System (TRMS) que es un sistema dinmico de laboratorio diseado especialmente para experimentos de control. En ciertos aspectos su comportamiento es parecido al de un helicptero. Desde el punto de vista de control ejemplifica un sistema no-lineal de orden alto con diferente dinmica en cada posible posicin. Los resultados obtenidos de los Errores Cuadrticos Relativos Medios (RM SE) se pueden resumir en la siguiente tabla: Error RMS relativo ARX331 0.1964

II

ARX441 0.1723 0.1695 N4SID6 Gauss-Newton33 10.06425 RG0331 0.03378 Tab. 7.1: Errores CuadrticosRelativos

7.7 Discusin
En este captulo se han comprobado las posibilidades que tiene la estructura de modelo totalmente parametrizada y su identificacin por medio de los mtodos ARX, Gauss-Newton y RGO. La principal idea es que esta estructura de modelo cubre todos los sistemas de un orden dado.

1067.IDENTIFICACINENEL

ESPACIO DEESTADOS

El mtodo de identificacin que se presenta utiliza la realizacin equilibrada (balanced realization) para conseguir un modelo bien condicionado numricamen te. En la tabla de resultados se puede observar que el mtodo RGO se comporta mejor que los otros algoritmos en un sistema como el TRMS con no linealidades y ruido.

8. APLICACIONES CONTROL AL PREDICTIVO


8.1 IntroduccinControl al Predictivo Basado en Modelo

Bajo este nombre se agrupan una serie de estrategias de control que tienen en comn como caracterstica principal, el hacer uso explcito de un modelo del proceso, para obtener la seal de control mediante la minimizacin de una cierta funcin de coste. En este sentido forman parte de una familia ms amplia, en la que se hace uso de un modelo del proceso para disear el controlador: LQ, IMC, asignacin de polos y ceros, etc. Adems de garantizar la operacin estable de la planta, los controladores avan zados de hoy en da han de satisfacer una serie de criterios adicionales u objetivos secundarios de control: econmicos, de seguridad, limitaciones fsicas de los equi pos, calidad del producto final, regulaciones ambientales , preferencias humanas, etc. Muchos de estos modelos admiten una representacin matemtica muy natu ral, bajo la forma de funciones objetivo dinmicas y ligaduras dinmicas de tipo desigualdad. El control predictivo basado en modelo tiene las siguientes caractersticas: Uso explcito de un modelo para predecir las salidas futuras.

Clculo de cierta secuencia que minimice cierta funcin objetivo. El horizonte se va desplazando hacia el futuro, lo que implica la aplicacin de la primera seal de control calculada en cada paso.

Ventajas del control predictivo basado en modelos sobre otros mtodos:

Se puede aplicar con pocos conocimientos de control, porque los conceptos son intuitivos y el sintonizado es relativamente sencillo.

1088.APLICACIONES

AL CONTROLPREDICTIVO

pasado -4

futuro
-

referencia r(t+p)
,.

w(t+k/t)

Salidas

predichas

1+1

t+2

t+p

horizonte

Fig.

8.1:

La

metodologa

del

control

predictivo

basado

en

modelos.

Se

puede

utilizar

para

controlar

una

gran

cantidad

de

procesos,

tanto

senci

llos

como

complejos;

incluyendo

sistemas

con

tiempo

de

retardo

grandes

sistemas

de

fase

no

mnima.

Se

puede

aplicar

al

caso

multivariable.

El

controlador

resultante

es

una

sencilla

ley

de

control

lineal.

Su

extensin

para

tratar

el

caso

con

restricciones

es

conceptualmente

senci

lla

puede

ser

incluida

durante

el

diseo.

Es

muy

til

cuando

las

referencias

futuras

son

conocidas.

Es

una

metodologa

abierta.

8.1.1

Estrategias

de

Control

Predictivo

Basado

en

Modelo

1.

En

cada

instante

de

tiempo

t,

se

predicen

las

salidas

futuras

del

proceso,

y(t+klt)

para

una

cierta

ventana

de

tiempo

k=1,2,...N,

utilizando

el

modelo

del

proceso.

recibe

el

nombre

de

horizonte

de

prediccin.

Estas

salidas

se valores

predicen futuros

con

la de

informacin un escenario

que de

est control

disponible que se

en postula

el

instante en el

t, instante

con t.

los

8.1. INTRODUCCIN CONTROL AL PREDICTIVO BASADO MODELO EN 109

2. Se define una trayectoria de referencia, r(t+klt), que describe cmo se desea guiarla salida del proceso desde su valor actual, y(t) hacia sus puntos de consigna futuros, w(t+klt). 3. De todo este conjunto se deduce la secuencia de control u(t+ktt) que hace mnima la funcin objetivo. 4. La seal de control u(tit) se manda al proceso. El resto de las seales se rechazan ya que y(t+l) es conocido y se vuelve al punto 1.
Trayectoria de referencia

de coste

Fig. 8.2: Estructura bsica del control predictivo.

8.1.2 Lafuncin objetivo


El criterio ms sencillo para el control predictivo es:
H

(8.1) Con este modelo se obtiene el control predictivo de mnima varianza. La expresin que se utiliza con ms frecuencia es:
N2

J(N1,N2,N3) =E{

(j)[y(t+jt)0(t+j)]2+

L X(j)[Au(t+j
j=1

i)]2}

(8.2) N1 y N2: Horizonte de coste (mnimo y mximo). N: Horizonte de control.

1108.APLICACIONES

AL CONTROLPREDICTIVO

r(tk)

Fig. 8.3: Distintas trayectoriasde referencia.

8.1.3 Trayectoria referencia de


Si conocemos la evolucin futura de la referencia, podemos actuar antes de que los cambios se produzcan.

8.2 Control Predictivo GPC.


Partimos de un modelo ARIMAX (tambin llamado CARIMA): A(z)y(t) =B(z_l)z_du(t_ 1) +C(z) (8.3)

en donde la perturbacin no medible viene representada por una secuencia de ruido blanco de media cero (t) coloreada por el polinomio C(z) e integrada por el operador incremento & Para optimizar la funcin de coste:
N2 N

J(Ni,N2,N3)

E{
j=N1

(j)[y(t+jt)

o(t+j)]2+

?(1) [Lu(t+j
j=1

l)]2}

(8.4) consideramos la ecuacin diofantina:[2] 1


=

E(z1 )/M(z) +zFj(z);

1 = E(z1)(z)

+Fj(z1)

(8.5)

8.3. EJEMPLO.

Si multiplicamos [1] por

consideramos [2] y

(z1)E(z1)y(t+j)
(1 _z_iFj(zl)y(t+j)

E(z1)B(z)Au(t+jd E(z )B(z)Au(t+jd

1) +E(z)e(t+j) (8.6)

1) +E(z1)e(t+f) (8.7)

y(t +

j)

Fj(Z1)y(t)

+E(z1 )B(z1 )Au(t+J d1) +E(z1)e(t+J)


(8.8)

Como el grado de E es j-1, los trminos de ruido estn todos en el futuro. La mejor prediccin es:

9(t+jlt)
con

G1(Z1 )Lu(t+jd

1) +Fj(z)y(t)

(8.9)

G(z)=E(z1)B(z)

(8.10)

8.3
y(t)

Ejemplo.
=

Considrese el siguiente sistema, descrito mediante un modelo ARIMAX: l.7y(t 1) 0.7y(t 2)+O.9zu(t 1)0.6i.u(t 2) +(t) (8.11)

con (t) una seal de ruido blanco de media cero. En la notacin empleada habi tualmente, los polinomios de la funcin de transferencia de este sistema son:

A(q) B(q)

= =

1 1.7q1 +0.7q 2)

12 8

0.9q

0.6q2

y se ha tomado C(q) = 1. Los parmetros del controlador GPC son N1 = 1, N=N2=3yX=0.1. Las ecuaciones del predictor se pueden obtener resolviendo la ecuacin dio fantina asociada, pero para resolverla a mano, es ms fcil iterar. As, y(t + 1It) y(t + 21t) 1.7y(t)0.7y(t 1) + 0.9Au(tlt) 0.6Au(t 1) = 1.7y(t + lit) 0.7y(t) + 0.9Au(t+ itt) 0.6Au(tlt) = 2.19y(t) 1.19y(t 1) +0.9Au(t+ lit) +0.93Lu(tIt) 1.02iu(t 1) y(t + 21t) = 1.7y(t + 21t) 0.7y(t + ilt) +0.9iu(t+ 21t) 0.6u(t lit) = 2.533y(t) 1.533y(t 1) +0.9iu(t+2It) +0.93iu(t+ lit) +0.951Lu(tIy) 1.314u(t 1) (8.13)

112

8. APLICACIONES CONTROL AL PREDICTIVO

en donde se ha tomado xi(t + jt)

y(t+2t) y(t+1t) y(t+3t)

+ /

1.7 2.19 1.19 0.7 2.533 1.533

)) (
=

0, Agrupando coeficientes, resulta

0.93 0.9 0.9 0 0 0.951 0.93 0.9 y(t) y(t 1)

( ) +(

) J

Au(t+lIt) u(tt)
zu(t+2It)

) J

(8.14)

1.02 0.6 1.314)

u(t1)

Por tanto, la matriz del controlador es

/
(GTG+X13)_1GT=

0.8947 0.0929 0.0095 0.8316 0.8091 0.0929 0.0766 0.8316 0.8947

.Au(t_1)

(8.15)

y la ley de control que se obtiene es Au(t) 0.644iu(t 1) l.7483y(t)+0.7513y(t +0.8947r(t+ 1)+0.0929r(t+2)+0.0095r(t+2)


=

(8 16)

Este es un controlador lineal e invariante en el tiempo, ya que el modelo es inva riante. Se puede comprobar la capacidad del controlador de mirar hacia adelante, ya que son tenidos en cuenta tres valores futuros de la referencia, tantos como la longitud de la ventana de prediccin.

8.4 Control Predictivo RGO.


La maybra de los procesos industriales se pueden aproximar por procesos de orden uno con un cierto retardo. Esto es debido a que si una constante de tiempo es mucho mayor que las restantes, las ms pequeas trabajan juntas para producir un retardo. 1 + ts Si discretizamos esta funcin de transferencia obtenemos: G(z)= Considerando un modelo CARIMA (Controlled Auto-Regressive and Integrated Moving-Average) obtenemos (1 az)y(t) =bzu(t G(s)
=

(8.17)

(8.18

i)+1

(8.19)

8.4. CONTROLPREDICTIVO RGO.

113

donde hemos tomado el polinomio correspondiente al ruido, de grado uno, y don de u(t) e y(t) son las seales de entrada y de salida del sistema, c(t) es un ruidb blanco y A es un integrador (A = 1 z). Esta ecuacin se puede transformar en

y(t+ 1) = (1 +a)y(t) ay(t 1) +bAu(td) +c(t+ y obtener la prediccin 55(t+ 1) = (1 + a)y(t)

1)

(8.20)

a(y(t

1) + b[u(t d)

u(t

1)]

(8.21)

A continuacin, lo que deseamos hacer es aplicar una secuencia de control que minimice la funcin objetivo:
N2

J(Ni,N2) =E{

(j)[j(t+jIt)

N2-d

r(t+j)J2+

j)[Au(t+N
j=1

)]2}

j_N1

(8.22) donde Ni > d y N2 = d+N. Minimizando J(N) respecto a Au(t), Au(t + 1), N 1) , obtenemos Mu=Py+Rw con u
=
. . .

At4t +

(8.23)

[Au(t), Au(t+ 1),.. .,Au(t+N 1)]T

(8.24)

[9(t +dlt), 9(t+d+ llt)]T

(8.25)

w[r(t+d+1),

r(t+d+2),...,r(t+d+N)]T

(8.26)

M y R so matrices de NxN y P de dimensin Nx2. Llamando q a la primera fila de la matriz M1, Au(t) viene dada por Au(t)_qPy+qRw Por consiguiente el incremento de la seal de control Au(t) resulta: Au(t)
=

(8.27)

lyl

5(t + dit)+ yZ 5(t+ d

1 It)+ ir! r(t)

(8.28)

1148.APLICACIONES

AL CONTROL PREDICTIVO

donde iyi, y2 Y 1ri son coeficientes. Por tanto nuestra estrategia es aplicar sucesi vamente las ecuaciones: 5(t+i)
=

(1 +a)y(t+i

ilt)

aj(t+i2) +b[u(t+id+

1)u(t+id)] (8.29)

u(t)

u(t 1) + (l y(t+dlt) +iy2 y(t+d ilt)

+irl

r(t))/G

(8.30)

Es decir: 5(t+i)
=

(1+a)y(t+i

llt)a51(t+i2)+b[u(t+id+l)u(t+i_d)] (8.31)

u(t)

u(t

1) + (ly 9(t +dlt) +

9(t + d

1 It)+ ir! r(t))/G

(8.32)

Esto significa que se puede expresar la ley de control en funcin de los dos valores estimados de la salida 5(t+ djt), 9(t + d 1 It) y de la referencia r(t) con tres parmetros desconocidos lyl, 1ri Si se pueden identificar estos parme tros, tendremos una ley de control. Por supuesto, nos interesa encontrar estos coeficientes de modo que minimicen el funcional 8.22.

20

40

60

100

Fig. 8.4: Resultados de la identificacin de los parmetros predictivo RGO.

l y i,. del control

8.4. CONTROL PREDICTIVO RGO.

115

Signal Gen.
Scope

Scopel

Fig. 8.5: Esquema para la identificacin de los parmetros de la ley de control predictivo.

Fig. 8.6: Resultados de la identificacin de los parmetros i y ir! del control predictivo RGO. El tiempo 10 corresponde al llenado del buffer.

8.4.1 Ventajasde utilizarRGOen un GPC.


Los algoritmos genticos optimizan el funcional
N2 N2d

J(N1 ,N2) = E{
j=Nj

6(j)[5(t + jlt) r(t +

j)]2+

X(j)[Au(t +N
j=1

1)]2}

(8.33)

116

8. APLICACIONES CONTROL AL PREDICTIVO

Fig. 8.7: Resultados de la identificacin de los parmetros del sistema. de un modo directo, obtenindose los coeficientes ly y lr de la expresin
N N-d lYk y(i
k=d

u(i)

k) +

lrj, r(i k)

(8.34)

k=1

Lo cual significa que podemos calcular el valor de la entrada del sistema con muy poco coste computacional. Existen, por tanto, dos bucles: uno lento que nos va actualizando los coefi cientes de la seal de entrada u, y un bucle r pido que calcula la seal de entrada. De esta manera se evita el tener que resolver el sistema Mu=qRy+qRw todas las veces, con lo que se gana en velocidad.

8.5

ControlPredictivo PID-RGO

8.5.1 Introduccin
La sintonizacin de controles PID digitales para las plantas industriales puede ser difcil algunas veces y consumir bastante tiempo. La situacin es mucho peor si el comportamiento de la planta vara con el tiempo. Las tcnicas de algoritmos genticos off-line para sistemas que no varan con el tiempo fueron propuestas por Porter y Jones [911como una alternativa posible a la sintonizacin de los PID digitales. De hecho, se comprob que los algoritmos genticos nos permiten una aproximacin ms sencilla a la sintonizacin de tales controladores que la solucin basada en algoritmos de optimizacin no genticos como los propuestos por Polak y Mayne [90] y por Gesing y Davidson [33].

8.5. CONTROL PREDICTIVO PID-RGO

117

Nuestra tcnica permite la sintonizacin on-line de controladores PID, dotn doles de caractersticas del control predictivo muy interesantes como son un me nor esfuerzo de control (la seal de control es ms suave) y un mejor seguimiento de la seal de referencia. Recordemos que el esquema general para el control predictivo es:

{
Referencia
uiej

Idenhilicacin y eiuLede paimetro Salida

Reuladoi

Prcceso

Fig. 8.8: Esquema general del control adaptativo. El bloque de Identificacin y ajuste de parmetros lo dividiremos en dos par tes: un primer bloque para identificar el sistema y un segundo bloque para ajustar los parmetros del PID. As obtendremos un control adaptativo basado enla optimizacin de un fun cional y en la identificacin del proceso.

Fig. 8.9:

8.5.2 Identificacin mediante Modelos Paramtricos Lineales


Partimos de un modelo de sistema dinmico del tipo: A(q1)y(t)
=

B(q)u(t+e(t)

(8.35)

1188.APLICACIONES

AL CONTROLPREDICTIVO

donde los polinomios A y B estn definidos por: B(q)


=

b0 + b1q1 + b2q2 +

+ b,bq

(8.36)

A(q1)

a +alq

+a2q 2+.

+anaq_rw

(8.37)

Para hacer la identificacin de los parmetros es conveniente escribir la ecua cin corno: y(t) siendo

=4(t)e(t)
,b,j,] (8.39)

(8.3

e el vector de parmetros desconocidos, definido por:


eT
=

[al,a2,.. .,a,,,b0,b1,b2,

. ..

siendo (t) el vector de regresin que consiste en mediciones entrada/salida dado por:
=

[y(t l),y(t 2),... ,y(t na),u(t


1), u(t 2),..., u(t nb)} (8.40)

La identificacin de un sistema dinmico se puede hacer off-line, o bien on une. En el primer caso uno de los mtodos mas clsicos es el mtodo de mnimos cuadrados, cuya solucin viene dada por

e(t)

[T][TYJ
,

(8.41)

siendo la matriz C1es la matriz de observaciones cuyas filas estn formadas por el vector definido anteriormente e Y es el vector de salidas, ambas con N filas, correspondientes a las N ltimas ecuaciones y(t) = (t)O,. ,y(t n + 1) = + l) escritas en forma vectorial. Sin embargo es mas til en trminos de control realizar la identificacin on-line de mod recursivo. Si en la ecuacin anterior denominamos P(t) = entonces
. . ,

P(t)

[=i(s)T(s)] (s)T(s)

[i

+ (t)T(t)]

P(t l)
-

+ (t)T(t)

(8.42)

Anlogamente, para 1Ty podemos escribir: 4T(t)Y(t)


=

T(t

1)Y(t 1)+T(t)Y(t)

(8.43)

8.5. CONTROLPREDICTIVO PID-RGO

119

con lo que podemos expresar la ecuacin 0(t) siva como: (t)


=

[T4]_1[TyJ

de forma recur

(t

1) + P(t)4(t) (y(t)

4T(t)(t

1))

(8.44)

donde llamamos e(t) = (y(t) 1)). Para obtener P(t) a partir de P(t-1) usamos el teorema de inversin de matrices y se obtiene P(t) =P(t 1) [s(t)

l+4T(t)P(t_1)(t)]

(8.45)

Con todo ello podemos estimar los parmetros de forma recursiva como: (t)
=

1) + P(t)e(t)

(8.46)

8.5.3

Control Predictivo PID-RGO

El control predictivo basado en modelo utiliza el modelo del sistema obtenido de la identificacin para incorporar el comportamiento futuro en el procedimiento de diseo del controlador. Se parte del modelo CARIMA del sistema, A(qy(t)B(q1)u(t

1) +

(t)

(8.47)

y se halla la secuencia de control que minimiza una funcin de coste de la forma:


N2 N

J(N1,N2,N)

E{

(9(t+jt)

r(t+j))2 + ? (Au(t+j j=1

l))}

(8.48)

donde E. es la esperanza matemtica, 9(t + jt) es una secuencia de j predicciones de la salida del sistema posteriores al instante t; N1 y N2 son los horizontes de prediccin, N es el horizonte de control y X(j) es una secuencia de ponderacin. En nuestro caso optimizamos este funcional por medio de algoritmos genti cos y as conseguimos una secuencia de control futura u(t), u(t+1),...de modo que la salida y(t+j) se aproxime a la referencia r(t+j). Deseamos hallar los coeficientes del controlador PID que optimizan el funcional anterior, para lo cual necesitamos una expresin que nos d los valores de u(t + j 1) en funcin de los valores de 9(t + jlt) r(t + j) y de los parmetros del PID. La ecuacin del PID ser

u(t)

[K+

+KD(l _z1)]

(r(t 1) y(t 1))

(8.49)

1208.APLICACIONES

AL CONTROL PREDICTIVO

por tanto Iu(t) Liu(t)


=

[K(1 Z)+KI+KD(l

z1)2](r(t 1) y(t1))

(8.50)

= (Kp+KJ+KD) (r(t 1) y(t1)) +(Kp 2KD)(r(t 2) y(t 2)) + (KD)(r(t 3) y(t 3))

(8.5 1) Lu(t) Ci(y(t 1) r(t 1)) +C2(y(t2) r(t2)) +C3(y(t3) r(t3))


=

(852)

De esta manera, el funcional queda en funcin de los valores 9(t +


.

jlt) r(t +

j) y de los coeficientes C1, C2, C3 Por tanto, podemos hallar los coeficientes

C1, C2, C3 que optimizan el funcional y despus hallar los coeficientes del PID correspondiente:

Kp=C2+2C3 K1=C1+C23C3 KD=C3

(8.53)

8.5.4 Simulacin control del adaptativo PID-RGO.


Deseamos comprobar el funcionamiento del controlador RGO-predictivo para varios valores de ? en el funcional 8.48, el peso del esfuerzo de control. Para valores pequeos de X tendremos que el esfuerzo de control es grande y por tanto el control ser ms rpido. A partir de las bibliotecas de bloques realizamos el esquema siguiente: En las figuras 8.11, 8.12 y 8.13 se puede comprobar el comportamiento del sistema para varios valores de X: 0.12, 0.16 y 0.2. El factor de peso de control afecta a la seal de control. Cuanto mayor sea su valor, menor esfuerzo de control. Si se le da un valor pequeo la respuesta del sistema ser ms rpida puesto que el sistema tiende a minimizar el error entre la salida y la referencia, olvidando el esfuerzo de control.Los valores de los parmetros de control l, Y2 y r1 y por tanto los polos en bucle cerrado dependen de los valores de ?.

8.6 Anlisis resultados de


A la vista de los anlisis y simulaciones realizados en las secciones anteriores, se desprenden los siguientes resultados:

8.6. ANLISISDE RESULTADOS

121

Fig. 8.10: Diagrama Sim ulink para Control 1

:::___H_ ::: vt
Fig. 8.11: Resultados del Control Predictivo con RGO para
=

0.12

La optimizacin gentica restringida (RGO) proporciona un marco unifica dor, muy flexible y natural, sobre el que desarrollar nuevos controladores predictivos.La naturaleza de esto es controladores puede ser muy variada, en particular, haciendo ciertas aproximaciones, se tiene controladores de tipo PID adaptativos. A diferencia de otras tcnicas de optimizacin, la optimizacin gentica restringida hace una gestin sencilla e intuitiva de las ligaduras.

122

8. APLICACIONES CONTROL AL PREDICTIVO

Jj 1
Fig. 8.12: Resultadosdel ControlPredictivoconRGO para2 = 0.16

1U L J
Fig. 8.13: Resultadosdel ControlPredictivo RGO para? = 0.20 con

Este mtodo se puede aplicar a cualquier sistema causal, incluyendo a los sistemas no lineales variantes en el tiempo, siempre que las no linealidades no sean demasiado grandes. Como problema, se puede apuntar la complejidad computacional del mto do, lo que impide variar la ley de control muy rpidamente (del orden de 0.1 s).

9. APLICACIONES TRMS 1:
9.1 Introduccin
En este captulo se considera la aplicacin a un sistema real: el Sistema MIMO de Rotores Gemelos (Twin Rotor MIMO System TRMS), que es un laboratorio diseado expresamente para realizar experimentos de control. En ciertos aspectos su comportamiento recuerda al de un helicptero. Desde el punto de vista de control ejemplifica un sistema de orden alto con acoplamientos cruzados muy significativos.
-

Fig. 9.1: Twin Rotor MIMO System (TRMS). El TRMS consiste en un eje pivotado en su bas.e de forma que puede rotar libremente en el plano horizontal y vertical. En las terminaciones de la barra hay dos rotores (el principal y el de cola) dotados con motores de corriente continua. Una barra con contrapeso est fijada al eje en el punto en que pivota. El estado del eje se puede describir por cuatro variables de estado: los ngulos horizontal y vertical medidos por sensores de posicin y dos correspondientes a las velocidades angulares. Dos variables de estado adicionales son las velocidades

124

9. APLICACIONES TRMS 1:

angulares de los rotores, medidas por tacogeneradores acoplados a los motores de continua.

Ot&cfl

Rotr priwipat Molor DC

pietrns ck tnedida.

Fig. 9.2: Twin Rotor MIMO System (TRMS).

En un helicptero normal la fuerza aerodinmica es controlada cambiando el ngulo de ataque. El TRMS est construido de forma que el ngulo de ataque es fijo. La fuerza aerodinmica se controla variando la velocidad de los rotores. Por tanto, las entradas de control son las tensiones suministradas a los motores de continua. Un cambio en el valor de la tensin hace que cambie la velocidad de rotacin lo que hace cambiar la correspondiente posicin de la barra. Sin embargo, se observan acoplamientos cruzados significativos entre las ac ciones de los rotores; cada rotor influencia las dos posiciones angulares. El diseo de controladores de ste sistema deben estar basados en desacoplos. Para el sistema desacoplado, se pueden aplicar entradas de control independientes para cada coordenada del sistema. Se puede utilizar un ordenador PC para el control en tiempo real del TRMS. Para ello se necesita una tarjeta controladora (PCL-812 en nuestro caso).

9.2. MODELADO PARMETROS Y

125

9.2 Modelado parmetros y


Los mtodos modernos de diseo y adaptacin de controladores en tiempo real requieren modelos matemticos de alta calidad del sistema. Para sistems de orden alto, no lineales y con acoplamientos los mtodos clsicos de modelado (basados en ecuaciones de Lagrange) son, a menudo, muy complicados. Por eso hemos decidido utilizar una aproximacin ms sencilla, basada en la representa cin en diagramas de bloques del sistema, y que es muy til para su utilizacin en el entorno SIMULINK.

Fig. 9.3: Diagrama de bloques del modelo TRMS. El diagrama de bloques se muestra en la figura. Las tensiones de control Uhy U,son las entradas de los motores de continua que mueven los rotores. El modelo de motor de continua con propulsor se compone de un sistema con dinmica lineal seguido de una no linealidad esttica. La parte lineal tiene forma de funcin de transferencia de primer orden Gh = ThS+ 1 y G = Ts+ 1 Las funciones no lineales h(Uh) y v(U) son las caractersticas estticas de los motores de continua con propulsores. La tensin de entrada est limitada al rango de 10v. Las relaciones no lineales entre la velocidad de los rotores y la fuerza aerodinmica resultante puede ser aproximada por las relaciones cuadrticas: Fh = sign(oh)ko yF = sign(o)ko (kh y k constantes positivas).

126

APLICACIONES TRMS 1: 9.

Es importante tener en cuenta que la forma geomtrica de los propulsores, no es simtrica, y por lo tanto el comportamiento en una direccin de diferente del correspondiente a la otra direccin.

Tab. 9.1: Notacin usadaen la figura 9.2

J Smboloj
ah h

Uh Gh h
0h

Fh
1h

Significado posicin horizontal del eje del TRMS (azimut position) velocidad angular del eje del TRMS (azimut velocity) entrada de control (tensin) del motor horizontal funcin de transferencia lineal del motor y rotor de cola parte no-lineal del motor y rotor de cola: h(Uh) = 0h velocidad de rotacin del rotor de cola funcin no-lineal (cuadrtica) de fuerza aerodinmica del rotor de cola: Fh = Fh(COh) brazo efectivo de la fuerzaaerodinmica del rotor de cola:
=

Unidades Erad] [rad/s] [V] [rad/s] Erad/sl [N]

lh(aV)

[m]

Jh Mh K
fh

a ) U, G V
0v

F
.

l J M K

f f

funcin no-lineal del momento de inercia respecto al eje vertical: Jh = Jh(a) [kgm2] par de giro horizontal [Nm] momento angular horizontal [Nms] momento de la fuerza de friccin del eje vertical [NmJ posicin vertical del eje del TRMS (pitch position) [rad] velocidad angular del eje del TRMS (pitch velocity) [rad/s] entrada de control (tensin) del motor vertical [V} funcin de transferencia lineal del motor y rotor principal parte no-lineal del motor y rotor principal: h(U) = [rad/s] velocidad de rotacin del rotor principal [rad/s] funcin no-lineal (cuadrtica) de fuerza aerodinmica del rotor principal: F = F(o) [N] brazo -efectivode la fuerza aerodinmica del rotor principal [mi momento de inercia respecto al eje horizontal [kgm2] par de giro vertical [Nm] momento angular vertical [NmsJ momento de la fuerza de friccin del eje horizontal [Nm} par de fuerzas vertical del contrapeso: f = f(a) [Nm] contina en la pginasiguient]

9.3. IDENTIFICACIN TRMS DEL

127

viene de la pginaanterior Unidades Smb. Significado [Nms] momento angular vertical del rotor de cola hv [Nms] momento angular horizontal del rotor principal lvii funcin no-lineal (cuadrtica) del par de giro de reaccin: vh
vh hv t
=

II
.

gvh(o)v)

[Nm1
[Nm] [s]

funcin no-lineal (cuadrtica) del par de giro de reaccin:


gh=gh(wh)

l/s

tiempo funcin de transferencia del integrador

La rotacin del propulsor produce un momento angular que, de acuerdo con la ley de conservacin del momento angular, puede ser compensada por las partes restantes del TRMS. Esto hace que exista una interaccin entre las dos funciones de transferencia, representadas por el momento de inercia de los motores con propulsores Jhv y Jvh. Esta interaccin influencia directamente a las velocidades de los ejes en ambos planos. Los pares de fuerza que actan son las fuerzas Fh y F multiplicadas por la longitud del brazo l (uy) y ls,. Controlar el sistema consiste en estabilizar el eje del TRMS en una posicin arbitraria deseada (pitch y azimut), dentro de unos lmites prcticos, o bien, hacer que siga una trayectoria deseada.

9.3 Identificacin TRMS del


Antes de estudiar los diversos controladores para el TRMS, vamos a realizar un primer estudio del sistema para saber cules son los problemas que nos pode mos encontrar. Para ello estudiamos la respuesta ante una onda cuadrada del rotor principal. Se puede apreciar en la figura que por debajo de la posicin de reposo (la de equilibrio cuando el motor est parado) se comporta prcticamente como un oscilador puro, mientras que por encima de la posicin de reposo se comporta como un oscilador amortiguado. El rotor secundario por su parte no tiene una fuerza que se contraponga a la fuerza de control, como ocurre con la gravedad en el otro rotor y adems apenas tiene rozmiento. Esto motiva que sea necesario cambiar el sentido de giro de las aspas continuamente para estar en un punto fijo. Antes de intentar hacer una identificacin adaptativa, vamos a ver cmo fun ciona una identificacin off-line.

128

9. APLICACIONES 1: TRMS

Fig. 9.4: Respuesta del rotor principal del TRMS a una onda cuadrada.

9.4 Control delTRMS PID


Para poder realizar un estudio comparativo de los diversos controladores, va mos a ver los resultados que se obtienen al controlar el TRMS con un PID adap tativo RGO.

9.4.1

Estabilizacin y seguimiento 1-DOF vertical

La tarea de control de estabilizacin en un grado de libertad (1 DOF) consiste en mover el TRMS a una posicin arbitraria en el plano seleccionado y estabili zarlo en esa posicin. El seguimiento consiste en que los movimientos del TRMS sigan la seal de referencia lo mas fielmente posible. Para comenzar restringimos nuestro objetivo de control a la estabilizacin y seguimiento del sistema en el plano vertical solamente. El correspondiente dia grama de bloques del control PID del sistema se muestra en la figura 9.6.
avd PDvy ________ SISTEMA
_______

Fig. 9.5: Control del sistema 1-DOF (estabilizacin y seguimiento en vertical). Arriba: salida vs. seal de referencia. Abajo: error cometido.

9.4. CONTROLPID DEL TRMS

129

El diagrama de bloques siguientes muestra el sistema de una forma ms deta llada. Ntese que slo se considera la parte vertical del sistema de control.

Fh

,Fh.a
h

1IJ 1/s-

MoDCcOn/

.Jhv

MotDCCCfly

Fig. 9.6: Diagrama bloquesdel sistema1-DOF(planovertical). de

.a

o-

rI.-,-.

c.-.a)

Fig. 9.7: Control del sistema 1-DOF(estabilizacin seguimientoen vertical). y Arriba: salidadel sistema vs. seal de referencia.Abajo: error cometi
lo.

130

APLICACIONES TRMS 1: 9.

9.4.2 Estabilizacinseguimiento y 1-DOF horizontal


La tarea de control de estabilizacin en un grado de libertad (1 DOF) consiste en mover el TRMS a una posicin arbitraria en el piano seleccionado y estabili zafio en esa posicin. Para ello bloqueamos un eje del sistema de forma que no se pueda mover en el piano vertical. El seguimiento consiste en que los movimientos del TRMS sigan la seal de referencia lo mas fielmente posible. Para comenzar restringimos nuestro objetivo de control a la estabilizacin y seguimiento del sistema en el piano horizontal solamente. El correspondiente diagrama de bloques del control PID del sistema se muestra en la figura 9.8.
aM pfl)
.SISTEMA

ah

Fig.

9.8:

Control

del

sistema

1 -DOF

(estabilizacin

seguimiento

horizontal).

El tallada.

diagrama Ntese

de que

bloques slo se

siguientes considera

muestra la parte

el

sistema

de del

una sistema

forma de

ms control.

de

horizontal

MotoDCco,,1 H9Y.

.L.:..

MobrDCcon rotp1ndp.I ..:, G .. y F 1 1Is IIJ 1Is

Fig.

9.9:

Diagrama

de

bloques

del

sistema

1-DOF

(plano

horizontal).

9.4.3

Estabilizacin

seguimiento

2-DOF.

La no planos. est

tarea bloqueado

en

este

caso

es

la

misma y

que por

en tanto

las

secciones est libre

previas para moverse

pero

el en

TRMS ambos

mecnicamente,

9.4. CONTROLPID DEL TRMS

13

Fig. 9.10: Controldel sistema 1-DOF(estabilizacin seguimientoen horizon y

tal). Arriba: salidadel sistema vs. seal de referencia.Abajo: error cometido.

Controlador simple El controlador PID simple controla los movimien PID


tos horizontal y vertical separadamente. En este sistema de control la influencia de un rotor sobre el otro no est compensada por la estructura del controlador. El sistema no est desacoplado.

a
Ch __ __v PID simple Uy

LJh-

E U SISTEMA 2-DOF (Ch _________ V PID hh

Fig.

9.11:

Control

del

sistema

2-DOE

9.4.4

Controlador

PID

con

acoplamiento

cruzado

El nos

cotrolador y

PID vertical.

con

acoplamiento En este sistema

cruzado de

controla control la

el

sistema

en de

los un

pla rotor

horizontal

influencia

132

9. APLICACIONES TRMS 1:

o.-.

00

00

00 1

00 1

a-o 1

00 i

o..

00

00

r1.-.-.

(00,-,a)

Fig. 9.12: Experimento con el controladorde estabilizaciny seguimiento 2-DOF PID. Arriba: salida del sistema vs. seal de referencia en eje vertical. Abajo: error cometido

0-a

00

00

1 (0o)

a r,.-,-.
(oor)

Fig. 9.13: Experimento con el controladorde estabilizaciny seguimiento 2-DOF PID. Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido
-

sobre el movimiento en el otro piano puede ser compensada por la estructura de acoplamiento cruzado del controlador.

9.5.CONTROLPREDICTIVOMEDIANTEPID YRGO133

a,,

Fig. 9.14: Diagrama de bloques del sistema de control 2-DOF PID de acopla miento cruzado.

Fig. 9.15:.Experimento con el controladorde estabilizaciny seguimiento 2-DOF PID con acoplamiento cruzado. Arriba: salida del sistema vs. seal de referencia en eje vertical. Abajo: error cometido

9.5

Control Predictivo mediante y RGO PID

El control predictivo basado en modelo utiliza el modelo del sistema obtenido de la identificacin para incorporar el comportamiento futuro en el procedimiento de diseo del controlador. Se parte del modelo CARIIvIAdel sistema, A(q1y(t)B(q1)u(t -1) +
(t)

(9.1)

y se halla la secuencia de control que minimiza una funcin de coste de la forma:


N2 N

(9(t+jIt)r(t+j))2+(Lu(t+f1))}
j=N1 j=1

(9.2)

134

9. APLICACIONES 1: TRMS

.i.

.--,.-.-.

Fig. 9.16: Experimento con el controladorde estabilizaciny seguimiento 2-DOF PID con acoplamiento cruzado. Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido. donde E. es la esperanza matemtica, 9(t + jt) es una secuencia de j predicciones de la salida del sistema posteriores al instante t; N1 y N2 son los horizontes de prediccin, N es el horizonte de control y X(j) es una secuencia de ponderacin. En nuestro caso optimizamos este funcional por medio de algoritmos genti cos y as conseguimos una secuencia de control futura u(t), u(t+l),...de modo que la salida y(t+j) se aproxime a la referencia r(t+j). Deseamos hallar los coeficientes del controlador PID que optimizan el funcional anterior, para lo cual necesitamos una expresin que nos d los valores de u(t + j 1) en funcin de los valores de 9(t + jt) r(t + j) y de los parmetros del PID. La ecuacin del PID ser

u(t)

[K+ K1

+KD(l _z1)]

(r(t 1) y(t 1))

(9.3)

por tanto
LtU(t)
=

[K(1 Z1)+Kj+K(l

z)2](r(t

1) y(t 1))

(9.4)

/.u(t)

(Kp+KI+KD)(r(t 1) y(t1)) +(Kp 2KD)(r(t 2) y(t 2)) + (KD)(r(t 3) y(t 3)) (9.5)
=

Lu(t)=Ci(y(t1)r(t1))+C2(y(t2)r(t2))+C3(y(t3)r(t_3)) (9.6)

9.6. CONTROLPREDICTIVO DEL TRMS

135

De esta manera, el funcional queda en funcin de los valores (t + jt) r(t + y de los coeficientes C1, C2, C3 Por tanto, podemos hallar los coeficientes C1, C2, C3 que optimizan el funcional y despus hallar los coeficientes del PID correspondiente:

j)

Kp=C2+2C3 Kj=C1+C23C3 KD=C3


Parmetrosdel proceso

(9.7)

Fig. 9.17: Sistema adaptativo con identificacin de modelo (MIAS)

9.6 Control predictivo TRMS del


Basndose en los estudios realizados en los captulos anteriores se ha desarro llado un controlador predictivo que utiliza las tcnicas RGO en dos niveles: para identificar un modelo del sistema y para encontrar los parmetros del controlador. Obviamente, un control adaptativo y predictivo necesita una gran cantidad de trabajo computacional. En cada instante de muestreo los parmetros del proceso deben ser identificados, el modelo predictivo debe ser calculado y la funcin de coste debe ser evaluada. Estas operaciones consumen tiempo y pueden hacer que la seal de control no se consiga variar con la rapidez necesaria. Para la realizacin del controlador se optimiza el funcional
N2 N2d

J(Ni,N2)

E{
j=N1

(j)[9(t+jIt)

r(t+j)]2+

7(j)[iu(t+N
j=1

1)]2}

(9.8)

136

9. APLICACIONES 1: TRMS

Fig. 9.18: Control del sistema con RGO-PID y RGO Predictivo. de un modo directo, utilizando la Optimizacin Gentica Restringida, obtenin dose los coeficientes ly y ir de la expresin
N Nd

u(i)
k=d

lyky(ik)+

lrkr(ik).
k=1

(9.9)

Lo cual significa que podemos calcular el valor de la entrada del sistema con poco coste computacional.
o. a

0.1

o.,

0 0.0

.a

.4

(000)

Fig. 9.19: Experimento con el controlador de estabilizacin y seguimiento: con trol predictivo-RGO en el plano vertical (con un grado de libertad). Arriba: salida del sistema vs. seal de referencia en eje vertical. Aba jo: error cometido.

9.6. CONTROLPREDICTIVO DELTRMS

137

os

00

100

1 00

-.ao

1 00

0_e o .a

L/rAJkffff1kJ
.a0 00 00

r,.-.-,e

(a0)

1 00

1 00

Fig. 9.20: Experimento con el controladorde estabilizacin y seguimiento: PID RGO (arriba) en el plano vertical (con un grado de libertad). Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo error cometido.

0 1

o.a

o.

00

aa

000

r11

(0ar.0)

Fig. 9.21: Experimento con el controlador de estabilizacin: Predictivo-RGO con dos grados de libertad. Arriba: salida del sistema vs. seal de referen cia en eje vertical. Abajo: error cometido.

138

9. APLICACIONES TRMS 1:

o.

-=

o.

r,.-.-.
O.

o. e

o
o-

o o
O -

o-o o .s o -4-o so

TV
so
rin,e (seosnO)

tjo 1

Fig. 9.22: Experimento con el controlador de estabilizacin: PID-RGO con dos grados de libertad. Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido.
1 0.8 0.6 0.4 0.2

o
0.2 0.4 0.6 0.8 0 20 40 60 (eecorld) 80 100 120

Time

Fig. 9.23: Experimento con el controlador de estabilizain (seales de control: control predictivo y PID).

Existen, por tanto, dos bucles: uno lento que nos va actualizando los coefi cientes de la seal de entrada u, y un bucle rpido que calcula la seal entrada. de De esta manera se evita el tener que resolver el sistema Mu = qRy + qRw todas las veces, con lo que se gana en velocidad.

9.7. CONTROL EL ESPACIO ESTADOS EN DE DEL TRMS

139

Esto nos permite hacer uso de modelos y de ligaduras altamente no lineales, y de funciones objetivo no cuadrticas, por lo que resultan ms potentes y flexibles que los convencionales. Para poder hacer frente a unas condiciones cambiantes, la etapa de optimiza cin ha de ser resuelta en tiempo real.

9.7 Control el Espacio Estados TRMS en de del


Hemos desarrollado un controlador PID que utiliza las tcnicas RGO en dos niveles: para identificar un modelo del sistema y para encontrar los parmetros del controlador. Como primer paso, realizamos una identificacin paramtrica, para lo cual partimos de una primera identificacin de mltiples modelos de tipo ARX, A (q )Yk z_dB(q_l)u + e(t), mediante el mtodo de mnimos cuadrados, y despus se transforma en una realizacin en el espacio de estados.

da/dt

Fig. 9.24: Control del sistema 2-DOE


A continuacin realizamos la bsqueda de modelos que se vayan adaptando mejor al sistema por medio de un algoritmo gentico. Para hacer la funcin de prdida V(i) = RYnk 9nk)2 lo ms pequea posible, se ha utilizado como funcin de salud F(i) = cte+V(i) , donde cte es una constante suficientemente grande (108) para mantener la diversidad de la po blacin. La probabilidad de reproduccin se ha calculado como F(t) = F(t)/P. En cada generacin, sustituimos el anterior modelo por el mejor de la nueva generacin como centro del entorno donde se realiza la bsqueda, de esta manera ,en caso de un sistema LTI, el mejor modelo debe ir tendiendo al valor que mini miza el funcional y la poblacin ira tendiendo a cero. A continuacin realizamos

140

APLICACIONESI:TRMS 9.

una nueva lectura de la entrada y la salida del sistema. De esta manera conseguimos un conjunto de aproximaciones sucesivas a me jores modelos en caso de el sistema sea invariante en el tiempo y si el sistema es variable, pero de variacin lo suficientemente lenta, entonces el modelo va si guiendo al sistema en sus variaciones.

Fig. 9.25: Experimento con el controlador de estabilizacin y seguimiento: PID


RGO en variables de estado. Arriba: salida del sistema Vs. referencia en eje vertical. Abajo: salida del sistema vs. referencia en eje horizon tal. Podemos adems aprovechar las caractersticas convenientes de la convergen cia global si al principio tomamos una bola lo suficientemente grande, de manera que reduzcamos la probabilidad de quedamos en un mnimo local. Una vez que sepamos que seguimos al mnimo adecuado, podemos reducir el tamao de la bo la y al mismo tiempo de la poblacin, para conseguir una mayor velocidad de ejecucin del algoritmo. Para que el algoritmo no tenga una convergencia prematura y se homogenei ce demasiado la poblacin, podemos aumentar el parmetro de probabilidad de mutacin.

9.8 Comparacin losdistintos de mtodos


Como se puede ver en la tabla, al introducir el control predictivo y el PID-RGO adaptativo se han mejorado los resultados, como era de prever.

9.8. COMPARACIN LOS DISTINTOS DE MTODOS

141

9iIErn
lambda

emu Demux4 Iambdal


-J

Fig. 9.26: Experimento con el controladorde estabilizacin:diagramade blo ques.


El control predictivo no se pudo introducir en el eje horizontal porque el tiem po de cmputo era mayor.que la constante de tiempo del sistema y no funcionaba bien el controlador. En resumen el mtodo RGO se ha podido aplicar al control del TRMS con buenos resultados. El mtodo ha demostrado ser fiable y con buen comportamien to con el nico incnveniente de que el tiempo de cmputo es grande y esto impide aplicarlo a sistemas muy rpidos.

142

9. APLICACIONES TRMS 1:

Tab. 9.2: Resultadosde la comparacin entrelos distintosmtodos de controldel TRMS.


Error RMS PID Vert. (1 DOF) PID Horiz. (1 DOF) PID (2 DOF) PID con acoplamiento cruzado (2 DOF) Predictivo-RGO Vertical PID-RGO Horizontal Predictivo-RGO y PID-RGO(2 DOF) SS-PID-RGO (2 DOF) Plano vertical 0.3980 0.4260 0.4284 0.1982 0.2038 0.2111

II Plano Horizontal II
0.5520 1.0326 1.0206 0.2145 0.2181 0.2212

10. APLICACIONES ROBOT II: MVIL


La localizacin de los robots mviles se basa en la odometra. El problema que presenta este mtodo es que se van acumulando los errores y por lo tanto la preci sin es cada vez menor. Para resolver esta situacin se utilizan normalmente dos mtodos: fundir la informacin sensorial con el mapa del entorno y el otro mtodo basado en la deteccin de marcas naturales o artificiales. El mtodo que nosotros hemos utilizado es l de deteccin de marcas artificiales para la localizacin del robot, empleando para ello como sensores una cmara con zoom motorizado so bre una plataforma pan and tilt y un anillo perifrico de 24 sensores perifricos. Para fusionar toda la informacin y as poder corregir la posicin y orientacin del vehculo utilizamos un filtro de Kaiman extendido. El filtro de Kaiman extendido que se ha utilizado emplea la tcnica de Res tricted Genetic Optimization (RGO) para mejorar el funcionamiento del filtro de Kalman.

10.1

El Filtrode KalmanExtendido Iterado

Cuando el estado de un sistema tiene que ser estimado a partir de informacin sensorial con ruido, se necesita emplear algn tipo de estimador de estados para fusionar los datos de los diferentes sensores para producir una estimacin preci sa del verdadero estado del sistema. Si la dinmica del sistema y el modelo de observacin son lineales, entonces el estimador de mnimos cuadrados puede ser calculado usando el filt ro de Kaiman. Cuando esto no es posible es necesario uti lizar un filtro extendido, como por ejemplo el Filtro Iterado de Kalman [ver cap. 6 para ms detalles].

10.2

Localizacin RobotMvilutilizando Filtro del un RGO No-lineal


, ...,

Los algoritmos genticos son un proceso probabilstico de bsqueda basado en la seleccin natural y en las leyes genticas. La poblacin 9 = (9i 92, E

144

10. APLICACIONESROBOT II: MVIL

es modificada de acuerdo con los procesos evolutivos naturales: despus de la inicializacin, son ejecutados la seleccin w : jA jN, cruce : jN jN y mutacin : jN jN recursivamente en un bucle. Cada ejecucin del bucle es llamada generacin y 9 representa la poblacin en la generacin t. El operador de seleccin tiene como fin mejorar la calidad media de la pobl cin dando a los individuos de mayor calidad una alta probabilidad de ser copiados en la nueva generacin. La seleccin, por lo tanto, enfoca la bsqueda hacia regio nes prometedoras del espacio de bsqueda. La calidad de un individuo es medida por la funcin de salud f: J + R, donde J representa el espacio de todos los posibles individuos. Los algoritmos genticos se utilizan usualmente como mtodo de optimiza cin global de funciones invariantes en el tiempo, y usualmente se ejecutan off line. Sin embargo, la seleccin natural de los seres vivos es un proceso local o semi local en el que las especies se adaptan por s mismas al entorno, que a su vez es dependiente del tiempo (es on une). Es posible adaptar el mtodo de algoritmos genticos si se restringe la bs

10.2. LOCALIZACIN DEL ROBOTMVILUTILIZANDO FILTRORGO UN NO-LINEAL queda a un entorno de la estimacin previa usandocomo funcin de salud: f: B((klk 1),) IR, with = IIP(klk 1)11,
+

1O-8+v(kk1)) and

(10.1)

V(x(k)) (z(k)h(k,x(k)))R(k)(z(k) = h(k,x(k))) 102 +(x(k)-x(kjk-l))(P(kIk-l)(x(k)-x(kIk-l)). ( .)


Por lo tanto el algoritmo actualiza las estimaciones de los estados y la matriz de covarianza y el bucle es repetido de nuevo, como se ilustra en la figura 1. La funcin de densidad de probabilidad de x(k) dado Z viene dada como

p(x(k)IZk) = p(x(k)Iz(k),Z1) =
!p(z(k) Ix(k))p(x(kZ1)) = N(z(k);h(k,x(k))R(k))N(x(k);(kIk(10.3)

1),P(kk1)).

Maximizar la funcin anterior es equivalente a calcular una estimacin maxi mum a posteriori (MAP). Esto es tambin equivalente a minimizar V(x(k)) ,i.e. maximizar la funcin de salud f(J). La funcin de salud estndar (i.e. dividida por la suma de las saludes) es una aproximacin de la funcin de densidad condicional (PDF). p ( x (k)Z)

p(z(k)x(k))p(x(k)Z) fp(z(k)Ix(k))p(x(k)lZ1)

(104)

De todo lo anterior queda claro que es posible calcular precisamente las no linealidades de las funciones f y g, sin embargo la introduccin de la hiptesis de ruido gaussiano no se puede evitar. Para determinar el radio de la zona de bsqueda, usamos la distancia de Mahalanobis

d= (x(kk 1) (k 11k 1))P (kk)((kk


que mide1a incertidumbre de la estimacin (k).

1) (k 11k1))

(10.5)

10.2.1 Consideracionesdiseo de
La arquitectura del vehculo est basada en una arquitectura hbrida (AFREB) con un amplio rango de metodologas reactivas de control. La arquitectura AFREB

146

APLICACIONES ROBOTMVIL 10. II:

consiste en los siguientes mdlos: supervisor de fusin, primitivas de compor tamiento y ejecutor. La funcin del mdulo supervisor de fusin es el clculo del peso asignado a cada primitiva de comportamiento. La funcin del mdulo ejecutor es el calculo de las ordenes dadas al robot basadas en los pesos de las pri mitivas de comportamiento. Las entradas estndar del ejecutor son la velocidad y y la curvatura co. La primitiva de comportamiento puede ser caracterizada por una secuencia temporal de valores apropiados para y y coque causan que el robot exhiba una primitiva de comportamiento pre-especificada.

10.2.2 Laestructura gentica


Para resolver el problema de localizacin del robot mvil por medio de ROO, necesitamos un esquema de codificacin para codificar los parmetros del proble ma en cadenas genticas. Aqu, la posicin del robot se codifica como una cadena por sus Cc ordenadas Cartesianas como:
{(xl,yl,81),(x2,y2,92),...,(xfl,yfl,8fl)}

(10.6)

con todos los valores guardados en forma decimal. Un conjunto de posiciones vlidas aleatorias es creado como generacin inicial alrededor de la solucin dada por el filtro extendido de Kaiman. Para resolver el problema, definimos un cromo soma con una longitud de 11 bits y poblaciones con un tamao de 250 individuos. Despus de que una nueva generacin ha sido creada, calculamos la funcin de salud de cada individuo (posicin).Definir funciones de salud apropiadas es vital para conseguir buenos rendimientos en la optimizacin

10.2.3 Lafuncin salud de


Para optimizar la estructura utilizando RGO, uno debe ser capaz de asignar una medida de la calidad de cada estructura en el espacio de bsqueda. La fncin de salud es responsable de esta tarea. La funcin de salud utilizada puede ser definida de la siguiente manera:

Marcas de Referencia: g
=

k-e 1pan

ob 2 pan

9k-e

9ob 2 1tilt tilt

(10.7)

donde g es el coste de la posicin correspondiente a la l-sima cadena de la k-sima generacin, an son los ngulos estimados entre el robot

10.2. LOCALIZACIN DEL ROBOTMVILUTILIZANDO FILTRORGO UN NO-LINEAL y la marca de referencia de la l-sima posicin en la poblacin en la k-sima generacin, respectivamente.
oke 1pan

arcsin

YaPy
/

Px) 1Yg

Py

ake

arcan

PzZa 2

V (Xa Px) + (Ya py) donde (px,py,pz) es la posicin de la marca de referencia y (Xa,ya,Za) es la posicin de la plataforma pan-tilt. La deteccin normalizada en escala de grises se utiliza para la deteccin de marcas. La operacin de correla cin puede ser vista como una forma de convolucin donde el encaje con el modelo patrn es anlogo con el kernel de la convolucin:
i=Nj=N

r(x,y) =I(x,y)oM(x,Y) =

L L M*(i,j)J(x+i,y+j)

(10.10)

i=O j=O

es decir, cada resultado de N pixels del modelo M(x, y) es multiplicado por los N pixels de la imagen base I(x,y), y todos estos productos son sumados. Finalmente el resultado es convertido en porcentaje, donde 100% significa que encaja perfectamente:

score=max(r,O)2* 100%

(10.11)

Para separar los resultados correlacin de la normalizadaconsidera se un umbral de aceptacin. Si la correspondencia entre la imagen y el modelo es menor que este nivelno se considera. Los ngulos pan y tilt de la cmara respecto de la marca de referencia son:
ob 9pan
=

arctan (u)

arctan d(v

C)

(10.13

donde f esladistancia (u, esel focal, v) centro lamarca referencia, de de (Cx,C) eselcentro laimagen de y d) eseltamao celda. de

148

APLICACIONESROBOT 10. II: MVIL

Segmentos del entorno: g= sumo(D

1
Dob)2

(10.14)

donde g es el coste de la posicin correspondiente a la l-sima cadena de la k-sima generacin. DI es la distancia estimada entre el sonar y el segmento de la l-sima generacin, respectivamente.

Jke(i)
1s

1 (cose+sinetan9)

(Y Yr)tan8

XrX

(10.15) donde (Xr, Yr, Or) es la posicin y orientacin del vehculo, (X, 17,8) es la posi cin y orientacin del segmento observado y 8_ el ngulo del sensor.

10.3 Resultados experimentales


Con la finalidad de comprobar la fiabilidad y robustez del sistema de reloca lizacin se ha realizado un estudio comparativo, con el vehculo detenido, con la finalidad de evaluar la mejora que supone la introduccin del mtodo anterior mente descrito en el proceso de localizacin del vehculo. Los resultados obtenidos se muestran en la siguiente tabla: Nm. generaciones 2agen. 3agen. 4agen. Con RGO 40 12 8 Sin RGO 60 31 29 Tab. 10.1: Localizacin en posicin con y sin RGO (1). Error en mm.

En las tablas 10.1 y 10.2 se muestra la evolucin del error de posicin y orien tacin del vehculo, al introducir en el sistema errores respectivos de 20 cm y 10 deg. En las tablas 10.3 y 10.4 se han introducido simultneamente errores de posi cin y ngulo.

10.3. RESULTADOS EXPERIMENTALES

149

Nm. generaciones 2agen. 3agen. 4agen. Con RGO -2.6 1.8 0.2 -3.9 2.6 -2 Sin RGO

Tab. 10.2: Localizacinangularcony sin RGO (1). Erroren grados.


Nm. generaciones 2agen. 3agen. 4agen. 49 11 8 61 31 18

ConRGO SinRGO

Tab. 10.3: Localizacinen posicincon y sin RGO (2). Erroren mm.


Nm. generaciones 2agen. 3agen. 4agen. 3.7 -0.5 1 Con RGO Sin RGO 4.1 -5.2 2.1

Tab. 10.4: Localizacinangular y sin RGO (2). Erroren grados. con

En las tablas anteriores, se pone de manifiesto la mejora que produce la im plantacin del mtodo descrito en el proceso de localizacin. El principal incon veniente radica en el elevado tiempo de ciclo que requiere para su ejecucin, del orden de 15 veces el necesario para el mtodo de la proyeccin.

150

APLICACIONES ROBOTMVIL 10. II:

11. CONCLUSIONES TRABAJO Y FUTURO.


11.1 11.1.1 Conclusiones Resumenconclusiones y

En esta tesis se ha desarrollado un nuevo mtodo Optimizacin Gentica Res tringida (RGO) y las ventajas de su utilizacin en la identificacin de sistemas no lineales, en la estimacin de estados (Filtro de Kaiman extendido), en el diseo de controladores adaptativos y aplicaciones a la relocalizacin de Robots mviles..

11.2 Aportaciones principales


Se ha desarrollado el mtodo de optimizacin RGO (Restricted Genetic Opti mization) para funciones que varen con el tiempo. Este mtodo ha probado ser muy til para minimizar o maximizar funciones no-lineales y no-diferenciables. Este mtodo est especialmente indicado para su uso en la identificacin para el control de sistemas dinmicos. El mtodo RGO ha sido utilizado en la identificacin en la forma de entradasalida [cap. 5], y en la forma de variables de estado [cap. 7] con excelentes resul tados. Las ventajas principales han sido su utilizacin en lnea y su aplicabilidad a sistemas no-lineales. Tambin ha sido aplicado este mtodo a la estimacin de estados [cap 6], creando dos nuevos filtros de Kalman extendidos, que se pueden aplicar a la es timacin de estados en lnea, de sistemas no lineales y los resultados han sido muy buenos. Este mtodo ha sido aplicado muy eficientemente a la localizacin de robots mviles [cap 10]. Seguidamente, se ha aplicado a la realizacin de controladores adaptativos no lineales basados en el mtodo RGO: PID-RGO[cap. 8, 9], controlador predictivo RGO [cap. 8, 9] y controlador en variables de estado RGO [cap. 9].

152

CONCLUSIONES 11. Y TRABAJO FUTURO.

Estos controladores han demostrado su vala al ser aplicados al control del TRMS (Twin Rotor MIMO System)[cap 9], que es un laboratorio diseado ex presamente para realizar experimentos de control y en ciertos aspectos su com portamiento recuerda el de un helicptero. Desde el punto de vista de control ejemplifica un sistema de orden alto con acoplamientos cruzados muy significati vos: En el

11.3 Trabajo Futuro


El mtodo RGO ha demostrado ser muy efectivo en resolver problemas de identificacin y control. En el futuro, ser muy interesante aplicarlo al reconocimiento de la estructura del modelo y la identificacin de qu regresores son los ms significativos en la construccin de dicho modelo. Tambin estamos pensando aplicarlo a diversas partes de la robtica como la localizacin de robots y la planificacin de trayectorias. Una tercera lnea de avance es la aplicacin de otros algoritmos evolutivos, tales como las Estrategias Genticas (Evolutionary Strategies) y la Programacin Gentica (Genetic Programming) para manejar estos problemas y comparar los resultados. Los Algoritmos Genticos Paralelos (Parallel Genetic Algorithms) tambin pueden ser de gran ayuda a la hora de mejorar las prestaciones de los algoritmos diseados y con ms aplicaciones en el mundo real.

BIBLIOGRAFA
[1] H. Akaike. A new look at the statistical model identification. JEEE Tran sactions on Automatic Control, AC-19:716723, 1974. [2] H. Akaike. Markovian representation of sthocastic processes by canonical variables. SIAM Journal of Control and Optimization, 13:162173, 1975. [3] J. M. Armingol. Localizacin Geomtrica de Robots Mviles Autnomos. PhD thesis, Univ. Carlos UI, Madrid, Spain, 1997. [4] J. M. Armingol, L. E. Moreno, S. Garrido, A. de la Escalera, and M. A. Salichs. Mobile robot localizatio using a non-linear evolutionary filter. In 3rd IFAC Symp. on Intelligent Autonomous Vehicles (IAV98).IFAC, 1998. [5] K. strim and T. Wigglund. PID Controllers: Theory, Design and Tun ning. Instrument Society of America, Research Triangle Park, N. C., 1995. [6] K. J. strom. Maxmum likelihood and prediction error methods. Automa tica, 16:551574, 1980. [7] K. J. strim and B. Wittenmark. Computer Controlled Systems. Prentice Hall, Englewood Cliffs, New Jersey, 1984. [8] K. J. strm and B. Wittenmark. Adaptive Control. Addison-Wesley, Rea ding, Massachusetts, 1995. [9] Y. Bar-Shalom and T.E. Fortmann. Tracking and Data Association. The Academic Press, London, 1988. [10] Y. Bar-Shalom and Xiao-Rong. Estimation and Tracking. Artech House, 1993. [11] C. Bordns. Control Predictivo Generalizado de Procesos Industriales: Formulaciones Aproximadas. PhD thesis, ETSII, Univ. de Sevilla, Spain, 1994.

154

[12] G. E. P. Box and D. R. Jenkins. 1me Series Analysis, Forecasting and Control. Holden-Day, San Francisco, 1980. [13] E. F. Camacho and C. Bordns. Model Predictive Control in the Process Industry. Springer-Verlag,Berlin, 1995. [14] C. Canudas. Adaptive ControlforPartially Known Systems. Elsevier, Ams terdam, 1988. [15] R. J. Carroll and D. Ruppert. Transformation and Weighting in Regression. Chapman and Hall, New York, 1988. [16] A. Chipperfield and P. Fieming. Genetic algorithms in control systems engineering. Control and Computers, 23(3):8894,1995. [17] C. T. Chou. Geometry of Linear Systems and Identijication. PhD thesis, Trinity College, Cambridge, England, 1994. [181 D. W. Clarke, C. Mohtadi, and P. S. Tuffs. Generalized Predictive Control: Part 1. The Basic Algorithm. Automatica, 23(2):137148,1987. [19] D. W. Clarke, C. Mohtadi, and P. S. Tuffs. Generalized Predictive Control: Part IT.Extensions and Interpretations. Automatica, 23(2):149160,1987. [20] A. Corana, M. Marchesi, C. Martini, and S. Ridella. Minimizing multimo dal functions of continuous variables with the simulated anneling algorit hm. ACM Trans. on Mathematical Software, 13(3), 1987. [21] L. Davis. Handbook of Genetic Algorithms. Van Nostrand Reinhold, 1991. [22] A. Prez de Madrid. Aplicacin de Las Tcnicas de Programacin Din mica al Control Predictivo Basado En Modelos. PhD thesis, Facultad de Ciencias, UNED, Madrid, Spain, 1995. [23] P. M. J. Van den Hof and R. J. P. Schrama. Identification and control closed-loop issues. Automatica, 31(12):17511770, 1995.

[24] J. E. Dennis and R. B. Schnabel. Numerical Methodsfor Unconstrained Ojitimization and Nonlinear Equations. Prentice-Hall, Englewood Cliffs, New Jersey, 1983.

Bibliografa

[25] S. J. Flockton and M. J. White. Pole-zero system identification using ge netic algorithms. In Proceedings 5th International Conference QnGenetic Algorithms, pages 531535.University of Illinois at Urbana Champaign, USA, 17-21 July 1993. [26] U. Forseli and L. Ljung. Closed-Loop Identification Revisited. Technical report, Linkiping University, Linkping, Sweden, 1997. [27] U. Forssell. Closed-loop Identfication. PhD thesis, Linkbping University, Linkping, Sweden, 1999. [28] U. Forssell and L. Ljung. Issues in closed-loop identification. Technical report, Linidiping University, Linkc5ping, Sweden, 1998. [29] 5. Garrido, L. E. Moreno, and C. Balaguer. State estimation for nonhinear systems using restricted genetic optimization. In 11th International Confe rence QnIndustrial and Engineering Applications of Artificial intelligence and Expert Systems. lEA-AlE, 1998. [30] 5. Garrido, L. E. Moreno, and M. A. Salichs. Nonlinear on-line identifi cation of dynamic systems with restricted genetic optimization. In 6th Eu ropean Congress Qn Intelligent Techniques and Soft Computing, Aachen, Germany, 1998. EUFIT. [31] 5. Garrido, L. E. Moreno, and M. A. Salichs. Identification of state space modeis with rgo. In 7th European Congress QnIntelligent Techniques and Soft Computing, Aachen, Germany, 1999. EUFIT. [32] P. J. Gawthrop. Parametric identification of transient signais. IMA Journal of Mathematical Control and Information, 1:117128, 1984. [33] W. Gesing and E.J. Davison. An exact penalty function algorithm for solving general constrained parameter optimization problem. Automatica, 15:175188,1979. [34] M. Gevers. Towards a joint design of identification and control. In H. L. Trentelman and J. C. Wihiems,editors, Essays on Control: Perspectives in the Theory and its applications, pages 111151. Birkhiuser, 1993. [35] D. Goldberg. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley,Reading, MA, 1993.

156

[36] G. H. Golub and C. F. Van Loan. Matrix Computations. The John Hopkins University Press, Baltimore, Maryland, 1989. [37] G. C. Goodwin and K. S. Sin. Adaptive Filtering, Prediction and Control. Prentice-Hall, Englewood Cliffs, N. J., 1984. [38] G. J. Gray and D. J. Murray-Smith. Nonlinear model structure identifica tion using genetic programming. Control Eng. Practice, 6(11): 13411353, 1999. [39] U. Grenander. Abstract Inference. Wiley, New York, 1981. [40] 1. Gujon and P. Albrecht. A time delay neural network character recognizer for touch terminal. Technical report, ATT Beil Laboratories, 1990. [41] 1. Gustafsson, L. Ljung, and T. Siderstrom. Identification of processes in closed loop identifiability and accuracy aspects. Automatica, 13:5975, 1977.

[42] R. L. Haupt and S. E. Haupt. Practical Genetic Algorithms. Wiley Interscience, New York, 1998. [43] J. Hertz, A. Krogh, and R. Palmer. Introduction to the Theory of Neural Computation. Addison-Wesley, 350 Bridge Parkway, Redwood City, CA 94065, 1991. [44] J. H. Holland. Adaptation in Natural and Artificial Systems. The University of Michigan Press, Ann Arbor, 1975. [45] J. J. Hopfield and D. W. Tank. Neural computation of decisions in optimi zations problems. Biol. Cybern, 1986. [46] T. C. Hsia. System Identiflcation: Least Squares method. Lexington Books, 1977. [47] K. Hunt, D. Sbarbaro, R. Zbikowski, and P. Gathrop. Neural networks for control systems a survey. Automatica, 28(6): 10831112, 1992.
-

[48] H. Hyc5tyniemi. Regularization of parameter estimation. In l3th IFAC World Congress, San Francisco, California, 1996. [49] H. Hyityniemi. On Structural Identifiability of Dynamic Modeis. Technical report, Helsinki University of Technology, Helsinki, Finland, 1998.

Bibliografa

[50] H. Iba, H. deGaris, and T. Sato. A numerical approach to genetic program ming for system identification. Evolutionary Computation, 28(6): 1083 1112, 1995. [511 R. Isermann. Practical aspects of process identification. Automatica, 16:575587, 1980. [52] R. Isermann. Digital Control Systems. Volume 1. Fundamentais, Determi nistic Control. Springer-Verlag,Berlin, 1989. [53] R. Isermann. Digital Control Systems. VolumeII. Sthocastic Control, Multi variable Control, Adaptive Control, Applications. Springer-Verlag, Berlin, 1989. [54] R. Isermann, K.H. Lachmann, and D. Matko. Adaptive Control Systems. Prentice-Hall International, Hemel Hempstead, UK, 1992. [55] R. Johansson. System Modeling and Identification. Prentice-Hall, Engle wood Cliffs, New Jersey, 1992. [56] C. R. Johnson. Admissibility in blind adaptive channel equalization. IEEE Control Systems Magazine, 1991. [57] A. Juditsky, H. Hjalmarsson, A. Benveniste, B. Delyon, L. Ljung, J. Sjo berg, and Q.Zhang. Nonlinear black-box models in system identification: Mathematical foundations. Automatica, 12(31):17251750,1995. [58] 5. J. Julier, J. K. Uhlmann, andII. F. Durrant-Whyte. A new approach for filtering nonlinear systems. a new approach for the nonlinear transforma tion of means and covariances in linear filters. IEEE Trans. on Automatic Control, 1996. [59] P. T. Kabamba. Balanced forms: Canonicity and parametrization. IEEE Trans. QnAutomatic Control, 30(11): 11061109, 1985. [60] T. Kailath. Linear Systems. Prentice-Hall, Englewood Cliffs, New Jersey, 1980. [61] R. E. Kalman. Identifiability and modelling in econometrics. In P. R. Kris naiah, editor, Developments in Statistics, volume 4. Academic Press, Lon don, 1983.

158

[62] R. E. Kaiman and R. S. Bucy. New results in linear filtering and prediction theory. J. Basic Eng. ASME, Series D:95108, 1961. [63] G. Kitagawa. Non-gaussian state-space modeling of nonstationary time se ries. Journal of the American Statistical Association, 82:10321063, 1987. [64] K. Kristinson and G. Dumont. System identification and control using ge netic algorithms. IEEE Transactions on Systems, Man, and Cybernetics, 22(5): 10331046, 1992. [65] 5. Kung. Digital Neural Networks. Prentice-Hall, Englewoods Cliffs, New Jersey, 1993. [66] C. Ledoux. Identification of SISO Nonlinear Wiener Systems. Technical report, Linkoping University, Linkc5ping,Sweden, 1996. [67] W. 5. Lee, B. D. O. Anderson, 1. M. Y. Mareels, and R. L. Kosut. On sorne key issues in the windsurfer approach to adaptive robust control. Automa tica, 31(11):16191636, 1995. [68] L. Ljung. System Identification Toolbox Users Guide. The Mathworks, 1986.
-

[69] L. Ljung. System Identification: Theoryfor the User. Prentice-Hall, En glewood Cliffs, N. J., 1987. [70] L. Ljung. Identification for Control What Is There To Learn? Technical report, Linkdping University,Linkoping, Sweden, 1998.
-

[71] L. Ljung and 5. Gunnarsson. Adaptation and tracking in system identifica tion a survey. Automatica, 26:721, 1990.
-

[72] L. Ljung and T. McKelvey. A Least Squares Interpretation of Sub-Space Methods for System Identification. Technical report, Linkping University, Linkoping, Sweden, 1996. [73] L. Ljung, Sjoberg, and T. McKelvey. On the Use of Regularization in System Identification. Technical report, Linkdping University, Linkoping, Sweden, 1992. [74] L. Ljung and T. Siderstrom. Theory and Practice of Recursive Identifica tion. MIT Press, Cambridge, Massachusetts, 1983.

Bibliografa

[75] W..Luo and S. A. Billings. Adaptive model selection and estimation for nonhinear systems using a sliding data window. Signal Processing, 46:179 202, 1995. [76] J. M. Maciejowski. Balanced realizations in system identification. In 7th IFAC Symposium on Identification and parameter Estimation, York, UK, 1985. [77] J. M. Maciejowski. Multivariable FeedbackDesign. Addison-Wesley,Wo kingham, England, 1989. [78] P. S. Maybeck. Stochastic modeis, Estimation, and Control. Academic Press, London, 1982. [79] P. McCullagh and J. A. Nelder. Generalized Linear Modeis. Chapman and Hall, New York, 1989. [80] T. McKelvey. Identification of State-Space Models from Time and Frez quency Data. PhD thesis, Linkdping University,L.ink5ping, Sweden, 1995. [81] Z. Michalewicz. Genetic Algorithms + Data Structures grams. Al Series. Springer Verlag, New-York, 1994.
=

Evolution Pro

[82] B. C. Moore. Principal component analisys in linear systems: Controhlabi lity, observability, and model reduction. IEEE Trans. on Automatic Control, 26(1):1732, 1981. [83] K.arendra and K. Parthasarathy. Identification and control of dynamical systems using neural networks. IEEE Trans. Neural Networks, 1:427, 1990. [84] K.arendra and K. Parthasarathy. Gradient methods for the optimization of dynamical systems containing neural networks. IEEE Trans on Neural Networks, 2(2):252262,1991. [85] J. P. Norton. An Introduction to Identification. Academic Press, London, 1986. [86] R. J. Ober. Balanced realizations: Canonical form, parametrization, model reduction. mt.J. Control, 46(2):643670,1987. [87] M. Ouladsine, F. Bicking, and G. Bloch. Identification of constrained dy namic systems by genetic type algorithm. In IFACArtificial Intelligence in Real-Time Control, Biend, Slovenia, 1995.

160

[88] A. J. M. Van Overbeek and L. Ljung. On-line structure selection for multi variable state space modeis. Automatica, 18(5):529543, 1992. [89] P. Poddarand K. P. Unnikrishnan. Memoryneuron networks: a prolegome
non. TechnicailReport GMR-7493, G. M. Research Laboratories, Warren, Michigan, 1991. [90] E. Polak and D. Q. Mayne. An algorithm for optimization problems with functional inequality constraints. IEEE Trans. on Automatic Control, 21:184193, 1976. [91] B. Porter and A. H. Jones. Genetic tunning of digital pid controllers. Elec tronic Letters, 28:843844, 1992. [92] X. Qi andF. Palmieri.Theoreticalanalysisof evolutionary algorithmswith an infinite population size in continuous space. part i: Basic properties of selection and mutation. IEEE Trans. QnNeural Networks, 5(1):102119, 1994. [93] X. Qi and F. Palmieri. Theoretical analysis of evolutionary algorithms with an infinite population size in continuous space. part u: Analysis of the di versification role of crossover. IEEE Trans. QnNeural Networks, 5(1):120 129, 1994. [94] D. E. Rumelhart, G. E. Hinton, and R. J. Williams. Parallel Distributed Processing, volume 1, chapter Learning internal representations by error backpropagation, pages 318362. MIT Press, 1986. [95] J. Sjoberg, H. Hjalmarsson, and L. Ljung. Neural Networks in System Identification. Technical report, Linkoping University, Linkping, Sweden, 1996. [96] J. Sjiberg, Q.Zhang, and L. Ljung. Nonlinear black-box modeling in sys tem identification: a unified overview.Automatica, 3 1:16911724, 1995. [97] T. SMerstrrn and P. Stoica. System Identification. Prentice-Hall Interna tional, Hemel Hempstead, Hertfordshire, 1989. [98] E. Sontag. Essays on Control: Perspectives in the Theory and its Appli cations, volume 14 of Progress in Systems and Control Theory, chapter Neural Networks for control, pages 339380.Birkhaser, 1990.

Bibliografa

[99] K. C. Tan, Y. Li, D. J. Murray-Smith, and K. C. Sharman. System identifi cation andlinearization using genetic algorithms with simulated annealing. In Proc. lst IEE/IEEE International Conference QnGenetic Algorithms in Engineering Systems: Innovations andApplications, Sheffield, UK., 1995. [100] H. Tanizaki. Nonlinear Filters. Springer, Berlin, 1996. [101] H. Tanizaki and R. 5. Mariano. Nonhinear filters based on taylor series expansions. Communications in Statistics, Theory and Methods, 25(6), 1996. [102] R. Valverde. Control de Sistemas mediante Redes Neuronales. Aprendizaje por Refuerzo. PhD thesis, Univ. Carlos III, Madrid, Spain, 1999. [103] P.E. Wellstead and M.B. Zarrop. Selftunning Systems: Control and Signal Processing. John Wiley and Sons, Chichester, U.K., 1991. [104] P. J. Werbos. Back propagation through time: What it does, how do it. Proceedings IEEE, 1990. [105] D. White and D. Sofge, editors. Handbook of Intelligent Control, Neural, Fuzzy, and Adaptive Approaches. Multiscience Press, Inc., Van Nostrand Reinhoid, 115 Fifth Avenue, New York, NY 10003, 1992. [106] R. P. Wishner, J. A. Tabaczynski, and M. Athans. A comparison of three non-linear filters. Automatica, 5:487496,1989. [107] Z. Yang, T. Hachino, and T. Tsuji. Qn-une identification of continuous time delay systems combining least squares techniques with genetic algorithms. mt. J. Control, 66(1):2342,1996. [108] D. Yuret. From Genetic Algorithms to Efficient Optimization. Technical report, MIT, Cambridge, Massachusetts, 1996. [109] L. A. Zadeh. From circuit theory to system theory. In Proc. IRE 50, pages 856865,1962.

También podría gustarte