Garrido Bullon Santiago
Garrido Bullon Santiago
Garrido Bullon Santiago
AUTORIZA:
Que su tesis doctoralcon el ttulo: IDENTIFICACIN ESTIMACIN Y CONTROL DE SISTEMASNO LINEALESMEDIANTE RGO pueda ser utilizada para fines de investigacinpor parte de la UniversidadCarlos III de Madrid. Legans, 18 de febrero de 2000.
z, Jc ko
L(ru
(?
k)
TESIS DOCTORAL
Legans, 1999
TESIS
DOCTORAL
IDENTIFICACIN,
Autor:
Directores:
Santiago Garrido Bulln Dr. Luis E. Moreno Lorente Dr. Carlos Balaguer Bernaldo de Quirs
Tribunal Calificador:
--.. -__7.
Presidente: Vocales:
Av
A:3
-
eu..o
Vocal Secretario:
Calificacin:
Legans, )de
de %Ooo
AGRADECIMIENTOS
Quiero dar las gracias en primer lugar a mis directores de tesis, D. Luis Mo reno y D. Carlos Balaguer, por su inapreciable ayuda y buenos consejos, no slo con el tema de la tesis, y que ahora culminan con la presentacin de este trabajo. A todos mis compaeros en el Departamento, por su desinteresada ayuda en todos los problemas que han ido surgiendo a lo largo de estos aos, y por los buenos ratos que hemos pasado entre tanto. En un aspecto ms personal, debo dar las gracias a mi familia por aguantar y animar durante tanto tiempo a alguien que hace cosas tan raras como sta.
RESUMEN
La identificacin de sistemas trata de la estimacin de modelos de sistemas dinmicos a partir de los datos observados. La estimacin trata de evaluar y di sear los estimadores de estado. Ambos se suponen que operan en un entorno estocstico. Esta tesis dirige su esfuerzo investigador principalmente hacia la mejora de la resolucin de los problemas de identificacin y estimacin de estados de sistemas dinmicos no-lineales y el control adaptativo de los mismos. Se presenta un nuevo mtodo hbrido para la optimizacin de funciones no li neales y no diferenciables que varan con el tiempo sin la utilizacin de derivadas numricas. Esto es especialmente importante por la presencia de ruido. Este m todo est basado en los algoritmos genticos con una nueva tcnica de bsqueda que hemos denominado Optimizacin Gentica Restringida (RGO). Este mto do est especialmente indicado para su uso en la identificacin para el control de sistemas dinmicos. Este mtodo de optimizacin es el marco unificador de la tesis y al ser un mtodo bsico permite su aplicacin a multitud de problemas relacionados con la Teora de Sistemas, que precisan de una optimizacin en lnea, puesto que las funciones varan con el tiempo y sin el uso de derivadas numricas ya que estos sistemas estn expuestos a ruidos. A partir de ste algoritmo, se presenta un mtodo de altas prestaciones para la identificacin de sistemas no lineales variables con el tiempo con modelos lineales y no lineales. Este mtodo puede ser usado en lnea y en bucle cerrado, por lo que se puede utilizar en control. Este mtodo utiliza un algoritmo de identificacin en lnea que empieza calculando qu ARX se adapta mejor al sistema, lo que nos da los rdenes y el retardo del modelo. A continuacin calcula un modelo ARMAX que sirve como semilla para inicializar el RGO y crear un modelo NARMAX. El algoritmo RGO permite describir un nuevo estimador no lineal para el fil trado de sistemas con procesos y modelos de observacin no lineales, basados en la optimizacin con RGO. Los resultados de simulacin se usan para comparar el rendimiento de este mtodo con EKE (Extended Kalman Filter), IEKF (Itera ted Extended Kalman Filter), SNF (Second-order Non-linear Filter), SIF (Single-
stage Iterated Filter) y MSF (Montecarlo Simulation Filter) en presencia de dife rentes niveles de ruido. Asimismo se compara con las Redes Neuronales de tipo Backpropagation. Cuando se aplica a la identificacin en el espacio de estados se obtiene un nue vo mtodo de identificacin que comienza calculando un ARX y posteriormente utiliza RGO para mejorar la identificacin previa. Este mtodo est basado en el modelo de parametrizacin completa y las realizaciones equilibradas. De esta manera se consiguen realizaciones de baja sensibilidad y que evitan los problemas de estructura de las realizaciones cannicas. Se presentan dos aplicaciones de estos mtodos. La primera es el control pre dictivo con RGO del Sistema MIMO de Rotores Gemelos (Twin Rotor MIMO System TRMS), que es un laboratorio diseado expresamente para realizar ex perimentos de control. En ciertos aspectos su comportamiento recuerda al de un helicptero. Desde el punto de vista de control ejemplifica un sistema de orden alto con acoplamientos cruzados muy significativos. La segunda aplicacin es la localizacin de robots mediante la informacin de los distintos sensores. Para fusionar toda esta informacin y as poder corregir la posicin y orientacin del vehculo es necesario un algoritmo que en este caso es una extension del filtro de Kalman usando RGO.
-
viii
ABSTRACT
The system identification deals with the problem of estimating modeis of dy namical systems from observed data. The estimation tries to evaluate and to de sign state estimators. The two of them are supposed to operate in a stochastic environmeflt. In this thesis, It has been tried to improve the methods of identification and state estimation of non-linear dynamical systems and their adaptive control. A new optimization hybrid method of non-linear and non-differentiable, time varying functions without using numerical derivatives is presented. This is im portant because of noise. This method based on Genetic Algorithms introduces a new technique called Restricted Geneti Optimization (ROO). This optimization method unifies the thesis anddue to the fact that it is a basic method, it can be applied to a lot of problems related with non-differentiable and time-varying functions. Based on this algorithm, a high performance method for the identification of non-linear, time-varying systems with linear and non-linear modeis, is presented. This method can be used on-line and in a closed loop. For this reason, it is well adapted to control. This method uses an on line identification algorithm that be gins by calculating what ARX is the best adapted to the system. This way the order and the delay of the system are known. Then, an ARMAX that is used as a seed to start the RGO and to create a NARMAX model, is calculated. ,The RGO algorithm can describe a new non-linear estimator for filtering of systems with non-linear processes and observation modeis based on the RGO op timization. The simulation results are used to compare the performance of this method with EKF (Extended Kaiman Filter), IEKF (Iterated Extended Kaiman Filter), SNF (Second-order Non-linear Filter), SIF (Single-stage Iterated Filter) y MSF (Montecarlo Simulation Filter) with different leveis of noise. When this method is applied to the state space identification a new method is obtained. This method begins by calculating an ARX and then uses RGO in order to improve the previous identification. This method is based on the fuil parametrization and balanced realizations. This way low sensitivity realizations are obtained and the structural issues of multivariable canonical parametzatiolls
are circumvented. Two applications of this method are considered. The first application is the predictive control with RGO of the Twin Rotor MIMO System (TRMS), that is a laboratory set-up designed for control experiments. In certain aspects, its beha viour resembles that of a helicopter. From the control point of view, it exemplifies a high order non-linear system with significant cross-couplings. The second one is the robot localization based on different kind of sensor information. To fuse all the different information, an algorithm is necessary. In this case, it has been used an extension of the Kalman algorithm with RGO.
NDICE GENERAL
Agradecimientosy ResumenV Abstractix IntroduccinXXffl 1. FundamentosEstado Arte y del 1.1 Identificacin1 1.1.1 Modelos de Sistemas Dinmicos2
1.1.2 Modelos de Entrada-Salida3 1.1.3 Modelos Paramtricos Lineales4 No-lineales5 1.1.4 Modelos Paramtricos 1.1.5 ModelosNo-Paramtricos, Redes Neuronales8 .1.1.6 Identificacincon AlgoritmosGenticos15 1.1.7 Identificacinen Bucle Cerrado16 1.2 Estimacinde Estados18 1.2.1 Modelosen el Espacio de Estados18 1.2.2 Laestimacin lineal en sistemas dinmicos El Filtro de Kaiman 1.2.3 Elcaso no lineal: Filtros No-lineales 1.2.4 FiltroExtendido de Kaiman (EKF) y Filtro No-lineal de Segundo Orden (SNF) 1.2.5 Filtroextendido Iterado de Kaiman(IEKF) 1.3 Validacinde Modelos 1.4 ControlAdaptativo
-
19
20 22 22 23 25 27 27
2.
30
2.2
35 41
53 53 54
54
55 57 59 61 61 62 63 63 64 67 67 68
5.4
69
7
75 79
6. Estimacin Estados de
6.1 6.2
83
6.3
86
86
xii
6.3.2 6.3.3
Filtroextendido Iterado de Kaiman (IEKF) Filtro Iterado de una Etapa (Single-stage Iterated Filter (Sif)) 6.3.4 Filtrocon Simulacin Montecarlo (MSF) Elnuevo Filtro, RGO Comparacinde Filtros No-lineales Discusin
108
110
111
112
115
116
116
117
119
120
120
9. Aplicaciones TRMS 1:
9.1 9.2 9.3 9.4 Introduccin Modeladoy parmetros Identificacindel TRMS Control del PID TRMS
.
9.4.1 Estabilizaciny seguimiento 1-DOF vertical 9.4.2 Estabilizaciny seguimiento 1-DOF horizontal 9.4.3 Estabilizaciny seguimiento 2-DOF 9.4.4 ControladorPID con acoplamiento cruzado 9.5 Control Predictivo mediante PID y ROO 9.6135 Control predictivo del TRMS 9.7139 Control en el Espacio de Estados del TRMS 9.8140 Comparacin de los distintos mtodos
.
143 10.1 El Filtro de Kaiman Extendido Iterado 143 10.2 Localizacin del Robot Mvil utilizando un Filtro RGO No-lineal 143 10.2.1 Consideraciones de diseo145 10.2.2 La estructura gentica146 10.2.3 La funcin de salud146 10.3 Resultados experimentales148 151 151 151 151 152
xiv
NDICE DE TABLAS
2.1 2.2 2.3 2.4 3.1 3.2 Fenotipos y salud asociada Nmero de copias esperado Cruce Cruce 2.5 Mapa de dominacin Elnmero de estados N como funcin de 1 y P 31 32 33 34 38 47 48
LamatrizZparal=2yP=2
Comparacinde los mtodos de identificacin de sistemas74 Comparacin de los mtodos de identificacin: RGO y Redes Neuronales Comparacin Comparacin Comparacin Comparacin Comparacin Comparacin de BlAS para el nivel de ruido 0.1 de RMSE para el nivel de ruido 0.1 de BlAS para el nivel de ruido 0.5 de RMSE para el nivel de ruido 0.5 de BlAS para el nivel de ruido 1.0 de RMSE para el nivel de ruido 1.0 94
5.1 5.2
6.1 6.2 6.3 6.4 6.5 6.6 7.1 9.1 9.2 10.1 10.2 10.3 10.4
77 94. 95 95 95 96
Errores Cuadrticos Relativos105 Notacinusada en la figura 9.2126 Resultadosde la comparacin entre los distintos mtodos de con trol del TRMS142 Localizacin Localizacin Localizacin Localizacin en posicin con y sin RGO (1). Error en mm. angular con y sin RGO (1). Error en grados en posicin con y sin RGO (2). Error en mm. angular con y sin RGO (2). Error en grados
. .
xvi
NDICE DEFIGURAS
1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 1.11 2.1 2.2 2.3 RedFeedforward con una capa oculta y una salida RedFeedforward con dos capas ocultas10 RedRecurrente. q1 retarda la seal un tiempo de muestreo. IdentificacinSerie-Paralelo11 IdentificacinParalela12 Red con realimentacin de la Capa Oculta13 Red con realimentacin de la Capa de Salida14 Sistemaen bucle cerrado17 Diagramade flujo del filtro de Kalman21 Sistema adaptativo con identificacin de modelo (MIAS)25 Sistema adaptativo con modelo de referencia (MRAS)26 AlgoritmosGenticos27 BsquedaGentica28 Terminologade los Algoritmos Genticos29 Ciclode los Algoritmos Genticos30 Cmofuncionan los Algoritmos Genticos30 Mtodosde seleccin31 Funcinde salud32 Cruce33 Mutacin34 Mecanismode bsqueda de la Optimizacin Gentica Restringida Mecanismode seguimiento de la Optirnizacin Gentica Restrin gida58 Diagramade flujo de la Optimizacin Gentica Restringida RGO Diagramade flujo de la RGO66 Mecanismode cruce68 Mecanismode mutacin68 Montajede la Planta 271 56 9
.
10
2.4
2.5 2.6 2.7 2.8 2.9 4.1 4.2 4.3 5.1 5.2 5.3 5.4
60
5.5
5.6
5.7
5.8 5.9
5.10 5.11
5.12
5.13
5.14
Fenmenode blow-up al intentar identificar la planta 1 con el blo que ARMAX de Simulink. Este efecto se debe a que se correlan los errores c(t) y r (t) con la entrada y hace imposible la identifi cacin de este sistema mediante este mtodo72 Resultadosde la identificacin de la planta 1 con el mtodo RGO. Arriba: salida del modelo vs. salida real. Abajo: error cometido. Resultadosde la identificacin de la planta 2 con el mtodo RGO. Arriba: salida del modelo vs. salida real. Abajo: error cometido. Resultadosde la identificacin de la planta 3 con el mtodo RGO. Arriba: salida del modelo vs. salida real. Abajo: error cometido. Resultadosde la identificacin de la planta 4 con el mtodo RGO. Arriba: salida del modelo vs. salida real. Abajo: error cometido. Estructura de la Red Multicapa utilizada en la comparacin. Resultados de la identificacin de la planta 1. Subfigura 1: salida del modelo Vs. salida real para RGO. Subfigura 2: error come tido. Subfigura 3: salida del modelo Vs. salida real para la Red Neuronal. Subfigura 4: error cometido77 Resultados de la identificacin de la planta 2. Subfigura 1: salida del modelo vs. salida real para RGO. Subfigura 2: error come tido. Subfigura 3: salida del modelo vs. salida real para la Red Neuronal. Subfigura 4: error cometido78 Resultados de la identificacin de la planta 3. Subfigura 1: salida del modelo vs. salida real para RGO. Subfigura 2: error come tido. Subfigura 3: salida del modelo vs. salida real para la Red Neuronal. Subfigura 4: error cometido78 Resultados de la identificacin de la planta 4. Subfigura 1: salida del modelo vs. salida real para RGO. Subfigura 2: error come tido. Subfigura 3: salida del modelo vs. salida real para la Red Neuronal. Subfigura 4: error cometido79
. .
72 73 73 74 75
Diagramade flujo del filtro de Kalman85 Diagramade flujo de la Optimizacin Gentica Restringida apli cada a la estimacin de estados91 Ejecuciones tpicas para el modelo 5 con EKF y SRGOF para nivel de ruido 1.093 TwinRotor MIMO System (TRMS)102 Resultados de identificacin de la Planta con el mtodo ARX. Arriba: Salida del Modelo vs. Salida del Sistema. Abajo: Error. 103
.
7.1 7.2
xviii
7.3
Resultados de identificacin de la Planta con el mtodo Gauss Newton.Arriba: Salida del Modelo vs. Salida del Sistema. Abajo: 103 Error Resultados de identificacin de la Planta con el mtodo RGO. Arriba: Salida del Modelo vs. Salida del Sistema. Abajo: Error. 104
Lametodologa del control predictivo basado en modelos108 Estructurabsica del control predictivo109 Distintastrayectorias de referencia Resultadosde la identificacin de los parmetros 1yi Y2 ) 1r del control predictivo RGO114 8.5 Esquema para la identificacin de los parmetros de la ley de con trol predictivo115 8.6 Resultadosde la identificacin de los parmetros 1yi ly Y r del control predictivo RGO. El tiempo 10 corresponde al llenado del buifer 8.7 Resultados de la identificacin de los parmetros del sistema. 8.8 Esquema general dl control daptativo 8.9 8.10 Diagrama Simulink para Control 1 8.11 Resultados del Control Predictivo con RGO para = 0.12 8.12 Resultados del Control Predictivo con RGO para = 0.16 8.13 Resultados del Control Predictivo con RGO para ? = 0.20
. . . . . . .
110
123 TwinRotor MIMO System (TRMS) 124 TwinRotor MIMO System (TRMS) 125 Diagramade bloques del modelo TRMS 128 Respuestadel rotor principal del TRMS a una onda cuadrada.. 9.5 Control del sistema 1-DOF (estabilizacin y seguimiento en ver tical). Arriba: salida vs. seal de referencia. Abajo: error cometido.128 129 9.6 Diagramade bloques del sistema 1-DOF (plano vertical) 9.7 ontroldel sistema 1-DOF (estabilizacin y seguimiento en ver tical). Arriba: salida del sistema vs. seal.de referencia. Abajo: 129 error cometido 9.8 Controldel sistema 1-DOF (estabilizacin y seguimiento horizon 130 tal) 130 9.9 Diagrama de bloques del sistema 1-DOF (plano horizontal). 9.10 Control del sistema 1-DOF (estabilizacin y seguimiento en hori zontal). Arriba: salida del sistema vs. seal de referencia. Abajo: 131 error cometido.
. . . . .
xix
9.11 Control del sistema 2-DOF 131 9.12 Experimento con el controlador de estabilizacin y seguimiento 2-DOF PID. Arriba: salida del sistema vs seal de referencia en eje vertical. Abajo: error cometido132 9.13 Experimento con el controlador de estabilizacin y seguimiento 2-DOF PID. Arriba: salida del sistema vs seal de referencia en eje horizontal. Abajo: error cometido132 9.14 Diagrama de bloques del sistema de control 2-DOF PID de aco plamiento cruzado133 9.15 Experimento con el controlador de estabilizacin y seguimiento 2-DOF PID con acoplamiento cruzado Arriba: salida del sistema Vs. seal de referencia en eje vertical Abajo: error cometido 133 9.16 Experimento con el controlador de estabilizacin y seguimiento 2-DOF PID con acoplamiento cruzado Arriba: salida del sistema Vs. seal de referencia en eje horizontal Abajo: error cometido. 134 9.17 Sistema adaptativo con identificacin de modelo (MIAS)135 9.18 Control del Sistema con RGO-PID y RGO Predictivo136 9.19 Experimento con el controlador de estabilizacin y seguimiento: control predictivo-RGO en el plano vertical (con un grado de li bertad). Arriba: salida del sistema vs seal de referencia en eje vertical. Abajo: error cometido136 9.20 Experimento con el controlador de estabilizacin y seguimiento: PID-RGO (arriba) en el plano vertical (con un grado de libertad). Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido137 9.21 Experimento con el controlador de estabilizacin: Predictivo-RGO con dos grados de libertad. Arriba: salida del sistema vs. seal de referencia en eje vertical. Abajo: error cometido137 9.22 Experimento con el controlador de estabilizacin: PID-RGO con dos grados de libertad. Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido138 9.23 Experimento con el controlador de estabilizacin (seales de con trol: control predictivo y PID)138 9.24 Control del sistema 2-DOF
. . . . 139 9.25 Experimento con el controlador de estabilizacin y seguimiento: PID-RGO en variables de estado. Arriba: salida del sistema Vs.
referencia
en
eje
vertical.
Abajo:
salida
del
sistema
vs.
referencia
en
eje
horizontal140
xx
xxi
xxii
INTRODUCCIN
Ha habido un gran inters por parte de la comunidad de control en aplicar los algoritmos genticos a problemas de Ingeniera de Control de Sistemas. Basa dos en modelos computacionales de la evolucin biolgica natural, los Algoritmos Genticos pertenecen a la clase de los algoritmos evolutivos, que tambin incluyen la programacin evolutiva, la evolucin de estrategias y la programacin genti ca. Comparado con los mtodos tradicionales de bsqueda y optimizacin, tales como los basados en el clculo o los basados en tcnicas enumerativas, los algo ritmos genticos son una tcnica robusta, que puede ser utilizada de forma global o semi-local y que se puede aplicar generalmente de forma ms directa a situacio nes que tienen poco o ningn conocimiento acerca del proceso a ser controlado. Para el ingeniero de control los algoritmos genticos y la programacin evoluti va, en general, presentan oportunidades de plantearse problemas que no permiten una solucin eficiente a travs de la aplicacin de tcnicas convencionales. En los ltimos aos, los algoritmos genticos han sido aplicados a muchos temas rela cionados con la Ingeniera de Control, incluyendo la optimizacin paramtrica y combinatoria y el control adaptativo. El diseo de controladores no-lineales es un problema muy importante en In geniera de Control, aunque difcil. Hoy en da, la mayora de los controladores industriales son lineales puros debido a las dificultades encontradas en el proble ma de diseo de controladores n lineales. Para construir un controlador no-lineal hemos de hacer suposiciones vlidas acerca de la estructura del controlador y del sistema a controlar. Estas suposiciones nos llevan frecuentemente al desarrollo de controladores no suficientemente robustos puesto que los efectos de la incerti dumbre no han sido tenidos en cuenta a la hora de disear el controlador. La identificacin de sistemas de dinmica desconocida ha producido un campo de investigacin llamado identificacin de sistemas. En identificacin de siste mas definimos o describimos una estructura modelo que tiene un comportamiento similar al del sistema desconocido.
Objetivos de la tesis
El principal objetivo de la tesis es el desarrollo de nuevos mtodos hbridos
de identificacin y de estimacin de estados, on une de sistemas dinmicos nolineales, basados en algoritmos genticos. Asimismo, se han estudiado sus pli caciones al control adaptativo de dichos sistemas. En la literatura, el uso de los algoritmos genticos como mtodo de optimiza cin se hace off-line y el tiempo utilizado es bastante grande, ya que usualmente los algoritmos genticos se usan como un mtodo de bsqueda global y en para lelo. Hemos utilizado nuevos mecanismos para usarlos como lo hace la Naturaleza: On-line y de una manera local o semi-local. Hemos demostrado que los algoritmos genticos se pueden usar como un m todo rpido de optimizacin de funciones que varen con el tiempo. A ste nuevo mtodo que hemos desarrollado lo hemos denominado Restric ted Genetic Optimization (RGO) y simula el mtodo del gradiente sin utilizar derivadas y puede ser utilizado cuando las seales tienen mucho ruido. El mtodo de bsqueda restringida consiste en hacer la bsqueda en un entorno del punto correspondiente al ltimo modelo identificado y tomar el punto mejor adaptado como centro del entorno de bsqueda de la nueva generacin. Los individuos de cada generacin representan los vectores de diferencia res pecto al mejor punto de la generacin anterior. El radio se toma proporcional a la incertidumbre.
Estructura de la Tesis
El contenido de la tesis se encuentra distribuido en diez captulos. Inicialmente se presenta un captulo dedicado a las distintas metodologas relacionadas con el contenido de la tesis. El dearrollo de un nuevo mtodo de optimizacin RGO (Restricted Genetic Optimization) para funciones que varen con el tiempo. Este mtodo ha probado ser muy til para minimizar o maximizar funciones posiblemente no-lineales y no-diferenciables. Este mtodo est especialmente indicado para su uso en la identificacin para el control de sistemas dinmicos. En el captulo 6 se presenta un mtodo de altas prestaciones para la identifi cacin de sistemas no lineales variables con el tiempo con modelos lineales y no lineales mediante RGO. El captulo 7 trata de nuevo estimador no lineal para la estimacin de los es tados en sistemas con procesos y modelos de observacin no lineales, basados en la optimizacin con RGO (Restricted Genetic Optimization). Los resultados de simulacin se usan para comparar el rendimiento de este mtodo con EKF (Exten ded Kalman Filter), IEKF (Iterated Extended Kalman Filter), SNF (Second-order Nonlinear Filter), SIF (Single-stage Iterated Filter) y MSF (Montecarlo Simula xxiv
tion Filter) en presencia de diferentes niveles de ruido. Asimismo se compara con las Redes Neuronales de tipo Backpropagation. En el captulo 8 mostramos un nuevo mtodo de identificacin de sistemas dinmicos con modelos en el Espacio de Estados. Este mtodo un algoritmo de identificacin que comienza calculando un ARX y posteriormente utiliza RGO para mejorar la identificacin previa. Las aplicaciones de estos mtodos al control se tratan en el captulo 9 a partir del Sistema MIMO de Rotores Gemelos (Twin Rotor MIMO System TRMS), que es un laboratorio diseado expresamente para realizar experimentos de con trol. En ciertos aspectos su comportamiento recuerda al de un helicptero. Desde el punto de vista de control ejemplifica un sistema de orden alto con acoplamien tos cruzados muy significativos. En el captulo 10 presentamos la aplicacin a la deteccin de marcas artificia les para la localizacin de robots, empleando para ello como sensores una cmara con zoom motorizado sobre una plataforma pan and tilt y un anillo perifrico de 24 sensores perifricos. Para fusionar toda la informacin y as poder corregir la posicin y orientacin del vehculo utilizamos un filtro de Kalman extendido basado en RGO. Algunas partes de esta tesis han sido publicadas previamente: La mayor parte (excepto la comparacin con las redes neuronales) del captulo 5 apareci como:
-
Garrido,S .,Moreno,L.E.,Salichs,M.A.(1998). Nonlinear On-line Iden tification of Dynamic Systems with Restricted Genetic Optimization. 6th European Congress on Intelligent Tecimiques & Soft Computing. (EUFIT98) El captulo 6 fue publicado como: Garrido,S ,Moreno,L.E.,Balaguer,C.( 1998). State Estimation for Nonlinear Systems using Restricted Genetic Optimization. 11th mt. Con ference QnIndustrial and Engineering Applications of Arti IIcial Inte lligence and Expert Systems.(IEA-AIE98)
.
El captulo 7 apareci como: Garrido,S ,Moreno,L.E. ,Salichs,M.A.(1999). Identification of State SpaceModels with RGO. 6th European Congress QnIntelligent Tech niques & Soft Computing. (EUFIT98)
.
Las aplicaciones a los Robots Mviles fueron desarrolladas junto con otros autores en: xxv
xxvi
Armingol, J.M., Moreno, L.E., Garrido, S., de la Escalera, A., Sa lichs, M.A.: Mobile Robot Localization Using a Non-Linear Evolu tionary Filter. 3rd IFAC Symp. on Intelligent Autonomous Vehicles (IAV98).
La identificacin de sistemas es la teora y el arte de construir modelos mate mticos de sistemas dinmicos basndonos en las entradas y salidas observadas. Como disciplina cientfica data de los primeros intentos de modelar series de tiem po usando tcnicas AR. Aunque una parte sustancial del desarrollo de las tcnicas est ligado a la Comunidad de Control, est bsicamente construida a partir de tcnicas estadsticas, en particular en los mtodos de regresin lineal y no-lineal. Construir modelos para sistemas desconocidos es un objetivo importante de la Ingeniera de control. Estos modelos necesitan simular el comportamiento real en los casos en que existe un conocimiento previo limitado de la estructura del sistema. Consideremos el motor de un coche por ejemplo. Es importante simular el comportamiento de un motor para la deteccin de fallos y para propsitos de diag nosis. Algunos factores importantes que afectan este proceso son las dificultades asociadas con el desarrollo de un modelo aceptable con un orden de complejidad mnimo y con un nmero de medidas mnimo. Estos factores hacen que el proceso de modelado de un motor de coche bastante difcil. Esto puede ser generalizado a una amplia clase de sistemas en la industria. La identificacin de sistemas no lineales se considera un problema difcil. La razn es que identificar un sistema no-lineal conlieva dos grandes etapas: la selec cin de la estructura del modelo con un cierto nmero de parmetros y la seleccin de un algoritmo que estime dichos parmetros. En la literatura han sido propuestos numerosos modelos lineales como solu cin al proceso de identificacin. Estos modelos son simples, como OE y ARX por ejemplo. En este caso podemos elegir un algoritmo sencillo para estimar ls parmetros del modelo. Aunqii muchos sistemas no-lineales pueden ser linealizados representndo los por medio de una ecuacin diferencial o en diferencias, modelar sistemas no-
FUNDAMENTOSYESTADODELARTE. 1.
lineales con modelos lineales implica muchas aproximaciones. Con frecuencia, estas aproximaciones no reflejan suficientemente el comportamiento real del sis tema no lineal.. Por tanto, el obtener un buen modelo, con una estructura que refleje la informacin real del sistema, exige un incremento en coste. Este coste es debido a la necesidad de algoritmos ms avanzados que puedan manejar mode los con estructuras complejas. Los modelos pueden ser paramtricos, que tienen la ventaja de estar dados por un conjunto pequeo de coeficientes, o bien no paramtricos como las re des neuronales, que tienen la ventaja de no estar restringidas a un cierto nmero, posiblemente pequeo, de descripciones posibles del modelo. El trmino Identificacin de sistemas fue acuado por Lofti Zadeh [109] en 1962, como: Identificacin es la determinacin, en base a la entrada y la salida, de un sistema, dentro de una clase de sistemas especificada, al cual el sistema probado es equivalente. Puede decirse que la identificacin de sistemas qued establecida como un campo de investigacin reconocido dentro del rea de control automtico a me diados de los sesenta: en el tercer congreso de la IFAC en Londres, 1966 en el que fue presentado un artculo de visin general sobre identificacin de sistemas (Eykhoffet al. 1966). Un ao despus fue organizado el primer Symposium IFAC sobre identificacin de sistemas en Praga. En la actualidad es el Sympsium con una serie mas larga de la IFAC. La teora sobre identificacin de sistemas est reunida, por ejemplo, en los libros de Ljung [69] y de Sbderstrom y Stoica [97], donde tambin se pueden encontrar numerosas referencias.
1.1.1
Cuando trabajamos con un modelo de un sistema, tenemos una cierta idea de cmo unas variables estn relacionadas entre s. Desde un punto de vista general, podemos decir que las relaciones observadas son un modelo del sistema. Est claro que los modelos pueden venir dados por diferentes estructuras y con distintas formulaciones matemticas. El uso deseado del modelo tambin determina el grado de sofisticacin requerido. El modelado e identificacin de sistemas no lineales es, en buena medida, un problema dependiente de las aplicaciones y que frecuentemente tiene sus races en la tradicin y en. las tcnicas especficas del rea de aplicacin.
.
1.1. IDENTIFICACIN
y(t)+aly(tl)=blu(tl)+b2u(t2) Es necesario determinar los valores de los parmetros ai, b1, y b2. Esto puede ser hecho por medio del conocido mtodo de mnimos cuadrados minai,bi,b2(Y(t) +aiy(t 1) biu(t 1) b2u(t2))2 (1.2)
(1.1)
Los valores 1, , y pueden ser calculados fcilmente en este caso puesto 1.2 es una funcin cuadrtica. As obtenemos el modelo del sistema: y(t) +y(t 1)
u(t 1) +iu(t2)
(1.3)
Este sencillo problema de identificacin de sistemas es un caso especial de la amplia clase de problemas de construccin de modelos.
y(k)=f(y(k_1),y(k_2),...,y(kn),u(kl,U(k2),...,U(1tm)) (1.4) donde u(k), y(k) representa el par de entrada-salida en el tiempo k. Los enteros positivos n y m son el nmero de salidas pasadas (tambin llamado el orden del sistema) y el nmero de entradas pasadas. En la prctica m es, normalmente, menor o igual que n. f puede ser cualquier funcin no-lineal definida desde el espacio de entradas y salidas pasadas hasta el espacio de salidas futuras. Si el sistema es lineal, f es una funcin lineal y la ecuacin anterior puede ser reescrita como:
(15)
FUNDAMENTOSYESTADQDELARTE. 1.
que puede ser visto como una manera de determinar el siguiente valor de la salida dadas las observaciones anteriores y las entradas. Aqu A (q) y B (q) son polinomios en el operador desplazamiento hacia atrs q1 e y(t), u(t), y e(t) son las salidas, entradas y ruido, respectivamente. El ruido e(t) es una sucesin aleatoria normalmente distribuida de media cero y varianza a2 O(Output Error) cuya expresin es y(t) u(t nk) + e(t)
-
(1.7)
con la fuente de error e(t) que es la diferencia (error) entre la salida real y la salida libre de ruido (terica). ARMAX (Auto-Regressive Moving Average with eXogenous inputs), cuya expresin es A(q)y(t)
=
B(q)u(t
nk) + C(q1)e(t)
(1.8)
En ste modelo la expresin A(q1)y(t) = e(t) representa la auto-regresin, y(t) = C(q1)e(t) representa la media mvil de ruido blanco, mientras que B(q1 )u(t) representa le entrada externa. Otros modelos pueden ser usados, como por ejemplo la representacin en el espacio de estados o el modelo de ceros y polos.
1.1. IDENTIFICACIN
9(tle) g((t),e)
=
8(k)gk((t))
(1.9)
donde 4(t) estformado por las entradas u(k) y salidas y(k) pasadas:
(t)
=
[y(t
1),.. .,y(tna),U(t1),...,u(Yflb)]T
(1.10)
y hemos introducido la notacin 9(t e) para hacer hincapi en que g (4(t),) es una estimcin de y(t) dada la informacin 4(t) y un vector de parmetros dad
e.
El mejor valor de Oest determinado entonces por el conjunto de datos
ZN
=
{[y(t),(t)]t=
1,... ,N}
(1.11)
y ser:
eN =
argmin
k=s
ly(t) 9(tIO)2
(1.12)
Modelosparamtricos No-lineales Series de Volterra Las series de Volterra son desarrollos en serie que consis
ten en trminos lineales, bilineales y trilineales. Trminos de mayor orden pueden ser incluidos para algunas aplicaciones. Una serie de Volterra con un orden y un retardo apropiadamente escogidos pueden ser usados para modelar sistemas
FUNDAMENTOSYESTADODELARTE. 1.
dinmicos no-lineales. Las series de Volterra vienen descritas por la expresin: y(k) 0au(k i) +oL7obiju(ki)u(kj) +L7 ciu(k
=
(113)
i)u(k
j)u(k
1)
El vector u representa la seal de entrada, el vector y la salida del modelo. Para sistemas estables las series infinitas pueden ser truncadas sin problemas si el lmite superior de la suma es lo suficientemente alto. Entonces la ecuacin anterior puede ser simplificada como: y(k) =1au(k-i) +F.Ltobj1u(ki)u(kj) +LZI L LZI0 ciu(k i)u(k +.
114
j)u(k 1)
De hecho, la mayora de los estudios en ste rea se limitan a series de Volterra de segundo o tercer orden. Las series de Volterrapueden ser representadas en flotacin vectorial: y(k)=afxi+bx2+cx3=xTa donde el vector de datos x y el vector de coeficientes viene dado por:
xT=
(1.15)
(1.16)
y
aT
=
(ao,..
.,aN_i,boo,.
. .
1 C000,...,CN_1,N_1,N_1
(1.17)
T c3
Los
rmetros
desconocidos
de
la
serie
pueden
ser
determinados
partir
de
las
medidas
entrada-salida
resolviendo
la
ecuacin
y=Xa
(1.18)
1.1. IDENTIFICACIN
donde y (k) y(k1) y(k-N) xf (k) xf(k1) xf(kN) a= 4(k) 4(k1) 4(kN)
4(k)
x(k1) 4(kN)
/ (
ai b
C
La solucin por mnimos cuadrados viene dada por la ecuacin normal XTXa XTy que tiene como solucin:
=
(xTX)_1XTy
(1.19)
donde t representa el tiempo discreto, y(t), u(t) y E(t) son la salida, la entrada, y el error de prediccin, respectivamente, n, n y ncson los rdenes correspondientes, F[.]es una funcin no lineal y d es el mnimo retardo de la entrada [Leontaritis 85]. El modelo polinomial NARMAX tiene como expresin y(k) =ao+1ay(k_i)+1bju(k_i)+E11CijY(k_i)U(k_J) (1.21) nos permite una descripcin buena y sencilla de una amplia clase de sistemas no lineales. Por ejemplo, si el modelo exacto NARMAX es y(k) =y(k 1)e_1_1) (1.22)
podemos desarrollar en serie la exponencial exp(x)=0) y emplear un modelo polinomial aproximado NARMAX y(k)
=
(1.23)
Redes Feedforward
El paso desde el desarrollo general 1.9 de una funcin en la base {gj} a lo que es una red neuronal no es grande. Basta escoger gk() = aka (13 + Yk) donde 13k k4 es un vector de parmetros y Yky ak son parmetros escalares para obtener (1.25) donde a0 es el valor correspondiente al nivel medio. A este modelo se le denomina Red Feedforward con una capa oculta y una salida. Las funciones de la base, llamadas nodos o neuronas, son funciones uniwi luadas que convierten la red neuronal e un desarrollo en funciones simples. La eleccin especfica de c(.) es denominada funcin de activacin y suele ser esco gida igual para todos los nodos. El nombre feedforward est explicado por la figura; hay una direccin espe cfica en el flujo de los clculos cuando se calcula la salida g. Primero se calculan
1.1. IDENTIFICACIN
LiJ
Fig. 1.1: Red Feedforward con una capa oculta y una salida.
las sumas con peso en la entrada de cada unidad, despus estas sumas son pasadas por la funcin de activacin y forman las salidas de las capas ocultas. Para calcu lar g se forma una suma con pesos de las salidas de los nodos de la capa oculta. Si g es una funcin vectorial, hay varios nodos de salida formando la capa de salida. La entrada 4)se denomina, a veces, capa de entrada. Los pesos de las diferentes sumas son los parmetros de la red. La funcin a(x) se toma de tipo sigmoide, es decir es una funcin continua que verifica lima(x) = a y lim_(x) = b con a, b E R y b < a. La red neuronal de una capa oculta 1.25 se puede generalizar a varias capas ocultas. La salida de la primera capa oculta alimenta la segunda capa y as sucesi vamente, y la ltima capa oculta alimenta a la capa de salida, como se puede ver en la figura. La frmula para dos capas ocultas ser g(4)) = i (1.26)
j m
Redes Recurrentes
Si alguna de las entradas de la red feedforward consiste en salidas retardadas de la red, o bien en algn estado interno retardado, la red recibe el nombre de red recurrente o red dinmica. ste tipo de redes es especialmente interesante para identificacin.
lo
Capadeentrada
Capasocultas
Capa desalida
J
A
AspectosAlgortmicos
Los pesos de la red deben ser escogidos de forma que la salida se ajuste lo mejor posible a los datos observados, para ello hay que minimizar el funcional: VN(O)
y(t) g((t),8)2
(1.27)
Como no hay solucin analftica a este problema, es necesario emplear algn mtodo numrico de optimizacin. Las rutinas de bsqueda ms eficientes estn
1.1. IDENTIFICACIN
11
basadas en bsqueda local en una direccin de mayor pendiente desde el punto actual. Tenemos, por tanto, un esquema iterativo del tipo
(i+1)
=
(i)
piRT1Vj
(1.28)
dondep es el paso, Vj es una estimacin del gradiente vk(()Res una matriz y que modifica la direccin de bsqueda.
El esquema de identificacin serie-paralelo utiliza las entradas y salidas de la planta y deja que internamente la red deduzca el error existente. Este esque ma, tambin llamado teacherforcing puede ser usado con cualquier algoritmo de aprendizaje. La idea es que durante la fase de entrenamiento, para calcular los nuevos esta dos de la red neuronal, se utilicen en el lazo de realimentacin las salidas actuales de la planta en lugar de las salidas de la red. Su implementacin puede ser muy sencilla con cualquier algoritmo. El serie-paralelo es til al inicio del aprendizaje para que los valores de la red no se alejen mucho y converja ms rpido. En el esquema de identificacin paralela, la red no tiene informacin directa acerca de las salidas de la planta, slo las entradas y el error entre las salidas de la planta y la red.
12
1.1. IDENTIFICACIN
13
Capa de entrada
Capa de salida y1
Neuronas auxiliares
y3
La red es de propagacin hacia adelante y al ajustar los pesos hay que tener en cuenta los pesos que van desde las entradas auxiliares a la capa oculta. Este tipo de red puede reconocer reproducir secuecias de periodos cortos de tiempo. Este tipo de red se utiliz para el reconocimiento de palabras generadas por una gramtica formal. Jordan propuso una arquitectura 1.7 donde la capa de entrada est dividida en dos partes: el conjunto de entradas exteas y la realimentacin de la activacin de la capa de salida a travs de conexiones de valor fijo.
14
Capade entrada
Capa Oculta
y1 y2
y3
Este tipo de red es utilizada para el reconocimiento y clasificacin de secuen cias. Fue sugerida por Jordan para su empleo en la generacin de trayectorias de robots. Ejemplos de otras arquitecturas dentro de ste grupo son:
.
Backpropagation in Dynamic Systems (BPD): [Narendra [84] (199 1)]:Identificaciny Control, Control por Modelo de Re ferencia. Propone la construccin de una segunda red llamada sensitivity model para el clculo en lnea de las derivadas de las salidas con respecto a los parmetros (matriz Jacobiana) y de las derivadas con respecto a las entradas. En el artculo, por lo dems explica con detalle el esquema propuesto para generar el gradiente.
Backpropagation through time (BTT): [Werbos [104] (1990)]: Identificacin, Camin remolque.
1.1. IDENTIFICACIN
El fundamento consiste en permitir a la red observar lo que ocurrir con el sistema durante un tiempo T de pasos futuros, para que pueda adaptar sus pesos en consecuencia. Debido a la duplicacin de unidades, los pesos y el coste computacional del entrenamiento, hacen que esta arquitectura no sea muy popular.
16
de estados, lineal e invariante en el tiempo. En este mismo ao, Iba, de Garis y Sato [50] usan una tcnica numrica off une, que integra una bsqueda adaptativa de una estructura de rbol basada en programacin gentica y un mecanismo de ajuste local de parmetros empleando bsqueda estadstica. En la programacin gentica tradicional, la recombinacin causa frecuentes rupturas de los bloques de construccin y la mutacin puede causar abruptos cambios en la semntica. Para superar estas dificultades ellos implementan la programacin gentica tradicional con una bsqueda local hill climbing, usando un procedimiento de ajuste de parmetros. Todos estos mtodos trabajan off-line y precisan que el sistema sea invariante del tiempo. El ltimo adems utiliza un mtodo no paramtrico.
Go(q)u(t) +Ho(q)e(t)
(1.29)
r(t)
F,(q)y(t).
(1.30)
y(t)
G0(q)S0(q)r(t) +S0(q)H0(q)e(t)
(1.31)
1.1. IDENTIFICACIN
y
17
Es importante saber que el mtodo de error de prediccin puede ser aplicado directamente, como si la realimentacin no existiera, y el resultado dar una pre cisin ptima si el sistema verdadero puede ser descrito dentro de la estructura de modelo escogida. Sin embargo, debido a las trampas a que nos puede llevar la identificacin en bucle cerrado, han sido sugeridos diversos mtodos alternativos. Se pueden clasificar en (ver el artculo de Gustafsson [41]): Procedimiento Directo: aplica el mtodo de error de prediccin y se Se identifica el sistema en bucle abierto usando medidas de la entrada y la salida. Procedimiento indirecto: Se identifica el sistema en bucle cerrado utilizan do medidas de la seal de referencia r y de la salida y y se usa esta esti macin para hallar los parmetros del sistema en bucle abierto utilizando el conocimiento del controlador. Procedimiento de Entrada-Salida conjuntas: Se identifican las funciones de transferencia de r a y y de r a u y se utilizan para hallar una estimacin del sistema en bucle abierto. y(t) _-G0q)S0(q)r(t)+S0(q)H0(q)e(t) u(t)= So(r(t) F(q)S0(q)H0(q)e(t)
(133)
El procedimiento de IdentificacinDirecta es el mtodo mas natural para hacer identificacin en bucle cerrado. Las principales razones son:
18
Funciona bien a pesar de la complejidad del regulador y no requiere cono cimiento de la realimentacin. No se necesitan algoritmos ni software especiales. Se asegura la consisten cia y la precisin ptima siempre que la estructura del modelo contenga al sistema verdadero. Los problemas que plantea ste procedimiento son: Es necesario tener buenos modelos del ruido (ver teorema 8.4 en el libro de Ljung [69]). Un pre-filtro/model de ruido que cambie las caractersticas del ruido ver dadero produce sesgo. El problema bsico de los datos en bucle cenado es que contienen menos in formacin que cuando se toman los datos en bucle abierto, puesto que un impor tante propsito de la realimentacin es hacer al sistema en bucle cerrado insensible a los cambios del sistema en bucle abierto. Los mtodos de error de prediccin, aplicados de una manera directa, con modelo de ruido que puede describir las propiedades del ruido verdadero dan es timaciones consistentes y precisin ptima. Adems no se necesita conocimiento de la realimentacin. Por esto deben ser vistos como los mtodos de primera eleccin. Este procedimiento de Identificacin directa es el utilizado en esta tesis, te niendo en cuenta las precauciones anteriores.
1.2.1
Un sistema dinmico puede ser tambin descrito por un modelo en el espacio de estados. El modelo en el espacio de estados de orden n de mltiples entradas y
J
donde:
x(k+1)
(134
( (
(1.3
x(k),u(k),y(k)son vector de estados, el vector de entradas y el vector de e el salidas, respectivamente. Si el sistema es lineal,
x(k+ 1)
Ax(k) +Bu(k)
36
y(k) =Cx(k)+Du(k)
)L
donde A, B, C y D son matrices(nxn), (mxn), (nxl) y (mxl) respectivamente. Estas estructuras sirven para modelar tanto sistemas lineales como no-lineales.
Filtro de Kaiman
El problema estimacin de dinmica
Consideremos un sistema dinmico lineal en tiempo discreto descrito por una ecuacin vectorial en diferencias con ruido blanco Gaussiano aditivo que modela perturbaciones no predecibles. La ecuacin de estado es x(k+1) =F(k)x(k)+G(k)u(k)+v(k), k=O,1,... (1.37)
donde x(k) es el vector de estado de dimensin n, u(k) es el vector de entrada de dimensin nu(que es conocido), y v(k), k = 0, 1,..., es la secuencia de ruido blanco Gaussiano de media cero con covarianza E[v(k)v(k)] La ecuacin de medida es
-
Q(k)
(1.38)
z(k)=H(k)x(k)+w(k),
k=1,2,...
(1.39)
con w(k) secuencia de ruido de medida blanco Gaussiano de media cero con co varianza E[w(k)w(k)]=R(k) (1.40)
20
FUNDAMENTOS ESTADODELARTE. 1. Y
Las matrices F, G, H, Q,y R se suponen conocids y que pueden cambiar con el tiempo. En otras palabras, el sistema puede cambiar con el tiempo y los ruidos son no estacionarios. El estado inicial x(O)es en general desconocido y se modela como una variable aleatoria Gaussiana con media y covarianza conocidas. Las dos secuencias de ruido y el estado inicial se suponen mutuamente independientes. Las anteriores condiciones se llaman lineales-Gaussianas.
(1.41)
kIk)]IZ]
(1.42)
las correspondientes variables del siguiente paso, (k + 1 k + 1) y P(k + 1 k + 1). Esto se puede hacer puesto que las variables Gaussianas quedan caracterizadas por sus dos primeros momentos.
z(k)=
donde (k) y ii(k) son los ruidos, que se suponen vectores aleatorios, indepen dientemente distribuidos:
(1.44)
(a(k) i(k)
(1.45)
Estado Real
Entrada conocida
Clculo covarlanza de la
Covarianza estado del en P(klk)
Estado tk en x(k)
Control tk en
___________
u(k)
1
i
delestado Covarianza dela Prediccin (k+1lk) prediccin del estado P(k+lik)= F(k)x(klk) +G(k)u(k) F(k)P(klk)F(k)+Q(k)
1 1
-
1 1
Actualizacinla de estimacin estado del (k+1lk+1) x(k+1 lk)+W(k+1)(k+1)
z(k+1)-z(k+llk
E(x(k) Zk)
x(k)p(x(k) Zk)dx.
(1.46)
Desafortunadamente, esta descripcin necesita un nmero infinito de parmetros. Por esta razn, un nmero importante de aproximaciones subptimas han sido propuestas. Estos mtodos utilizan aproximaciones analticas de las distribucio nes de probabilidad, la ecuacin de transicin de estados o la ecuacin de medida. Existen otros mtodos, tales como el mtodo de Montecarlo, que necesitan miles de puntos para aproximar la densidad de probabilidad condicional. En aplicacio nes con muchas dimensiones, stos ltimos mtodos no son prcticos. Por esta razn son necesarios mtodos con un nmero razonable de operaciones, tales co mo los estudiados en este trabajo.
22
FUNDAMENTOSYESTADODELARTE. 1.
1.2.4 Filtro Extendido Kaiman de (EKF)y Filtro No-lineal Segundo de Orden (SNF)
El filtro Extendido de Kaiman es similar a un filtro de Kaiman linealizado, con la excepcin de que la linealizacin es realizada en la trayectoria estimada en vez de hacerlo en una trayectoria nominal previamente calculada. Por esta razn, las funciones g(k, x(k 1), c(k))h(k, ,i(k)) desarrolladas en serie de Taylor y x(k) son alrededor de (klk) contrminos hasta primer o segundo orden para obtener l EKF o SNFrespectivamente. El desarrollo con trminos de segundo orden de la ecuacin de transicin es:
x(k) =g(k,x(k l),E(k)) g(k,(kk 1),O) +g(k,x(k l),E(k))(x(k 1)(k 11k1))+g(k,x(k 1),E(k))E(k) +e(x(k1)-x(k- 11k-l))g(k,x(kl),E(k))(x(k1)-(kl),c(k))e(k) 11k-1))
+ejc(k)(k,xk-
(1.47) y el desarrollo con trminos hasta segundo orden de la ecuacin de medida es: z(k) = h(k,x(k),Ti(k) h(k,(kk l),O) +h(k,x(k l),ri(k))(x(k 11k1))+h1(k,x(k 1) (k l),11(k))1(k) +ej(x(k1)-(k
11k-l))h(k,x(kl),i(k))(x(k1)-(k-
11k-1))
son debidos a la no linealidad en la medida. Es posible disminuir estos errores si el estado actualizado no es calculado como una aproximacin a la esperanza condicional sino como un estimador del tipo maximum a posteriori. La funcin de densidad de probabilidad condicional, PDF, de x(k) dado si todas las variables aleatorias son Gaussianas, es
p(x(k)Z)
= = =
p(x(k)lz(k),Zk_l) ip(z(k)Ix(k))p(x(kIZk_l))
9VXz(k);h(k,x(k)),R(k)) N(x(k);(kIk l),P(klk 1)) (1.49)
V(x(k))
(150)
El Filtro de Kaiman Extendido Iterado (IEKF) usa un algritmo Newton Raphson para estimar (kk). DesarrollandoV en srie de Taylor hasta segudo orden alrededor de la i-sima estimacin de x(k)da como resultado:
V=V+V(xx)+(xX)V(XX)
Poniendo el gradiente a cero:
(1.51)
=x (V)V
(1.52)
.!(kIk) =f(klk) +P(kIk)H(k)R(k){z(k) h(k,(kk))} P(kIk)P(kIk 1)((kk)(klk 1)), (1.53) withH(k),= h.(k,(klk))
1.3
Validacin Modelos de
Despus de la estimacin, la pregunta obvia es si el modelo que se ha deriva do s adecuado para el uso que se le pretende dar. ste es el difcil y subjetivo problema de la validacin. De acuerdo con Bohlin la mejor manera de atacar el
24
problema es confrontar al modelo con todas las fuentes de informacin disponi bles, incluyendo el conocimiento previo, los datos experimentales y la experiencia usando el modelo. Para tener ms confianza en el modelo el consejo general es emplear tantas herramientas de validacin como sea posible. La primera forma concebible es el uso del sentido comn. Si, por ejemplo, un parmetr estimado representa la longitud de un eje, sta debe ser positiva. Otro ejemplo puede ser el nivel de un depsito. Los tests de ste tipo pertenecen a la categora del conocimiento previo y son especialmente importantes cuando los parmetros tienen algn significado fsico. La gran mayora de los mtodos estn basados en datos experimentales. Un test bsico consiste en calcular la varianza de los parmetros estimados. Una va rianza grande comparada con el valor del parmetro indica que algo est mal. Otra posibilidad es estimar varios modelos en paralelo. La respuesta en frecuencia del modelo paramtrico puede ser comparada con la respuesta espectral, por ejemplo. La herramienta de validacin ms verstil, en todas las categoras, es la si mulacin. El sistema verdadero y el sistema derivado se alimentan con la misma seal de entrada y se comparan las salidas. Para una buena comparacin es desea ble que el experimento se base en datos nuevos, es decir que no se hayan utilizado para la estimacin. Esto recibe el nombre de validacin cruzada. Tambin suele ser valioso investigar la secuencia de residuos {a(9jy)}, espe cialmente con datos nuevos. Una manera muy sencilla es representar grficamente estos residuos y comprobar si la secuencia resultante muestra el patrn de ruidos esperado. Conjuntamente con esto, para saber si los residuos son ms o menos blancos, puede ser estudiada su covananza muestral
R(t)
N-t
E(t,N)E(t+tN),
que para t> Odebe ser pequeo, al menos si N es grande. Adems la inde pendencia entre la entrada y la salida puede ser comprobada representando
R(t)=
min(N,Nt) t=max(1,1t)
para varios retardos t. stos deben ser tambin pequeos, puesto que de lo contrario, hay ms informacin en la salida del sistema real, originada por la en trada. Lo que significa que todava existen dinmicas no modeladas.
25
El Control adaptativo trata el problema de controlar la salida de la planta en presencia de incertidumbres paramtricas o estructurales. En el control adaptativo tradicional, para conseguir que un problema fuera tratable, la planta se supona lineal con parmetros desconocidos. Se escoga una estructura de controlador, y los parmetros se ajustaban escogiendo una ley adaptativa, de modo que la salida de la planta siguiera a la referencia asintticamente. Desde el principio de la tecnologa de control adaptativo, se han propuesto dos clases distintas de controladores adaptativos. En el indirecto, los parmetros de la planta se estiman y se ajustan en base a los datos de entrada-salida. En el directo, los parmetros del controlador se ajustan directamente en base a los datos de entrada -salida. Existen una gran variedad de esquemas adaptativos dentro de estas dos clases, tales como el Model Reference Adaptive Control (MRAC), Self-Tuning Adaptive Control (STAC), Self-Organizing Fuzzy Logic (SOFLIC), Neural Networks (NN), y Neurofuzzy Adaptive Control (NAC). Para los procesos cuyos parmetros varan lentamente en el tiempo, los con troladores adaptativos con realimentacin pueden ser divididos en dos grandes grupos. Los sistemas adaptativos con identificacin de modelo (MIAS) determi
26
nan un modelo del proceso las medidas de entrada-salida y mtodos de identifica cin. Aqu los parmetros son calculados de acuerdo con el mtodo de diseo del controlador que ha sido programado con anterioridad. Esta clase de reguladores adaptativos tambin es denominada self tuning regulators. Los sistemas adaptativos con modelo de referencia (MRAS) intentan obtener una respuesta en bucle cerrado prxima a la dada por el modelo de referencia para la seal de entrada. Aqu una seal externa, por ejemplo la variable de referencia, es medida y la diferencia entre las seales se forma usando las seales del bucle de control y del modelo de referencia y cambiando los parmetros del controlador por medio de un mtodo adaptativo. A lo largo de esta tesis hemos utilizado controladores adaptativos con identi ficacin de modelo(MIAS).
Introduccin Los algoritmos genticos son mecanismos de bsqueda basados en las leyes de la seleccin natural y de la gentica. Combinan la supervivencia de los individuos mejor adaptados junto con un intercambio aleatorio de informacin, lo que le da al algoritmo un aire de bsqueda biolgica. Los algoritmos genticos hansido desarrollados por John Holland y su equipo de estudiantes de la universidad de Michigan. Las metas que se proponan eran: explicar rigurosamente los procesos adaptativos y disear nuevos sistemas artifi ciales que sigan manteniendo los mecanismos de los sistemas naturales. Para ms detalles se pueden consultar [Goldberg 91] y [Davis 89]. Se parte, inicialmente, de un conjunto de individuos, la poblacin, y de una funcin que evala su eficacia para el problema concreto y que es la funcin que se desea optimizar. Al valor que se asigna a cada individuo a partir de esta funcin se le denomina salud.
John Holland, (1975).Adaptation in naturaland artificial systems. Algoritmos que manejan poblaciones consistentes en
soluciones codificadasde problemas. La bsqueda de buenas soluciones es realizada en el espacio de solucionescodificadas. Manipulacin de poblaciones: seleccin, cruce y mutacin.
28
tes de la informacin de los cromosomas de los individuos mejor adaptados de la generacin anterior. Los algoritmos genticos no son slo una simple bsqueda aleatoria, ya que utilizan de forma eficiente la informacin histrica de las g neraciones anteriores para indagar nuevos caminos de bsqueda que mejoren los resultados anteriores. Las caractersticas principales son: Los algoritmos genticos no trabajan directamente con los objetos, sino con la codificacin de esos objetos, que pueden ser un nmero, un conjunto de parmetros, etc. A esta codificacin le llamamos cromosoma. Concreta mente, en nuestro trabajo, hemos representado a cada individuo por un cro mosoma definido por una sucesin de Oy 1, que representan los coeficientes del modelo paramtrico. Los algoritmos genticos realizan la bsqueda mediante toda una genera cin objetos, no buscan un nico elemento.
Los algoritmos genticos utilizan una funcin objetivo que nos da la infor macin de lo adaptados que estn los individuos, y no las derivadas u otra informacin auxiliar.
Espacio de b(isqeda de soluciones
Los mecanismos de los algoritmos genticos simples son sorprendentemen te fciles, dado que los mecanismos que utiliza son el mecanismo de copia y el de intercambio de partes de las cadenas de cromosomas.
El por qu este mecanismo funciona es algo ms sutil, y el efecto combinado de simplicidad de la operacin y la potencia de su efecto son dos de las principales atracciones de la aproximacin mediante algoritmos genticos. Algunos de los principales atractivos de los algoritmos genticos como mtodo de optimizacin son: Se pueden utilizar como mtodo de optimizacin global o semi-local, segn interese.
Cromosoma
Fenotipo
Poblacin
r 1
2.9865
1
t
Funcin de salud
No hace uso de ningn gradiente, ni conceptos similares. Por lo que se pue de usar con seales con mucho ruido, en las que no tiene sentido las ideas asociadas a la derivada. No obstante, si las funciones son derivables, los al goritmos genticos se pueden usar en la primera fase de minimizacin, para encntrar las cuencas de atraccin, y a continuacin utilizar, por ejemplo, un mtodo basado en el gradiente. Se pueden utilizar en lnea.
El nmero de operaciones y por tanto el coste computacional puede ser muy alto si no se toman precauciones. No hay ninguna teora matemtica hasta el momento, que nos asegure l convergencia. Se puede emplear fcilmente computacin en paralelo.
30
SeIecin
Como es lgico, este tipo de mtodos son apropiados cuando trabajamos con funciones que no son suaves y no son convexas y que no se deben aplicar a casos sencillos en que son ms rpidos y precisos otros mtodos, como los basados en el gradiente. Son los AG un intercambioaleatoriode bits?Quhay detrs? Holland cre un teoremallamado teoremade los esqumes de Holland. Existen ofros teoremas,algunos de ellosbasados en el
anlisis de las cadenas de Markov: Es una cadena de diferentessolucionesque 1)ennite encontrar la
solucin ptima?
31
2*7
1,5,2,8,2,1,1,7
00100
00111
El valor decimal (fenotipo) de cada cadena codificada as como la salud que nos devuelve la funcin problema F(x)=x2 estn reproducidas en la tabla anterior. Vamos a definir la probabilidad de seleccin de cada individuo como el cociente entre su salud y la suma de la salud de todos los individuos (salud global, de manera que aquellos individuos con mayor salud tengan un mayor porcentaje de seleccin. El nmero de veces esperado que cada cadena sea seleccionada para reproducirse no es ms que su probabilidad por el tamao de la poblacin (as el tamao de la poblacin generada ser igualmente de cuatro muestras.
32
2.
Individuo Probabilidad N Copias Esperad5] 01101 169/634= 0,27 1,1 10100 400/634= 0,63 2,5 00100 16/634= 0,02 0,1 00111 49/634= 0,08 0,3
El mecanismo de seleccin, de manera grfica, es como sigue: supongamos una ruleta dividida en cuatro porciones proporcionales a la probabilidad de cada individuo, donde al individuo de mayor salud (mayor probabilidad) se le asigna la mayor porcin. Si elegimos un punto de la ruleta al azar, s te estar comprendido dentro de una de las porciones (cuanto ms grande sea la porcin ms probable es que el punto elegido al azar caiga dentro de ella), seleccionando para la reproduccin al individuo asociado a la misma. As, los individuos de mayor salud (mayor porcin) tienen una mayor pro babilidad de ser seleccionados, mientras los de poca salud (poca porcin de ruleta) corren una suerte contraria.
33
1-puntodeCmce
Cruceuniforme
lIlfihlIfilMIl
H fil
SI
rl
fi H i
LS
i i
Fig. 2.
Cruce.
Por ejemplo, si en la seleccin tenemos como padres a los individuos 10100 y 00111, con una probabilidad de cruce Pc=0,6 y en una tirada al azar entre O y 1 obtenemos un 0,3 ponemos en marcha el mecanismo de cruce, de biendo elegir al azar un punto de cruce en las cadenas (en nuestro caso ste debe limitarse entre las posiciones 1 y 4, donde existe cadena binaria). Si conseguimos, por ejemplo, un 3 al azar y contamos de derecha a izquierda, los padres quedaran divididos en dos subcadenas por el tercer bit:
l0l0O*101100PADRE1
II
Los hijos resultarn de una combinacin de estas cuatro subcadenas: el primer hijo contendr los tres primeros bits del Padre 1 y los dos ltimos del Padre 2, mientras el segundo hijo llevar la informacin relativa a los tres primeros bits del Padre 2 y los dos ltimos del Padre 1.
Hay que notar que en este mecanismo no se consideran como posibles pun tos de cruce el bit Oy el bit 5 (extremos de las cadenas), ya que tendramos
34
2.
Hijo 1 + Hijo2+
00100 10111
como hijos copias idnticas de los padres, lo que equivaldra a no haber cruce. Mutacin: El operador de mutacin, encargado de mutar alelos para conseguir una mayor riqueza gentica y no perder informacin, acta en nuestro al goritmo gentico bsico bajo una probabilidad de mutacin Pm fijada de antemano (de valor muy bajo). Cada vez que generemos nuevas poblaci nes, tras el mecanismo de cruce debemos correr el de mutacin para todos los alelos de cada individuo. Si se cumple Pm el alelo cambia de valor, de O a 1 y viceversa.
IE
Supongamos uno de los individuos generados en el ejemplo del mecanismo de cruce bsico: 00100, mediante tiradas al azar chequeamos una posible mutacin en cada alelo con una Pm dada (por ejemplo de 0,01). Si se produce mutacin en el alelo 1 y en el 3, la cadena binaria quedara modificada como sigue: 00001, cambiando as el fenotipo del individuo (originalmente corresponda al valor 4; tras la mutacin ha pasado al valor 1). Esto habra que repetirlo con toda la poblacin generada.
2.1.2
Mecanismos Avanzados
f=af+b
con f la antigua funcin de salud. Siendo Cmuit nmero esperado de el copias del mejor individuo de cada poblacin, las constantes a y b se eligen segn:
(2.1)
Cmuit fmedia
(2.2)
f,nedia
fmedia
(2.3)
De esta manera reducimos el intervalo de salud en las primeras generaciones (disminuyendo su alta competitividad) y lo aumentamos en las ltimas (ele vando la baja competitividad), logrando una mayor eficiencia y retardando la convergencia. El problema del reescalado lineal aparece en aquellas situaciones en que es necesario disminuir la salud de individuos con una salud de por s baja respecto a la media. En este caso puede ocurrir que los nuevos valores escalados sean negativos. Para prevenir esto limitamos la salud escalada mnima a cero.
36
Reescalado por desviacin tpica: sugerido Forresten 1985,utiliza la des por viacin tpicade la poblacinparadefinir la funcinde reescalado:
=
f (f
c a)
(2.4)
donde la constantec toma un valor mltiplo de la desviacintpica a, nonnalmente entre1 y 3. Reescalado por potencias: Gules,en 1985,experimentcon otro mtodode reescaladodondela saludescalada quedaba comopotenciade la saludori ginal: La variablek depende problemaen particular,siendonecesario del modifi carla a lo largode la simulacin.
OtrosMtodos SeIeccn de
Adems del mecanismo bsicode seleccin,implementadoen el algoritmo gentico simple, existenotrasversionesmscomplejasy especializadas. Entre ellas cabedestacar:
Muestreo estocstico reemplazo: esel mtodode seleccinexperimenta sin do por De Jongen su algoritmode pruebaR3,basadoen valoresesperados de seleccin. Muestreo determinstico: cadaindividuo es seleccionado nmerode veces un igual a la parteenterade su valor de copiasesperado (pseieccjonfl), comple tando la poblacincon aquellosindividuoscuya parte fraccionariade este valor seamayor. Muestreo estocstico permanente con/sin reemplazo: tienengranparecido al mtodoanterior(determinstico) aunque difierenen el modode completar la poblacindeseleccin.Enel muestreo estocstico permanente reem con plazo la parte fraccionariadel valor esperado copiassirve para calcular de el pesoque cadaindividuo tendren una seleccinbsicapor ruleta. Por otra parte,en el muestreo estocstico permanente reemplazo, sin estas par tes fraccionarias utilizan directamente se comoprobabilidades seleccin de a la horade completar poblacin. la
El cromosoma expresado es aquel que resulta de combinar el cromosoma 1 y el 2 aplicando el mecanismo de dominacin: G4 del cromosoma 2 domina frente a g4 del cromosoma 1, resultando que en la posicin 4 del cromosoma expresado tendremos G4 En el caso de los genes de la posicin 1 los dos son recesivos por lo que no dominara ninguno de ellos, resultando que el primer gen del cromosoma expresado sera el gi.
38
La representacin dual es de gran efectividad en entornos cambiantes con el tiempo, donde aumenta la eficiencia y adaptacin del algoritmo, mientras en entomos invariables no se perciben cambios significativos con el uso de este meca nismo gentico. En la historia de los algoritmos genticos, estos operadores fueron utilizados por Bagley, Holistien, Holland y Brindie. Bagley incluy en cada gen de la pareja de cromosomas un indicador de do minacin junto a la informacin codificada del fenotipo del individuo. Holistien (1971) desarroll un sistema de dominacin triallico para cdigos binarios intro duciendo tres alelos, el 1, equivalente a un 1 dominante, el -1, equivalente a un 1 recesivo y el Oque tambin es recesivo. El mapa de dominacin es el siguiente:
0 0 0 -1 0 1 1
-1 0 1 1
1 1 1 1
Brindie experiment con otros modelos de dominacin: Dominacin variable y global: la probabilidad de dominacin de un 1 O se determina a partir de su proporcin en la poblacin actual. Con estas proba bilidades y mediante pruebas de Bemouilli obtenemos los alelos resultantes para cada gen de los cromosomas. Dominacin determinstica. variable y global: el alelo dominante es aquel con mayor proporcin en la poblacin actual. Seleccin aleatoria de un cromosoma: se seleccionan como alelos dominan tes en sus respectivas posiciones todos los de un cromosoma elegido al azar de entre la poblacin. Dominacin del mejorcromosoma : de cada pareja de cromosomas de un in dividuo tomamos como alelos dominantes los de aquel cromosoma con ma yor salud.
inversin
-+
(...g6Ig3g4g5Ig2gl} {...1I11OI1O}
Hay que notar que, aunque debido al cdigo de representacin utilizado en nuestro algoritmo gentico la inversin modifica el fenotipo del individuo, en los sistemas naturales la informacin contenida en los genes es independiente de su posicin en el cromosoma y la inversin no tiene efecto alguno sobre su salud. Un problema asociado al mecanismo de inversin en cdigos binarios es el de cruce entre cromosomas no homlogos. Si cruzamos dos cromosomas no ho mlogos a los que se haya aplicado la inversin, puede ocurrir que las cadenas resultantes no contengan el mapa gentico completo, reduciendo as la efectivi dad del mecanismo de cruce.
Cromosomal(invertido):(...g6g3g4g5g2g1) Cruce Cromosoma2(invertido): ... g6g5g3g4g2g1)
/ {... /
g6g3g3g4g2gl}
{...g6g5g4gSg2gl)
En este ejemplo, debido a la recombinacin de los genes por la inversin, los cromosomas resultantes tras el cruce no contienen a todos los genes (del gi
40
al g7) sino que algunos se encuentranrepetidos. As, podemos haber perdido informacin dado que estos cromosomas poseenel mapa genticocompleto. no Bagley (1967)propuso restringirlos cruces a cromosomashomlogospara evitar este efectoindeseado.En 1972Frantz estudidos modelosde inversinen funciones con distintosgradosde no linealidad:
Inversin lineal: inversinsimple(anteriormente explicada). Inversin lineal y extrema: asignuna probabilidadde 0,75 a la inversin lineal, si sta no se cumpla poda sucederuna inversinde los alelos ex tremos del cromosoma(primeroy ltimo)con probabilidad 0,125. Esta va riante intentabacontrarrestar hechode que la inversintiende a permutar el alelos centralesfrente a los situadoscerca de los extremos. Frantz utilizestos modelossegndos modosde funcionamiento: Inversin continua:el mecanismode inversinse activasegnuna ciertaproba bilidad pj y se aplicaa cadanuevoindividuoen cuantoes generado. Inversin masiva: no se aplica la inversin hasta que se ha generado toda la poblacin, para despusutilizarlos dos mismospuntosde cruce (inversin simple) en la mitadde sta. Para evitar los problemasde cruce entre cromosomasno homlogos,Frantz experiment con cuatro sistemas: Cruce restringido: limitamosel cruce, tal como Bagleysugiri, a cromosomas homlogos. Cruce por viabilidad: no se restringeel cruce,aunque si las cadenasresultantes no incluyentodo el mapa genticose desechan. Cruce por patrones: tras seleccionardos cromosomasse aplica la inversin a uno de ellos (al azar), y segn el patrn de ste se invierteel segundo. El cruce se realiza,posteriormente, la manerahabitual. de Cruce por patrn del mejor cromosoma: parecidoa la varianteanterior,pero el cromosoma defineel patrn de inversines el de mayor salud. que
42
3.1
Consideremos un proceso que puede ser descrito en cada paso por uno de los N estados distintos i1,j2,. , i. En cada paso el sistema puede cambiar de estado (o permanecer en el mismo) de acuerdo con un conjunto de probabilidades de transicin. Cuando estas probabilidades slo dependen del estado de partida y de llegada y no de los estados anteriores, se dice que el proceso es de Markov.
Definicin 3.1 .1: Un proceso estocstico {Xk}, k=l,2,... con un espacio de esta
dos .5 = {i1, j2 i3,... los estados i1, i2,. p(X
=
. .
iN} N
es cierto que
= =
i1)
p(X
i_1) =
(3.1)
i0,...,X
if1) =p(Xo=
io)p(Xi
=iiIXo = i0)...p(X
iIx_i
p(ABXn
j)
p(AX
j)p(BlX
i)
(3.3)
44
donde A es un suceso arbitrario definido por los resultados de los pasos 0, 1,.. , n 1 y B es un suceso definido por los resultados de los pasos n + 1,n +2Esta ecuacin se describe a menudo como la independencia entre elfuturo y el pasado si el presente es conocido. En el caso de la caso de las cadenas de Markov, el sistema est descrito por una matriz P de dimensiones N x N que da la probabilidad de transitar del estado i en el tiempo t 1 al estado j en el tiempo t.
.
P(i,j)(t)
= p,(t)
P(X
i)=
(.4)
donde X es la variable aleatoria de la cadena de Markov. Los valores Pi,j(t) definen la matriz P(i, j) (t) de probabilidad de transicin de un estado a otro en un paso de tiempo. Definicin 3.1 .2: La probabilidad de ir del estado i al estado j en el paso t se llama probabilidad de transicin Pu (t). Si la probabilidad de transicin es inde pendiente de t, la cadena de Markov de llama homognea. Vamos a estudiar solamente cadenas de Markov homogneas en un espacio S = { u , j2,. , i, } finito,por tanto, las probabilidades de transicin vienen dadas por una matriz de transicin P = (pij) que verifica Puf 0, Vi = 1,2,. , n, Vj = 1,2,.. , n. A las matrices con estas propiedades se las denomina estocsticas. La mtriz de transicin en n pasos es la n-sima potencia de P:
.. . . .
(n)
=
(n)
=
PX1
= 1)
(3.5)
Se verifica la ecuacin
(n+m)
=
Vn Vm 0,
(3.6)
que es llamada ecuacin de Markov. Tambin puede ser escrita en forma matricial como
p(ln+n)
=
p(m)p(n)
(3.7)
Es tambin posible calcular las probabilidades condicionales sobre un conjun to de estados J: p) =p(X1 EJlXt_=i)=
LY
jEJ
(3.8)
>0.
(n)
Oy P, >
(m)
>
0.
En ste ltimo caso se dice que los estados i y j se comunican. Proposicin cia. 1. Reflexividad: i
j, j
ya que p
-+
2. Simetra: Si i +4
entonces j
+
k. Tambin es aplicacin
Definicin 3.2.2: Si una cadena de Markov tiene todos sus estados en la misma clase de equivalencia, se dice que es irreducible. En una cadena de Markov irreducible hay una probabilidad positiva de un estado a cualquier otro estado. Definicin 3.2.3: Una cadena de Markov es aperidica si el mximo comn divisor de m para Pm(j,
j)
> 0,Vx
de Markov peridica, y en tales procesos existen estados que no comunican para ciertos nmeros de pasos.
46
ESTUDIOMATEMTICO LOSA.G. 3. DE
Definicin 3.2.4: Una cadena esa la vez aperidica e irreducible se llama que regular. Definicin 3.2.5: Un estado llamatransitoriosi hay unaprobabilidadpositiva se de que el procesono vuelvaal estadoi. Definicin 3.2.6:
f=
(3.9) Definicin 3.2.8: Un estadosellamarecurrente cuandoel regreso l esel su a ceso seguro. Definicin 3.2.9: La esperanza matemtica nmerode pasosque senecesi del tan paravolver al mismoestadosellamatiempode recurrencia.
,1u
(3.10)
Definicin 3.2.10: UnestadoesabsorbentecuandoP= 1. Est claro quesi un estado absorbente, es entonces recurrente. es
Vamos a considerar el algoritmo gentico como cadena de Markov, para lo cual cada estado va a estar formado por (Xl ,X2, ,Xr), siendo x el nmero de soluciones de tipo i en la poblacin en el tiempo t. Se debe cumplir que xi + + Xr = N, siendoN el nmero de elementos de la poblacin. El espacio muestra! ser
...
(3.11)
Proposicion
21.
siendo r J
r1
5
6 7 8 9 10
10 220 11 286
19448 3268760
Desafortunadamente, el tamao N x N de la matriz Q para las aplicaciones tpicas es inmanejable ya que el nmero de estados N crece rpidamente con la poblacin P y la longitud de la cadena 1.
48
Las poblaciones posibles vienen descritas por la matriz Z, que es una matriz N x r. La i-sima fila 4j = Zj,Q,. ,Zj,r1 de Z es el vector de incidencia de la poblacin i-sima. En otras palabras, Zi,y es el nmero de veces que aparece la cadena y en la poblacin i-sima, donde y es la representacin entera de la cadena binaria. Por ejemplo, supongamos 1 = 2 y P = 2. Entonces r 4, N = 10, y la matriz Z sera la que se muestra en la tabla 3.2
. .
= 2 yP = 2.
Nix y Vose definieron dos operadores matemticos, 5 y M, donde F viene determinado por la funcin de salud, y !M depende del coeficiente de mutacin p, el coeficiente de recombinacin y de la forma de mutacin y recombinacin usada (en su artculo suponen que el operador de mutacin es el estndar (bit flipping) y que la recombinacin se hace por un slo punto y que produce un nico descendiente). Con .F y 7( definidos, es posible calcular la probabilidad de transicin Pij desde el estado i al estado j como Q(i,j)=p=P!JJ
f 1Zjy LIJY
(3.12)
Esto es, dadosF y 9(, Pij especifica tan probableesque un Algoritmo Ge qu ntico en estadoi pasea estadoj enla siguiente generacin. puedever en esta Se ecuacin que seha supuesto la seleccinsehacede maneraproporcionala la que salud. Si el coeficientede mutacinji no escero,todos los estados tienenprobabili dad no cero de seralcanzados.
f(b)
) 14=1
1-.
donde f esuna funcinpositivay por tanto,P(b) > O,V i = 1, .N. Si consideramos solamente operadorseleccin, puedecomprobarque: el se
..
arg max{f(b)/b
E P}.
Entonces p(k)
k*oo
(O,...,O,N,O,...,O).
(3.13)
Siendo p(k) =vectorde distribucinde probabilidady N ocupala posicini. Utilizando los tresoperadores, seleccin, mutaciny cruce,en la formausual tenemosque:
50
Teorema 3.4.2: Todoslos estados S[k]sonrecurrentes. de Para comprobarlo bastadarsecuentade quemedianteel operador mutacinse puede pasarde un estado otro cualesquiera, decir,p(X,X) > O. a es Esto estantocomodecir quela cadenaesirreducible. Teorema 3.4.3: Consideremos cadena Markov X enel espaciode esta una de dos 3, con probabilidadde transicinP(i, j). Si la cadenade Markov es regular entoncesexisteunanicadistribucinde probabilidad i hm Prob(Xm = jJXo
(j), j
E $ tal que
moo
(3.14)
lr(j) > 0,
E 3
(3.15)
Esta distribucinlmite t se llama distribucinestacionaria la cadenade de Markov, y i(j) puedeser vistacomo la probabilidadde estara largoplazoen el estado j.
Proposicin 3.4.2: Si losoperadores mutacin y cruce elitistas, de son entonces la cadena Markovestformada unaclaseabsorbente de por formada X por que estransitoria formada losdems por estados. Corolario 3.4.1: En estecaso podemos asegurar el algoritmo que converge la a solucinptima. Es decir, si utilizamos algoritmo que un gentico mutacin cruce con y elitis tas, tenemos asegurado el algoritmo que converge puntoptimodel espacio, al ya que hayunaclaseabsorbente correspondientepuntoptimoy otraclase al transi toria formada todos dems por los puntos.
=
52
Los algoritmos para la optimizacin de funciones estn limitados generalmen te a funciones regulares y unimodales. Sin embargo, muchas funciones son mu! timodales, discontinuas y no diferenciables. Para optimizar este tipo de funciones se han empleado mtodos de muestreo estocstico. Mientras que las tcnicas tra dicionales de bsqueda utilizan caractersticas del problema para determinar el siguiente punto muestral (por ejemplo, gradientes, Hessianos, linealidad, y con tinuidad), las tcnicas de bsqueda estocstica no hacen tales suposiciones. En cambio el siguiente punto (o puntos) se determina basndose en reglas de mues treo y decisin estocsticas, en vez de reglas de decisin determinsticas. Los algoritmos genticos han sido usados para resolver problemas difciles con funciones objetivo que no poseen buenas propiedades, tales como continui dad, diferenciabilidad, condicin de Lipschitz, etc) [Davis [21], Goldberg [35], Holland [44],Michalewicz[81]]. Estos algoritmos mantienen y manipulan una familia, o poblacin, de soluciones e implementan una supervivencia de los me jor adaptados como estrategia de bsqueda de mejores soluciones. Esto provee un paralelismo implcito y explcito que permite la explotacin de varias regiones prometedoras al mismo tiempo. El paralelismo implcito es debido a la teora de esquemas desarrollada por Holland, mientras que el paralelismo explcito es de bido a la manipulacin de una poblacin de puntos (la evaluacin de la salud de estos puntos es fcil de realizar en paralelo). Un problema que ha sido poco estudiado en la literatura de optimizacin es el de la optimizacin dinmica, es decir de funciones que varen con el tiempo. Este es un problema especialmente interesante para la Teora de Control, puesto que, en mayor o menor medida, los sistemas con los que trabajamos varan con el tiempo, adems de presentar los problemas anteriores.
544.MTODODE
OPTIMIZACINGENTICARESTRINGIDA (RGO)
Los algoritmos genticos no trabajan directamente con los objetos, sino con la codificacin de esos objetos, que pueden ser un nmero, un conjunto de parmetros, etc. A esta codificacin le llamamos cromosoma. La optimizacin se puede realizar con parmetros continuos o discretos. Los algoritmos genticos realizan la bsqueda mediante toda una genera cin objetos, no buscan un nico elemento. Los algoritmos genticos utilizan una funcin objetivo que nos da la infor macin de lo adaptados que estn los individuos, y no las derivadas u otra informacin auxiliar. Las reglas de transicin son probabilsticas, no determinsticas. Optimizan parmetros con superficies de coste extremadamente complejas. Pueden saltar fuera de un mnimo o mximo local. Trabajan con datos generados numricamente, datos experimentales o fun ciones analticas.
En optimizacin de funciones que varan con el tiempo, esta caracterstica es interesante en las primeras generaciones, para encontrar la cuenca de atraccin correcta, pero no es interesante despus y adems consume mucho tiempo de cmputo. Por esta razn, es deseable un mtodo que funcione como mtodo de optimiza cin global en las primeras etapas, para encontrar la cuenca de atraccin correcta y que posteriormente se comporte como un mtodo de optimizacin local o semi local. Sera deseable tambin que tuviera propiedades parecidas a las de los mto dos basados en el gradiente, pero sin los inconvenientes de que sea necesaria la existencia de derivadas y su sensibilidad al ruido. Los algoritmos para la optimi zacin de funciones estn generalmente limitados a funciones regulares convexas. Sin embargo muchas funciones son multi-modales, discontinuas, y no diferencia bles. Mientras que los mtodos tradicionales de bsqueda utilizan caractersticas delproblema para determinar el siguiente punto (gradientes, hessianos, linealidad, y continuidad) la bsqueda gentica no hace estas suposiciones. Cuando queremos optimizar funciones que varan con el tiempo las cosas se complican an ms porque necesitamos un mtodo que sea lo suficientemente rpido para seguir las variaciones de los puntos ptimos de la funcin.
4.3.1
RGO
El mtodo de bsqueda restringida consiste en hacer la bsqueda en un en torno del punto correspondiente al ltimo modelo identificado y tomar el punto mejor adaptado como centro del entorno de bsqueda de la nueva generacin. A continuacin se vuelve a tomar el individuo con mejor salud como centro del nuevo entorno de bsqueda y as sucesivamente. La codificacin d cada cromosoma corresponde al vector diferencia con res pecto al centro del entorno. ste punto tambin se introduce en la siguiente ge neracin (es la cadena formada por ceros). El punto correspondiente al mejor de cada generacin y que se va a guardar como centro del entorno de la generacin siguiente se guarda aparte de la generacin y representando coordenadas absolu tas.. Para evaluar la funcin de salud, consideramos el centro del entorno ms la decodificacin de cada uno de los cromosomas. Es decir, el mtodo trabaja de un modo incremental. Este comportamiento pretende simular el mtodo del gra diente, pero sin utilizar derivadas y puede ser utilizado cuando las seales tienen mucho ruido.Vamos teniendo nuevas generaciones orientadas en la direccin de mayor decrecimiento de la funcin de coste, y con una distancia al centro prxima
56
a la correspondiente a la velocidad de cambio del sistema. Podemos hacer una bsqueda en un entorno grande al principio y despus reducir su radio. De hecho se realiza una bsqueda global al principio y local al final. Este mtodo reduce la probabilidad de encontrar un mnimo local. El radio se ha tomado proporcional a la incertidumbre de la estimacin con extremos superior e inferior. La manera de calcular la incertidumbre depende de la aplicacin que se hace de la optimizacin, por ejemplo, en el caso de la estimacin de estados, usamos la distancia de Mahalanobis 6.43 d
=
(4.1)
que mide la incertidumbre de la estimacin (k). En el caso de la identificacin de sistemas el radio se ha tomado proporcional al criterioMDL (Minimum Descrip tion Length) con extremos superior e inferior. Tambin se pueden utilizar otros criterios como el AIC (Akaikes Information theoretic Criterion) o el FPE (Final Prediction-Error criterion)(ver Ljung[69]). En nuestro algoritmo hemos implementado los siguientes operadores: repro duccin, cruce, mutacin, elitismo, inmigracin, ranking y bsqueda restringida. Hemos utilizado el mecanismo de ranking para regular el nmero de descen dientes que un individuo puede tener, porque si un individuo es muy bueno, puede tener demasiados descendientes y hacer que la diversidad gentica descienda mu cho.
4.4. ALGORITMO
En caso de que el sistema vaya variando rpidamente en el tiempo, podemos incluir los mecanismos de reescalado, dominancia triallica e inmigracin. Este mecanismo se ha implementado utilizando como funcin de salud F(i) =
cte+Vn(i) donde V(i) = L!((ynk 9n k)2 es la funcin de prdida (loss func tion) y ctees una constante suficientemente grande (108). Es importante destacar que el mtodo RGO realiza la bsqueda con ms nfa sis en una direccin preferente, la direccin de mxima pendiente y a una distancia preferente Este hecho permite reducir la bsqueda de 50 100 dimensiones a 1 2. Por sta razn ste mtodo es comparable al mtodo del gradiente en preci sin y velocidad, con la ventaja de que es aplicable cuando las expresiones no don diferenciables y las seales contienen ruido.
4A
Algoritmo
1. Se obtiene un primer conjunto de datos. 2. Se crea la poblacin inicial para deducir el tipo y las caractersticas del sistema. 3. Se evala la salud de los individuos. 4. Se hallan las caractersticas del sistema, por ejemplo, en el caso de identifi cacin, nos interesan el tiempo de retardo y el orden, o tambin nos puede interesar la eleccin de modelo. 5. Se ecogen datos u(k), y(k). 6. Se obtiene una primera estimacin del modelo utilizando mnimos cuadra dos extendidos o alguna otra tcnica. 7. Hacemosk=1 8. Se crea la poblacin inicial, tomando los individuos como diferencia res pecto al modelo anterior. 9. Se evala la salud de los individuos. 10. Comienzo del buce. 11. Se aplican los mecanismos d seleccin, cruce y mutacin. 12. Se clona el mejor individuo de la generacin anterior.
58
Los distintos puntos representan los posibles cambios respecto del estimador,que es el centro de la bola.
/in
del Sistema
13. Aplicamos el mecanismo de inmigracin. 14. Se evala la salud de los individuos de la nueva generacin.
(4.2)
16. Sumamos el mejor individuo al modelo previo. 17. Calculamos la incertidumbre para utilizarla en el clculo del nuevo radio de la regin de bsqueda. 18. Se recogen datos u(k), y(k). 19. Hacemos k = k+ 1 y repetimos los pasos 10-19.
45
Caractersticas la RGO de
Se ueden utilizar como mtodo de optimizacin en una bola de radio que vaya variando segn la incertidumbre de las estimaciones, con lo que evi tamos buscar en una regin excesivamente amplia como hacen los mtodos de bsqueda global y evitamos la posibilidad de caer en un ptimo local como hacen los mtodos de optimizacin local. ste mtodo est especialmente pensado para utilizarlo en la optimizacin de funciones variantes en el tiempo. Lo que permite usarlo en la identifi cacin de sistemas, ya sea en la forma de la funcin de transferencia o en variables de estado y para la estimacin de estados por medio de un filtro de Kalman Generalizado.
..
60
Llenar elbuifer conlosdatosu(k)ey(k)J [Crear lapoblacininicial] Encontrar las caractersticas del sistema: orden, retardo,etc.
(
(
CRecoger datos:u(k),y(k)
(tos:u(k),y(k
TI)
Aplicarlosmecanismosdeseleccin,crucey
mutacin
J
,
( C
II) )
1
]
La idntificacin de sistemas no lineales mediante modelos lineales o no li neales es un trabajo difcil y complicado. La mayora de las veces debemos partir de los conocimientos humanos sobre la dinmica del sistema. La identificacin posterior de los parmetros la realizamos a mano, utilizando las propiedades heu rsticas de cada familia de modelos. Los mtodos ms usuales en la identificacin de sistemas estn basados en mnimos cuadrados o en el mtodo de mxima verosimilitud que son mtodos lo cales guiados por el gradiente y necesitan una funcin de prdidas (loss function) diferenciable y un espacio de bsqueda suave. A menudo fallan en la bsqueda de un ptimo global cuando el funcional no es diferenciable o es no lineal en sus parmetros. Esto tiene el inconveniente de que si las seales tienen ruido coloreado, como suele ser habitual en la prctica, los mtodos basados en mnimos cuadrados tienen el fracaso asegurado. Si adems estamos implementado el mtodo en lnea el ruido estar correlacio nado con.los regresores y el mtodo explotar, fenmeno conocido como blow-up. Para evitar esto en algunos casos sencillos, se puede usar un factor de olvido muy prximo a la unidad, pero en la mayora de los casos de sistemas no lineales variantes en el tiempo esta tcnica falla. A menudo fallan en la bsqueda de ptimos globales cuando ste espacio de bsqueda es no diferenciable, o no lineal en sus parmetros. Los mtodos de op timizacin basados en algoritmos genticos pueden mejorar los resultados porque no utilizan las propiedades de diferenciabilidad o de ser lineal en los parmetros. En 1992, Kristinsson y Dumont [64] hicieron un primer estudio de la identi ficacin de sistemas y del control off-line con algoritmos genticos de sistemas dinmicos continuos y discretos. Comprobaron que los algoritmos genticos son efectivos en ambos dominios y que es posible identificar directamente parmetros
625.IDENTIFICACINDESISTEMASNOLINEALES
fsicos, o bien, polos y ceros. Hicieron simulaciones con sistemas de fase mnima y no mnima y de un sistema con dinmica no modelada. En 1993, Flockton y White [25] utilizan los algoritmos genticos para hacer otra identificacin off-line de polos y ceros con algunas pequeas mejoras. Posteriormente, en 1995, Tan, Li y Murray-Smith [99] usan los algoritmos ge nticos cn simulated annelingpara hacer una identificacin off-line y la linea lizacin de sistemas no lineales, invariantes del tiempo con un modelo ARMAX. Utiliza esta tcnica de bsqueda para identificar los parmetros de un sistema des crito por un modelo ARMAX en variables de estado, en presencia de ruido blanco y para aproximar un sistema no lineal multivariable por un modelo en el espacio de estados, lineal e invariante en el tiempo. En este mismo ao, Iba, deGaris y Sato [50] usan una tcnica numrica off line, que integra una bsqueda adaptativa de una estructura de rbol basada en programacin gentica y un mecanismo de ajuste local de parmetros empleando bsqueda estadstica. En la programacin gentica tradicional, la recombinacin causa frecuentes rupturas de los bloques de construccin y la mutacin puede causar abruptos cambios en la semntica. Para superar estas dificultades ellos implementan la programacin gentica tradicional con una bsqueda local hill climbing, usando un procedimiento de ajuste de parmetros. Todos estos mtodos trabajan off-line y precisan que el sistema sea invariante del tiempo. El ltimo adems utiliza un mtodo no paramtrico. Este captulo describe un mtodo de identificacin on-line de sistemas no li neales, variantes en el tiempo que tiene altas prestaciones. Hemos utilizado mo delos OE, ARMAX y NARMAX como semillas para el mtodo RGO y se puede extender a otros modelos similares, como Box-Jenkins, el Lineal General, Mode los de Polos y Ceros o la descripcin en el Espacio de Estados, utilizando para ello optimizacin gentica restringida. Las principales diferencias del ROO con los anteriores mtodos es que ste trabaja en lnea, identifica modelos lineales y no lineales, variantes en el tiempo y usa modelos paramtricos convencionales.
5.3. IDENTIFICACIN MULTIMODELO MULTIPARMETRO SISTEMAS Y DE NOLINEALES MEDIANTEMODELOSPARAMTRICOS LINEALES.63 Para evaluar la funcin de salud, consideramos el centro del entorno ms la decodificacin de cada uno de los cromosomas. Es decir, el mtodo trabaja de un modo incremental. Este comportamiento simula el mtodo del gradiente sin utilizar derivadas y puede ser utilizado cuando las seales tienen mucho ruido. Vamos teniendo nuevas generaciones orientadas en la direccin de mayor de crecimiento de la funcin de coste, y con una distancia al centro prxima a la correspondiente a la velocidad de cambio del sistema. Podemos hacer una bsqueda en un entorno grande al principio y despus reducir su radio. De hecho se realiza una bsqueda global al principio y local al final. Este mtodo reduce la probabilidad de encontrar un mnimo local. El radio se ha tomado proporcional al criterio MDL (Minimum Description Length) con extremos superior e inferior. Tambin se pueden utilizar otros cri terios como el AIC (Akaikes information theoretic criterion) o el FPE (Final prediction-error criterion)(ver [69]). En nuestro algoritmo hemos implementado los siguientes operadores: repro duccin, cruce, mutacin, elitismo, inmigracin, ranking y bsqueda restringida. Hemos utilizado el mecanismo de ranking para regular el nmero de descen dientes que un individuo puede tener, porque si un individuo es muy bueno, puede tener demasiados descendientes y hacer que la diversidad gentica descienda mu cho. Este mecanismo se ha implementado utilizando como funcin de salud F (i) =
cte+V(i) donde V(i) = (ynk 9n k) es la funcin de prdida (loss func tion) y ctees una constante grande (108).
5.3 Identificacin multimodelo yrnultiparmetro de sistemasnolineales mediant modelos paramtricos lineales. 5.3.1 Identificacin modelos con lineales
Un modelo de entrada-salida es un modo de describir un sistema dinmico basndose exclusivamente en la relacin entre las entradas y salidas del sistema. Algunos de los modelos lineales mas conocidos son: RX (Auto-Regressive with eXogenous inputs), cuya expresin es A(q1)y(t) =B(q1)u(tnk)+ek que puede ser visto como una manera de determinar el siguiente valor de la salida dadas las observaciones anteriores y las entradas. Aqu A(q1) y B(q) (5.1)
645.IDENTIFICACINDESISTEMAS
NOLINEALES
son polinomios en el operador desplazamiento hacia atrs q1 e y(t), u(t), y e(t) son las salidas, entradas y ruido, respectivamente. El ruido e(t) es una sucesin aleatoria normalmente distribuida de media cero y varianza a2. OE (Output Error) cuya expresin es
y(t) u(t + e(t) nk)
-
(5.2)
con la fuente de error e(t) que es la diferencia (error) entre la salida real y la salida libre de ruido (terica). ARMAX (Auto-Regressive Moving Average with eXogenous inputs), cuya expresin es A(q1)y(t)
=
B(q1)u(t
nk) + C(q1)e(t)
(5.3)
En ste modelo la expresin A(q)y(t) = e(t) representa la auto-regresin, y(t) = C(q )e(t) representa la media mvil de ruido blanco, mientras que B(q1 )u(t) representa le entrada externa. Otros modelos pueden ser usados, como por ejem pio la representacin en el espacio de estados o el modela de ceros y polos.
5.3. IDENTIFICACIN MULTIMODELO MULTIPARMETRO SISTEMAS Y DE NOLINEALESMEDIANTEMODELOSPARAMTRICOSLINEALES.65 Esta bsqueda la realizamos por medio de un algoritmo gentico. En paralelo, vamos haciendo una bsqueda de modelos OB , y(t) = u(t nk) + e(t) utilizando la misma tcnica. Para hacer la funcin de prdida V(i) = 9n k)2 lo ms peque a posible, se ha utilizado como funcin de salud F(i) = cte+1,,(i) donde ctees una constante suficientemente grande (108) para mantener la diversidad de la po blacin. La probabilidad de reproduccin se ha calculado como F(t) = F(t)/1. En cada generacin, sustituimos el modelo anterior por el mejor de la nueva generacin como centro del entorno donde se realiza la bsqueda, de esta manera ,en caso de un sistema LTI, el mejor modelo debe ir tendiendo al valor que mini miza el funcional y la poblacin ira tendiendo a cero. A continuacin realizamos una nueva lectura de la entrada y la salida del sistema. De esta manera conseguimos un conjunto de aproximaciones sucesivas a me jores modelos en caso de el sistema sea invariante en el tiempo y si el sistema es variable, pero de variacin lo suficientemente lenta, entonces el modelo va si guiendo al sistema en sus variaciones. Podemos adems aprovechar las caractersticas convenientes de la convergen cia global si al principio tomamos una bola lo suficintemente grande, de manera que reduzcamos la probabilidad de quedarnos en un mnimo local. Una vez que sepamos que seguimos al mnimo adecuado, podemos reducir el tamao de la bo la y al mismo tiempo de la poblacin, para conseguir una mayor velocidad de ejecucin del algoritmo. Para que el algoritmo no tenga una convergencia prematura y se homogenei ce demasiado la poblacin, podemos aumentar el parmetro de probabilidad de mutacin. Aunque este algoritmo es costoso n cuanto a operaciones, es lo suficiente mente rpido como para ser empleado en lnea, ya que el clculo de un modelo con 35 coeficientes tarda una dcima de segundo en un PC (120 MHz). A esto hay que aadir que las aplicaciones a que tpicamente se desea aplicar este identifica dor, es decir a los sistemas de control adaptativo, poseen dos bucles, uno rpido, que es el de control, y otro lento que es el identificador. Por tanto se puede aplicar a sistemas con una constante de tiempo de orden de las centsimas de segundo. Debemos damos cuenta de que los algoritmos genticos hacen una bsqueda preferentemente en una direccin, la de mximo decrecimiento, mientras que el mtodo Montecarlo la hace con igual densidad en todas las direcciones, con lo que si estamos buscando en un espacio de 50 a 100 dimensiones, es evidentemente superior.
66
1
Encontrar las caractersticas del sistema: rdenes, retardo, etc.
Calcular modelos OE, ARMAX y NARMAX por mediodemnimoscuadradosextendidos Tomar los nuevos datos u(k) e y(k) Crear la poblacin inicial, tomandocomo individuos la diferencia con el modelo previo Evaluar la salud inicial de los cromosomas Aplicar los mecanismos de seleccin, cruce, mutacin, etc. Clonar el mejor individuo de la generacin anterior y aplicar la inmigracin Evaluar la salud de los individuos de la nueva generacin Seleccionar el mejor cromosoma Sumarelmejor individuoalmodeloprevio
67
5.4.1
Modelos NARMAX
Entre los modelos no lineales, uno de los mas interesantes, es el modelo NAR MAX (Non-linear Auto-Regressive Moving Average with eXogenous inputs), qe puede ser descrito como y(t)
F{y(t
1),... , (t
ne)]+ E(t)
(5.4)
donde t representa el tiempo discreto, y(t), u(t) y (t) son la salida, la entrada, y el error de prediccin, respectivamente, fly, n y neson los rdenes correspondientes, F[.]es una funcin no lineal y dd es el mnimo retardo de la entrada [Leontaritis 85] El modelo polinomial NARMAX tiene como expresin y(k) =ao+ 1ay(ki)+E (5.5)
nos permite una descripcin buena y sencilla de una amplia clase de sistemas no lineales. Por ejemplo, si el modelo exacto NARMAX es y(k) =y(k 1)e_u(_l) podemos desarrollar en serie la exponencial
exp(x)=Y0
(5.6)
(5.7)
y emplear un modelo polinomial aproximado NARMAX y(k)=y(k_1)_y(k_1)u(k_1)+y(k_1)u2(k_1)_y(k_1)u3(k_l) (5.8) Podemos comprobar que ste modelo tiene obvias ventajas sobre las series fun cionales tales como las series de Volterra.
685.IDENTIFICACINDE
SISTEMASNOLINEALES
Cruce: Puntode
000000
ccKD11 Padre2 AntesdelCruce
Padre 1
ruce
000fl
1 Hijo
1)( 1)
oxoo
Fig. 5.2: Mecanismo de cruce
Hijo2
delCruce Despus
$4
Despus la mutacin de Fig. 5.3: Mecanismo de mutacin
5.5. RESTRICCIONES
Para mejorar esta estimacin realizamos una bsqueda de modelos NARMAX, y(k)
=
i)
n + 1bju(k i)u(k 1)
.
i)+
cuyos coeficientes sean prximos al calculado anteriormente y que tengan una funcin de prdida lo ms pequea posible. En cada generacin, el ltimo modelo es sustituido por el mejor de la nueva generacin como centro del entorno donde se realiza la bsqueda De esta manera nuestro modelo va siguiendo al modelo real. En ste entorno los individuos de las nuevas generaciones estarn orientados principalmente en la direccin de mxima pendiente de la funcin de prdida (usando el criterio MDL, o bien AIC o FPE) y a la distancia que corresponde a la velocidad de cambio del sistema real. Para hacer la funcin de prdida V(i) = 9n k)2 lo ms peque a posible, se ha utilizado como funcin de salud F(i) = cte+(i) donde ctees una constante suficientemente grande (18) para mantener la diversidad de la po blacin. La probabilidad de reproduccin se ha calculado como F(t) = F(t)/. El nmero de coeficientes del modelo NARMAX
ny
nu
y(k)
a + E_1ay(k 1E1c1y(k
i)
+ _1b1u(k i)u(k j)
)+
10) (5
crece exponencialmente con el orden de desarrollo. Por este motivo, se ha utili zado una expansin de orden dos, con sistemas de orden menor que ocho y con cinco coeficientes para modelar el ruido.
5.5 Restricciones
Un problema del que adolecen la mayora de los mtodos de identificacin es no permiten introducir fcilmente el conocimiento previo que tenemos del siste ma. En la mayora de los casos slo se puede elegir el tipo de modelo (ARX, OE, ARMAX, BJ, etc.) procurando adems que sea lineal porque de lo contrario no se pueden aplicar los mtodos habituales. Sin embargo, enel mtodo de algoritmos genticos lo que hacemos es optimi zar numricamente una funcin V=E0(y(tk)y(tk))2 y no nos cuesta ningn trabajo aadir restricciones duras de desigualdad, como a1 > 0, asignando salud cero a los individuos que estn en la regin factible. Las (5.11)
705.IDENTIFICACINDESISTEMASNOLINEALES
restricciones blandas se pueden tratar, aadiendo un trmino de penalizacin al funcional V. Por ejemplo, si deseamos introducir la restriccin al > Ocomo una restriccin blanda, podemos aadir a la funcin de prdida el trmino a, cuando al> 0.
5.6 Resultados
Para poder contrastar los resultados con otros mtodos, vamos a utilizar como ndices de funcionamiento los siguientes: Error RMS: RMSerror= Error relativo RMS: Relative RMS error = yN VN Estudiaremos los resultados obtenidos al aplicar nuestro mtodo con modelos OE, ARMAX y NARMAX a varios sistemas no lineales: Planta 1: y(k)0.6y(k 1)+0.4y(k2)= (u(k)0.3u(k 1)+0.05u(k2))sin(0.Olk) +e(k) 0.6e(k 1)+O.4e(k2) (5.14) con condiciones iniciales nulas. Esta planta corresponde a un sistema lineal y(k) = 1 + 10.61+0.4c[2e(k) (5.15) x100% (5.13) (5.12)
con una pequea oscilacin sinusoidal en la gananciai Planta 2: Esta planta consiste en un primer bloque lineal: y(k) 0.6y(k 1) +0.4y(k 2) = u(k) 0.3u(k 1) +O.05u(k 2) +e(k)0.6e(k1)+0.4e(k2) 5 16
puesto en serie con una zona muerta de 0.1, con condiciones iniciales nulas.
5.6. RESULTADOS
71
Planta 3: y(k)
=
5 17)
0.697676, B1
0.017203, B2
(5 18)
con condiciones iniciales nulas. Nota: Las plantas 3 (sin la no-linealidad) y 4 han sido elegidas por haber sido utilizadas en el proyecto Psycho de identificacin y control con redes neuronales. El montaje es el mismo para todas las plantas, tenemos una entrada al sistema principal consistente en una seal prbns de amplitud 1. A la salida de ste le sumamos un ruido coloreado que es la salida que obtenemos al filtrar un ruido blanco de pico 0.1 con el filtro 1+0.7q+O.2q2 1 0.6q1 + 0.4q2
519
La entrada prbns al sistema principal y la salida del sistema total las llevamos al bloque de identificacin, que nos va dando los coeficientes del sistema para los modelos OE, ARMAX y NARMAX, as como los errores RMS (absoluto y relativo) y los ndices AIC, FPE y MDL. Los resultados obtenidos se pueden resumir en la siguiente tabla:
72
10 0 10 -20 -30
Actual
output
va. predicted
uTr
model
output
IJUIAIIJ.iilJIui
14 10 0 10 -20 -30 14
16 Error
22
24
26
16
18 Time
20 (seca)
22
24
26
Fig. 5.5: Fenmeno de blow-up al intentar identificar la planta 1 con el bloque ARMAX de Simuliik. Este efecto se debe a que se correlan los erro res E(t) y 1(t) con la entrada y hace imposible la identificacin de este sistema mediante este mtodo.
Time Error
o
1 50 100 150 200 250
Time
Fig. 5.6: Resultados de la identificacin de la planta 1 con el mtodo RGO. Arri ba: salida del modelo vs. salida real. Abajo: error cometido.
5.6. RESULTADOS
73
FeI 10 5
L,tput
vs.
Model
cDutpilt
o
-5 Time Error 10 5
o
50 100 Time 150 200 250
Fig. 5.7: Resultados de la identificacin de la planta 2 con el mtodo RGO. Arri ba: salida del modelo vs. salida real. Abajo: error cometido.
0.2 0.1
Real
output
v.
IVIo del
output
o
0.1 0. 2
50
1 00 flrne Error
1 50
200
0.1
o
0.1
0.2o-
50
1 00 Time
1 50
200
250
Fig. 5.8: Resultados de la identificacin de la planta 3 con el mtodo RGO. Arri ba: salida del modelo vs. salida real. Abajo: error cometido.
74
1
Planta 1 ARMAX Simulink 0.050 QE RGO 0.050 ARMAXRGO 0.018 NARMAX RGO 0.017
RMS Error Planta 2 Planta 3 Planta 4 1.330 209.200 10.780 0.030 0.009 0.050 0.010 0.0008 0.050 0.003 0.0003 0.040
flme 6rrar
4 2
flm
Fig. 5.9: Resultadosde la identificacin la planta4 con el mtodo RGO. Arri de ba: salidadel modelo vs. salida real.Abajo: error cometido.
75
b=F(Lcojaj+8
i= 1
(5.20)
donde a son los niveles de activacin de las entradas, o el peso de conexin de la entrada i-sima al elemento de salida, 8 es un valor umbral y F es la funcin de activacin, en ste caso la sigmoide F(x) = El mecanismo de aprendizaje Backpropagation consiste en propagar hacia atrs, partiendo de la salida de las seales de error para calcular los ajustes,que se deben.aplicar a los pesos de todas las conexiis de la red. Este mecanismo es utilizado para ajustar los pesos y sesgos de las redes neuronales para minimizar la suma cuadrtica de los errores de la red. Esto se realiza cambiando continuamente los valores de los pesos de la red y los sesgos en la direccin de mximo decrecimiento con respecto al error (regla Delta).
,
Capd entrada
Capa Cauta
y1 Y2
Y3
765.IDENTIFICACINDESISTEMASNOLINEALES
La regla Delta es el algoritmo de entrenamiento del perceptrn para entradas y salidas continuas y se basa en que el ajuste del peso o, sea proporcional a la derivada, respecto del peso, del error cuadrtico medio E medido en el patrn actual p, (5.21) Desarrollando esta expresin, se obtiene,
=
y&xi
(5.22)
donde P = d o es la diferencia entre la salida deseada d y la salida actual 0P para el patrn p. La regla de actualizacin es
+ 1pO)i. (5.23) Las redes Backpropagation entrenadas tienden a dar respuestas razonables cuando se le presentan entradas que no han visto nunca. Tpicamente, una nueva entrada debe llevar al sistema a una salida similar a la correcta para vectores de entrada parecidos a los utilizados en el entrenamiento. El montaje es el mismo para todas las plantas, tenemos una entrada al sistema principal consistente en una seal prbns de amplitud 1 mas una onda cuadrada de amplitud 0.4 y frecuencia 0.1. A la salida de ste le sumamos un ruido coloreado que es la salida que obtenemos al filtrar un ruido blanco de pico 0.1 con el filtro
0i,o1d
z2+0.7z+0.2 z20.6z+0.4 Los principales problemas bservados en las redes son: la fuerte dependencia de las seales utilizadas para el entrenamiento y que los sistemas deben ser inva riantes en el tiempo o, a lo sumo, con variaciones pequeas. Para poder utilizarlas en control adaptativo es necesario que la red sea capaz de aprender rpidamente en lnea. Otro problema de las Redes Neuronales es que no dan un modelo explcito del sistema. Los resultados obtenidos se pueden resumir en la siguiente tabla:
524
57.COMPARACINCONLASREDESNEURONALES77
Tab. 5.2: Comparacin de los mtodos de identificacin: RGO y Redes Neuronales. ErrorRMS Planta 1 Planta 2 Planta 3 Plantaj 0.1678 NARMAX RGO 0.0293 0.02284 0.02201 0.07069 0.407 Red Neurona! 0.0335 0.04419
II II
1E
flr4S
rrorO.OOS
Fig. 5.11: Resultados de la identificacin de la planta 1. Subfigura 1: salida del modelo vs. salida real para RGO. Subflgura 2: error cometido. Subfl gura 3: salida del modelo vs. salida real para la Red Neuronal. Subfl gura 4: error cometido.
785.IDENTIFICACINDE
SISTEMASNOLINEALES
i;
1 00 0 nr,,S .-.-o.-..o.0000a 1 000
rvrLvJj
Fig. 5.12: Resultados de la identificacin de la planta 2. Sub figura 1: salida del
modelo vs. salida real para RGO. Subfigura 2: error cometido. Subfi gura 3: salida del modelo vs. salida real para la Red Neuronal. Subfi gura 4: error cometido.
-I 00 flI.#IS 0.0.00001
0 1
000
OLOJC
flrns
.-o.-ooroee
5.8. CONCLUSIONES
=E!1iVVVV/VVVNVVV&AA
AMWAAtWAANVMVN
IS .-roro.aO,
Fig. 5.14: Resultados de la identificacin de la planta 4. Subfigura 1: salida del modelo vs. salida real para RGO. Subfigura 2: error cometido. Subi gura 3: salida del modelo vs. salida real para la Red Neuronal. Subfi gura 4: error cometido.
5.8 Conclusiones
En este captulo se ha desarrollado un nuevo algoritmo para la identificacin de sistemas dinmicos basado en RGO. Se han utilizado modelos OE, ARMAX y NARMAX, pero el mtodo se puede utilizar igualmente con cualquier otro mto do paramtrico. En las simulaciones realizadas, los mtodos basados en RGO mejoran consi derablemente los resultados obtenidos por los mtodos basados en mnimos cua drados e incluso los de Redes Neuronales Backpropagation. Los resultados obtenidos prueban que el mtodo RGO puede ser utilizado para mejorar los resultados obtenidos con otros mtodos de identificacin de sistemas. En especial cuando el sistema no es lineal en los parmetros y cuando las seales de entrada y salida contienen ruido coloreado.
80
6. ESTIMACIN ESTADOS DE
6.1 Introduccin
El filtro de Kalman da una solucin efectiva al problema de filtrado lineal Gaussiano. Sin embargo, cuando hay no linealidades, tanto sea en la especifica cin del modelo como en el proceso de observacin, se requieren otros mtodos. Cuando el estado de un sistema tiene que ser estimado a partir de informacin sensorial con ruido, se necesita emplear algn tipo de estimador de estados para fusionar los datos de los diferentes sensores para producir una estimacin precisa del verdadero estado del sistema. El mtodo mas frecuentemente utilizado para la fusin de la informacin dada por los sensores en aplicaciones de robtica mvil es el Filtro de Kalman [61] y sus diferentes variaciones. Este filtro se utiliza para combinar todos los datos de medidas (por ejemplo, para fundir los diferentes datos de los distintos tipos de sensores) para obtener una estimacin ptima en sentido estadstico. Si la dinmica del sistema y el modelo de observacin son lineales y tanto el error del sistema como el error de medida (de los sensores) son Gaussianos, entonces el estimador de mnimos cuadrados puede ser calculado usando el filtro de Kalman. Es decir el Filtro de Kalman da una estimacin ptima desde el punto de vista estadstico. El clculo del Filtro de Kalman se hace recursivamente, es decir, en cada itera cin, slo la nueva medida y la ltima estimacin son usadas en el clculo actual, por tanto no hay necesidad de guardar las estimaciones y medidas previas. Es ta caracterstica hace que no necesite ni una gran potencia de clculo ni un gran almacenamiento. Las medidas de un grupo de sensores pueden ser fundidas utilizando el filtro de Kaiman para estimar el estado actual y para hacer una prediccin del estado futuro del sistema. En el caso no lineal el problema de filtrado en el espacio de estados viene dado por
82
ESTIMACIN 6.ESTADOS DE
(6.1) (6.2)
h(k,x(k),i(k))
donde 2(k) y r(k) son los ruidos, que se suponen vectores aleatorios, indepen dientemente distribuidos: 2(k) ((O (Q(k) O (k) O O R(k)
(6.3)
La estimacin ptima implica la descripcin de la densidad de probabilidad condicional MSE(kk) E(x(k)IZk) fx(k)p(x(k)IZk)dx. = Desafortunadamente, esta descripcin necesita un nmero infinito de parmetros. Por esta razn, un nmero de aproximaciones subptimas han sido propuestas. Estos mtodos utilizan aproximaciones analticas de las distribuciones de proba bilidad, la ecuacin de transicin de estados o la ecuacin de medida. Existen otros mtodos, tales como el mtodo de Montecarlo, que necesitan miles de pun tos para aproximar la densidad de probabilidad condicional. En aplicaciones con muchas dimensiones, stos ltimos mtodos no son prcticos. Por esta razn son necesarios mtodos con un nmero razonable de operaciones, tales como los es tudiados en este trabajo. Para el problema de filtrado no-lineal, la aproximacin ms sencilla e intuitiva es utilizar el desarrollo en serie de Taylor y utilizar las funciones de medida y de transicin no-lineales en el algoritmo del filtro lineal recursivo de Kalman. Los filtros no-lineales tradicionales incluyen el Filtro Extendido de Kalman (EKF), el Filtro No-lineal de Segundo orden (SNF) y el Filtro Iterado de una etapa (Single stage Iteration Filter (SIF)), que estn descritos en Wishner, Tabaczynskiy Athans [106J. Para reducir el sesgo de las estimaciones del filtro y obtener el valor esperado de las distribuciones de probabilidad ms correctamente, fue desarrollado el Filtro de Simulacin Montecarlo por Tanizaki y Mariano [100, 1011
(6.4)
6.2
El Problema Filtrado. de
El problema consiste en hallar una estimacin del estado x(k) del sistema de inters, con una dinmica discreta no lineal dada por x(k)=g(k,x(k1),E(k))
.
(6.5)
83
donde g la funcin de estado del modelo, x(k) es el estado del sistema en el tiempo k y c(k) es el ruido del proceso. La nica informacin disponible del sistema es la observacin con ruido dada por la ecuacin no lineal de medida
z(k)=h(k,x(k),1i(k))
(6.6)
donde z(k) es el vector de observacin, h es el modelo de observacin que trans forma el espacio de estados en el espacio de observacin y 11(k) es el ruido de medida. El estimador MMSE coincide con la media condicional. Sea (iIj) E[x(i)ZJ] con = {z(1),z(2),...,z(j)}T. La covarianza estimada es P(iIj) = E[{x(i) x(iIj)}{x(i) _(ij)}Tzi] Estas ecuaciones son difciles de evaluar en la prctica. Por esta razn se emplean estimadores recursivos. En el caso li neal con ruido aditivo gaussiano el MMSE es el filtro de Kalman. Las ecuaciones lineales son , en este caso:
.
(6.7)
(6.8)
v(k)=z(k)2(kkl)
La covarianza de esta magnitud es
(6.9)
P(kk
1) =P(kIk l)+R(k),
(6.10)
(6.11)
-
6.2.1
x(k+1)=F(k)x(k)+G(k)u(k)+v(k),
k=0,1,...
(6.12)
84
ESTIMACIN 6. DE ESTADOS
donde x(k) es el vector de estado de dimensin n, u(k) es el vector de entrada de dimensin nu(que es conocido), y v(k), k = 0, 1,..., es la secuencia de ruido blanco Gaussiano de media cero con covarianza E[v(k)v(k)] La ecuacin de medida es z(k)=H(k)x(k)+w(k) k=l,2,...
=
Q(k)
(6.13)
(6.1
con w(k) secuencia de ruido de medida blanco Gaussiano de media cero con co varianza E[w(k)w(k)J R(k) (6.15)
Las matrices F, G, II, Q,y R se suponen conocidas y que pueden cambiar con el tiempo. En otras palabras, el sistema puede cambiar con el tiempo y los ruidos son no estacionarios. El estado inicial x(0) es en general desconocido y se modela como una variable aleatoria Gaussiana con media y covarianza conocidas. Las dos secuencias de ruido y el estado inicial se suponen mutuamente independientes y adems los ruidos son independientes. Las ateriores condiciones se llaman lineales-Gaussianas.
E{x(k)JZ]
(6.16)
que eslamedia condicional del estado en el tiempo k, dadaslas observaciones hastaeltiempo k inclusive , y dela matriz covarianza de asociada P(kk)
=
(6.17)
las correspondientes del variablessiguiente paso, (k+ ljk+ 1) y P(k+ 1k+ 1). Esto sepuedehacer puesto que las variables Gaussianas quedan caracterizadas por sus dos primerosmomentos.
6.2.
EL
PROBLEMA
DE
FILTRADO.
85
Entrada conocida
Controltk en
_________
1
1
1
Medida tk+1 en
z(k+1)
Innovacin do la
covananza
S(k1)= )P(k+1 H(k+1 )H(kl) +R(k1)
W(k+1)
1
1
Actualizacin k covarianza 1 1
(6.18)
2(k+llk) =F(k).e(kIk)+G(k)u(k)
Restando de la ecuacin de estado obtenemos el error de prediccin de estado,
(6.19)
(k+lIk)
=x(k+1)(k+
11k)=F(k)(kIk)+v(k)
(6.20)
86
ESTIMACIN 6.ESTADOS DE
(6.21)
S(k+l)=H(k+l)P(k+llk)H(k-I-i)+R(k+1)
La covarianza entre el estado y la medida es , usando 6.20
(6.2)
E[i(k+ lIk)(k+llk)lZk} =E[(k+ llk)[H(k+ 1)i(k-flIk)+w(k+ l)]IZ] =P(k+lJk)H(k+ 1) (6.23) La ganancia del filtro, PP1 es
=
(6.25)
v(k+1)=z(k-I-1)--2(k+1Ik)=(k+1Ik)
es la innovacin. Finalmente, la covarianza actualizada es
(6.26)
P(k+ lIk+ 1) =P(k+ llk)P(k+ lIk)H(k+ 1)S(k+ 1)H(k+ 1)P(k+ 11k) = [IW(k+1)H(k+l)]P(k+llk)
(6.27) o, en forma simtrica P(k+1lk+1)=P(k+1lk)W(k+1)S(k+1)W(k+1) (6.28)
6.3
FiltrosNo-lineales Tradicionales
87
de hacerlo en una trayectoria nominal previamente calculada. Por esta razn, las funcionesg(k,x(k 1),E(k)) y h(k,x(k),ti(k)) son desarrolladas en serie de Taylor alrededor de x(kIk) con trminos hasta primer o segundo orden para obtener el EKF o SNF respectivamente. El desarrollo con trminos de segundo orden de la ecuacin de transicin es:
x(k)
+e(x(k-
11k-1))
(6.29)
y el de aollo con trminos hasta segundo orden de la ecuacin de medida es:
z(k) = h(k,x(k),i1(k) h(k,(kk l),0) +h(k,x(k l),(k))(x(k 1)(k 1k1)) +h1(k,x(kl),i(k))i(k) +ej(x(k1) -x(k- 11k-1))h(k,x(k1),i(k))(x(k1)-(k11k-1))
+Lej11(k)hi(k,x(kl),T(k))T(k) -i-ej(x(k 1) (k
j=1
donde ej es el vector de la base Cartesiana. Las tcnicas basadas en el Filtro de Kaiman Extendido han demostrado ser robustas y mantener el seguimiento de la posicin robot de forma precisa. Sin em bargo el Filtro de Kaiman Extendido no puede representar ambigedades (como las simetras) y no es capaz de relocalizar al robot en caso de fallo en la localiza cin. Muchas de estas dificultades estriban en asumir la restriccin Gaussiana del Filtro de Kalman.
88
ESTIMACIN 6.ESTADOS DE
V(x(I))
(632)
El Filtro KaimanExtendido de Iterado (IEKF) un algoritmo usa Newton Raphson para estimar (kIk). Desarrollando serie Taylor segundo Ven de hasta orden alrededor de la i-sima estimacin de x(k)da como resultado:
V+V(xx)
+ (xx)V(xx)
(6.33)
89
((k)_((0
(k))O)
(R(k) O
P(klk-1)))
(klk 1) = gi((kk) +g(k,x(kk 1),E(k)))(k 1)(kIk 1), 11k P(kIk 1) = g(k,x(kk),E(k))P(kk l)g(k,x(kk 1),E(k))+Q(k), 2(kIk 1) h(k,x(klk 1),i(k)), = P(k) = Hu(k,(kIk),x)P(k, k 1)(Hu(k,x(kk),x)) + R, (k) =z(k)2(kIk 1), W(k) = P(k,k 1)h(k,(kIk),x)P(k), P(k,k) = P(k,k 1) W(k)P(k)W(k), x(klk)=x(k,k1)+W(k)(k)
x(k) =g(k,(kki),O)
+g(k,x(k_1),c(k))(x(k_l)_(k_1k_1)),
(636)
90
ESTIMACIN 6. DEESTADOS
.(kIk1)= 1), P(kk l)= 1((kIk 1) (kk l))((kjk 1) (kk 1)), 2(kjk1)= L12(kIk 1), P(kk 1) L1(2(kIk 1) = 2(kk l))(2(kk 1) 2(kk 1)), P(kIk1)= w(k) =Pxz(kIkT l)P(kJk 1), P(kk) =P,(kIk l)W(k)P(kIk l)W(k),
and
(6.38)
where (kIk 1)= g(k,(k l,kl),c(k)), and 2(k,k 1)= h(k,(k,k l),i(k))
6.4
El nuevoFiltro,RGO
...,
Los algoritmos genticos son un proceso probabilstico de bsqueda basado en la seleccin natural y en las leyes genticas. La poblacin 9 = (9i ,92, 9) E jN es modificada de acuerdo con los procesos evolutivos naturales: despus de la inicializacin, son ejecutados la seleccin w : jN jN, cruce : jN jN , mutacin : jN recursivamente en un bucle. Cada ejecucin del bucle es llamada generacin y 9 representa la poblacin en la generacin t. El operador de seleccin tiene como fin mejorar la calidad media de la pobla cin dando a los individuos de mayor calidad una alta probabilidad de ser copiados en la nueva generacin. La seleccin, por lo tanto, enfoca la bsqueda hacia regio nes prometedoras del espacio de bsqueda. La calidad de un individuo es medida
6.4. EL NUEVOFILTRO,RGO
por la funcin de salud f : J donde J representa el espacio de todos los posibles individuos. Los algoritmos genticos se utilizan usualmente como mtodo de optimiza cin global de funciones invariantes en el tiempo, y usualmente se ejecutan off une. Sin embargo, la seleccin natural de los seres vivos es un proceso local o semi local en el que las especies se adaptan por s mismas al entorno, que a su vez es dependiente del tiempo (es on une).
+
Iniciar la poblacin
Aplicar los operadores: seleccin, cruce, mutacin, elitismo e inmigracin para construir la nueva poblacin
Fig. 6.2: Diagrama de flujo de la Optimizacin GenticaRestringida aplicadaa la estimacin de estados. Es posible adaptar el mtodo de algoritmos genticos si se restringe la bsque da a un entorno de la estimacin previa usando como funcin de salud:
con=
P(klk1)l,
cte+V((kIk1))
92
ESTIMACIN 6. DEESTADOS
640
=p(x(k)z(k),zk_l)
= =
l),P(klk-
1)). (6.41)
Maximizar la funcin anterior es equivalente a calcular una estimacin maxi mum a posteriori (MAP). Esto es tambin equivalente a minimizar V(x(k)) , i.e. maximizar la funcin de salud f(J). La funcin de salud estndar (i.e. dividida por la suma de las saludes) es una aproximacin de la funcin de densidad condicional (PDF). Zk p(z(k)Ix(k))p(x(k)Zk_l) p(x( k )I ) fp(z(k)x(k))p(x(k)z1)
-
( 642
De todo lo anterior queda claro que es posible calcular precisamente las no linealidades de las funciones f y g, sin embargo la introduccin de la hiptesis de ruido gaussiano no se puede evitar. Para determinar el radio de la zona de bsqueda, usamos la distancia de Mahalanobis d= ((kjk 1) (k lJk 1))P1(kIk)(kk 1) (k 1k 1)) (6.43)
que mide la incertidumbre de la estimacin (k). Todosestos procesos pueden ser aplicados al Filtro Extendido de Kalman (pa ra obtener el Filtro de Optimizacin Gentica Restringida, RGOF) o al Filtro Nolineal de Segundo Orden, SNF (para obtener el Filtro de Optimizacin Gentica Restringida de Segundo Orden, SRGOF).
93
EKF FILTER
3.5
3
9lGcF FILTER
2.5 2 1 .5
0.5
50
100
150
200
Fig. 6.3: Ejecuciones tpicas para el modelo 5 con EKF y SRGOF para nivel de
ruido 1.0. estimacin (k). es comparada con x(k) y el BlAS y el RMSEentre el valor esti mado (k) y el simulado x(k) se calcula para cada tiempo k. Este procedimiento se realiza 6000 veces (30 ejecuciones de 200 puntos cada una). Para comparar los distintos mtodos de estimacin, considerar cinco ejemplos conocidos en orden ascendiente de no linealidad y con tres niveles diferentes de ruido. En todos los casos c(k) y r(k) se suponen normalmente distribuidos como
()((g)1(
J
)(
1 x(k)=x(k1)+E(k)
.
g))1
(645)
(6.44)
donde C es una constante y el valor inicial x(0) est distribuido como una variable aleatoria normal. El primer modelo es lineal:
1..z(k)=x(k)+n(k)
El segundo elmodelo es Logstico:
Xk..) k Z )
47)(6
94
ESTIMACIN 6.ESTADOS DE
x(k)= 0.5x(k + 1)
1 z(k)=-0+i1(k).
El ltimo corresponde al seguimiento de un mvil con un sensor que mide solamente el ngulo, dado por Bar-Shalom y Fortmann [9] en 1988.
x(k)=(
)x(k_1)+E(k) atan
((X(1,kX(k)))
(6.49)
1 z(k)
+i(k)
Tab. 6.1: Comparacin de BlAS para el nivel de ruido 0.1. Model 1 Model 2 Model 3 Model 4 Model 5 EKF -0.2062 0.0058 -0.1275 0.7118 -0.2342 IEKF -0.7654 0.0250 -1.2593 0.4796 -0.2488 SNF -0.2063 0.0109 -0.1210 0.4796 -0.4361 SIF 0.1955 8.5E-05 -0.1812 0.5861 -0.3238 MSF -4.9743 0.0057 -0.1397 0.4487 -0.2453 RGOF -0.1889 0.0076 -0.1142 0.2688 0.2411 SRGOF 0.6469 0.0078 -0.1198 0.3893 0.0938
Tab. 6.2: Comparacinde RMSE para el nivel de ruido 0.1. Model 1 Model 2 Model 3 Model 4 Model5 EKF 0.9616 0.0876 0.9162 10.9863 1.1963 IEKF 2.0934 0.0822 2.1868 10.8942 1.0293 SNF 0.9638 0.0536 0.8812 10.8942 0.9003 SIF 1.9693 0.0690 1.0947 13.1817 0.8980 MSF 36.5653 0.0786 0.8718 11.3058 0.8828 RGOF 0.9515 0.0532 0.8695 10.3893 1.1523 SRGOF 1.3145 0.0543 0.8554 10.1435 0.8511
6.6. DISCUSIN
Tab. 6.3:_Comparacinde BlAS para el nivel de ruido 0.5. Model 1 Model 2 Model3 Model4 Model5 EKF -1.9802 0.2251 -0.1691 0.2727 0.1648 IEKF -6.7135 0.2233 -0.7962 0.1858 -0.1300 SNF -0.7908 02275 -0.1250 0.1858 -0.0797 SIF 0.4687 0.2269 -0.1911 0.8650 0.1989 MSF -59.0465 0.2236 -0.0628 0.5375 -0.0202 RGOF -0.8040 0.2209 -0.1453 0.4761 0.3438 SRGOF -1.1171 0.2055 -0.1603 -1.2549 -1.0691
Tab. 6.4: Comparacin de RMSE para el nivel de ruido 0.5. Model 1 Model2 Model 3 Model 4 Model 5 EKF 4.996 1.5537 0.8632 14.7955 5.5196 IEKF 10.068 1.5561 1.7991 14.7742 5.0794 SNF 4.354 1.5546 0.8463 14.7742 4.6296 SIF 8.767 1.5494 1.0864 17.9635 4.4094 MSF 154.528 1.5540 0.8523 14.8041 5.1212 RGOF 3.847 1.5525 0.8573 10.3697 5.9636 SRGOF 4.2704 1.5063 0.8611 6.0052 4.8815
________
Tab. 6.5: Comparacin de BlAS para el nivel de ruido 1.0. Model1 Model2 Model 3 Model 4 Model 5 EKF -1.0107 0.0811 -0.1275 0.28454 0.2183 IEKF -4.01 17 0.1628 -1.2593 0.19430 0.2765 SNF -1.0325 0.0859 -0.1210 0.19430 0.0084 SIF 0.9615 0.0369 -0.1812 0.52118 -1.6102 MSF -17.5458 0.0810 -0.1397 0.43729 0.6963 RGOF -2.3808 0.0524 -0.1146 0.01695 0.3160 SRGOF -2.1398 0.0529 -0.1198 0.11951 1.7845
6.6 Discusin
En este captulo se describe un nuevo mtodo de filtrado no lineal. Este mto do utiliza la Optimizacin Gentica Restringida para reducir el error de estimacin
96
ESTIMACIN 6. DEESTADOS
de las estimaciones previas EKF o SNF. Las tablas 1-3 sumarizan los resultados de cinco modelos con tres niveles de ruido: JEI = = 0.1, 0.5 y 1.0. Cada nmero mostrado en las tablas repre senta la media de treinta ejecuciones de doscientos puntos cada una. Queda claro de los siguientes resultados que la precisin (basada en el criterio RMSE) de las estimaciones del SRGOF son ciertamente superiores a las de los otros algoritmos, especialmente en las situaciones con ms ruido y ms no lineali dades. Juzgando a partir del criterio de los BlAS no hay grandes diferencias entre los diferentes mtodos, aunque algunos algoritmos (MSF, SIF y IEKF) son menos robustos en ciertas situaciones. Finalmente, la caracterstica ms importante del mtodo propuesto SRGOF es su robustez en las situaciones de alto ruido y fuertes no linealidades, que son las caractersticas deseadas de tales filtros.
Un sistema lineal general discreto e invariante en el tiempo puede ser descrito como y(t)
=
Go(q)u(t) +Ho(q)eo(t),
(7.1)
donde y(t) es el vector de salida de dimensin p, u(t) es el vector de entrada de dimensin m y que se suponen conocidos. Las perturbaciones desconocidas que actan en la salida se suponen generadas por el segundo trmino, donde eo(t) es el vector deiiiido de dimensin p. Se supone que eo(t) es una secuencia de variabls estocsticas independientes que cumplen E[eo(t)]
=
O,
E[eo(t)eo(t)T] = A0
(7.2)
donde E es el operador esperanza matemtica. Como el sistema es de orden finito, puede ser descrito tambin en el espacio de estados, introduciendo el vector auxiliar de estados x(t) de dimensin n, siendo n la dimensin del sistema. La relacin de entrada-salida puede ser descrita por x(t+1) =Ax(t)+Bu(t)+Keo(t) y(t) = Cx(t) +eo(t). dondeA E Rnxn B E Rnx, K E RnXP y CE RPXn. La manera representar en 7.3 se dice est forma innova de elruido que en de ciones. El modelo en espacio de estados 7.3 es igual al sistema 7.1 si las matrices A, B, C yK cumplen Go(q)= C(qIA)B, yHo(q)
=
73)
C(qIA)1K+I.
(7.4)
987.IDENTIFICACINENELESPACIODEESTADOS
Las matrices A, B, C y K no son nicas. Es posible un cambio de base para los estados x(t)
=
T1x(t)
(7.5)
donde T e R<2 una matriz no singular, y el sistema en las nuevas variables de es estado son x(t+l) =Ax(t)+Bu(t)+Keo(t) y(t)=Cx(t)+eo(t). ) Donde A = T1AT, B= T1B, K = T1K y C = CT. Es fcil ver que C(qIA)B = C(qIA)1B C(qIA)K+I=C(qIA)1K+I
76
J(t+
1) =A(8)(t)
+B(9)u(t) +K(0)e(t)
8)
Y(t)= C(e)e(t) + e(t). donde las matrices A,B, C y K estn construidas a partir del vector O de acuerdo con la estructura de modelos M. Una estructura de modelos !M esglobalmente identificable si M(0) = M(0*) e = 0*. Es decir, dos vectores de parmetros distintos Oy 9 no pueden dar el mis mo modelo. Las estructuras de modelos identificableshan sido muy utilizadas para la iden tificacin de sistemas debido a la correspondencia biunvoca entre los modelos y los valores del vector de parmetros. Sin embargo, para algunos sistemas es difcil encontrar una parametrizacin bien condicionada. Las estructuras de modelo identificables 9v!1fueron introducidas en [88] y pueden ser definidas como:
.
7.3. MODELOSEN EL ESPACIO ESTADOS DE TOTALMENTE PARAMETRIZADOS Definicin 7.2.1: SeaA(O) unamatrizrellenadecerosy conunosen la lneasu perior a la diagonal.Seanlas filas numeradas ra,.. , r, donder rl, n, rellenas con parmetros. Sean B(O)y K(9) rellenas parmetros C(O)con cerosy con con y unos en la fila i, columnar_ 1 + 1. (Seconsiderar = 0 y que p esla dimensin de y(t)).
.
93 94 +
(t)
99 +u(t)
12
914913
e(t)
99 920 (7.9)
(7.10)
1007.IDENTIFICACINENELESPACIODEESTADOS
multi-ndices se ajusta mejor a nuestro sistema puesto que la estructura totalmen te parametrizada contiene a todas las dems. Adems la calidad del modelo puede aumentar al elegir una estructura ms flexible. Esto nos permite adems hacer transformaciones para obtener una descripcin que est bien condicionada num ricamente. Basndonos en las realizaciones balanceadas, introducidas por Moore [82], Kabamba [59] describe una parametrizacin cannica identificable para sistemas en tiempo continuo con valores singulares de Hankel distintos. Este resultado fue generalizado por Ober a sistemas arbitrarios en [86] incluyendo una exten sin a sistemas en tiempo discreto utilizando la transformacin bilineal. con sta parametrizacin los parmetros pueden ser variados de forma continua sin que el sistema resulte no mnima. Otra ventaja, en comparacin con la forma observable, es que las parametrizaciones balanceadas tienen mejores propiedades numricas. Sin embargo, los ndices estructurales deben ser conocidos tambin para este tipo de parametrizacin. Chou [17] usa la parametrizacin equilibrada para la identifi cacin de sistemas.
A(O)
0.9606
3.8812
5.8806 3.9600
Los valores propios, que son todos ellos iguales a 0.99, son extremadamente sensible a perturbaciones en los parmetros. Un cambio aditivo de 2x108 en cual quiera de los parmetros puede perturbar a uno de los autovalores y convertirlo en mayor que uno.Por esta razn es necesario introducir el concepto de realizacin equilibrada. La matriz
W
0= L(AT)!cCTCA1
es conocida como el Gramiano de observabilidad parael sistema en el espacio de estados. Los autovalores de esta matriz describen cmo la variable de estado inicial x(O) influencia la seal de salida y(t) cuando u(t) 0. Esta matriz tambin satisface la siguiente ecuacin de Lyapunov
es llamada el Gramiano de controlabilidad. Esta matriz describe cmo la entrada u influencia al vector de estado x. W tambin satisface
=AWAT+BBT.
Las matrices Gramianas son simtricas por construccin. Definicin. Una realizacin en el espacio de estados es equilibrada si
W0 =W==diag coni>,...a>0.
(i
...
,n)
102
una constante suficientemente grande (108) para mantener la diversidad de la po blacin. La probabilidad de reproduccin se ha calculado como F(t) = F(t)/I. La bsqueda es llevada a cabo usando matrices completamente parametrizadas y a cada generacin la estimacin es transformada en una realizacin balanceada para conseguir un modelo bien condicionado numricamente. En cada generacin, sustituimos el anterior modelo por el mejor de la nueva generacin como centro del entorno donde se realiza la bsqueda, de esta manera ,en caso de un sistema LTI, el mejor modelo debe ir tendiendo al valor que mini miza el funcional y la poblacin ira tendiendo a cero. A continuacin realizamos una nueva lectura de la entrada y la salida del sistema.
Fig. 7.1: Twin Rotor MIMO System (TRIVIS). De esta manera conseguimos un conjunto de aproximaciones sucesivas a me jores modelos en caso de el sistema sea invariante en el tiempo y si el sistema es variable, pero de variacin lo suficientemente lenta, entonces el modelo va si guiendo al sistema en sus variaciones. Podemos adems aprovechar las caractersticas convenientes de la convergen cia global si al principio tomamos una bola lo suficientemente grande, de manera que reduzcamos la probabilidad de quedarnos en un mnimo local. Una vez que sepamos que seguimos al mnimo adecuado, podemos reducir el tamao de la bo la y al mismo tiempo de la poblacin, para conseguir una mayor velocidad de ejecucin del algoritmo. Para que el algoritmo no tenga una convergencia prematura y se homogenei ce demasiado la poblacin, podemos aumentar el parmetro de probabilidad de mutacin.
7.5.IDENTIFICACINRGOENELESPACIODEESTADOS103
Aunque este algoritmo es costoso en cuanto a operaciones, es lo suficiente mente rpido como para ser empleado en linea. A esto hay que aadir que las aplicaciones a los que tpicamente se desea aplicar este identificador, es decir a los sistemas de control adaptativo, poseen dos bucles, uno rpido, que es el de control, y otro lento que es el identificador. Por tanto se puede aplicar a sistemas con una constante de tiempo del orden de las centsimas de segundo.
) 0 1
4O
YeI,:
X)
Moe
ou tpul.
ic
Mugen
tu: Meus
12)
14 ured
output
ic
1&0
.o
::/hY(1
0 0 4O Modelo 5(X) rtpu.
ICXC, Meueu
ISCO
-ISCO
Fig. 7.2: Resultados de identificacin de la Planta con el mtodo ARX. Aruba: Salida del Modelo vs. Salida del Sistema. Abajo: Error
4 Vellow:
IECO
0.5
o
0 -ICO Model EcO output 1)
lEcO Meusu
l-4c0
lECO
EcCO
,od outpul
Fig. 7.3: Resultados de identificacin de la Planta con el mtodo Gauss Newton.Arriba: Salida del Modelo vs. Salida del Sistema. Abajo: Error
1047.IDENTIFICACINENELESPACIODEESTADOS
200
.4
Vov:
1odeIotpt.
&X
1cO M9ontr
121
Mourod
14X)
otpfl
1&
1&X
20
1
0.5
c
0.5 0
20
403 MOdel
503
output
105)
123)
1403
105)
105)
Measu
rod OulpUt
Fig. 7.4: Resultados de identificacin de la Planta con el mtodo RGO. Aruba: Salida del Modelo vs. Salida del Sistema. Abajo: Enor
7.5.1
E Agortmo
1. Se obtiene una primera estimacin utilizando mnimos cuadrados de un mo delo ARX y se pasa al espacio de estados. 2. Convertimos el sistema en una realizacin balanceada. 3. Hacemos k
=
k=argmnviv(e)
empleando RGO (Restricted Genetic Optimization) con matrices completa mente pararnetrizadas. 5. Convertimos la estimacin obtenida en una realizacin balanceada. 6. Hacemos k = k+ 1 y repetimos los pasos 4-6 hasta que
VN(B2)VN(8)<E
(7.13)
(7.14)
7.6. RESULTADOS
105
7.6
Resultados
Para poder contrastar los resultados con otros mtodos, vamos a utilizar como ndices de funcionamiento.los siguientes: Error RMS: RMS error= Error relativo RMS: Relative RMS error =
VN
(_)2 N
(7.15)
x 100%
(7.16)
Para comparar los varios mtodos de identificacin, consideramos la aplica cin a sistemas reales: al Twin Rotor Mimo System (TRMS) que es un sistema dinmico de laboratorio diseado especialmente para experimentos de control. En ciertos aspectos su comportamiento es parecido al de un helicptero. Desde el punto de vista de control ejemplifica un sistema no-lineal de orden alto con diferente dinmica en cada posible posicin. Los resultados obtenidos de los Errores Cuadrticos Relativos Medios (RM SE) se pueden resumir en la siguiente tabla: Error RMS relativo ARX331 0.1964
II
ARX441 0.1723 0.1695 N4SID6 Gauss-Newton33 10.06425 RG0331 0.03378 Tab. 7.1: Errores CuadrticosRelativos
7.7 Discusin
En este captulo se han comprobado las posibilidades que tiene la estructura de modelo totalmente parametrizada y su identificacin por medio de los mtodos ARX, Gauss-Newton y RGO. La principal idea es que esta estructura de modelo cubre todos los sistemas de un orden dado.
1067.IDENTIFICACINENEL
ESPACIO DEESTADOS
El mtodo de identificacin que se presenta utiliza la realizacin equilibrada (balanced realization) para conseguir un modelo bien condicionado numricamen te. En la tabla de resultados se puede observar que el mtodo RGO se comporta mejor que los otros algoritmos en un sistema como el TRMS con no linealidades y ruido.
Bajo este nombre se agrupan una serie de estrategias de control que tienen en comn como caracterstica principal, el hacer uso explcito de un modelo del proceso, para obtener la seal de control mediante la minimizacin de una cierta funcin de coste. En este sentido forman parte de una familia ms amplia, en la que se hace uso de un modelo del proceso para disear el controlador: LQ, IMC, asignacin de polos y ceros, etc. Adems de garantizar la operacin estable de la planta, los controladores avan zados de hoy en da han de satisfacer una serie de criterios adicionales u objetivos secundarios de control: econmicos, de seguridad, limitaciones fsicas de los equi pos, calidad del producto final, regulaciones ambientales , preferencias humanas, etc. Muchos de estos modelos admiten una representacin matemtica muy natu ral, bajo la forma de funciones objetivo dinmicas y ligaduras dinmicas de tipo desigualdad. El control predictivo basado en modelo tiene las siguientes caractersticas: Uso explcito de un modelo para predecir las salidas futuras.
Clculo de cierta secuencia que minimice cierta funcin objetivo. El horizonte se va desplazando hacia el futuro, lo que implica la aplicacin de la primera seal de control calculada en cada paso.
Se puede aplicar con pocos conocimientos de control, porque los conceptos son intuitivos y el sintonizado es relativamente sencillo.
1088.APLICACIONES
AL CONTROLPREDICTIVO
pasado -4
futuro
-
referencia r(t+p)
,.
w(t+k/t)
Salidas
predichas
1+1
t+2
t+p
horizonte
Fig.
8.1:
La
metodologa
del
control
predictivo
basado
en
modelos.
Se
puede
utilizar
para
controlar
una
gran
cantidad
de
procesos,
tanto
senci
llos
como
complejos;
incluyendo
sistemas
con
tiempo
de
retardo
grandes
sistemas
de
fase
no
mnima.
Se
puede
aplicar
al
caso
multivariable.
El
controlador
resultante
es
una
sencilla
ley
de
control
lineal.
Su
extensin
para
tratar
el
caso
con
restricciones
es
conceptualmente
senci
lla
puede
ser
incluida
durante
el
diseo.
Es
muy
til
cuando
las
referencias
futuras
son
conocidas.
Es
una
metodologa
abierta.
8.1.1
Estrategias
de
Control
Predictivo
Basado
en
Modelo
1.
En
cada
instante
de
tiempo
t,
se
predicen
las
salidas
futuras
del
proceso,
y(t+klt)
para
una
cierta
ventana
de
tiempo
k=1,2,...N,
utilizando
el
modelo
del
proceso.
recibe
el
nombre
de
horizonte
de
prediccin.
Estas
salidas
se valores
predicen futuros
con
la de
informacin un escenario
que de
est control
disponible que se
en postula
el
instante en el
t, instante
con t.
los
2. Se define una trayectoria de referencia, r(t+klt), que describe cmo se desea guiarla salida del proceso desde su valor actual, y(t) hacia sus puntos de consigna futuros, w(t+klt). 3. De todo este conjunto se deduce la secuencia de control u(t+ktt) que hace mnima la funcin objetivo. 4. La seal de control u(tit) se manda al proceso. El resto de las seales se rechazan ya que y(t+l) es conocido y se vuelve al punto 1.
Trayectoria de referencia
de coste
(8.1) Con este modelo se obtiene el control predictivo de mnima varianza. La expresin que se utiliza con ms frecuencia es:
N2
J(N1,N2,N3) =E{
(j)[y(t+jt)0(t+j)]2+
L X(j)[Au(t+j
j=1
i)]2}
1108.APLICACIONES
AL CONTROLPREDICTIVO
r(tk)
en donde la perturbacin no medible viene representada por una secuencia de ruido blanco de media cero (t) coloreada por el polinomio C(z) e integrada por el operador incremento & Para optimizar la funcin de coste:
N2 N
J(Ni,N2,N3)
E{
j=N1
(j)[y(t+jt)
o(t+j)]2+
?(1) [Lu(t+j
j=1
l)]2}
1 = E(z1)(z)
+Fj(z1)
(8.5)
8.3. EJEMPLO.
consideramos [2] y
(z1)E(z1)y(t+j)
(1 _z_iFj(zl)y(t+j)
1) +E(z)e(t+j) (8.6)
1) +E(z1)e(t+f) (8.7)
y(t +
j)
Fj(Z1)y(t)
Como el grado de E es j-1, los trminos de ruido estn todos en el futuro. La mejor prediccin es:
9(t+jlt)
con
G1(Z1 )Lu(t+jd
1) +Fj(z)y(t)
(8.9)
G(z)=E(z1)B(z)
(8.10)
8.3
y(t)
Ejemplo.
=
Considrese el siguiente sistema, descrito mediante un modelo ARIMAX: l.7y(t 1) 0.7y(t 2)+O.9zu(t 1)0.6i.u(t 2) +(t) (8.11)
con (t) una seal de ruido blanco de media cero. En la notacin empleada habi tualmente, los polinomios de la funcin de transferencia de este sistema son:
A(q) B(q)
= =
1 1.7q1 +0.7q 2)
12 8
0.9q
0.6q2
y se ha tomado C(q) = 1. Los parmetros del controlador GPC son N1 = 1, N=N2=3yX=0.1. Las ecuaciones del predictor se pueden obtener resolviendo la ecuacin dio fantina asociada, pero para resolverla a mano, es ms fcil iterar. As, y(t + 1It) y(t + 21t) 1.7y(t)0.7y(t 1) + 0.9Au(tlt) 0.6Au(t 1) = 1.7y(t + lit) 0.7y(t) + 0.9Au(t+ itt) 0.6Au(tlt) = 2.19y(t) 1.19y(t 1) +0.9Au(t+ lit) +0.93Lu(tIt) 1.02iu(t 1) y(t + 21t) = 1.7y(t + 21t) 0.7y(t + ilt) +0.9iu(t+ 21t) 0.6u(t lit) = 2.533y(t) 1.533y(t 1) +0.9iu(t+2It) +0.93iu(t+ lit) +0.951Lu(tIy) 1.314u(t 1) (8.13)
112
+ /
)) (
=
( ) +(
) J
Au(t+lIt) u(tt)
zu(t+2It)
) J
(8.14)
u(t1)
/
(GTG+X13)_1GT=
.Au(t_1)
(8.15)
(8 16)
Este es un controlador lineal e invariante en el tiempo, ya que el modelo es inva riante. Se puede comprobar la capacidad del controlador de mirar hacia adelante, ya que son tenidos en cuenta tres valores futuros de la referencia, tantos como la longitud de la ventana de prediccin.
(8.17)
(8.18
i)+1
(8.19)
113
donde hemos tomado el polinomio correspondiente al ruido, de grado uno, y don de u(t) e y(t) son las seales de entrada y de salida del sistema, c(t) es un ruidb blanco y A es un integrador (A = 1 z). Esta ecuacin se puede transformar en
1)
(8.20)
a(y(t
1) + b[u(t d)
u(t
1)]
(8.21)
A continuacin, lo que deseamos hacer es aplicar una secuencia de control que minimice la funcin objetivo:
N2
J(Ni,N2) =E{
(j)[j(t+jIt)
N2-d
r(t+j)J2+
j)[Au(t+N
j=1
)]2}
j_N1
(8.22) donde Ni > d y N2 = d+N. Minimizando J(N) respecto a Au(t), Au(t + 1), N 1) , obtenemos Mu=Py+Rw con u
=
. . .
At4t +
(8.23)
(8.24)
(8.25)
w[r(t+d+1),
r(t+d+2),...,r(t+d+N)]T
(8.26)
M y R so matrices de NxN y P de dimensin Nx2. Llamando q a la primera fila de la matriz M1, Au(t) viene dada por Au(t)_qPy+qRw Por consiguiente el incremento de la seal de control Au(t) resulta: Au(t)
=
(8.27)
lyl
(8.28)
1148.APLICACIONES
AL CONTROL PREDICTIVO
donde iyi, y2 Y 1ri son coeficientes. Por tanto nuestra estrategia es aplicar sucesi vamente las ecuaciones: 5(t+i)
=
(1 +a)y(t+i
ilt)
aj(t+i2) +b[u(t+id+
1)u(t+id)] (8.29)
u(t)
+irl
r(t))/G
(8.30)
Es decir: 5(t+i)
=
(1+a)y(t+i
llt)a51(t+i2)+b[u(t+id+l)u(t+i_d)] (8.31)
u(t)
u(t
9(t + d
(8.32)
Esto significa que se puede expresar la ley de control en funcin de los dos valores estimados de la salida 5(t+ djt), 9(t + d 1 It) y de la referencia r(t) con tres parmetros desconocidos lyl, 1ri Si se pueden identificar estos parme tros, tendremos una ley de control. Por supuesto, nos interesa encontrar estos coeficientes de modo que minimicen el funcional 8.22.
20
40
60
100
115
Signal Gen.
Scope
Scopel
Fig. 8.5: Esquema para la identificacin de los parmetros de la ley de control predictivo.
Fig. 8.6: Resultados de la identificacin de los parmetros i y ir! del control predictivo RGO. El tiempo 10 corresponde al llenado del buffer.
J(N1 ,N2) = E{
j=Nj
j)]2+
X(j)[Au(t +N
j=1
1)]2}
(8.33)
116
Fig. 8.7: Resultados de la identificacin de los parmetros del sistema. de un modo directo, obtenindose los coeficientes ly y lr de la expresin
N N-d lYk y(i
k=d
u(i)
k) +
lrj, r(i k)
(8.34)
k=1
Lo cual significa que podemos calcular el valor de la entrada del sistema con muy poco coste computacional. Existen, por tanto, dos bucles: uno lento que nos va actualizando los coefi cientes de la seal de entrada u, y un bucle r pido que calcula la seal de entrada. De esta manera se evita el tener que resolver el sistema Mu=qRy+qRw todas las veces, con lo que se gana en velocidad.
8.5
ControlPredictivo PID-RGO
8.5.1 Introduccin
La sintonizacin de controles PID digitales para las plantas industriales puede ser difcil algunas veces y consumir bastante tiempo. La situacin es mucho peor si el comportamiento de la planta vara con el tiempo. Las tcnicas de algoritmos genticos off-line para sistemas que no varan con el tiempo fueron propuestas por Porter y Jones [911como una alternativa posible a la sintonizacin de los PID digitales. De hecho, se comprob que los algoritmos genticos nos permiten una aproximacin ms sencilla a la sintonizacin de tales controladores que la solucin basada en algoritmos de optimizacin no genticos como los propuestos por Polak y Mayne [90] y por Gesing y Davidson [33].
117
Nuestra tcnica permite la sintonizacin on-line de controladores PID, dotn doles de caractersticas del control predictivo muy interesantes como son un me nor esfuerzo de control (la seal de control es ms suave) y un mejor seguimiento de la seal de referencia. Recordemos que el esquema general para el control predictivo es:
{
Referencia
uiej
Reuladoi
Prcceso
Fig. 8.8: Esquema general del control adaptativo. El bloque de Identificacin y ajuste de parmetros lo dividiremos en dos par tes: un primer bloque para identificar el sistema y un segundo bloque para ajustar los parmetros del PID. As obtendremos un control adaptativo basado enla optimizacin de un fun cional y en la identificacin del proceso.
Fig. 8.9:
B(q)u(t+e(t)
(8.35)
1188.APLICACIONES
AL CONTROLPREDICTIVO
b0 + b1q1 + b2q2 +
+ b,bq
(8.36)
A(q1)
a +alq
+a2q 2+.
+anaq_rw
(8.37)
Para hacer la identificacin de los parmetros es conveniente escribir la ecua cin corno: y(t) siendo
=4(t)e(t)
,b,j,] (8.39)
(8.3
[al,a2,.. .,a,,,b0,b1,b2,
. ..
siendo (t) el vector de regresin que consiste en mediciones entrada/salida dado por:
=
La identificacin de un sistema dinmico se puede hacer off-line, o bien on une. En el primer caso uno de los mtodos mas clsicos es el mtodo de mnimos cuadrados, cuya solucin viene dada por
e(t)
[T][TYJ
,
(8.41)
siendo la matriz C1es la matriz de observaciones cuyas filas estn formadas por el vector definido anteriormente e Y es el vector de salidas, ambas con N filas, correspondientes a las N ltimas ecuaciones y(t) = (t)O,. ,y(t n + 1) = + l) escritas en forma vectorial. Sin embargo es mas til en trminos de control realizar la identificacin on-line de mod recursivo. Si en la ecuacin anterior denominamos P(t) = entonces
. . ,
P(t)
[=i(s)T(s)] (s)T(s)
[i
+ (t)T(t)]
P(t l)
-
+ (t)T(t)
(8.42)
T(t
1)Y(t 1)+T(t)Y(t)
(8.43)
119
[T4]_1[TyJ
de forma recur
(t
1) + P(t)4(t) (y(t)
4T(t)(t
1))
(8.44)
donde llamamos e(t) = (y(t) 1)). Para obtener P(t) a partir de P(t-1) usamos el teorema de inversin de matrices y se obtiene P(t) =P(t 1) [s(t)
l+4T(t)P(t_1)(t)]
(8.45)
Con todo ello podemos estimar los parmetros de forma recursiva como: (t)
=
1) + P(t)e(t)
(8.46)
8.5.3
El control predictivo basado en modelo utiliza el modelo del sistema obtenido de la identificacin para incorporar el comportamiento futuro en el procedimiento de diseo del controlador. Se parte del modelo CARIMA del sistema, A(qy(t)B(q1)u(t
1) +
(t)
(8.47)
J(N1,N2,N)
E{
(9(t+jt)
l))}
(8.48)
donde E. es la esperanza matemtica, 9(t + jt) es una secuencia de j predicciones de la salida del sistema posteriores al instante t; N1 y N2 son los horizontes de prediccin, N es el horizonte de control y X(j) es una secuencia de ponderacin. En nuestro caso optimizamos este funcional por medio de algoritmos genti cos y as conseguimos una secuencia de control futura u(t), u(t+1),...de modo que la salida y(t+j) se aproxime a la referencia r(t+j). Deseamos hallar los coeficientes del controlador PID que optimizan el funcional anterior, para lo cual necesitamos una expresin que nos d los valores de u(t + j 1) en funcin de los valores de 9(t + jlt) r(t + j) y de los parmetros del PID. La ecuacin del PID ser
u(t)
[K+
+KD(l _z1)]
(8.49)
1208.APLICACIONES
AL CONTROL PREDICTIVO
[K(1 Z)+KI+KD(l
z1)2](r(t 1) y(t1))
(8.50)
= (Kp+KJ+KD) (r(t 1) y(t1)) +(Kp 2KD)(r(t 2) y(t 2)) + (KD)(r(t 3) y(t 3))
(852)
jlt) r(t +
j) y de los coeficientes C1, C2, C3 Por tanto, podemos hallar los coeficientes
C1, C2, C3 que optimizan el funcional y despus hallar los coeficientes del PID correspondiente:
(8.53)
121
:::___H_ ::: vt
Fig. 8.11: Resultados del Control Predictivo con RGO para
=
0.12
La optimizacin gentica restringida (RGO) proporciona un marco unifica dor, muy flexible y natural, sobre el que desarrollar nuevos controladores predictivos.La naturaleza de esto es controladores puede ser muy variada, en particular, haciendo ciertas aproximaciones, se tiene controladores de tipo PID adaptativos. A diferencia de otras tcnicas de optimizacin, la optimizacin gentica restringida hace una gestin sencilla e intuitiva de las ligaduras.
122
Jj 1
Fig. 8.12: Resultadosdel ControlPredictivoconRGO para2 = 0.16
1U L J
Fig. 8.13: Resultadosdel ControlPredictivo RGO para? = 0.20 con
Este mtodo se puede aplicar a cualquier sistema causal, incluyendo a los sistemas no lineales variantes en el tiempo, siempre que las no linealidades no sean demasiado grandes. Como problema, se puede apuntar la complejidad computacional del mto do, lo que impide variar la ley de control muy rpidamente (del orden de 0.1 s).
9. APLICACIONES TRMS 1:
9.1 Introduccin
En este captulo se considera la aplicacin a un sistema real: el Sistema MIMO de Rotores Gemelos (Twin Rotor MIMO System TRMS), que es un laboratorio diseado expresamente para realizar experimentos de control. En ciertos aspectos su comportamiento recuerda al de un helicptero. Desde el punto de vista de control ejemplifica un sistema de orden alto con acoplamientos cruzados muy significativos.
-
Fig. 9.1: Twin Rotor MIMO System (TRMS). El TRMS consiste en un eje pivotado en su bas.e de forma que puede rotar libremente en el plano horizontal y vertical. En las terminaciones de la barra hay dos rotores (el principal y el de cola) dotados con motores de corriente continua. Una barra con contrapeso est fijada al eje en el punto en que pivota. El estado del eje se puede describir por cuatro variables de estado: los ngulos horizontal y vertical medidos por sensores de posicin y dos correspondientes a las velocidades angulares. Dos variables de estado adicionales son las velocidades
124
9. APLICACIONES TRMS 1:
angulares de los rotores, medidas por tacogeneradores acoplados a los motores de continua.
Ot&cfl
pietrns ck tnedida.
En un helicptero normal la fuerza aerodinmica es controlada cambiando el ngulo de ataque. El TRMS est construido de forma que el ngulo de ataque es fijo. La fuerza aerodinmica se controla variando la velocidad de los rotores. Por tanto, las entradas de control son las tensiones suministradas a los motores de continua. Un cambio en el valor de la tensin hace que cambie la velocidad de rotacin lo que hace cambiar la correspondiente posicin de la barra. Sin embargo, se observan acoplamientos cruzados significativos entre las ac ciones de los rotores; cada rotor influencia las dos posiciones angulares. El diseo de controladores de ste sistema deben estar basados en desacoplos. Para el sistema desacoplado, se pueden aplicar entradas de control independientes para cada coordenada del sistema. Se puede utilizar un ordenador PC para el control en tiempo real del TRMS. Para ello se necesita una tarjeta controladora (PCL-812 en nuestro caso).
125
Fig. 9.3: Diagrama de bloques del modelo TRMS. El diagrama de bloques se muestra en la figura. Las tensiones de control Uhy U,son las entradas de los motores de continua que mueven los rotores. El modelo de motor de continua con propulsor se compone de un sistema con dinmica lineal seguido de una no linealidad esttica. La parte lineal tiene forma de funcin de transferencia de primer orden Gh = ThS+ 1 y G = Ts+ 1 Las funciones no lineales h(Uh) y v(U) son las caractersticas estticas de los motores de continua con propulsores. La tensin de entrada est limitada al rango de 10v. Las relaciones no lineales entre la velocidad de los rotores y la fuerza aerodinmica resultante puede ser aproximada por las relaciones cuadrticas: Fh = sign(oh)ko yF = sign(o)ko (kh y k constantes positivas).
126
APLICACIONES TRMS 1: 9.
Es importante tener en cuenta que la forma geomtrica de los propulsores, no es simtrica, y por lo tanto el comportamiento en una direccin de diferente del correspondiente a la otra direccin.
J Smboloj
ah h
Uh Gh h
0h
Fh
1h
Significado posicin horizontal del eje del TRMS (azimut position) velocidad angular del eje del TRMS (azimut velocity) entrada de control (tensin) del motor horizontal funcin de transferencia lineal del motor y rotor de cola parte no-lineal del motor y rotor de cola: h(Uh) = 0h velocidad de rotacin del rotor de cola funcin no-lineal (cuadrtica) de fuerza aerodinmica del rotor de cola: Fh = Fh(COh) brazo efectivo de la fuerzaaerodinmica del rotor de cola:
=
lh(aV)
[m]
Jh Mh K
fh
a ) U, G V
0v
F
.
l J M K
f f
funcin no-lineal del momento de inercia respecto al eje vertical: Jh = Jh(a) [kgm2] par de giro horizontal [Nm] momento angular horizontal [Nms] momento de la fuerza de friccin del eje vertical [NmJ posicin vertical del eje del TRMS (pitch position) [rad] velocidad angular del eje del TRMS (pitch velocity) [rad/s] entrada de control (tensin) del motor vertical [V} funcin de transferencia lineal del motor y rotor principal parte no-lineal del motor y rotor principal: h(U) = [rad/s] velocidad de rotacin del rotor principal [rad/s] funcin no-lineal (cuadrtica) de fuerza aerodinmica del rotor principal: F = F(o) [N] brazo -efectivode la fuerza aerodinmica del rotor principal [mi momento de inercia respecto al eje horizontal [kgm2] par de giro vertical [Nm] momento angular vertical [NmsJ momento de la fuerza de friccin del eje horizontal [Nm} par de fuerzas vertical del contrapeso: f = f(a) [Nm] contina en la pginasiguient]
127
viene de la pginaanterior Unidades Smb. Significado [Nms] momento angular vertical del rotor de cola hv [Nms] momento angular horizontal del rotor principal lvii funcin no-lineal (cuadrtica) del par de giro de reaccin: vh
vh hv t
=
II
.
gvh(o)v)
[Nm1
[Nm] [s]
l/s
La rotacin del propulsor produce un momento angular que, de acuerdo con la ley de conservacin del momento angular, puede ser compensada por las partes restantes del TRMS. Esto hace que exista una interaccin entre las dos funciones de transferencia, representadas por el momento de inercia de los motores con propulsores Jhv y Jvh. Esta interaccin influencia directamente a las velocidades de los ejes en ambos planos. Los pares de fuerza que actan son las fuerzas Fh y F multiplicadas por la longitud del brazo l (uy) y ls,. Controlar el sistema consiste en estabilizar el eje del TRMS en una posicin arbitraria deseada (pitch y azimut), dentro de unos lmites prcticos, o bien, hacer que siga una trayectoria deseada.
128
9. APLICACIONES 1: TRMS
Fig. 9.4: Respuesta del rotor principal del TRMS a una onda cuadrada.
9.4.1
La tarea de control de estabilizacin en un grado de libertad (1 DOF) consiste en mover el TRMS a una posicin arbitraria en el plano seleccionado y estabili zarlo en esa posicin. El seguimiento consiste en que los movimientos del TRMS sigan la seal de referencia lo mas fielmente posible. Para comenzar restringimos nuestro objetivo de control a la estabilizacin y seguimiento del sistema en el plano vertical solamente. El correspondiente dia grama de bloques del control PID del sistema se muestra en la figura 9.6.
avd PDvy ________ SISTEMA
_______
Fig. 9.5: Control del sistema 1-DOF (estabilizacin y seguimiento en vertical). Arriba: salida vs. seal de referencia. Abajo: error cometido.
129
El diagrama de bloques siguientes muestra el sistema de una forma ms deta llada. Ntese que slo se considera la parte vertical del sistema de control.
Fh
,Fh.a
h
1IJ 1/s-
MoDCcOn/
.Jhv
MotDCCCfly
.a
o-
rI.-,-.
c.-.a)
Fig. 9.7: Control del sistema 1-DOF(estabilizacin seguimientoen vertical). y Arriba: salidadel sistema vs. seal de referencia.Abajo: error cometi
lo.
130
APLICACIONES TRMS 1: 9.
ah
Fig.
9.8:
Control
del
sistema
1 -DOF
(estabilizacin
seguimiento
horizontal).
El tallada.
diagrama Ntese
de que
bloques slo se
siguientes considera
muestra la parte
el
sistema
de del
una sistema
forma de
ms control.
de
horizontal
MotoDCco,,1 H9Y.
.L.:..
Fig.
9.9:
Diagrama
de
bloques
del
sistema
1-DOF
(plano
horizontal).
9.4.3
Estabilizacin
seguimiento
2-DOF.
La no planos. est
tarea bloqueado
en
este
caso
es
la
misma y
que por
en tanto
las
pero
el en
TRMS ambos
mecnicamente,
13
a
Ch __ __v PID simple Uy
LJh-
Fig.
9.11:
Control
del
sistema
2-DOE
9.4.4
Controlador
PID
con
acoplamiento
cruzado
El nos
cotrolador y
PID vertical.
con
cruzado de
controla control la
el
sistema
en de
los un
pla rotor
horizontal
influencia
132
9. APLICACIONES TRMS 1:
o.-.
00
00
00 1
00 1
a-o 1
00 i
o..
00
00
r1.-.-.
(00,-,a)
Fig. 9.12: Experimento con el controladorde estabilizaciny seguimiento 2-DOF PID. Arriba: salida del sistema vs. seal de referencia en eje vertical. Abajo: error cometido
0-a
00
00
1 (0o)
a r,.-,-.
(oor)
Fig. 9.13: Experimento con el controladorde estabilizaciny seguimiento 2-DOF PID. Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido
-
sobre el movimiento en el otro piano puede ser compensada por la estructura de acoplamiento cruzado del controlador.
9.5.CONTROLPREDICTIVOMEDIANTEPID YRGO133
a,,
Fig. 9.14: Diagrama de bloques del sistema de control 2-DOF PID de acopla miento cruzado.
Fig. 9.15:.Experimento con el controladorde estabilizaciny seguimiento 2-DOF PID con acoplamiento cruzado. Arriba: salida del sistema vs. seal de referencia en eje vertical. Abajo: error cometido
9.5
El control predictivo basado en modelo utiliza el modelo del sistema obtenido de la identificacin para incorporar el comportamiento futuro en el procedimiento de diseo del controlador. Se parte del modelo CARIIvIAdel sistema, A(q1y(t)B(q1)u(t -1) +
(t)
(9.1)
(9(t+jIt)r(t+j))2+(Lu(t+f1))}
j=N1 j=1
(9.2)
134
9. APLICACIONES 1: TRMS
.i.
.--,.-.-.
Fig. 9.16: Experimento con el controladorde estabilizaciny seguimiento 2-DOF PID con acoplamiento cruzado. Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido. donde E. es la esperanza matemtica, 9(t + jt) es una secuencia de j predicciones de la salida del sistema posteriores al instante t; N1 y N2 son los horizontes de prediccin, N es el horizonte de control y X(j) es una secuencia de ponderacin. En nuestro caso optimizamos este funcional por medio de algoritmos genti cos y as conseguimos una secuencia de control futura u(t), u(t+l),...de modo que la salida y(t+j) se aproxime a la referencia r(t+j). Deseamos hallar los coeficientes del controlador PID que optimizan el funcional anterior, para lo cual necesitamos una expresin que nos d los valores de u(t + j 1) en funcin de los valores de 9(t + jt) r(t + j) y de los parmetros del PID. La ecuacin del PID ser
u(t)
[K+ K1
+KD(l _z1)]
(9.3)
por tanto
LtU(t)
=
[K(1 Z1)+Kj+K(l
z)2](r(t
1) y(t 1))
(9.4)
/.u(t)
(Kp+KI+KD)(r(t 1) y(t1)) +(Kp 2KD)(r(t 2) y(t 2)) + (KD)(r(t 3) y(t 3)) (9.5)
=
Lu(t)=Ci(y(t1)r(t1))+C2(y(t2)r(t2))+C3(y(t3)r(t_3)) (9.6)
135
De esta manera, el funcional queda en funcin de los valores (t + jt) r(t + y de los coeficientes C1, C2, C3 Por tanto, podemos hallar los coeficientes C1, C2, C3 que optimizan el funcional y despus hallar los coeficientes del PID correspondiente:
j)
(9.7)
J(Ni,N2)
E{
j=N1
(j)[9(t+jIt)
r(t+j)]2+
7(j)[iu(t+N
j=1
1)]2}
(9.8)
136
9. APLICACIONES 1: TRMS
Fig. 9.18: Control del sistema con RGO-PID y RGO Predictivo. de un modo directo, utilizando la Optimizacin Gentica Restringida, obtenin dose los coeficientes ly y ir de la expresin
N Nd
u(i)
k=d
lyky(ik)+
lrkr(ik).
k=1
(9.9)
Lo cual significa que podemos calcular el valor de la entrada del sistema con poco coste computacional.
o. a
0.1
o.,
0 0.0
.a
.4
(000)
Fig. 9.19: Experimento con el controlador de estabilizacin y seguimiento: con trol predictivo-RGO en el plano vertical (con un grado de libertad). Arriba: salida del sistema vs. seal de referencia en eje vertical. Aba jo: error cometido.
137
os
00
100
1 00
-.ao
1 00
0_e o .a
L/rAJkffff1kJ
.a0 00 00
r,.-.-,e
(a0)
1 00
1 00
Fig. 9.20: Experimento con el controladorde estabilizacin y seguimiento: PID RGO (arriba) en el plano vertical (con un grado de libertad). Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo error cometido.
0 1
o.a
o.
00
aa
000
r11
(0ar.0)
Fig. 9.21: Experimento con el controlador de estabilizacin: Predictivo-RGO con dos grados de libertad. Arriba: salida del sistema vs. seal de referen cia en eje vertical. Abajo: error cometido.
138
9. APLICACIONES TRMS 1:
o.
-=
o.
r,.-.-.
O.
o. e
o
o-
o o
O -
o-o o .s o -4-o so
TV
so
rin,e (seosnO)
tjo 1
Fig. 9.22: Experimento con el controlador de estabilizacin: PID-RGO con dos grados de libertad. Arriba: salida del sistema vs. seal de referencia en eje horizontal. Abajo: error cometido.
1 0.8 0.6 0.4 0.2
o
0.2 0.4 0.6 0.8 0 20 40 60 (eecorld) 80 100 120
Time
Fig. 9.23: Experimento con el controlador de estabilizain (seales de control: control predictivo y PID).
Existen, por tanto, dos bucles: uno lento que nos va actualizando los coefi cientes de la seal de entrada u, y un bucle rpido que calcula la seal entrada. de De esta manera se evita el tener que resolver el sistema Mu = qRy + qRw todas las veces, con lo que se gana en velocidad.
139
Esto nos permite hacer uso de modelos y de ligaduras altamente no lineales, y de funciones objetivo no cuadrticas, por lo que resultan ms potentes y flexibles que los convencionales. Para poder hacer frente a unas condiciones cambiantes, la etapa de optimiza cin ha de ser resuelta en tiempo real.
da/dt
140
APLICACIONESI:TRMS 9.
una nueva lectura de la entrada y la salida del sistema. De esta manera conseguimos un conjunto de aproximaciones sucesivas a me jores modelos en caso de el sistema sea invariante en el tiempo y si el sistema es variable, pero de variacin lo suficientemente lenta, entonces el modelo va si guiendo al sistema en sus variaciones.
141
9iIErn
lambda
142
9. APLICACIONES TRMS 1:
II Plano Horizontal II
0.5520 1.0326 1.0206 0.2145 0.2181 0.2212
10.1
Cuando el estado de un sistema tiene que ser estimado a partir de informacin sensorial con ruido, se necesita emplear algn tipo de estimador de estados para fusionar los datos de los diferentes sensores para producir una estimacin preci sa del verdadero estado del sistema. Si la dinmica del sistema y el modelo de observacin son lineales, entonces el estimador de mnimos cuadrados puede ser calculado usando el filt ro de Kaiman. Cuando esto no es posible es necesario uti lizar un filtro extendido, como por ejemplo el Filtro Iterado de Kalman [ver cap. 6 para ms detalles].
10.2
Los algoritmos genticos son un proceso probabilstico de bsqueda basado en la seleccin natural y en las leyes genticas. La poblacin 9 = (9i 92, E
144
es modificada de acuerdo con los procesos evolutivos naturales: despus de la inicializacin, son ejecutados la seleccin w : jA jN, cruce : jN jN y mutacin : jN jN recursivamente en un bucle. Cada ejecucin del bucle es llamada generacin y 9 representa la poblacin en la generacin t. El operador de seleccin tiene como fin mejorar la calidad media de la pobl cin dando a los individuos de mayor calidad una alta probabilidad de ser copiados en la nueva generacin. La seleccin, por lo tanto, enfoca la bsqueda hacia regio nes prometedoras del espacio de bsqueda. La calidad de un individuo es medida por la funcin de salud f: J + R, donde J representa el espacio de todos los posibles individuos. Los algoritmos genticos se utilizan usualmente como mtodo de optimiza cin global de funciones invariantes en el tiempo, y usualmente se ejecutan off line. Sin embargo, la seleccin natural de los seres vivos es un proceso local o semi local en el que las especies se adaptan por s mismas al entorno, que a su vez es dependiente del tiempo (es on une). Es posible adaptar el mtodo de algoritmos genticos si se restringe la bs
10.2. LOCALIZACIN DEL ROBOTMVILUTILIZANDO FILTRORGO UN NO-LINEAL queda a un entorno de la estimacin previa usandocomo funcin de salud: f: B((klk 1),) IR, with = IIP(klk 1)11,
+
1O-8+v(kk1)) and
(10.1)
p(x(k)IZk) = p(x(k)Iz(k),Z1) =
!p(z(k) Ix(k))p(x(kZ1)) = N(z(k);h(k,x(k))R(k))N(x(k);(kIk(10.3)
1),P(kk1)).
Maximizar la funcin anterior es equivalente a calcular una estimacin maxi mum a posteriori (MAP). Esto es tambin equivalente a minimizar V(x(k)) ,i.e. maximizar la funcin de salud f(J). La funcin de salud estndar (i.e. dividida por la suma de las saludes) es una aproximacin de la funcin de densidad condicional (PDF). p ( x (k)Z)
p(z(k)x(k))p(x(k)Z) fp(z(k)Ix(k))p(x(k)lZ1)
(104)
De todo lo anterior queda claro que es posible calcular precisamente las no linealidades de las funciones f y g, sin embargo la introduccin de la hiptesis de ruido gaussiano no se puede evitar. Para determinar el radio de la zona de bsqueda, usamos la distancia de Mahalanobis
1) (k 11k1))
(10.5)
10.2.1 Consideracionesdiseo de
La arquitectura del vehculo est basada en una arquitectura hbrida (AFREB) con un amplio rango de metodologas reactivas de control. La arquitectura AFREB
146
consiste en los siguientes mdlos: supervisor de fusin, primitivas de compor tamiento y ejecutor. La funcin del mdulo supervisor de fusin es el clculo del peso asignado a cada primitiva de comportamiento. La funcin del mdulo ejecutor es el calculo de las ordenes dadas al robot basadas en los pesos de las pri mitivas de comportamiento. Las entradas estndar del ejecutor son la velocidad y y la curvatura co. La primitiva de comportamiento puede ser caracterizada por una secuencia temporal de valores apropiados para y y coque causan que el robot exhiba una primitiva de comportamiento pre-especificada.
(10.6)
con todos los valores guardados en forma decimal. Un conjunto de posiciones vlidas aleatorias es creado como generacin inicial alrededor de la solucin dada por el filtro extendido de Kaiman. Para resolver el problema, definimos un cromo soma con una longitud de 11 bits y poblaciones con un tamao de 250 individuos. Despus de que una nueva generacin ha sido creada, calculamos la funcin de salud de cada individuo (posicin).Definir funciones de salud apropiadas es vital para conseguir buenos rendimientos en la optimizacin
Marcas de Referencia: g
=
k-e 1pan
ob 2 pan
9k-e
(10.7)
donde g es el coste de la posicin correspondiente a la l-sima cadena de la k-sima generacin, an son los ngulos estimados entre el robot
10.2. LOCALIZACIN DEL ROBOTMVILUTILIZANDO FILTRORGO UN NO-LINEAL y la marca de referencia de la l-sima posicin en la poblacin en la k-sima generacin, respectivamente.
oke 1pan
arcsin
YaPy
/
Px) 1Yg
Py
ake
arcan
PzZa 2
V (Xa Px) + (Ya py) donde (px,py,pz) es la posicin de la marca de referencia y (Xa,ya,Za) es la posicin de la plataforma pan-tilt. La deteccin normalizada en escala de grises se utiliza para la deteccin de marcas. La operacin de correla cin puede ser vista como una forma de convolucin donde el encaje con el modelo patrn es anlogo con el kernel de la convolucin:
i=Nj=N
r(x,y) =I(x,y)oM(x,Y) =
L L M*(i,j)J(x+i,y+j)
(10.10)
i=O j=O
es decir, cada resultado de N pixels del modelo M(x, y) es multiplicado por los N pixels de la imagen base I(x,y), y todos estos productos son sumados. Finalmente el resultado es convertido en porcentaje, donde 100% significa que encaja perfectamente:
score=max(r,O)2* 100%
(10.11)
Para separar los resultados correlacin de la normalizadaconsidera se un umbral de aceptacin. Si la correspondencia entre la imagen y el modelo es menor que este nivelno se considera. Los ngulos pan y tilt de la cmara respecto de la marca de referencia son:
ob 9pan
=
arctan (u)
arctan d(v
C)
(10.13
donde f esladistancia (u, esel focal, v) centro lamarca referencia, de de (Cx,C) eselcentro laimagen de y d) eseltamao celda. de
148
1
Dob)2
(10.14)
donde g es el coste de la posicin correspondiente a la l-sima cadena de la k-sima generacin. DI es la distancia estimada entre el sonar y el segmento de la l-sima generacin, respectivamente.
Jke(i)
1s
1 (cose+sinetan9)
(Y Yr)tan8
XrX
(10.15) donde (Xr, Yr, Or) es la posicin y orientacin del vehculo, (X, 17,8) es la posi cin y orientacin del segmento observado y 8_ el ngulo del sensor.
En las tablas 10.1 y 10.2 se muestra la evolucin del error de posicin y orien tacin del vehculo, al introducir en el sistema errores respectivos de 20 cm y 10 deg. En las tablas 10.3 y 10.4 se han introducido simultneamente errores de posi cin y ngulo.
149
Nm. generaciones 2agen. 3agen. 4agen. Con RGO -2.6 1.8 0.2 -3.9 2.6 -2 Sin RGO
ConRGO SinRGO
En las tablas anteriores, se pone de manifiesto la mejora que produce la im plantacin del mtodo descrito en el proceso de localizacin. El principal incon veniente radica en el elevado tiempo de ciclo que requiere para su ejecucin, del orden de 15 veces el necesario para el mtodo de la proyeccin.
150
En esta tesis se ha desarrollado un nuevo mtodo Optimizacin Gentica Res tringida (RGO) y las ventajas de su utilizacin en la identificacin de sistemas no lineales, en la estimacin de estados (Filtro de Kaiman extendido), en el diseo de controladores adaptativos y aplicaciones a la relocalizacin de Robots mviles..
152
Estos controladores han demostrado su vala al ser aplicados al control del TRMS (Twin Rotor MIMO System)[cap 9], que es un laboratorio diseado ex presamente para realizar experimentos de control y en ciertos aspectos su com portamiento recuerda el de un helicptero. Desde el punto de vista de control ejemplifica un sistema de orden alto con acoplamientos cruzados muy significati vos: En el
BIBLIOGRAFA
[1] H. Akaike. A new look at the statistical model identification. JEEE Tran sactions on Automatic Control, AC-19:716723, 1974. [2] H. Akaike. Markovian representation of sthocastic processes by canonical variables. SIAM Journal of Control and Optimization, 13:162173, 1975. [3] J. M. Armingol. Localizacin Geomtrica de Robots Mviles Autnomos. PhD thesis, Univ. Carlos UI, Madrid, Spain, 1997. [4] J. M. Armingol, L. E. Moreno, S. Garrido, A. de la Escalera, and M. A. Salichs. Mobile robot localizatio using a non-linear evolutionary filter. In 3rd IFAC Symp. on Intelligent Autonomous Vehicles (IAV98).IFAC, 1998. [5] K. strim and T. Wigglund. PID Controllers: Theory, Design and Tun ning. Instrument Society of America, Research Triangle Park, N. C., 1995. [6] K. J. strom. Maxmum likelihood and prediction error methods. Automa tica, 16:551574, 1980. [7] K. J. strim and B. Wittenmark. Computer Controlled Systems. Prentice Hall, Englewood Cliffs, New Jersey, 1984. [8] K. J. strm and B. Wittenmark. Adaptive Control. Addison-Wesley, Rea ding, Massachusetts, 1995. [9] Y. Bar-Shalom and T.E. Fortmann. Tracking and Data Association. The Academic Press, London, 1988. [10] Y. Bar-Shalom and Xiao-Rong. Estimation and Tracking. Artech House, 1993. [11] C. Bordns. Control Predictivo Generalizado de Procesos Industriales: Formulaciones Aproximadas. PhD thesis, ETSII, Univ. de Sevilla, Spain, 1994.
154
[12] G. E. P. Box and D. R. Jenkins. 1me Series Analysis, Forecasting and Control. Holden-Day, San Francisco, 1980. [13] E. F. Camacho and C. Bordns. Model Predictive Control in the Process Industry. Springer-Verlag,Berlin, 1995. [14] C. Canudas. Adaptive ControlforPartially Known Systems. Elsevier, Ams terdam, 1988. [15] R. J. Carroll and D. Ruppert. Transformation and Weighting in Regression. Chapman and Hall, New York, 1988. [16] A. Chipperfield and P. Fieming. Genetic algorithms in control systems engineering. Control and Computers, 23(3):8894,1995. [17] C. T. Chou. Geometry of Linear Systems and Identijication. PhD thesis, Trinity College, Cambridge, England, 1994. [181 D. W. Clarke, C. Mohtadi, and P. S. Tuffs. Generalized Predictive Control: Part 1. The Basic Algorithm. Automatica, 23(2):137148,1987. [19] D. W. Clarke, C. Mohtadi, and P. S. Tuffs. Generalized Predictive Control: Part IT.Extensions and Interpretations. Automatica, 23(2):149160,1987. [20] A. Corana, M. Marchesi, C. Martini, and S. Ridella. Minimizing multimo dal functions of continuous variables with the simulated anneling algorit hm. ACM Trans. on Mathematical Software, 13(3), 1987. [21] L. Davis. Handbook of Genetic Algorithms. Van Nostrand Reinhold, 1991. [22] A. Prez de Madrid. Aplicacin de Las Tcnicas de Programacin Din mica al Control Predictivo Basado En Modelos. PhD thesis, Facultad de Ciencias, UNED, Madrid, Spain, 1995. [23] P. M. J. Van den Hof and R. J. P. Schrama. Identification and control closed-loop issues. Automatica, 31(12):17511770, 1995.
[24] J. E. Dennis and R. B. Schnabel. Numerical Methodsfor Unconstrained Ojitimization and Nonlinear Equations. Prentice-Hall, Englewood Cliffs, New Jersey, 1983.
Bibliografa
[25] S. J. Flockton and M. J. White. Pole-zero system identification using ge netic algorithms. In Proceedings 5th International Conference QnGenetic Algorithms, pages 531535.University of Illinois at Urbana Champaign, USA, 17-21 July 1993. [26] U. Forseli and L. Ljung. Closed-Loop Identification Revisited. Technical report, Linkiping University, Linkping, Sweden, 1997. [27] U. Forssell. Closed-loop Identfication. PhD thesis, Linkbping University, Linkping, Sweden, 1999. [28] U. Forssell and L. Ljung. Issues in closed-loop identification. Technical report, Linidiping University, Linkc5ping, Sweden, 1998. [29] 5. Garrido, L. E. Moreno, and C. Balaguer. State estimation for nonhinear systems using restricted genetic optimization. In 11th International Confe rence QnIndustrial and Engineering Applications of Artificial intelligence and Expert Systems. lEA-AlE, 1998. [30] 5. Garrido, L. E. Moreno, and M. A. Salichs. Nonlinear on-line identifi cation of dynamic systems with restricted genetic optimization. In 6th Eu ropean Congress Qn Intelligent Techniques and Soft Computing, Aachen, Germany, 1998. EUFIT. [31] 5. Garrido, L. E. Moreno, and M. A. Salichs. Identification of state space modeis with rgo. In 7th European Congress QnIntelligent Techniques and Soft Computing, Aachen, Germany, 1999. EUFIT. [32] P. J. Gawthrop. Parametric identification of transient signais. IMA Journal of Mathematical Control and Information, 1:117128, 1984. [33] W. Gesing and E.J. Davison. An exact penalty function algorithm for solving general constrained parameter optimization problem. Automatica, 15:175188,1979. [34] M. Gevers. Towards a joint design of identification and control. In H. L. Trentelman and J. C. Wihiems,editors, Essays on Control: Perspectives in the Theory and its applications, pages 111151. Birkhiuser, 1993. [35] D. Goldberg. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley,Reading, MA, 1993.
156
[36] G. H. Golub and C. F. Van Loan. Matrix Computations. The John Hopkins University Press, Baltimore, Maryland, 1989. [37] G. C. Goodwin and K. S. Sin. Adaptive Filtering, Prediction and Control. Prentice-Hall, Englewood Cliffs, N. J., 1984. [38] G. J. Gray and D. J. Murray-Smith. Nonlinear model structure identifica tion using genetic programming. Control Eng. Practice, 6(11): 13411353, 1999. [39] U. Grenander. Abstract Inference. Wiley, New York, 1981. [40] 1. Gujon and P. Albrecht. A time delay neural network character recognizer for touch terminal. Technical report, ATT Beil Laboratories, 1990. [41] 1. Gustafsson, L. Ljung, and T. Siderstrom. Identification of processes in closed loop identifiability and accuracy aspects. Automatica, 13:5975, 1977.
[42] R. L. Haupt and S. E. Haupt. Practical Genetic Algorithms. Wiley Interscience, New York, 1998. [43] J. Hertz, A. Krogh, and R. Palmer. Introduction to the Theory of Neural Computation. Addison-Wesley, 350 Bridge Parkway, Redwood City, CA 94065, 1991. [44] J. H. Holland. Adaptation in Natural and Artificial Systems. The University of Michigan Press, Ann Arbor, 1975. [45] J. J. Hopfield and D. W. Tank. Neural computation of decisions in optimi zations problems. Biol. Cybern, 1986. [46] T. C. Hsia. System Identiflcation: Least Squares method. Lexington Books, 1977. [47] K. Hunt, D. Sbarbaro, R. Zbikowski, and P. Gathrop. Neural networks for control systems a survey. Automatica, 28(6): 10831112, 1992.
-
[48] H. Hyc5tyniemi. Regularization of parameter estimation. In l3th IFAC World Congress, San Francisco, California, 1996. [49] H. Hyityniemi. On Structural Identifiability of Dynamic Modeis. Technical report, Helsinki University of Technology, Helsinki, Finland, 1998.
Bibliografa
[50] H. Iba, H. deGaris, and T. Sato. A numerical approach to genetic program ming for system identification. Evolutionary Computation, 28(6): 1083 1112, 1995. [511 R. Isermann. Practical aspects of process identification. Automatica, 16:575587, 1980. [52] R. Isermann. Digital Control Systems. Volume 1. Fundamentais, Determi nistic Control. Springer-Verlag,Berlin, 1989. [53] R. Isermann. Digital Control Systems. VolumeII. Sthocastic Control, Multi variable Control, Adaptive Control, Applications. Springer-Verlag, Berlin, 1989. [54] R. Isermann, K.H. Lachmann, and D. Matko. Adaptive Control Systems. Prentice-Hall International, Hemel Hempstead, UK, 1992. [55] R. Johansson. System Modeling and Identification. Prentice-Hall, Engle wood Cliffs, New Jersey, 1992. [56] C. R. Johnson. Admissibility in blind adaptive channel equalization. IEEE Control Systems Magazine, 1991. [57] A. Juditsky, H. Hjalmarsson, A. Benveniste, B. Delyon, L. Ljung, J. Sjo berg, and Q.Zhang. Nonlinear black-box models in system identification: Mathematical foundations. Automatica, 12(31):17251750,1995. [58] 5. J. Julier, J. K. Uhlmann, andII. F. Durrant-Whyte. A new approach for filtering nonlinear systems. a new approach for the nonlinear transforma tion of means and covariances in linear filters. IEEE Trans. on Automatic Control, 1996. [59] P. T. Kabamba. Balanced forms: Canonicity and parametrization. IEEE Trans. QnAutomatic Control, 30(11): 11061109, 1985. [60] T. Kailath. Linear Systems. Prentice-Hall, Englewood Cliffs, New Jersey, 1980. [61] R. E. Kalman. Identifiability and modelling in econometrics. In P. R. Kris naiah, editor, Developments in Statistics, volume 4. Academic Press, Lon don, 1983.
158
[62] R. E. Kaiman and R. S. Bucy. New results in linear filtering and prediction theory. J. Basic Eng. ASME, Series D:95108, 1961. [63] G. Kitagawa. Non-gaussian state-space modeling of nonstationary time se ries. Journal of the American Statistical Association, 82:10321063, 1987. [64] K. Kristinson and G. Dumont. System identification and control using ge netic algorithms. IEEE Transactions on Systems, Man, and Cybernetics, 22(5): 10331046, 1992. [65] 5. Kung. Digital Neural Networks. Prentice-Hall, Englewoods Cliffs, New Jersey, 1993. [66] C. Ledoux. Identification of SISO Nonlinear Wiener Systems. Technical report, Linkoping University, Linkc5ping,Sweden, 1996. [67] W. 5. Lee, B. D. O. Anderson, 1. M. Y. Mareels, and R. L. Kosut. On sorne key issues in the windsurfer approach to adaptive robust control. Automa tica, 31(11):16191636, 1995. [68] L. Ljung. System Identification Toolbox Users Guide. The Mathworks, 1986.
-
[69] L. Ljung. System Identification: Theoryfor the User. Prentice-Hall, En glewood Cliffs, N. J., 1987. [70] L. Ljung. Identification for Control What Is There To Learn? Technical report, Linkdping University,Linkoping, Sweden, 1998.
-
[71] L. Ljung and 5. Gunnarsson. Adaptation and tracking in system identifica tion a survey. Automatica, 26:721, 1990.
-
[72] L. Ljung and T. McKelvey. A Least Squares Interpretation of Sub-Space Methods for System Identification. Technical report, Linkping University, Linkoping, Sweden, 1996. [73] L. Ljung, Sjoberg, and T. McKelvey. On the Use of Regularization in System Identification. Technical report, Linkdping University, Linkoping, Sweden, 1992. [74] L. Ljung and T. Siderstrom. Theory and Practice of Recursive Identifica tion. MIT Press, Cambridge, Massachusetts, 1983.
Bibliografa
[75] W..Luo and S. A. Billings. Adaptive model selection and estimation for nonhinear systems using a sliding data window. Signal Processing, 46:179 202, 1995. [76] J. M. Maciejowski. Balanced realizations in system identification. In 7th IFAC Symposium on Identification and parameter Estimation, York, UK, 1985. [77] J. M. Maciejowski. Multivariable FeedbackDesign. Addison-Wesley,Wo kingham, England, 1989. [78] P. S. Maybeck. Stochastic modeis, Estimation, and Control. Academic Press, London, 1982. [79] P. McCullagh and J. A. Nelder. Generalized Linear Modeis. Chapman and Hall, New York, 1989. [80] T. McKelvey. Identification of State-Space Models from Time and Frez quency Data. PhD thesis, Linkdping University,L.ink5ping, Sweden, 1995. [81] Z. Michalewicz. Genetic Algorithms + Data Structures grams. Al Series. Springer Verlag, New-York, 1994.
=
Evolution Pro
[82] B. C. Moore. Principal component analisys in linear systems: Controhlabi lity, observability, and model reduction. IEEE Trans. on Automatic Control, 26(1):1732, 1981. [83] K.arendra and K. Parthasarathy. Identification and control of dynamical systems using neural networks. IEEE Trans. Neural Networks, 1:427, 1990. [84] K.arendra and K. Parthasarathy. Gradient methods for the optimization of dynamical systems containing neural networks. IEEE Trans on Neural Networks, 2(2):252262,1991. [85] J. P. Norton. An Introduction to Identification. Academic Press, London, 1986. [86] R. J. Ober. Balanced realizations: Canonical form, parametrization, model reduction. mt.J. Control, 46(2):643670,1987. [87] M. Ouladsine, F. Bicking, and G. Bloch. Identification of constrained dy namic systems by genetic type algorithm. In IFACArtificial Intelligence in Real-Time Control, Biend, Slovenia, 1995.
160
[88] A. J. M. Van Overbeek and L. Ljung. On-line structure selection for multi variable state space modeis. Automatica, 18(5):529543, 1992. [89] P. Poddarand K. P. Unnikrishnan. Memoryneuron networks: a prolegome
non. TechnicailReport GMR-7493, G. M. Research Laboratories, Warren, Michigan, 1991. [90] E. Polak and D. Q. Mayne. An algorithm for optimization problems with functional inequality constraints. IEEE Trans. on Automatic Control, 21:184193, 1976. [91] B. Porter and A. H. Jones. Genetic tunning of digital pid controllers. Elec tronic Letters, 28:843844, 1992. [92] X. Qi andF. Palmieri.Theoreticalanalysisof evolutionary algorithmswith an infinite population size in continuous space. part i: Basic properties of selection and mutation. IEEE Trans. QnNeural Networks, 5(1):102119, 1994. [93] X. Qi and F. Palmieri. Theoretical analysis of evolutionary algorithms with an infinite population size in continuous space. part u: Analysis of the di versification role of crossover. IEEE Trans. QnNeural Networks, 5(1):120 129, 1994. [94] D. E. Rumelhart, G. E. Hinton, and R. J. Williams. Parallel Distributed Processing, volume 1, chapter Learning internal representations by error backpropagation, pages 318362. MIT Press, 1986. [95] J. Sjoberg, H. Hjalmarsson, and L. Ljung. Neural Networks in System Identification. Technical report, Linkoping University, Linkping, Sweden, 1996. [96] J. Sjiberg, Q.Zhang, and L. Ljung. Nonlinear black-box modeling in sys tem identification: a unified overview.Automatica, 3 1:16911724, 1995. [97] T. SMerstrrn and P. Stoica. System Identification. Prentice-Hall Interna tional, Hemel Hempstead, Hertfordshire, 1989. [98] E. Sontag. Essays on Control: Perspectives in the Theory and its Appli cations, volume 14 of Progress in Systems and Control Theory, chapter Neural Networks for control, pages 339380.Birkhaser, 1990.
Bibliografa
[99] K. C. Tan, Y. Li, D. J. Murray-Smith, and K. C. Sharman. System identifi cation andlinearization using genetic algorithms with simulated annealing. In Proc. lst IEE/IEEE International Conference QnGenetic Algorithms in Engineering Systems: Innovations andApplications, Sheffield, UK., 1995. [100] H. Tanizaki. Nonlinear Filters. Springer, Berlin, 1996. [101] H. Tanizaki and R. 5. Mariano. Nonhinear filters based on taylor series expansions. Communications in Statistics, Theory and Methods, 25(6), 1996. [102] R. Valverde. Control de Sistemas mediante Redes Neuronales. Aprendizaje por Refuerzo. PhD thesis, Univ. Carlos III, Madrid, Spain, 1999. [103] P.E. Wellstead and M.B. Zarrop. Selftunning Systems: Control and Signal Processing. John Wiley and Sons, Chichester, U.K., 1991. [104] P. J. Werbos. Back propagation through time: What it does, how do it. Proceedings IEEE, 1990. [105] D. White and D. Sofge, editors. Handbook of Intelligent Control, Neural, Fuzzy, and Adaptive Approaches. Multiscience Press, Inc., Van Nostrand Reinhoid, 115 Fifth Avenue, New York, NY 10003, 1992. [106] R. P. Wishner, J. A. Tabaczynski, and M. Athans. A comparison of three non-linear filters. Automatica, 5:487496,1989. [107] Z. Yang, T. Hachino, and T. Tsuji. Qn-une identification of continuous time delay systems combining least squares techniques with genetic algorithms. mt. J. Control, 66(1):2342,1996. [108] D. Yuret. From Genetic Algorithms to Efficient Optimization. Technical report, MIT, Cambridge, Massachusetts, 1996. [109] L. A. Zadeh. From circuit theory to system theory. In Proc. IRE 50, pages 856865,1962.