Tesis Doctorado Quintero Final

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 311

MINISTERIO DE CULTURA Y EDUCACIÓN

Universidad Nacional de San Juan


FACULTAD DE INGENIERÍA

Tesis Doctoral de:

Olga Lucía Quintero Montoya


Aprobada por la
Facultad de Ingeniería de la Universidad Nacional de San Juan
Para el otorgamiento del grado académico del grado académico de

DOCTOR EN INGENIERÍA
FILTROS DE PARTÍCULAS EN SISTEMAS
DINÁMICOS NO LINEALES NO
GAUSSIANOS:
IDENTIFICACIÓN, ESTIMACIÓN DE
ESTADOS Y APLICACIONES

Tesis Doctoral de:


Olga Lucía Quintero Montoya

Aprobada por la
Facultad de Ingeniería de la Universidad Nacional de San Juan
Para el otorgamiento del grado académico del grado académico de

DOCTOR EN INGENIERÍA

Dirección de Tesis: Dr. Ing. Fernando di Sciascio


Jurado de Tesis: Dr. Ing. Fernando di Sciascio
Jurado de Tesis: Dr. Ing. Eliete María de Oliveira Caldeira

Fecha de la defensa oral: Diciembre 21 de 2009


FILTROS DE PARTÍCULAS EN SISTEMAS DINÁMICOS NO
LINEALES NO GAUSSIANOS: IDENTIFICACIÓN, ESTIMACIÓN
DE ESTADOS Y APLICACIONES

Tesis Doctoral de:

Olga Lucia Quintero Montoya

Primera Edición en San Juan – mayo de 2010


Impreso en Argentina – printed in Argentina

Queda hecho el depósito que marca la Ley 22.399

ISBN: 978-987-05-8642-5

La reproducción total o parcial de este libro en forma idéntica, escrita a


máquina por el sistema multigraph, mimeógrafo, fotocopiado u otro medio
no autorizado por el editor, viola los derechos reservados.

©Olga Lucia Quintero Montoya. Universidad Nacional de San Juan,


Argentina.

Instituto de Automática – Universidad Nacional de San Juan.


Avenida Libertador San Martín 1109 (o) – 5400 San Juan, Argentina.
"Soy víctima de un dios, frágil, temperamental.
Que en vez de rezar por mí, se fue a bailar...
... se fue a la disco de un lugar.
Quiso mi disfraz, vivir como un mortal;
como no logró matarme, me regaló una visión particular...." (El loco)

A mi Papá... que no está conmigo, que llevo en mi sangre, en mi alma y en


mi corazón.

A mi Dios, compañero incondicional quien puso a mí alrededor a las


maravillosas personas que día a día me recordaron su existencia, su presencia
y su infinito amor. Sin él nada soy, nada puedo dar, no puedo amar.
Quiero agradecer a los regalos y manifestaciones de Dios…

A mis amigos En Medellín a Andrea Ángel, Marcelo Yepes y Cata Buitrago


y En San Juan a Tania, Diego y André, Gus, Ángeles y los Martínez, Kike
Buzarquis, Natalia, Adri, Carlitos Soria, Los Avella y Los Frávega de San
Martín testigos de mis llantos y de mis alegrías quienes mostraron que el
amor también vive dentro de la amistad sincera e incondicional, y se basa en
el profundo respeto. Muchas gracias por tolerarme.

A mi amor, que con su presencia en mi vida me dio la oportunidad de


descubrir que la mayor fuerza conocida después de Dios, es el amor propio
que vive en mi interior y sin él es imposible amar…

A Horacio Arango, Hernán Álvarez y Carlos Canudas de wit mis maestros e


inspiración. A Mamá por darme la vida y enseñarme a volar, pese a que
luego no quería permitírmelo y a Mi hermano por cuidar de ella durante mi
ausencia.

Para el entendimiento del lector, la presente aplicación es fruto de una carrera


de 5 años con el análisis, modelado, simulación y control básico; posterior
estimación de estados usando varias técnicas y pruebas de control avanzado
sobre este proceso fermentativo.

Debo en sus comienzos a Natalia Echeverry, Margarita Ramírez y Hernán


Álvarez los conocimientos básicos de su naturaleza dinámica. A PhD.
Daugulis, PhD, McLellan y PhD, Li, les debolos artículos seminales que
ganaron mi interés en este proceso de fermentación alcohólica en continuo,
los primeros reportes basados en experimentación y algunos consejos.

A la Dra. Anna Carolina Raposso Camelo, mis más sinceros agradecimientos


por permitirme no solo usar los datos experimentales que junto con su equipo
han obtenido; sino también los parámetros que obtuvo para su análisis
biotecnológico de la Zymomonas mobilis. Es de anotar que en la actualidad,
las referencias de estimación de estados en este proceso fermentativo, nos
corresponden a quienes han sabido acompañarme en estos trabajos durante
mi carrera doctoral. Previo a la presentación del problema de estimación en
Bacillus turingiensis debo agradecer a Dra. Adriana Amicarelli por su
colaboración en la aplicación que se presentará dentro del capítulo 5 de esta
tesis. Asimismo su participación en las publicaciones en el área de
bioprocesos ha sido efectiva, eficaz y de gran relevancia. La explicación del
comportamiento dinámico del bioreactor me fue proporcionada con mucha
paciencia; de la misma manera que el material para la descripción dinámica
que se presenta, el modelo básico y los datos experimentales. Con ello pude
realizar la aplicación de los filtros en simulación, posterior modelado de
incertidumbre y aplicación en datos reales. Un agradecimiento a Dr. Gustavo
Scaglia, por el desarrollo de las técnicas basadas en métodos numéricos, su
dedicación a las aplicaciones en robótica móvil y su cuidadosa supervisión
para la aplicación sobre el problema de fermentación. Siempre muestra que
“…todo es más fácil de lo que parece…”

Al Dr. Fernando di Sciascio por su paciencia y su fé.

Finalmente a Marcelo Francisco, quien me ha acompañó durante el tiempo y


difícil trabajo de la revisión de esta tesis… su presencia, su amistad y su fe en
mi, han sido la fuerza que me faltaba para cerrar las puertas que estaban
abiertas.
Resumen
Los sistemas reales poseen generalmente dinámicas altamente no lineales a
las cuales se puede considerar una combinación de una estructura
determinística y una componente aleatoria dada las incertidumbres asociadas
a diferentes factores y que en el proceso de modelamiento representan la
brecha de información entre el modelo y el proceso real. Parte de la
información acerca de los sistemas dinámicos no está totalmente disponible
ni es posible de medir, lo que hace que el desarrollo de sistemas de control se
dificulte. El objetivo de la estimación o la identificación de sistemas, es
poder reconstruir la mayor información acerca del sistema, heredada de las
posibles observaciones de la salida y/o de los estados relacionados. Dentro de
la Ingeniería de Sistemas de Control, es fundamental poseer esta información
mediante técnicas de estimación de estados, con el objetivo final de llevar los
estados del sistema a los valores deseados ya sea posicionamiento o
seguimiento de trayectorias lo que sugiere una combinación en lazo cerrado
de estimador y su inclusión en lazos de control.

En esta tesis, la aproximación que se seguirá para abordar el problema de


estimación de los estados es el llamado “filtrado no lineal y no Gaussiano” es
la de los llamados Filtros de Partículas, (Gordon et. Alt., 1993; Doucet 1999,
Doucet et al, 2002; Crisan et al, 2002; Briers 2006). Esta técnica se
fundamenta básicamente en la teoría Bayesiana y en los Métodos
Secuenciales de Monte-Carlo. El principio de esta la metodología es la
aproximación de las distribuciones relevantes con medidas aleatorias
compuestas de partículas, donde interviene el cálculo recursivo de las
distribuciones de probabilidad de los estados desconocidos y utilizando los
conceptos de muestreo de importancia y aproximación por medio de medidas
aleatorias discretas. Esto es, se discretizan las ecuaciones diferenciales
estocásticas que caracterizan el sistema en tiempo continuo para obtener
ecuaciones estocásticas en diferencias. En este punto es posible plantear una
formulación válida en forma probabilística bajo la teoría Bayesiana, donde
una solución optima se obtiene a partir de de la función de densidad de
probabilidad del estado (pdf), pero si la pdf no se conoce exactamente, se
debe usar un filtro recursivo donde los datos recibidos pueden ser procesados
secuencialmente. Las funciones de densidad de probabilidad continuas de los
estados son aproximadas con medidas discretas aleatorias que están
compuestas de partículas ponderadas, y los pesos. Esto es, se plantea el uso
de un número independiente de partículas, muestreadas directamente del
espacio de estado con el fin de representar la probabilidad a posteriori y
actualizando los posteriores con las nuevas observaciones.

Esta metodología presenta la ventaja de no utilizar linealizaciones del sistema


a aproximar. Además, posee un gran potencial para la implementación en
paralelo, en sistemas que requieran mayor complejidad y carga
computacional. Del éxito de los algoritmos y las mejoras planteadas, depende
su incorporación en lo que representa el objetivo de la automática, el diseño
de sistemas de control que los incluyan dentro de esquemas de estimación o
como técnicas de identificación; para así poder aplicar esta disciplina al
sector de control automático de procesos y bioprocesos como la fermentación
en continuo de la bacteria Zymomonas mobilis (Z.m) para la obtención de
etanol y la fermentación batch de bacillus turingiensis (bt) para la obtención
de células esporuladas con el fin de fabricación de insecticidas. Luego de la
construcción de estimadores de estados para los dos bioprocesos, se aplicaron
técnicas de control basado en métodos numéricos desarrolladas anteriormente
por (Scaglia, 2006) y aplicadas en seguimiento de trayectorias en robótica
móvil (Scaglia et al, 2007, 2008) sobre el proceso de fermentación alcohólica
en continuo de Z. m.

Un sistema de control típico para un bio reactor en continuo consiste de


controladores simples de realimentación para regular el tiempo de residencia
del reactor, la temperatura y el pH. El sistema de control se diseña para
suministrar el flujo de nutrientes prescrito, además evadiendo condiciones
ambientales que afecten adversamente la productividad del bio reactor. Con
el objetivo de mantener las variables primarias como la biomasa y las
concentraciones de producto, se han implementado estrategias a lazo abierto
basadas en la consideración poco realista que las perturbaciones no medidas
tienen un efecto negativo en el desempeño del bio reactor, lo cual no siempre
es así. Entonces, como consecuencia de lo mencionado anteriormente, el
desarrollo de las estrategias en lazo cerrado para la estabilización del reactor
y la optimización de la relación biomasa/producto, puede representar una
mejora significativa en el proceso de producción.

En este trabajo de tesis, se usan métodos numéricos no solo para simular la


evolución y el comportamiento dinámico de la fermentación alcohólica a
partir de Zymomonas mobilis sino también para encontrar las acciones de
control que permitan llevar las variables de estado del bio reactor desde el
estado actual al estado deseado con el fin de maximizar su productividad. La
contribución de esa parte del trabajo se basa en que no es necesario hacer
cálculos complejos para obtener las acciones de control del bio reactor,
tampoco se usan linealizaciones del modelo dinámico; lo que hace que esta
solución sea fácil de implementar para afrontar el reto de control de este bio
reactor en continuo. Se lograron controladores para las tres variables
principales del proceso, mediante 3 tipos de aproximaciones y finalmente se
obtuvieron resultados satisfactorios para el seguimiento de una trayectoria de
fermentación basada en datos reales, en lazo cerrado con los estimadores de
filtros de partículas.
Abstract
Generally, real systems have highly no lineal dynamics which can be
considered a combination between deterministic structures and uncertainties
associated to several factors. In modelling procedure, uncertainties represent
the gap of information between the model and the real process. Some
information about the dynamic systems is not completely available and not
possible to measure; which makes the development of models for design of
control systems being difficult.

The main objective of the states estimation or systems identification is to be


able to rebuild most amount of information about the system from its outputs
and/or the related states observations. In the control systems engineering, is
essential to obtain this information through state estimation techniques, with
the final objective to carry the system states to the desired values either in
positioning or trajectory tracking, which suggest a combination in close loop
of the estimator and a control technique.

In this thesis, the approach to be followed to solve the problem of the lack
information of some states in a dynamic system is the called “no lineal no
Gaussian filtering”. It means the well known Particle Filtering. This
technique is based on the Bayes Theory and the sequential methods of Monte
Carlo. The basis of this methodology is the approximation of the distributions
with randomly measurements built by particles, where the recursive
calculation of probability distribution functions (pdf) of the states, the
importance sampling and also the approximation of discrete randomly
measurements are involved. That is, the stochastic differential equations that
characterize the system in continuous time are discretized to obtain stochastic
equations in differences. At this point it is possible to propose a valid
probabilistic formulation using the Bayes Theory, where an optimal solution
is obtained from the probability density function of the states. But if the pdf
is not exactly known, must be used a recursive filter where the received data
must be processed sequentially. The continuous pdf of the states are
approached with discrete random measurements composed by weighted
particles and its weight. That is, the use of an independent number of
particles, sampled directly from the state spaces with the objective to
represent the posteriori probability and updating the posteriori of new
observations is posed. This methodology has the main advantage of not to
use linearization of the system to be approximated. Besides, has a big
potential to its parallel implementation over systems that require bigger
complexity and computational load. Algorithms incorporation into the
automatica main objective (the design of control systems that include the
algorithm in estimation schemes) depends on their success.

This work makes possible to apply this methodology to the automatic control
of processes and bio processes such as the continuous fermentation of the
bacteria Zymomonas mobilis (Z.m) for fuel production and the batch
fermentation of bacillus turingiensis (bt) to the sporulated cells production.
After the building of the state estimators for the two previously mentioned
bio process, where applied techniques of numerical methods based control
developed previous by Scaglia (Scaglia, 2006) and applied in trajectory
tracking of mobile robotics (Scaglia et al, 2007, 2008), over the Z.m
continuous alcoholic fermentation process.

A typically control system for a continuous bio-reactor consists of simple


feedback controllers to regulate the residence time of reactor, temperature
and pH. The control system is designed to supply the nutrients flow, besides
avoiding environmental conditions that affect the productivity of bioreactor
to maintain the main variables in the desired values. Have been implemented
open loop strategies based on the unrealistic consideration that the non
measure disturbances has a negative effect in the bio reactor performance,
which is not always true. Consequently, the development of a close loop
strategies for stabilization of reactor and biomass/product relationship
optimization, can represent a meanly improvement in the production process.
In this thesis, numerical methods are used not only to simulate the evolution
and the dynamic behavior of an alcoholic fermentation; but also to find the
control actions that allow carrying the state variables of bio reactor, from the
current state the desire one with the objective to maximize its productivity.
The main contribution of this part of the thesis is based on the fact that it is
not necessary to make complex calculations to obtain the control actions of
bioreactor; neither linearization of dynamic model is used, which makes this
solution easy to implement. Controllers for the main variables of the process
were designed, through three different approximations and finally
satisfactory results were obtained to the trajectory tracking of a fermentation
based on real data, in close loop with the particle filtering estimators.
Índice General
Capítulo 1 Introducción y motivación………………………………………1
1.1 Objetivos………………………………………………………7
1.1.1 Objetivo general….………………………………………….7
1.1.2 Objetivos específicos alcanzados……………………………7
1.2 Importancia de la Investigación……………………………….8
1.3 Alcances y Limitaciones………………………………………9

Capítulo 2 Problema de Filtrado en general………………………………..10


2.1 Estadística Bayesiana y Estimación Bayesiana……………….13
2.1.1 Formulación Continua del Modelo General de estados……..15
Teorema de Bayes…………………………………………………15
2.1.2 Soluciones óptimas del problema de filtrado no lineal……...20
Ecuación de Kushner………………………………………………23
Ecuacion de Zakai…………………………………………………20
2.1.3 Formulación en tiempo discreto del Modelo General de
estados……………………………………………………………..23
2.2 Filtrado Lineal, Filtro de Kalman……………………………..26
2.2.1 Introducción…………………………………………………26
2.2.2 Breve definición……………………………………………..26
Problema práctico, Demostración: Filtro de Kalman Bucy como
caso Lineal de la Ecuación de Kushner……………………………30
2.3 Filtros No Lineales…………………………………………….32
2.3.1 Filtro de Kalman Extendido…………………………………32
2.3.2 Métodos Basados en grillas aproximados…………………...35
2.3.3 Filtro de Kalman Unscented…………………………………37

Capítulo 3 Métodos Secuenciales de Monte Carlo y Filtros de Particulas….42


3.1 Métodos de Monte Carlo………………………………………42
3.2 Métodos de Muestreo………………………………………….44
3.2.1 Muestreo de Importancia…………………………………….44
3.2.2 Muestreo de Rechazo………………………………………..47
3.2.3 Muestreo de Importancia Secuencial ……………………….50
3.2.3.1Método de Filtrado basado en Muestreo de Importancia
Secuencial FILTRO SIS…………...................................................51
3.3 Re muestreo……………………………………………………55
3.3.1 Re Muestreo en Muestreo de Importancia…………………..55
3.3.2 Filtro de Importancia Secuencial con Re muestreo
(SIR)/Bootstrap……………………………………………………56
3.3.3 Tipos de Re muestreo……………………………………….63
3.3.3.1 Re muestreo Multinomial……………………………........63
3.3.3.2 Re muestreo Residual …………………………………….63
3.3.2.3 Re muestreo Sistemático………………………………….64
3.3.3.4 Re muestreo de Monte Carlo local….…………………….65
3.4 Filtros SIR/SIS Mejorados……………………………………68
3.4.1 Muestreo estratificado………………………………………70
3.4.2 Filtro de Partículas Regularizado……………………………71
3.4.3 Filtro de partículas de post regularización………………......73
3.4.4 Filtro de partículas pre regularizado…………………………74
3.4.5 Métodos de Reducción de la Varianza Rao-
Blackwellización…………………………………………………..76
3.4.5.1 Algoritmo de Rao Blackwellización………………………80
3.4.6 Kernel Smoothing y regularización…………………………82
3.4.7 Solución numérica de la ecuación de Focker Planck…..........82
3.4.8 Filtros de Dimensión Finita………………………..………..83
3.4.9 Filtro de Daum ………………...............................................83
3.4.10 Filtro de Partículas Auxiliar………………………..............85
3.4.11 Filtros de Partículas Marginalizados……………………….91
3.4.12 Filtro de densidad de hipótesis de probabilidad……………94
3.4.13 Filtro de partículas marginal……………………………….96
3.5 Teoría de Markov, Monte Carlo - Cadenas de Markov y
aplicaciones………………………………………………………103
3.5.1 Monte Carlo y Cadenas de Markov………………………...106
3.5.2 Modelos de Markov ocultos………………………………..107
3.6 Muestreo de Independencia de Metropolis – Hastings………111
3.7 Muestreo tipo Gibbs…………………………………………112

Capítulo 4 Aproximación al problema de discretización de modelos no


lineales y modelado de incertidumbres para filtrado no lineal……………114
4.1 Modelos de incertidumbre……………………………………116
4.1.1 Caso 1: Modelo de incertidumbre simple…………………..117
4.1.2 Caso 2: Transformación lineal fraccional………………….117
4.1.3 Caso 3: Modelos tipo ARIMA……………………………..119
4.1.4 Caso 4: Modelos muestreados de datos (sampled data
models)…………………………………………………………...121
Capítulo 5 Implementación de la técnica de filtrado no lineal en sistemas
dinámicos no lineales no Gaussianos, estimación de estados, identificación de
sistemas……………………………………………………………………127
5.1 Aplicación en un bioreactor en continuo de fermentación
alcohólica para producción de etanol a partir de Zymomonas
mobilis……………………………………………………………132
5.1.1 Justificación………………………………………………...132
5.1.2 Descripción del proceso……………………………………133
5.1.3 Primera aproximación: Estimación de Biomasa en el proceso
de fermentación alcohólica en continuo, simulación del
proceso……………………………………………………………140
5.1.4 Segunda aproximación: Estimación de biomasa en el proceso
de fermentación alcohólica en continuo – Regiones de operación
definidas por Raposso et al., 2005………………….....................152
5.2 Aplicación en un bio reactor por lotes (batch) para producción δ-
endotoxinas de Bacillus Thuringiensis (bt)………………… …...174
5.2.1 Modelo fenomenológico del Bioproceso…………………..174
5.2.2 Filtrado de Partículas………………………………………180
5.2.3 Segunda Aproximación…………………………………….192

Capítulo 6 Controladores basados en métodos numéricos para bioreactor de


fermentación alcohólica en continuo………………………………………205
6.1 Estrategia de control basada en métodos numéricos…………209
6.2 Diseño de los controladores………………………………….213
6.2.1 Controlador 1……………………………………………….213
6.2.2 Controlador 2………………………………………………224
6.2.3 Controlador 3……………………………………………….230
6.3 Controladores basados en métodos numéricos y estimadores en
lazo cerrado………………………………………………………239
6.3.1Controlador 1-2 y estimador……………………...................240
6.3.2 Controlador 3 y estimador de estados……………………...242
.
Capítulo 7 Conclusiones…………………………………………………..245
7.1 Producción Académica………………………………………246

Bibliografía………………………………………………………………..249

APÉNDICE PRELIMINARES MATEMÁTICOS……………………….277


Lista de Acrónimos

FK Filtro de Kalman (Kalman Filter)


EFK Filtro de Kalman extendido (Extended Kalman Filter)
SPDE Ecuación en derivadas parciales estocástica (Stochastic
partial differential ecuation)
MCMC Monte Carlo y Cadenas de Markov
GSF Filtro de Suma Gaussiana (Gaussian Sum Filter)
NIF Filtro de integración numérica (Numerical integration filter)
RSF Filtro de muestreo por rechazo (Rejection Sampling filter)
MAP Máximo a posteriori
ML Máxima verosimilitud (máximum likelihood)
SIR Muestreo de importancia con re muestreo (Sampling
Importance resampling)
SIS Muestreo de importancia secuencial (Sequential importance
sampling)
ASIR Muestreo de importancia con re muestreo auxiliar
(Auxiliary sampling importance resampling)
RPF Filtro de partículas regularizados (Regilarized particle
filter)
cdf Función de densidad acumulativa
pdf Función de densidad de probabilidad (probability density
function)
ODE Ecuación diferencial ordinaria (Ordinary differential
equation)
SDE Ecuación diferencial estocástica (Stochastic diferential
equation)
APF Filtro de partículas auxiliar (Auxiliary particle filter)
PHD Densidad de hipótesis de probabilidad
HMM Modelo de Markov escondido (Hidden Markov Model)
ARIMA Autoregresivo integrado de media móvil (Autoregressive
integrated moving average)
LFT Linear fractional transformation
LTI Linear time invariants
LTV Linear time variants
Z.m Zymomonas mobilis
Bt Bacillus turingiensis
S. cerevisiae Saccharomyces cerevisiae
Lista de Tablas

Capítulo 3
Tabla 3.1: Tabla resumen de los métodos de Monte Carlo y los métodos de
Filtrado no Lineal 43

Capítulo 5
Tabla 5.1: Parámetros Comportamiento Oscilatorio sostenido 140
Tabla 5.2: Parámetros del Bioreactor Parámetros usados para simulación del
bioreactor 140
Tabla 5.3. Tiempo de cómputo en minutos para cada prueba del proceso de
estimación experimento 1. 145
Tabla 5.4: Errores obtenidos en diferentes pruebas de simulación, ilustración
de los peores casos 148
Tabla 5.5: Parámetros usados para estimación con datos reales de
Zymomonas mobilis 155
Tabla 5.6 Tiempo de estimación de Biomasa en simulación (minutos) para
una simulación completa de 150 horas 156
Tabla 5.7. Tiempo de cómputo en minutos para cada ejecución del proceso
de estimación experiencia 5 160
Tabla 5.8. Tiempo de cómputo en minutos para cada ejecución del proceso
de estimación prueba 7 161
Tabla 5.9. Tiempo de cómputo en minutos para cada ejecución del proceso
de estimación experiencia 9 164
Tabla 5.10. Tiempo de cómputo en minutos para cada ejecución del proceso
de estimación experiencia 11 167
Tabla 5.11. Dinámica del Oxígeno Disuelto 177
Tabla 5.12: Resumen del error máximo de estimación de estados en las
pruebas iniciales para Bacillus Turingiensis 182

Capítulo 6
Tabla 6.1 Resumen de datos de las simulaciones para prueba de
controladores 217
Lista de Figuras

Capítulo 1
Figura 1.1 Esquema de metodología de filtrado 3

Capítulo 2
Figura 2.1 Ejemplo gráfico comparativo de esquemas de muestreo 41

Capítulo 3
Figura 3.1 Comparación del muestreo por Importancia y muestreo por
rechazo 49
Figura 3.2 Descripción esquemática del paso de re muestreo 60
Figura 3.3 Descripción gráfica del filtro de Partículas con re muestreo 61
Figura 3.4 Diagrama de Bloques Algoritmo de Filtro de Partículas con re
muestreo 62
Figura 3.5 Ilustración del paso de re muestreo en un filtro de partículas 67

Capítulo 4
Figura 4.1 Modelo de Incertidumbre de transformación lineal fraccional 118

Capítulo 5
Figura 5.1 Diagrama de proceso de Fermentación alcohólica en continuo 135
Figura 5.2 Esquema de Estimación en simulación para el proceso de
fermentación de Z.m 141
Figura 5.3 a. Estimación de Biomasa con 50 partículas y esquema de re
muestreo Multinomial 144
b. Errores en la estimación de los estados del bioreactor, durante una prueba
en simulación de 150 horas con un tiempo de muestreo de 0.1 horas 145
Figura 5.4 a. Concentración de biomasa estimada por el filtro SIR. La línea
punteada describe la estimación mientras que la línea continua describe el
valor del modelo considerado como real 147
b. Concentración de biomasa estimada por el filtro SIR. La línea punteada
describe la estimación mientras que la línea continua describe el valor del
modelo considerado como real 147
Figura 5.5 a. Dinámica de inhibición Z estimada por el filtro SIR. Línea
punteada representa las estimaciones y las líneas continuas son consideradas
las dinámicas reales del sistema Dinámicas de Inhibición estimadas por el
filtro SIR 149
b. Dinámica de inhibición I estimada por el filtro SIR. Línea punteada
representa las estimaciones y las líneas continuas son consideradas las
dinámicas reales del sistema 149
Figura 5.6 Concentración de biomasa estimada 150
Figura 5.7 a. Valor de Errores de estimación 150
b. Concentración de biomasa estimada 151
c. Estimación de Estados de Inhibición Z 151
d. Estimación de Estados de Inhibición I 151
Figura 5.8 Esquema de Estimación usado para la prueba con datos reales 153
Figura 5.9 Interpolación de datos reales.
a. Concentración de Sustrato 154
b. Concentración de Producto 154
c. 155
Figura 5.10 Concentración de biomasa estimada
a. Estimación de Biomasa experimento 5 usando 10 partículas y re muestreo
residual 158
b. Estimación de Biomasa experimento 5 usando 10 partículas y re muestreo
multinomial 159
c. Estimación de Biomasa experimento 5 usando 10 partículas y re muestreo
determinístico 159
d. Estimación de Biomasa experimento 5 usando 100 partículas y re muestreo
multinomial 159
Figura 5.11 a. Estimación de Biomasa experimento 7 usando 10 partículas y
emuestreo residual 162
b. Estimación de Biomasa experimento 7 usando 10 partículas y re muestreo
multinomial 162
c. Estimación de Biomasa experimento 7 usando 10 partículas y re muestreo
determinístico 162
d. Estimación de Biomasa experimento 7 usando 100 partículas y re muestreo
determinístico 163
Figura 5.12 a. Estimación de Biomasa experimento 9 usando 10 partículas y
Re muestreo multinomial 165
b. Estimación de Biomasa experimento 9 usando 50 partículas y re muestreo
determinístico 165
c. Estimación de Biomasa experimento 9 usando 100 partículas y re muestreo
multinomial 165
Figura 5.13 a. Estimación de Biomasa experimento 11 usando 10 partículas y
Re muestreo residual 167
b. Estimación de Biomasa experimento 11 usando 10 partículas y re muestreo
determinístico 168
c. Estimación de Biomasa experimento 11 usando 10 partículas y re muestreo
multinomial 168
d. Estimación de Biomasa experimento 11 usando 50 partículas y re muestreo
determinístico 168
Figura 5.14 Estimación de Biomasa, las líneas continuas son las de la
interpolación de los datos reales, las líneas punteadas corresponden a la
estimación del filtro 168
Figura 5.15 Resultados de la prueba 4 en la cual se usó un ruido de baja
potencia como perturbación de las medidas 170
a. Concentración de Biomasa estimada en la prueba 4 con baja potencia en la
componente de ruido 171
b. Estimación de la variable de Inhibición Z 171
c. Estimación de la variable de Inhibición I 172
Figura 5.16 a. Estimación de producto, en línea continua los datos de la
interpolación de los datos reales, en punteado las estimaciones del filtro 173
b. Estimación de producto, en línea continua los datos de la interpolación de
los datos reales, en punteado las estimaciones del filtro 173
Figura 5.17 Diagrama de Bloques del Estimador de Biomasa 181
Figura 5.18 Estimación de Biomasa con modelos en simulación y
componentes de difusión adicionadas. Tiempo de muestreo (t0) de 1 hora, re
muestreo residual. 183
Figura 5.19 Estimación de Biomasa con modelos en simulación y
componentes de difusión adicionadas. Tiempo de muestreo (t0) de 0.01 horas
re muestreo determinístico 183
Figura 5.20 Resultados normalizados de estimación de células vegetativas
para la prueba 7 del filtro SIR con esquema de re muestreo residual. Línea
continua el modelo considerado como real, puntos el resultado del filtro 184
Figura 5.21 Resultados normalizados de estimación de células esporuladas
para la prueba 7 del filtro SIR con esquema de re muestreo residual 185
Figura 5.22 Resultados normalizados de sustrato primario para la prueba 7
del filtro SIR con esquema de re muestreo residual 185
Figura 5.23 Resultados normalizados de sustrato secundario para la prueba 7
del filtro SIR con esquema de re muestreo residual 186
Figura 5.24 Resultados normalizados de oxígeno disuelto para la prueba 7 del
filtro SIR con esquema de re muestreo residual 186
Figura 5.25 Superficie generada por el máximo de los errores de estimación
de células vegetativas, usando los 3 tipos de re muestreo a 0.5 horas de
muestreo 187
Figura 5.26 Superficie generada por el máximo de los errores de estimación
de células vegetativas 187
Figura 5.27 Superficie generada por el máximo de los errores de estimación
de células vegetativas 188
Figura 5.28 Superficie generada por el máximo de los errores oxigeno
disuelto 188
Figura 5.29 Superficie generada por el máximo de los errores oxigeno
disuelto usando los 3 esquemas de re muestreo a 0.5 horas de muestreo 189
Figura 5.30 Resultados normalizados de Células Vegetativas para la prueba
del filtro SIR usando muestreo residual 189
Figura 5.31 Resultados normalizados de Células Esporuladas para la prueba
del filtro SIR usando muestreo residual 190
Figura 5.32 Sustrato primario para la prueba del filtro SIR usando muestreo
residual, a 0.2 horas de tiempo de muestreo 190
Figura 5.33 Resultados normalizados de Sustrato secundario para la prueba
del filtro SIR usando muestreo residual 191
Figura 5.34 Resultados normalizados de Oxígeno disuelto para la prueba del
filtro SIR usando muestreo residual 191
Figura 5.35 Células vegetativas para la prueba de el filtro SIR usando
muestreo residual 192
Figura 5.36 Sustrato primario para la prueba de el filtro SIR usando muestreo
residual 193
Figura 5.37 Oxígeno disuelto para la prueba de el filtro SIR usando muestreo
residual, a 0.01 horas de tiempo de muestreo 193
Figura 5.38 Diagrama de Bloques del Estimador de Biomasa 194
Figura 5.39 a. Modelado de Incertidumbre de la concentración de Biomasa
para la fermentación A 196
b. Modelado de Incertidumbre para la concentración de sustrato para la
fermentación A 197
c. Modelado de Incertidumbre para la concentración de oxígeno disuelto de la
fermentación A 197
Figura 5.40 a. Modelado de Incertidumbre de la concentración de Biomasa
para la fermentación B 198
b. Modelado de Incertidumbre para la concentración de sustrato para la
fermentación B 198
c. Modelado de Incertidumbre para la concentración de oxígeno disuelto de la
fermentación B 199
Figura 5.41 a. Modelado de Incertidumbre de la concentración de Biomasa
para la fermentación C 200
b. Modelado de Incertidumbre para la concentración de sustrato para la
fermentación C 200
c. Modelado de Incertidumbre para la concentración de oxígeno disuelto de
la fermentación C 201
Figura 5.42 Entradas para el estimador de Biomasa propuesto
a. Concentración de Sustrato primario (Sp) 202
b. Concentración de Oxígeno Disuelto (OD) 202
Figura 5.43 Estima de Biomasa para la fermentación B usando como modelo
de incertidumbre el construido a partir de la fermentación B 202
Figura 5.44 Estima de Biomasa para la fermentación B usando como modelo
de incertidumbre el construido a partir de la fermentación C 203
Figura 5.45 Estima de Biomasa para la fermentación C usando como modelo
de incertidumbre el construido a partir de la fermentación B 204
Figura 5.46 Estima de Biomasa para la fermentación C usando como modelo
de incertidumbre el construido a partir de la fermentación C 204

Capítulo 6
Figura 6.1 Diagrama del proceso continuo de fermentación 205
Figura 6.2 Desempeño del controlador de Sustrato y producto, para
fermentación 1 218
Figura 6.3 Acciones de control Ds y Sin para fermentación 1 219
Figura 6.4 Desempeño del controlador de Sustrato y producto, para
fermentación 2 220
Figura 6.5 a. Acción de control de sustrato de alimento para la fermentación
2 221
b. Acción de control de tasa de dilución para la fermentación 2 222
Figura 6.6 Desempeño del controlador de Sustrato y producto, para
fermentación 3 222
Figura 6.7 Acciones de control Ds y Sin para fermentación 3 223
Figura 6.8 Desempeño del controlador 2 con recirculación fija del 10% ante
perturbaciones Fermentación 1 226
a. Concentración de Producto en la fermentación controlada 226
b. Concentración de sustrato en la fermentación controlada 226
c. Acción de control concentración de sustrato de alimento 227
d. Acción de control de tasa de dilución 227
Figura 6.9 Desempeño del controlador 2 siguiendo trayectorias obtenidas de
datos experimentales Fermentación 2
a. Concentración de sustrato en la fermentación controlada 228
b. Concentración de Producto en la fermentación controlada 228
c. Acción de control de tasa de dilución 229
d. Acción de control concentración de sustrato de alimento 229
Figura 6.10 Desempeño del controlador 3 siguiendo trayectorias obtenidas de
datos experimentales 235
Figura 6.11 Acciones de Control para el seguimiento de trayectoria 236
Figura 6.12 Desempeño del controlador 3 ante perturbaciones siguiendo
trayectorias obtenidas de datos experimentales
a. Variables de control Biomasa, Susutrato y Producto 237
b. Variables manipuladas recirculación de microorganismos, sustrato de
entrada, tasa de dilución de sustrato y tasa de dilución total 237
Figura 6.13 Esquema general de estimación y control 239
Figura 6.14 Controlador de Sustrato y producto en lazo cerrado con
estimador de estados 240
Figura 6.15 Controlador de Sustrato y Producto en lazo cerrado con
estimador de Biomasa siguiendo trayectorias basadas en datos reales 241
Figura 6.16 Controlador mejorado y estimador de biomasa para control de la
población de Células de Z.m 242
Figura 6.17 Controlador mejorado y estimador de biomasa para control de
concentración de sustrato de alimento 243
Figura 6.18 Controlador mejorado y estimador de biomasa para control de
concentración de producto 243
1

Capítulo 1
INTRODUCCIÓN Y MOTIVACIÓN
Los procesos reales poseen, por naturaleza, dinámicas altamente no lineales debido a
las interacciones entre muchas de las variables internas del sistema. Estas dinámicas,
en algunos casos, pueden describirse mediante la representación del sistema en
ecuaciones diferenciales y, posteriormente, ser expresadas en términos de las variables
de estado, a través de las cuales, se tratan de establecer las relaciones entre las
entradas, los estados y las salidas del sistema. La forma en que la información se
propaga a través de la evolución del sistema determina los valores de los estados y su
repercusión en la salida global del sistema no lineal.

Dado que la representación matemática de un sistema real no es exacta, es posible que


las diferencias entre estos modelos y la realidad, sean tratadas por medio de algunas
aproximaciones. Generalmente se considera que las discrepancias entre la realidad y el
modelo matemático obedecen a incertidumbres que se adicionan al modelo de estados
convirtiéndolo en un conjunto de ecuaciones más complejas y con características que
obedecen al tipo de perturbación que se considera parte del sistema. Al hablar de
perturbación es necesario incorporar terminología más adecuada para su
caracterización y cuantificación y las herramientas adecuadas para ese fin son las
teorías de probabilidades y procesos estocásticos, esto es, las perturbaciones se
caracterizan y cuantifican mediante sus funciones de distribución de probabilidad. De
esta forma, la distribución de probabilidad de los estados del sistema determina que la
propagación de información pueda ser o no de tipo gaussiano.

La aplicación de técnicas de reconstrucción de información tradicionales no


proporciona resultados satisfactorios, pues en ellos se asume que la función de
distribución de los estados del sistema es de tipo gaussiana. En algunos casos se
construyen modelos lineales en entornos de los puntos de operación (linealización), lo
que oculta las dinámicas globales del sistema. Por otro lado, es posible determinar la
relación de la salida con las variables de estado, pero dada su naturaleza no lineal y no
Gaussiana, debe hacerse uso de herramientas estadísticas más complejas.

El objetivo de la estimación de estados o la identificación de sistemas consiste en


reconstruir la mayor información posible acerca del sistema (cuando no está
totalmente disponible ni medida), a partir de las observaciones (mediciones) de la
salida y/o de los estados relacionados. Dentro de la ingeniería de sistemas de control
es fundamental poseer esta información para el desarrollo de aplicaciones varias, por
ejemplo, seguimiento de trayectorias, monitoreo y su inclusión en lazos de control.
2

Los denominados Filtros de Partículas son una clase de filtros Bayesianos recursivos,
diseñados para la estimación de los estados de sistemas dinámicos no lineales con
perturbaciones no Gaussianas.

El principio de esta metodología es la aproximación de las distribuciones de


probabilidad relevantes, con medidas aleatorias discretas denominadas partículas1 y
sus pesos asociados2. Dentro de esta aproximación interviene el cálculo recursivo de
las distribuciones de probabilidad de los estados desconocidos usando los conceptos
de muestreo de importancia y aproximación por medio del uso de medidas aleatorias
discretas. Las funciones de densidad de probabilidad continuas de los estados son
aproximadas con medidas discretas aleatorias que están compuestas de partículas y sus
pesos. Este método ofrece como ventaja frente a los métodos tradicionales, la no
utilización de linealizaciones del sistema a aproximar. Presenta, además, un gran
potencial para implementación en paralelo, en sistemas que requieran mayor
complejidad computacional.

Para aplicar esta metodología, se plantea una formulación del problema en tiempo
discreto mediante ecuaciones en diferencias que describen los diferentes tipos de
interacciones. Éstas generalmente representan el modelo del sistema que describe la
evolución del estado en el tiempo y el modelo de incertidumbre, el cual relaciona las
medidas inciertas o ruidosas con el estado.

Ahora bien, es posible plantear una formulación válida en forma probabilística bajo la
aproximación Bayesiana, donde una solución óptima se obtiene a partir de la función
de densidad de probabilidad del estado (pdf). Pero si la pdf no se conoce exactamente,
como se verá más adelante, se debe usar un filtro recursivo donde los datos recibidos
pueden ser procesados secuencialmente. En otros términos, se plantea el uso de un
número independiente de partículas, muestreadas directamente del espacio de estado
con el fin de representar la probabilidad a posteriori, y actualizando a cada instante la
distribución con las nuevas observaciones. A partir del conocimiento de la
probabilidad a posteriori, es posible obtener información de la mejor estimación del
estado desconocido.

Un esquema que puede dar una referencia de la metodología de filtrado para la


obtención de la información es el que se muestra en la Figura 1.1:

1
Variables aleatorias que son muestras desconocidas del espacio de estado
2
Masas de probabilidad calculadas con la teoría de Bayes
3

FILTRO PREDICCIÓN ACTUALIZACIÓN


Usa el modelo para Usa la última medida para
predecir la pdf modificar la predicción
(T de Bayes)

Figura 1.1. Esquema de Metodología de Filtrado.

La relevancia del método radica en el hecho de que en ingeniería de control y de


procesos, asegurar la estimación en línea del vector de estados es el elemento clave de
las aproximaciones basadas en modelos como son: la optimización, el monitoreo del
desempeño y el control del proceso en sí mismo. Los denominados Filtros de
Partículas son una clase filtros Bayesianos recursivos, diseñados para la estimación en
línea de los estados de sistemas no lineales con perturbaciones estocásticas no
gaussianas.

De esta forma, la estimación de los estados puede verse como un problema de filtrado
óptimo. Bajo la perspectiva Bayesiana, si las ecuaciones de estado son lineales y la
función de densidad de probabilidad de los estados a posteriori es gaussiana, el filtro
de Kalman proporciona esta solución óptima. Sin embargo, cuando no se verifican las
hipótesis acerca de las características probabilísticas de los estados, no existe una
solución analítica y, por consiguiente, deben realizarse aproximaciones subóptimas.
Un ejemplo de estas aproximaciones es el filtro de Kalman extendido, que asume que
la densidad a posteriori es gaussiana, y adopta una expansión en series de Taylor para
hacer una aproximación local del vector de estados actual. En la práctica, cuando las
ecuaciones de estado son altamente no lineales y la densidad a posteriori no es
gaussiana, el filtro de Kalman extendido puede presentar grandes errores de
estimación (Quintero et al, 2005). Alternativamente, uno de los algoritmos propuestos
en la literatura es el filtro aproximado basado en grillas, introducido en la ingeniería
de control aplicada a procesos por Terwiesch (1995). El costo computacional de este
filtro basado en grillas incrementa exponencialmente con la dimensión del espacio de
estados limitando la amplitud de su aplicación (Chen et al., 2003).

En esta tesis se discutirá el filtrado no lineal como respuesta al problema de


estimación de estados y su aplicación. En este caso, debe considerarse una planta o
sistema, cuyos estados están compuestos por un vector xt de dimensión n (donde el
subíndice t indica su variación con el tiempo), y se supone que la evolución del
sistema está dada por una ecuación de la forma:
4

dxt
f xt Ruido1 (t ) (1.1)
dt

Donde f es una función no lineal de los estados y el Ruido1 es la acumulación de todas


las incertidumbres y las perturbaciones externas al sistema que afectan a los estados.
Las observaciones yt que se hacen del sistema descrito anteriormente, que también
tienen una medida de incertidumbre y ruido, pueden expresarse igualmente por una
ecuación no lineal de la forma:

dyt
g xt Ruido2 (t ) (1.2)
dt
El estado xt y la observación yt están correlacionadas. Es posible que con las
componentes de ruido agregadas existan problemas en el planteamiento del problema
en tiempo discreto, considerando iteraciones ruidosas de algunas funciones f y g; sin
embargo con la buena elección de las características aleatorias el problema queda bien
caracterizado.

El problema de estimación radica en obtener la “mejor estimación posible” del vector


de estados, dadas las observaciones de las entradas y salidas pasadas de las que se
dispone. Como mejor estimación posible, se entiende el método que arroje el valor
más cercano al real, a partir de la información disponible.

La forma usual de modelar las perturbaciones e incertidumbres es mediante


ecuaciones diferenciales estocásticas. Las ecuaciones simbólicas anteriores se pueden
expresar mediante el siguiente sistema de ecuaciones diferenciales estocásticas o
ecuaciones de difusión de Itô, en las cuales, las componentes denominadas
anteriormente como Ruido1 (t ) , y Ruido2 (t ) son expresadas mediante las
componentes de difusión en términos de 1 , 2 , dwt y dvt .

dxt f xt , t dt 1 xt , t dwt
(1.3)
dyt g xt , t dt 2 xt , t dvt

Donde f, g y son funciones vectoriales o matriciales no lineales de las dimensiones


adecuadas y los vectores vt , wt son procesos de Wiener 3 independientes (ver
apéndice A).

En términos de ecuaciones diferenciales estocásticas, el nuevo objetivo (a partir del


trabajo de Kalman en 1960) consiste en deducir las condiciones bajo las cuales pueden

3
También se los denomina en la bibliografía Movimiento Browniano o procesos de Wiener Levy
5

encontrarse esquemas recursivos y de dimensión finita para calcular la distribución de


probabilidad condicional del estado dada la filtración Ft y (ver apéndice A), producida
por la observación del proceso ys ;0 s t . Para conseguir este objetivo, se han
desarrollado varios trabajos en esta área, los cuales se describirán brevemente a
continuación:

Luego que Kalman publicara su artículo (1960), muchos investigadores trataron de


combinar las aproximaciones hechas por Kailath (1968, 1971) en los que usa la teoría
de martingalas para determinar las ecuaciones diferenciales estocásticas. Dicha
aproximación plantea un nuevo proceso estocástico denominado innovación de la
forma:

t
t yt E g s Fsy ds (1.4)
0

Con g(t) = gt y el término Fs y la filtración producida por el proceso de observación.


En otras palabras, condicionando la observación a la filtración Fs y , puede también
condicionarse sobre la filtración Fsv producida por el nuevo proceso de innovación,
cuya ventaja radica en la implementación recursiva de la solución. Si el ruido de las
observaciones w es un proceso Browniano estándar, la función g es independiente de
w y además, se cumple que (ver apéndice A):

t
E g ( xs ) 2 ds (1.5)
0

Las filtraciones producidas por la innovación y las observaciones son las mismas y
contienen la misma información. Sin embargo, (Fujisaki et al, 1972) demostró que
independientemente de los resultados que muestran la equivalencia de las filtraciones
de la innovación y las observaciones, la solución de filtrado puede expresarse en
términos de una integral estocástica respecto al proceso de innovación. Esta
aproximación se basa en el teorema de Girsanov (Girsanov, 1960) para transformar la
medida de probabilidad y así obtener una martingala respecto a Fsv . Puede usarse el
hecho que cualquier martingala continua de cuadrado integrable (respecto a Fsv ) y
puede representarse como una integral estocástica respecto al movimiento Browniano.

La ecuación generada por la solución de esta martingala es la que se conoce como la


ecuación de Kushner, la cual supone que xt es un proceso de Markov con un
generador infinitesimal L, el cual es un operador diferencial y xt , wt son procesos
6

de Wiener independientes. Esto es, sea la función t ( ) E ( xt Ft y ) para todo en


el dominio del operador L, entonces la ecuación de Kushner establece que

t t
t ( ) 0 ( ) t ( L )ds s (g ) s ( h) s ( ) dys s ( g) (1.6)
0 0

Donde la ecuación anterior permite una evaluación recursiva, pero tiene la dificultad
de que la media condicional depende de todos los momentos condicionales de orden
superior, lo que lleva a un sistema de dimensión infinita. Dado que esas ecuaciones no
poseen una solución cerrada, muchas investigaciones han tratado de determinar las
condiciones para la existencia de filtros no lineales, usando la teoría de Lie.
Afortunadamente, la ecuación puede ser mapeada a una ecuación diferencial parcial
estocástica (stochastic partial differential equation, SPDE), manteniendo la densidad
condicional; esta es la llamada ecuación que Zakai propuso en 1969 (Zakai, 1969).

En Kunita, 1982 se muestra que la solución a las ecuaciones de Kushner y Zakai


tienen correspondencia uno a uno. Y a partir de estos resultados, muchos
investigadores se dedicaron a buscar soluciones mediante análisis y métodos
numéricos (esquemas de discretización implementables en computadoras) como por
ejemplo el “splitting operator” (Sun and Glowinski, 1993).

Un método alternativo es el de las grillas adaptables locales, “adaptive local grids”,


basado en el esquema de discretización de Kushner y Le Gland (Kushner and Dupuis,
1992) para encontrar soluciones eficientes a la ecuación de Zakai (Chen and Haykin,
2002). Estos métodos se usan cuando se tiene sistemas con ruidos de observación
bajos.

Otro método de aproximación es el filtro de partículas que se abordará en esta tesis.


Los métodos mencionados anteriormente resuelven la ecuación de Zakai y por ende la
función de densidad completa (no normalizada) del problema de filtrado. En
aplicaciones reales, por lo general, no se está interesado en la función de densidad
completa como vehículo para obtener la media condicional de los estados. Cuando se
está interesado solamente en la media condicional de los estados, es mucho mejor
aplicar un método como la aproximación vía cadenas de Markov.

Pensar en resolver la ecuación de Zakai es una buena aproximación al problema de


filtrado óptimo no lineal, pero algunos de los algoritmos que se han desarrollado hasta
ahora no son recursivos ni económicos computacionalmente, lo que puede llevar a
pensar que, dado un problema particular, la solución de la ecuación de Zakai
representa un problema de referencia con el cual deben compararse los demás
métodos.
7

1.1 Objetivos

1.1.1 Objetivo general

El objetivo general de la tesis consiste en desarrollar técnicas de Identificación y de


Estimación de Estados para sistemas dinámicos con características no lineales con
perturbaciones no gaussianas, empleando las técnicas de Filtrado No lineal. En
particular se hace énfasis en el Filtro de Partículas basado en la teoría de estimación
secuencial Bayesiana y en las técnicas secuenciales de Monte Carlo, realizando
aportes en cuanto al desarrollo de los algoritmos y en las aplicaciones en las áreas de
bioprocesos, biotecnología y en robótica móvil.

1.1.2 Objetivos específicos alcanzados: A continuación, se presentan los objetivos


particulares alcanzados en la tesis:

Se investigó el estado del arte del filtrado no lineal y estudiaron las técnicas
más importantes desde la perspectiva Bayesiana que los fundamenta,
consiguiendo de este modo analizar las medidas comparativas para el
mejoramiento de los algoritmos y su implementación práctica.

Se investigaron las técnicas de Filtrado de Partículas fundamentados en los


Métodos Secuenciales de Monte Carlo con el fin de realizar aportes en las
siguientes áreas de interés:

a. Se desarrolló una metodología para la elección de la función de


distribución inicial propuesta para diferentes tipos de Sistemas
Dinámicos No lineales.

b. Se implementó dicha metodología en los problemas de aplicación


práctica del entorno de investigación, como son las áreas de bioprocesos
y biotecnología.

c. Se realizó una evaluación y una mejora en los esquemas de re muestreo


(resampling) para las aplicaciones propuestas.

d. Se hizo un estudio de la eficiencia de Muestras Simuladas y monitoreo


de la eficiencia de muestreo.

e. Luego de la exploración de la técnica de suavizado (smoothing),


regularización, incremento de datos, Rao-Blackwellización y variaciones
de los Métodos de Monte Carlo y Cadenas de Markov (MCMC) se
buscaron mejoras de tipo práctico en los algoritmos.
8

f. Se hizo uso de funciones de densidad de probabilidad del tipo


exponencial, contrastando con las frecuentemente usadas.

g. Se realizó la exploración de nuevas o diferentes reglas de integración


para muestreo eficiente.

h. Se hizo el desarrollo de filtros no recursivos y semirecursivos como


filtros no lineales exactos con dimensión finita poco creciente.
Se realizó la implementación de los filtros de partículas en una aplicación
sobre un sistema no lineal, tanto en simulación del modelo y se contrastaron
los datos con los obtenidos de la experimentación en la planta real. Con esto
se realizó la comparación de las soluciones óptimas del filtrado no lineal con
las soluciones aproximadas empleadas en la literatura (por ejemplo, el filtro
de Kalman extendido).

Se analizó, estudió y dominó la técnica de control basado en métodos


numéricos (Scaglia, 2006) con aplicaciones en la robótica móvil (Scaglia, et
al, 2008) con el fin de usarla en combinación con los estimadores de estados
diseñados mediante técnicas estocásticas.

Se empleó la técnica de filtrado no lineal como estimador de estados,


incluido dentro de un lazo de control avanzado como el control basado en
métodos numéricos y se realizó su implementación dependiendo del tipo de
sistema dinámico y los trabajos de aplicación desarrollados en cada una de
las plantas.

1.2 Importancia de la Investigación

La teoría de filtrado en general, ampliamente desarrollada hace varias décadas, ha


dejado uno de los mayores impactos en el desarrollo tecnológico, pues, debido a su
popularidad y buena aceptación, ha servido como instrumento del desarrollo de
muchas aplicaciones en las áreas de las comunicaciones, sensórica, aeronáutica, etc.
(Julier, 1997).

La necesidad de implementación y mejoramiento de las estimaciones, la falta de


sensores, la búsqueda de nuevas y mejores herramientas de estimación para los lazos
de control, hacen necesario analizar la factibilidad de incorporación de esta técnica.
Aunque está considerada como una de las mejores, esta técnica cuenta con la
dificultad principal de no ser generalizada, debido a la necesidad del conocimiento
previo del comportamiento dinámico del sistema, para el planteamiento de las
funciones de distribución utilizadas en el método. Así pues, desarrollando el análisis
9

sobre varios tipos de sistemas dinámicos, es posible plantear una metodología para
definir dichas funciones de distribución que, como se ha mencionado anteriormente,
representan la base de los algoritmos secuenciales de filtrado.

Se analiza la definición de los fundamentos de los filtros de partículas y se estudian


los tópicos más interesantes del algoritmo (esquemas de muestreo, técnicas de
mejoramiento) que representan un campo abierto de investigación.

Del éxito de los algoritmos y las mejoras planteadas depende su incorporación en lo


que representa el objetivo de la automática, el diseño de sistemas de control que los
incluyan dentro de esquemas de estimación o como técnicas de identificación; para así
poder aplicar esta disciplina al sector de control automático de procesos y bioprocesos
o a las aplicaciones de posicionamiento, navegación, seguimiento y localización en
robótica móvil. (Morales and de Freitas, 2003), (Gustafsson and Gunnarsson, 2002),
(Thrun and Fox, 2001).

1.3 Alcances y limitaciones

Como se planteó anteriormente, es parte de este trabajo el estudio de las técnicas de


Filtrado de Partículas, y de la importancia de la elección de los parámetros que esta
técnica implica con el fin de proponer mejoras teóricas y metodológicas para la
implementación en procesos reales, que se encuentran disponibles en el ambiente de
investigación del Instituto de Automática y sobre los cuales es posible la interacción
con otros investigadores para el conocimiento de los modelos y las dinámicas que los
rigen.

La implementación en plantas reales le aporta a este trabajo el carácter


multidisciplinario que necesita para corroborar la importancia de su aplicación en
varias áreas y probar la factibilidad de uso de la metodología propuesta.
10

Capítulo 2
PROBLEMA DE FILTRADO EN GENERAL

El ampliamente conocido algoritmo estándar del filtro de Kalman está bien


representado por el primer y segundo momento de las funciones de densidad de
probabilidad (media y varianza), dado que las ecuaciones de la medida y la transición
se asumen lineales y además, se asume que todas las funciones de distribución
involucradas son gaussianas.

Aunque en dicho algoritmo se asume que las distribuciones de los términos del error
en el modelo de espacio de estado son normales y/o las ecuaciones de las medidas y
las transiciones son lineales, no es posible obtener una ecuación explícita para el
algoritmo de filtrado. Dado que estas condiciones no siempre se cumplen, las
estimaciones de filtrado obtenidas resultan no ser reales.

Como posible solución se planteó una mejora (filtro de Kalman extendido) a través de
una aproximación de las ecuaciones no lineales de las medidas y de las transiciones,
usando las expansiones por series de Taylor y se aplicaron las ecuaciones linealizadas
directamente al algoritmo lineal recursivo del filtro de Kalman. Lo anterior, pudo
hacerse porque el hecho de aplicar las funciones linealizadas al filtro de Kalman
convencional implica que los términos no gaussianos del error con media no cero, se
aproximen como los términos del error con media cero.

Sin embargo, cuando un sistema es lineal y gaussiano, la estimación del filtro de


Kalman es óptima en el sentido que minimiza el error medio cuadrático. Lo que
implica que el filtro de Kalman bajo condiciones de normalidad es un estimador de
mínima media cuadrática y que, sin asumir dicha condición de normalidad, se conoce
como el estimador lineal de mínima media cuadrática (Chen, 2003).

Como mencionaron Meinhold y Singpurwalla (1989), y según Tanisaki (1996), los


modelos de filtro de Kalman basados en condiciones de normalidad no son robustos,
lo que implica que cuando hay una diferencia significativa entre las funciones de
densidades previas y los datos observados, la función de densidad a posteriori se
vuelve poco realista.

Como respuesta al problema de la poca confiabilidad de la información obtenida,


aparecen otro tipo de soluciones que se acercan al escenario real de los sistemas en
cuestión. Se plantea el problema completo de filtrado no lineal no gaussiano en el
11

cual, la aproximación tanto de las funciones de densidad como de las funciones no


lineales, es esencial para encontrar su solución. Así, el conocido como algoritmo de
filtrado Bayesiano recursivo puede obtenerse a partir de las funciones de densidad
condicional de la variable de estado, las cuales son obtenidas por medio de la regla de
Bayes.

Algunos filtros no lineales fueron desarrollados por Kitagawa e Higuchi (Kitagawa e


Higuchi, 1987), Tanizaki (Tanizaki, 1991, 1995b), Tanizaki y Mariano (Tanizaki y
Mariano 1994, 1995a, 1995b). Alspach y Sorenson (Alspach y Sorenson, 1972) donde
se aproximaron las funciones de densidad por distribuciones resultantes de sumas
Gaussianas, llamado Filtro de Suma Gaussiana, en inglés (Gaussian Sum Filter).
Otros sugirieron aplicar a la función de densidad de probabilidad de aproximación,
una Integración adaptable de Monte Carlo conocida como Muestreador de Gibbs
(Gibbs sampler GSF).

Algunos estudios relacionados con el tema son los de Kitagawa e Higuchi (Kitagawa e
Higuchi, 1987) quien propuso una aproximación, representando las funciones de
densidad numéricamente por una función lineal por tramos, donde cada función de
densidad está representada por un número de segmentos, ubicación de nodos, el valor
de cada nodo, y su evolución a través de integración numérica. De acuerdo a esta
aproximación proporcionada por la integración numérica, el costo computacional
incrementa más que proporcionalmente al aumento de la dimensión del vector de
estados. Su programación es compleja si la dimensión es grande. Este tipo de filtrado
numérico de sistemas no lineales no normales se llama Filtro de integración numérica
(en inglés Numerical Integration Filter NIF).

Como mejoras el filtro de integración numérica (NIF), Tanizaki (Tanizaki, 1991),


Tanizaki y Mariano (Tanizaki y Mariano, 1994) sugirieron un filtro no lineal por
muestreo por importancia usando métodos de Montecarlo llamado Integración por
muestreo por Importancia de Monte Carlo (Monte Carlo Integration with Importance
Sampling), en el cual, un algoritmo recursivo de las funciones ponderadas,
representado por la relación entre dos funciones de densidad de probabilidad, se
obtiene a partir de simulaciones del método de Monte Carlo estocástico.

Geweke y Tanisaki (Geweke y Tanisaki 1999), desarrollaron una función de densidad


de probabilidad previa en un marco bayesiano, llamada teoría de Muestreo por
Importancia la cual es aplicada a filtros no lineales no gaussianos. Desde el punto de
vista de programación y tiempo computacional, este filtro puede extenderse fácilmente
a casos prácticos de dimensión grande, comparado con el filtro de integración
numérica.

Uno de los problemas en el filtro de muestreo por importancia, consiste en que, para la
aproximación de las funciones de densidades de filtrado (funciones de densidad
12

objetivo), el diseñador debe elegir apropiadamente otra función de densidad; esta


función es llamada función de importancia, la cual se elige empíricamente de acuerdo
al problema específico.

Una alternativa para evadir este problema de elección de la función de importancia,


fue propuesta por Tanizaki y Mariano (Tanizaki y Mariano, 1994), desarrollando un
filtro de Monte Carlo basado en funciones de densidad (en inglés density based Monte
Carlo Filter DMF), donde se usa el método de simulaciones de Monte Carlo
estocástico como solución alternativa del modelo de espacio de estados no lineal. Las
características del algoritmo propuesto por Tanizaki y Mariano, radican en que los
números aleatorios del vector de estados son generados a partir de la ecuación de
transición para todo el tiempo y que el algoritmo requiere la obtención de la función
de densidad a partir de la ecuación de las medias. Lo que significa que la ecuación que
relaciona las medias es utilizada para encontrar la función de densidad mientras que la
ecuación de transición de los estados es usada para generar los números aleatorios de
las variables de estado, este último también es llamado estimador no lineal.

También se propusieron algunos filtros no lineales usando aproximaciones de Monte


Carlo. Para la solución de este problema usaron muestras aleatorias para obtener
estimaciones; donde se usa el muestreo por rechazo para generar las muestras
aleatorias a partir de las funciones de densidad de filtrado. Usando la técnica de
muestreo por rechazo, se obtiene un algoritmo recursivo llamado Filtro de Muestreo
por Rechazo (en inglés Rejection Sampling Filter RSF), aquí no se necesitan las
formas funcionales de las funciones de densidad de probabilidad que se usan en el
filtro de integración numérica y en el de muestreo por importancia; dado que las
muestras aleatorias son generadas a partir de la función de densidad, su programación
es más fácil comparada con otros filtros.

Los filtros de Kalman extendido, filtro no lineal de segundo orden, filtro de


simulación de Monte Carlo y el filtro de iteración de un estado son clasificados por
Tanisaki como filtros no lineales tradicionales. El filtro de sumas gaussianas, filtro de
integración numérica, filtro de muestreo por importancia y el filtro de Monte Carlo
basado en funciones de densidad y el de muestreo por rechazo, son llamados filtro no
lineales basados en funciones de densidad. Otra clasificación para el filtro de
simulación de Monte Carlo, filtro de muestreo por importancia, filtro de Monte Carlo
basado en funciones de densidad y el de muestreo por rechazo, son llamados filtros no
lineales basados en simulación (Tanizaki, 1996).

Como los métodos recursivos son el principal contenido de esta tesis, se tratarán a
profundidad posterior al estudio de las teorías básicas, en el capítulo 3. Ahora bien, en
este punto es necesario definir claramente las operaciones que se consideran dentro de
la teoría de filtrado en general y que definen y dan forma a los problemas que se van a
plantear más adelante.
13

Filtrado: Es la extracción de información de una cantidad de interés a un instante de


tiempo t usando medidas de los demás estados del sistema, hasta el tiempo t inclusive.

Predicción: Es una forma de estimación a priori. Lo que hace es derivar información


acerca de la cantidad de interés en un tiempo t + T en el futuro (T>0) usando los datos
de las medidas incluido el tiempo t.

Suavizado: es una forma de estimación a posteriori en la cual se usan los datos


medidos después del tiempo de interés para las estimaciones. Específicamente, el
estimado suavizado en el tiempo t’ se obtiene usando datos medidos en el intervalo (0,
t), con t’<t.

2.1 Estadística bayesiana y Estimación bayesiana

La estadística bayesiana, sobre la cual se basan la mayoría de los filtros no lineales


recursivos, permite modelar las incertidumbres incorporando conocimiento previo y
evidencia observacional. De la misma forma, hace uso de la probabilidad como una
medida condicional de la incertidumbre, donde todas las incertidumbres son tratadas
como variables aleatorias.

Como manera de describir las cualidades de una o más variables, se les llaman
“estadísticas bayesianas suficientes” a las expresiones del tipo p(x/y), donde y son las
medidas u observaciones del sistema, y la variable x es la información que no se
dispone explícitamente. Dicha estadística cumple con la condición de que las
probabilidades condicionales sean de la forma p(x/y)= p(x/y’), para todo par de
observaciones y e y’. Para su uso, debe comenzarse con la selección de un modelo
donde se incluyan los datos tomados y los cálculos de sus probabilidades previas, y
posteriormente estimar los parámetros para incorporar los datos en el modelo a
conformar.

Cuando se desean abordar los problemas de estimación, desde una perspectiva


estocástica, se deben tener en cuenta dos tipos de ópticas: la bayesiana y la fisheriana,
las cuales son ampliamente conocidas. La primera, se basa en el famoso teorema
planteado por el inglés Thomas Bayes y publicado después de su muerte en 1763. La
segunda aproximación se debe a los trabajos desarrollados por Sir Ronald Aylmer
Fisher en las primeras décadas del siglo XX.

La diferencia principal entre ambos puntos de vista para la estimación de los estados
en sistemas dinámicos, radica en la aproximación Bayesiana al problema conocido
como método del máximo a posteriori (MAP), los estados y las medidas de las salidas
del sistema son considerados como variables aleatorias. Mientras que la teoría
desarrollada por Fisher llamada también como el método de máxima verosimilitud (en
14

inglés maximum likelihood ML), el estado está planteado como fijo pero desconocido
y no es una variable aleatoria.

En casos especiales los estimadores fisherianos (ML) y bayesianos (MAP) producen


las mismas estimaciones, aunque las aproximaciones conceptuales sean diferentes. De
esta forma, tanto el estado como las salidas medidas, están relacionadas por una
medida llamada función de probabilidad condicional (en inglés likelihood function
p(y/x)). Es aquí donde ambas teorías difieren puesto que desde el punto de vista
Fisheriano la función de probabilidad (escrita como l(x)), es función únicamente del
estado x incluyéndose después de esto las observaciones. Esta perspectiva no se
analizará en el presente trabajo4.

Desde el punto de vista bayesiano que nos ocupa, el objetivo planteado es usar la
información obtenida a partir de las observaciones de las variables aleatorias que
representan las medidas de las salidas y(t) y las entradas u(t) con el fin de inferir
información de las otras variables aleatorias representadas por los estados del sistema
x(t).

En este tipo de estimación estadística se trata al vector de observaciones y como un


vector aleatorio, justificando que se asumen ruidos de medida aleatorios, equipo de
medida impreciso o algunos otros efectos o dinámicas no modeladas. Se asume
entonces, que el vector de observación tiene la ya mencionada función de densidad de
probabilidad p(y/ x). Donde si el valor verdadero del parámetro es conocido, las
propiedades estadísticas de la medida pueden ser conocidas.

El vector de variables aleatorias x posee una función de densidad de probabilidad a


priori p(x), la cual contiene toda la información acerca del vector de estados, previo al
desarrollo del experimento y a la obtención de las medidas. Esta distribución previa
acopla toda la información conocida y desconocida acerca de los parámetros, previo a
la observación de las salidas experimentales. El resultado del experimento es una de
las realizaciones5 del proceso estocástico que define la variable aleatoria y. Cuando se
obtienen las medidas es necesario obtener información acerca de cómo se relacionan
con el vector de estados, es aquí que dicha relación es proporcionada por la ya
mencionada función de probabilidad; la cual, diciéndolo de otro modo, provee
información acerca de qué tan bien las medidas aproximan el estado. La función de
probabilidad proviene del modelo de medida (Schon, 2003), (Lehmann, 1991),
(Berger, 1985), (Box y Tiao, 1992), (Bergman, 1999) y (Mitter, 1996).

A continuación se presentará la regla de Bayes con el fin de formalizar parte de lo


anteriormente descrito como la base de los filtros que se desarrollarán. Precedida por

4
Ver Apéndice A Estadísticas suficientes desde el punto de vista Fisheriano.
5
Ver Apéndice A definición de realización en un proceso estocástico.
15

la formulación continua del modelo de estados que se considera en esta tesis.


Posteriormente, se describirá el caso discreto.

2.1.1 Formulación Continua del Modelo General de estados

Se asume que la evolución de cada uno de los estados del sistema obedece a la
siguiente ecuación diferencial estocástica:

dxt f xt , t dt 1 xt , t dwt
(2.1)

Donde el objetivo es estimar recursivamente el vector de los estados x a partir de las


medidas y definidas como:

dyt g xt , t dt 2 xt , t dvt (2.2)

Donde f , g , 1 y 2 son funciones vectoriales o matriciales de las dimensiones


adecuadas (funciones no lineales) y los vectores vt , wt son procesos de Wiener
independientes.

Teorema de Bayes

La función de densidad de probabilidad condicional de los estados respecto a las


observaciones puede escribirse como:
p ( y / x) p( x)
p( x / y) (2.3)
p( y)

Donde la constante de normalización correspondiente al denominador, puede


expresarse usando la ley de probabilidad total:

p( y ) p( y / x) p( x)dx (2.4)
n

La función de densidad p(y/x) es la verosimilitud mientras que la función de densidad


de los estados o parámetros p(x) es llamada a priori. Usando el teorema de la
probabilidad total, la regla de Bayes (llamada también el resultado a posteriori) puede
expresarse usando la función de densidad conjunta de x e y, p( y, x) como en la
ecuación 2.5.
16

a posteriori verosimilitud a priori


p( y, x)
p ( y / x) p( x) p( x / y ) (2.5)
p( x / y ) p( y, x)dx
p( y)
n
evidencia

Dado que la función de densidad de probabilidad condicional es la solución


fundamental al problema de inferencia, la distribución conjunta es la única descripción
necesaria para desarrollar una inferencia estadística.

Desde el punto de vista bayesiano, la función de probabilidad de la salida respecto a


los estados del sistema y la distribución a priori, o alternativamente la función de
densidad, definen el modelo estadístico del problema de estimación; mientras que la
función a posteriori es la solución. Una vez obtenida la información {y=y}, las
variables previamente mencionadas (como la variable aleatoria x), se convierten en la
variable aleatoria x/y, y la función de densidad a posteriori se usa para deducir la
probabilidad de cada característica obtenida a partir de los datos. Luego, la función de
densidad condicional a posteriori debe siempre considerarse como la solución más
general al problema de estimación, si se tiene como objetivo principal obtener algunos
rasgos de la variable a posteriori.

2.1.2 Soluciones óptimas del problema de filtrado no lineal: Ecuacion de Kushner,


Ecuacion de Zakai

El problema de filtrado No lineal ha sido considerado por Bucy (Bucy ,1965),


Kushner (Kushner, 1967), Zakai (Zakai, 1969), y sus estudios se concentraron
principalmente en encontrar una ecuación para la función de densidad de probabilidad
condicional de un proceso no observado, dada una trayectoria observada. Es sabido
que la esperanza condicional del proceso (operador de Expectación) dada la
trayectoria, da su mejor estimación en media cuadrática.

Esta función de densidad condicional, puede calcularse usando dos métodos:

El primero es la llamada ecuación de Kushner (Kushner, 1967), la cual es una


ecuación diferencial en derivadas parciales no lineal estocástica.
El segundo método es la llamada ecuación de Zakai (Bucy, 1965), (Zakai,
1969), la cual es una ecuación diferencial en derivadas parciales lineal para la
función de densidad no normalizada.

En la tesis se presentarán ambas aproximaciones. Sin embargo, el problema de


construir soluciones de la ecuación de Zakai es más importante para aplicaciones
prácticas debido a la linealidad. La aproximación a esta ecuación se hará conforme al
trabajo de Daum (Daum, 1987) y Twardowska (Twardowska et al, 2003) en los cuales
17

se menciona que si en la ecuación de Zakai se reemplaza la perturbación con buenas


aproximaciones, entonces las aproximaciones convergen a la ecuación límite con el
llamado término de corrección de Itô. Respecto a la aproximación a la ecuación de
Kushner (Kushner, 1967), el tema será abordado desde su propia perspectiva,
respetando la notación de su trabajo. Es de anotar que ambas perspectivas exigen una
formalidad matemática que será respetada de sus trabajos originales.

Ecuación de Kushner

La función de densidad condicional de los estados xt , dadas las observaciones


ys , s t , se escribe simplemente como P a, t . Por simplicidad, la dependencia de
P a, t respecto a ys , s t se suprime en la notación usada por Kushner. El modo de
P a, t , escrito como at , es un proceso estocástico (suponiendo que es un modo), y el
objeto del artículo de Kushner es la obtención de la ecuación dinámica que satisface
at . Como en el caso Gaussiano lineal, la ecuación contiene la observación. La más
simple de las ecuaciones de filtrado es el resultado de Kalman y Bucy para el caso
lineal Gaussiano.

“El saber si es más útil conocer el modo condicional que la media condicional para
algún problema de filtrado, es un punto de controversia, dependiendo del problema
específico”.

A pesar de la controversia, es útil comparar los métodos de procesamiento de los datos


observados o al menos tener algunos significados alternativos para la disponibilidad
de este procesamiento. Sin embargo, la estimación del modo condicional tiene un
perfil intuitivo intrínseco a la estimación de “máxima verosimilitud” o probabilidad.

El sistema correspondiente a la ecuación exacta no se puede construir con


componentes finitas para el problema no lineal (también cierto para la ecuación de la
media condicional). A pesar de ello, es útil tener una expresión explícita de la
ecuación exacta con la cual comparar las aproximaciones hechas por cada método,
para su utilidad en aproximaciones sugeridas, o para saber que debe ser aproximado.
Esto último, es cierto especialmente en vista de la gran importancia y la dificultad del
problema de procesar datos no lineales. Por ellos, el hecho de hacer buenas
aproximaciones es un campo abierto actualmente.

En la publicación de Kushner, se encuentran citados algunos trabajos (Bryson y


Frasier, 1963), (Friedland, 1969) y (Friedland y Bernstein, 1969) sobre los cuales, él
basó sus estudios para la formulación de su solución al problema de filtrado No lineal,
18

en los cuales se consideraba un tipo de problema ligeramente distinto para el tiempo


continuo y discreto. Esto es, considerando el sistema en tiempo continuo dado por:

xt f x t (2.6)

Con las observaciones

t g xt t (2.7)

Que para la ecuación de Zakai eran llamadas z.

Entonces, el equivalente en tiempo discreto del problema considerado anteriormente,


es encontrar la secuencia xn que maximice la secuencia P xn / 1 ,..., n , es decir, que
maximice la probabilidad del valor actual de los estados, dadas las observaciones
hasta el instante actual.

El problema en (Bryson y Frasier, 1963) y (Friedland y Bernstein, 1969) consistía en


encontrar la secuencia de los valores anteriores de xn que maximizaran la secuencia
P x1 ,.., xn / 1 ,..., n , lo que era resuelto aproximadamente por medio de
aproximaciones a problemas de dos puntos de acotamiento.

Una ventaja obtenida al hacer la aproximación de la secuencia, consiste en que en vez


de usar las aproximaciones derivadas indirectamente antes del trabajo de Kushner, él
plantea una solución donde el significado exacto de todos los términos queda claro y
no quedan explícitos ni expuestos ningún multiplicador o ninguna cantidad que no se
encuentre definida en términos de cantidades conocidas.

En el trabajo de Kushner se plantea como innovación, que la función P a, t sea


suficientemente diferenciable respecto a las componentes de a. Entonces, en el modo
a el gradiente satisface que Pa at , t 0 , donde los subíndices ai representan la
derivada, a el gradiente, aa la matriz de segundas derivadas parciales y la expresión
Pai aa denota a Pai .
aa

Se supone que la matriz Paa at , t es no singular, y en caso que lo fuera, entonces el


modo no es único, o puede ocurrir un salto finito en at en un instante infinitesimal de
tiempo, o posiblemente pueda ocurrir algún otro problema analítico. No es necesario
19

suponer que P at , t es unimodal, pero suponiendo que a es la ubicación de un


máximo local de P a,0 , es decir Pa a0 ,0 el resultado obtenido por Kushner que se
mostrará más adelante, representa el movimiento de la ubicación del máximo local de
el modo at correspondiente a la condición inicial a0 a lo largo del movimiento
continuo de at y la matriz Paa at , t es no singular.

Para mostrar el movimiento del máximo local de at expresado mediante la expresión


da , debe considerarse que la función de densidad condicional P at , t satisface
condiciones de suficiente derivabilidad respecto a at y se supone que satisface una
ecuación diferencial estocástica.

El resultado general de Kushner, radica en que el vector de proceso (el modo


condicional) at satisface la ecuación diferencial estocástica:

da PPaa1 g a' 1
dy gdt Paa1 L P a
dt
1 2 1 (2.8)
P 2 Paa1 dy ' 1
g Paa1 g a' 1
dy P Paa u
aa 2

En la cual, las funciones f, V, g , P y sus derivadas se evalúan en at , t . El símbolo


'
prima ’ significa la transpuesta, la matriz g a es la matriz que en su i - ésima columna
tiene el gradiente respecto a at de gi ; la i - ésima componente del vector gdyi dy j
debe ser interpretado como Edwi dw j ij dt los que son el (i,j )- ésimo elementos de
la matriz .

En la ecuación diferencial estocástica anterior, el vector u, tiene componentes

1
ui dy ' g a Paa1 Pai aa Paa1 g a' 1
dy (2.9)

1 (2.10)
L P fi P v P
i ai 2 i, j ij a a
i j
20

Q
Note que L Q es la ecuación de Kolmogorov6 para la función de densidad de
t
un proceso no condicionado.

Dada la complejidad de la ecuación diferencial, Kushner expone el caso escalar en el


cual, se observa que si las realizaciones del proceso P / Paa y Paaa / Paa se encuentran
disponibles, puede construirse el sistema y se obtiene un sistema dinámico cuya
entrada es la observación y cuya salida es el modo condicional.

Si el sistema es completamente lineal y Gaussiano, entonces la expresión de Paaa 0


y P / Paa será el negativo de la varianza condicional de la media condicional, que
coincide con el valor de at . Como por ejemplo que el valor q P / Paa , hecho que
satisface la ecuación de Ricatti.

Ecuación de Zakai

Kalman y Bucy resolvieron el problema de estimación lineal con medidas continuas


en 1961. Luego de esta publicación, en los últimos tiempos muchos investigadores
han desarrollado muy pocos filtros exactos de dimensión finita para problemas no
lineales. Estos filtros existen en casos especiales, por ejemplo, el filtro de Benes y el
de Daum. (Benes, 1981, 1985), (Daum, 1986, 1987, 1987), and projection filter.
Daum hizo algunas aproximaciones a la solución del problema, inicialmente para
algunos problemas de difusión y luego por medio de la separación de variables bajo
ciertos criterios. Esta sección de esta tesis, será basada en su trabajo y se conservará la
nomenclatura utilizada (Daum, 1987).

La aproximación a la ecuación de Zakai, puede ser implementada en tiempo real,


solucionando un número finito fijo de ecuaciones diferenciales ordinarias. Se
mantendrá la notación del trabajo de Twardowska (Twardowska et al, 2003)

6
Ecuación de Kolmogorov: Según el teorema 4.3.1 en (Kushner, 1967) siendo aij(.) y fi(.) acotados y que
satisfagan la condición uniforme de Holder, y sea a(.) uniforme definida positva. Entonces existe un proceso
de difusión homogéneo con un generador diferencial L. Su densidad de transición p(x,t,y) (la densidad de la
función de transición de Markov P(x,t,y)) es la solución fundamenal de la ecuación diferencial (en variables
x,t donde x es igual al estado inicial) u / t x, t Lu x, t con condiciones
iniciales u x, t x y ,t 0 . El proceso es fuertemente Feller y Markoviano, y es una solución única
t t
de Y (t ) x f Y ( s), s ds Y (s), s dw(s)
0 0
21

Considere el problema de estimar una difusión (ver apéndice A) In valuada x(r), que
evoluciona en tiempo continuo de acuerdo a la siguiente ecuación diferencial
estocástica de Itô. (ver apéndice A).

dx(t ) f ( x(t ), t )dt G(t )dw(t ) (2.11)

Donde f, G son funciones no lineales y dadas las medidas Rn valuadas, tomadas


continuamente en el tiempo:

dz (t ) h( x(t ), t )dt dv(t ) (2.12)

Donde h, es una función no lineal y el proceso estocástico {w(t)} es un movimiento


Browniano estándar en el espacio Rn, independiente de x(t) y {v(t)}. El ruido de
proceso medido, {v(t)}, es un movimiento Browniano Rm valuado, con una matriz de
covarianza definida positiva E dvdvT R(t )dt y {v(t)} es independiente de las
condiciones iniciales de los estados x(t0).
La variable aleatoria x(t) tiene una función de densidad de probabilidad no dispersa
p(x,t) y lo suficientemente suave para satisfacer la ecuación de Focker - Plank. (ver
apéndice A).

El sigma álgebra generado por el conjunto de observaciones en un intervalo de tiempo


t0 t se denota Zt. (ver apéndice A). Para unas condiciones iniciales dadas,
p( x, t0 ) se asume que la ecuación de Zakai que corresponde al sistema definido en
(2.11) y (2.12) tiene una única solución p( x, t Zt ) en su espacio de Sobolev
apropiado.

Para comenzar con el desarrollo de este tópico, debe hacerse un conjunto de


condiciones teóricas previas, mencionadas a continuación:

Se asume que existen las matrices de funciones MxM valuadas A A(t ), A R MxM , y
el conjunto de las funciones del tiempo Bj=Bj(t) pertenecientes a MxM, para
j=1,2,…,M de modo que las ecuaciones diferenciales en derivadas parciales (2.13) y
(2.14), tengan una solución Rn valuada θ = θ(i,t) para todo i y t de tal forma que se
cumple que:
22

1
Qr T f A (2.13)
t x 2

T M
1
Q j Bj (2.14)
2 x x j 1

x, z, t CT z, t x, t (2.15)

En la cual

T
r log p x, t , 1 x, t ,..., M x, t ,Q GG T (2.16)
x

Y
2
T j
1 x, t ,..., M x, t , j Tr Q (2.17)
x2

Y definiendo
1 T 1
h x, t R t h x, t hT x , t R 1
t z (2.18)
2

Existe una solución ψ= ψ(t) y (2.21) de modo que p(x,t)exp(θT(x,t)ψ(t)) sea un


elemento del espacio de Sobolev S.

d t
AT t t t C z, t (2.19)
dt

T
En el que 1 , 2 ,..., M con j
T
B j , para j=1,2,…,M y la condición
inicial de la ecuación (2.19) es ψ(t0)=0.

Luego, el teorema que se propone para resolver es el siguiente:


23

Teorema:

Considere el problema de estimación no lineal planteado anteriormente, y cuente con


las condiciones asumidas 1 y 2. Bajo esas condiciones, el problema de estimación
tiene una estadística suficiente ψ(t) de Rm y la función de densidad condicional No
normalizada de x(t) está dada por:

T
p x, t Z t p x, t exp x, t (t ) (2.20)

2.1.3 Formulación en tiempo discreto del Modelo General de estados

Se asume que la evolución de los estados del sistema en tiempo discreto obedece a la
siguiente ecuación estocástica en diferencias:

xk f k ( xk 1 ) 1k xk 1 , wk 1
(2.21)

Donde el objetivo es estimar recursivamente los estados xk a partir de las medidas


definidas mediante la siguiente ecuación estocástica en diferencias:

yk hk ( xk ) 2k xk 1 , vk 1
(2.22)

Donde f , g , 1 y 2 son funciones vectoriales o matriciales de las dimensiones


adecuadas (funciones no lineales discretizadas). Y se asume que ahora wk y vk son
ruidos blancos tanto en los estados como en las muestras. Ya que la aproximación
discreta al proceso de Wiener puede ser interpretado como un ruido blanco.

El problema es calcular recursivamente el vector de estados xk en el tiempo k tomando


diferentes valores, a partir de los datos muestreados y1:k para construir una función de
densidad de probabilidad de los estados p( xk / y1:k ) si se conoce p( xk 1 / y1:k 1 ) por
medio de la relación establecida por el Teorema de Chapman-Kolmogorov (Oskendal,
2003):

p ( xk / y1:k 1 ) p( xk / xk 1 ) p( xk 1 / y1:k 1 ) dxk 1


(2.23)

Donde los estados xk son un proceso de Markov de orden 1, por eso cumplen
24

p( xk / x0:k 1 ) p( xk / xk 1 )
(2.24)

La función de densidad de probabilidad, puede escribirse como:

p( xk / y1:k 1 ) p( xk / yk 1 )
(2.25)

Y de esta forma, ésta se convierte en la función de transición de probabilidad de los


estados y en el instante de tiempo k se cumple la regla de Bayes

p( yk / xk ) p( xk / y1:k 1 )
p( xk / y1:k 1 )
p( yk / y1:k 1 )
(2.26)

Donde se llamará la Probabilidad a p( yk / xk ) que determina esencialmente el modelo


de ruido medido. Previo a p( xk / y1:k 1 ) , con
p ( xk / y1:k 1 ) p ( xk / x1:k 1 ) p ( xk 1 / y1:k 1 )dxk 1 y evidencia, p( yk / y1:k 1 )

Por ende se cumple que la evidencia es:

p ( yk / y1:k 1 ) p ( yk / xk ) p( xk / y1:k 1 )dxk


(2.27)

Retomando lo anteriormente expuesto, la aproximación tanto de las funciones de


densidad de probabilidad de los estados y de las funciones no lineales es el punto
clave del algoritmo. Con esta información se plantea la estimación de los estados
usando el algoritmo de filtrado recursivo bayesiano donde pueden obtenerse de las
funciones de densidad condicional de las variables de estado, usando la información
proporcionada a partir de la regla de Bayes previamente mencionada.

Desde el punto de vista bayesiano, la funciones de probabilidad (evidencia) y a priori,


o alternativamente la función de densidad de la salida respecto al estado, definen el
modelo estadístico del problema de estimación, mientras que la función a posteriori es
la solución. Una vez obtenida la información de las medidas y , los estados
previamente mencionados como la variable aleatoria x, se convierten en la variable
aleatoria x / y y la función de densidad a posteriori se utiliza para deducir la
probabilidad de cada característica obtenida a partir de los datos.
25

Luego, la función de densidad a posteriori debe tenerse en cuenta siempre como la


solución más general al problema de estimación, si se tiene como objetivo principal
obtener algunos rasgos de la variable posterior. Así pues, la solución completa y
óptima al problema de estimación bayesiana la da, la función de densidad a posteriori
como la mejor aproximación de toda la información disponible acerca del estado x.
Obtenida a partir de la solución recursiva de las integrales anteriormente expuestas, lo
que es analíticamente difícil de resolver debido a la dimensión del problema.

El desarrollo de un algoritmo de este tipo implica, el cálculo de las integrales


multidimensionales de las funciones de densidad de probabilidad anteriormente
mencionadas, lo que hace que el costo de su procesamiento en procesadores sea
computacionalmente alto. Debido a la carga computacional que implica la solución
óptima del problema de filtrado, proporcionada por la regla de Bayes y la ecuación de
Chapman Kolmogorov, este tipo de filtro teórico propuesto sugiere una solución
secuencial lo que sugiere que una de las herramientas posibles son los métodos de
Monte Carlo, los cuales usan el muestreo estadístico y técnicas de estimación para
evaluar soluciones a problemas matemáticos de esta naturaleza.
26

2.2 Filtrado Lineal, Filtro de Kalman

2.2.1 Introducción

La aplicación del algoritmo básico y la evolución del conjunto de algoritmos que


actualmente se conocen como Filtro de Kalman, comienza considerablemente rápido
luego de la publicación original del algoritmo recursivo. Las mejoras hechas por
Kalman y otros investigadores, dio origen a una avalancha de aproximaciones y
avances teóricos hacia la formulación de una extensión a los sistemas no lineales. Los
estudios antes mencionados acerca del filtro de Kalman son aplicables a la teoría de
filtrado en general, y su extensión a los sistemas no lineales. En esta tesis los primeros
pasos hacia la estimación de estados se realizaron mediante filtros lineales y
subóptimos; que, como se vio anteriormente, son simplificaciones de los casos de
filtrado óptimo, que se aproximarán mediante filtrado de partículas. Particularmente,
puede afirmarse que el filtro de Kalman es la aplicación general del filtro bayesiano
recursivo.

2.2.2 Breve Definición:

Dentro de las herramientas matemáticas que se pueden usar para la estimación


estocástica de los estados de un sistema dinámico a partir de medidas con ruidos, nos
ocupa estudiar la más conocida usada desde su aparición: el filtro de Kalman,
propuesto por Rudolph E. Kalman, quien publicó en 1960 un artículo donde describía
una solución recursiva al problema de filtrado lineal gaussiano en tiempo discreto
(Kalman, 1960; 1961). Este filtro es esencialmente un conjunto de ecuaciones
matemáticas que implementan un estimador del tipo predictor-corrector, que es
óptimo en el sentido que minimiza la covarianza del error de estimación, siempre y
cuando se cumplan las condiciones propuestas.

n
Este filtro, trata de estimar el estado x de un proceso controlado de tiempo
discreto, gobernado por la ecuación estocástica en diferencias:

xk Axk Buk wk
1 (2.28)

La matriz A en la ecuación en diferencias del estado relaciona el estado en el instante


previo (k-1), con el estado en el instante de tiempo actual (k), sin tener en cuenta algún
tipo de ruido en el proceso. La matriz B de dimensión (n x l) relaciona la entrada
l
u (que es una secuencia arbitraria de entrada al sistema, que puede o no ser una
acción de control dependiendo de la configuración del filtro si es en lazo abierto o
27
m
cerrado con un controlador) con el estado xk . Y con una medición y definida
como:

yk Hxk vk
(2.29)

La matriz H, de (dimensión n x m) en la ecuación de las medidas relaciona el estado


xk con cada una de ellas yk . En la práctica, A y H pueden cambiar con el tiempo pero
se considerarán invariantes en el tiempo. Las secuencias de ruido blanco discreto
gaussiano { wk } y { vk }, pueden o no ser independientes entre si y las mismas
representan el ruido del proceso y de las medidas, respectivamente. A partir de ellas
es posible definir expresiones para las matrices de covarianza Q y R y de covarianza
cruzada S:

w (t ) Q S
E w T ( ) vT ( ) (t ) (2.30)
v(t ) ST R

Q 0, R 0

o lo que es equivalente

E [ w (t ) w T ( )] Q (t ) , Q 0 (2.31)

E [v(t ) v T ( )] R (t ) , R 0 (2.32)

E [ w (t ) v T ( )] S (t ) (2.33)

1 para t
Donde (t ) es la delta de Kronecker: (t )
0 para t

Con respecto a la matriz de covarianza cruzada S, puede lograrse S 0 y por lo tanto


que { wk }y { vk }, sean independientes redefiniendo la matriz A, la perturbación wk y
la matriz Q .

Los estados iniciales x0 son variables aleatorias gaussianas de media x0 y matriz de


covarianza P0 además se asume que las secuencias { wk } y { vk } no están
correlacionadas con x0 .
28

p(w) N (0, Q) p(v) N (0, R) (2.34)

Las matrices de covarianza del ruido de proceso y de la medida son Q y R


respectivamente, las cuales en la práctica, pueden, ser variantes en el tiempo. En la
tesis se considerarán invariantes.

Se define xˆk n
(súper menos) la estimación del estado a priori en cada tiempo k,
dado que se conoce el valor del estado previo en el tiempo k. Sea xˆk n
la
estimación del estado a posteriori en el tiempo k dadas las medidas yk . Ahora bien,
los errores de estimación a priori y a posteriori son:

ek xk xˆk ek xk xˆk
(2.35)

La covarianza del error a priori es:

Pk E ek ek T
(2.36)

y la covarianza del error estimado a posteriori es:

Pk E ek ekT
(2.37)

Debe encontrarse una ecuación que calcule el valor de la estimación del estado a
posteriori xˆk n
como combinación lineal de la estimación del estado a priori
xˆk n
y una diferencia ponderada entre la medida actual zk y la predicción de la
medida Hxˆk n
de la forma:

xˆk xˆk K k yk Hxˆk (2.38)

A continuación se tratará de dar una breve justificación de la ecuación anterior desde


el punto de vista probabilístico. La diferencia yk Hxˆk en la ecuación anterior es la
innovación de la medida, o residuo, que refleja la discrepancia entre la medida
29

predicha Hxˆk n
y la medida actual o valor verdadero. La matriz Kk de dimensión n
x m en la ecuación (2.38) es la ganancia o factor de combinación que minimiza la
ecuación de la covarianza del error a posteriori. Dicha ganancia se calcula de la
siguiente forma:

1
Kk Pk H T HPk H T Rk
(2.39)
Con

lim K k H 1 , lim K k 0
Rk 0 Pk 0
(2.40)

La justificación para la obtención de esta ganancia está basada en la probabilidad de


una estimación a priori condicionada por todas las medidas previas según la regla de
Bayes. Es de anotar que el filtro de Kalman mantiene los dos primeros momentos de
la distribución del vector de estados.

E xk xˆk
T
E xk xˆk xk xˆk Pk
(2.41)

La ecuación de estimación del estado a posteriori refleja la media de la distribución de


estados, la cual está normalmente distribuida si las condiciones se cumplen. La
covarianza del error a posteriori refleja la varianza de la distribución de estados (el
segundo momento no central). En otros términos,

T
p xk zk N E xk , E xk xˆk xk xˆk

p xk zk N xˆk , Pk
(2.42)

El filtro de Kalman estima estados dentro de un proceso usando una forma de control
por realimentación: el filtro estima el estado del proceso y, al mismo tiempo, obtiene
la realimentación en forma de medidas con ruido. Entonces, las ecuaciones para el
filtro de Kalman se dividen en dos grupos: ecuaciones de actualización y ecuaciones
de medida. Las primeras son las que proyectan o adelantan en el tiempo el estado
actual y las estimaciones del error de covarianza para obtener las estimaciones a priori
para el nuevo tiempo de paso. Las ecuaciones de actualización de las medidas son las
30

responsables de la realimentación, es decir, incorporar una nueva medida en la


estimación a priori para obtener una estimación a posteriori mejorada.

Las ecuaciones de actualización pueden pensarse como ecuaciones de predicción, o de


un predictor, mientras que las ecuaciones de la medida pueden ser ecuaciones de
corrección. Finalmente, el algoritmo tipo predictor-corrector para resolver el
problema de filtrado numéricamente es:

xˆk Axˆk 1 Buk


T
Pk APk 1 A Q
1
Kk Pk H T HPk H T R
xˆk xˆk K k zk Hxˆk
Pk I Kk H Pk

Donde I es la matriz identidad del orden adecuado, y zk es el vector de mediciones


del sistema.

Problema práctico, Demostración: Filtro de Kalman Bucy como caso Lineal de la


Ecuación de Kushner (De utilidad para la comprensión del lector en el sentido que el
problema de filtrado lineal es un caso particular del filtrado óptimo, por ende la
aplicación de filtros de partículas -como solución recursiva al filtrado óptimo- que es
el tema central de esta tesis será usado como técnica superior al filtro de Kalman en
las aplicaciones específicas)

Sean los estados de un sistema dinámico definidos mediante la ecuación diferencial


estocástica

dx(t ) f ( x (t ), t )dt dz
t (2.43)
yt h xs (t ) ds wt
0

Con x el vector de las señales, y las observaciones y los vectores z y w procesos de


Wiener independientes. Las funciones f y h no lineales de las dimensiones adecuadas.

Planteando la ecuación de Kushner en el caso escalar, de modo que


31

qg a qVaaa 3Va VPaaa


da 2
dy gdt f qf aa
2 2 2 Paa
(2.44)
q 2 g aa g a q 2 Paaa g a2
2
dt dt
2 Paa 2

Debe entonces denotarse el valor de P / Paa q . Vamos a encontrar ecuaciones


diferenciales que sean satisfechas por q y por Paaa / Paa ; las cuales tendrán nuevos
términos. Teniendo como punto de referencia su aplicación en la identificación para el
caso lineal y gaussiano; es interesante poder plantear una ecuación para q, con la
varianza condicional.

Luego, nótese que las funciones de la forma P / Paa , Paa , P , f , V se evalúan sobre
at , t en el tiempo t . También para las funciones del tiempo de la forma
L at , t F t dF es un diferencial estocástico total que cumple
dL dF L at dt , t dt L at , t .

Entonces, aplicando el lema de Itô:

2
dqt d P / Paa dP / Paa PdPaa / Paa2 P dPaa / Paa3 dP dPaa / Paa2
(2.45)

Donde, en virtud del lema de Itô, los productos de los diferenciales se reemplazan por
los valores esperados de los productos.

Evaluando la ecuación anterior, tenemos que:


1 g a2 P g g
dq L P q L P aa dt 2
5q 2 q 3 aaa dt q 3 a 2aaa dt
Paa 2 Paa
Paaa q 2 g aa Paaa g a Paaa
q L P a dt g Et g qg aa dt 3q 3 g aa dt (2.46)
2 Paa2 2
2 Paa 2
2 Paa
dy E t gdt q 2 Paaa g a
2
g aa
Paa

En donde el término E t g E g xt ys , s t . La ecuación anterior se reduce a la


ecuación de Ricatti si el sistema es lineal y gaussiano, ya que su primer término es
igual a:
32

q V Paaa Vaaaa Paaa VPaaaa


Vaa q f aaa q 2 f a f q 3Vaa 2Va
2 2 Paa 2 Paa 2 Paa
(2.47)

Donde los valores de Va Vaa gaa g aaa 0y para


a at , Paaa 0, Paaaa / Paa 3/ q . Así queda demostrado.

2.3 Filtros No lineales

2.3.1 Filtro de Kalman Extendido

Debido a la formulación del algoritmo del Filtro de Kalman Extendido fueron


realizados muchos estudios de simulación numérica. Estos estudios demostraron que
las estimaciones y las matrices de covarianzas asociadas producidas por el Filtro de
Kalman Extendido, no hacen necesario tolerar una relación estricta o discernible con
el comportamiento real del sistema y la estimación del error. Tópicos como la
inclusión del término de divergencia, el cual fue inventado para definir el problema,
lanzaron un tipo de investigación que cualquier investigador (que desarrollaba Filtros
de Kalman extendidos para algún problema específico) debía considerar y superar

Dentro de la cantidad de clasificaciones que muchos autores le dan a los filtros no


lineales, algunos clasifican el Filtro de Kalman Extendido como subóptimo, ya que
aunque tenga funciones no lineales, hace su aproximación por medio de una
linealización local, y p( xk / y1:k ) se aproxima por medio de una distribución
Gaussiana.

El Filtro de Kalman Extendido (en inglés Extended Kalman Filter, EKF) se aplica en
sistemas dinámicos no lineales, y consiste básicamente en linealizar las ecuaciones del
sistema utilizando una metodología similar al desarrollo de primer orden de las series
de Taylor. La estimación de los estados puede obtenerse mediante las ecuaciones del
filtro de Kalman aplicadas al sistema lineal resultante de linealizar alrededor del
estado actual, usando las derivadas parciales de las funciones del proceso y de las
n
salidas medidas xk .

n
Se asume que los estados del sistema xk son gobernados por la ecuación
estocástica en diferencias

xk f xk 1 , uk , wk
(2.48)
33

m
con una salida medida yk obtenida a partir de

yk h xk , vk
(2.49)

Considerando a f y h funciones no lineales con respecto a sus argumentos, u las


entradas al sistema y como en el caso lineal las secuencias de ruido blanco discreto
Gaussiano { wk }y { vk }, representan las perturbaciones del vector de estados y de las
medidas respectivamente. Sin embargo, ambas expresiones pueden aproximarse sin
los ruidos de estado ni salida, mediante las relaciones:

xk f xˆk 1 , uk , 0
yk h xk , 0
(2.50)

Es importante decir que el defecto fundamental del Filtro de Kalman Extendido radica
en que las distribuciones (o las funciones de densidades en el caso continuo) de
algunas variables aleatorias, no son Gaussianas bajo sus transformaciones no lineales
respectivas. Es posible afirmar que el Filtro de Kalman Extendido es simplemente un
estimador que aproxima la optimalidad de la regla de Bayes por medio de la
linealización. Ahora bien, para estimar un proceso que se rige por medio de relaciones
no lineales, deben escribirse las ecuaciones que linealizan dichas expresiones:

xk xk A xk 1 xk 1 Wwk 1

yk y k H xk xk Vvk
(2.51)

Donde A es la matriz Jacobiana de las derivadas parciales de f respecto a los estados x

fi
Ai , j xk 1 , uk , 0
xj
(2.52)

W es la matriz Jacobiana de las derivadas parciales de f respecto a w

fi
Wi , j xk 1 , uk , 0
wj
(2.53)
34

H es la matriz Jacobiana de las derivadas parciales de h respecto a x

hi
Hi, j xk , 0
xj
(2.54)

V es la matriz Jacobiana de las derivadas parciales de h respecto a v

hi
Vi , j xk , 0
vj
(2.55)

Debe recordarse que en la práctica el valor real del vector de estados no está
disponible, ya que es la cantidad que se trata de estimar. Pero, por otro lado, se tiene
acceso a la medida real, la cual se usa para obtener el vector de estados estimado.

Se considera entonces un proceso del error con las siguientes ecuaciones de estado:

exk A xk 1 xk 1 k 1

ez k Hexk k
(2.56)

Donde k y k son nuevas variables aleatorias con media cero y matrices de


covarianza WQWT y VRVT, respectivamente, con Q y R matrices definidas
anteriormente en el caso lineal.

Note que las ecuaciones del proceso del error son lineales y se aproximan en su forma
a las ecuaciones usadas en el filtro de Kalman discreto, lo que motiva a usar este
modelo para estimar el error de predicción de los estados exk , usando el residuo de las
medidas ezk , y esta estimación denotada por eˆk , puede usarse para obtener la
estimación del estado a posteriori del proceso no lineal original

xˆk xk eˆk
(2.57)

Luego, teniendo en cuenta las distribuciones aproximadas de las variables aleatorias


k , k y del error:
35

p(exk ) N 0, E exk eTxk

p( k ) N 0,WQkW T (2.58)
p( k ) N 0,VRkV T

Debe buscarse que el valor de eˆk sea cero y se obtiene que

eˆk Kk eyk
(2.59)

Efectuando algunos reemplazos y modificaciones se tiene que

xˆk xˆk K k eyk


(2.60)
xˆk xˆk K k yk yk

La ecuación anterior puede usarse para actualizar las medidas en el filtro de Kalman
extendido a partir de la aproximación sin ruido e yk y la expresión de la ganancia de
Kalman del caso lineal. Resumiendo las ecuaciones de actualización en el tiempo
toman la siguiente forma:

xˆk f xˆk 1 , uk , 0
Pk Ak Pk 1 AkT Wk Qk 1WkT (2.61)

y las de actualización de las medidas

1
Kk Pk H kT H k Pk H kT Vk RkVkT

xˆk xˆk K k yk h xˆk , 0


Pk I K k H k Pk
(2.62)

2.3.2 Métodos Basados en Grillas Aproximados

La aproximación basada en grillas para resolver el problema de aproximación


planteado por Bayes, se hace partiendo de la base que si el espacio de estado es
36

continuo, puede ser descompuesto en Ns celdas y en una forma integral en Rn puede


usarse la grilla para calcular la función de densidad a posteriori. Entonces, el espacio
de estados se distribuye de la siguiente forma:

xki : i 1,..., N s
(2.63)
Donde x representa el vector de estados. Generalmente, el método de integración por
grillas, plantea que la aproximación se hace de la forma:

N
g ( xt )dxt g ( xk(i ) ) n

n i 1
(2.64)

Donde g ( xt ) es una función no lineal de los estados. Usando una grilla regular, con
el volumen ∆n, dentro del conjunto de muestras. El error de aproximación depende del
tamaño de la grilla, o la dimensión del espacio de estados. La grilla debe ser lo
suficientemente densa para dar una buena aproximación al espacio de estado continuo,
el cual debe estar predefinido.

La actualización del tiempo y de las medidas de Bayes se resuelve usando el método


numérico aproximado, donde las funciones de densidad son constantes a tramos en
algunas regiones del espacio de estados. Aplicando integración basada en grillas al
problema de Bayes, y partiendo del modelo de ruido aditivo considerado
anteriormente para sistemas no lineales, las aproximaciones obtenidas son las
siguientes:

p( xk(i ) yk ) k
1
pek ( yk h( xk( j ) )) p( xk(i ) yk 1 )
N
p( xk(i )1 yk ) pwk ( xk(i )1 f ( xk( j )1 )) p( xk(i ) yk ) n

j 1
(2.65)

Donde la notación para los estados x, las salidas y y las funciones no lineales de los
estados f y de las salidas h se mantiene. Y con el factor de normalización

k pek ( yk h( xk(i )1 )) p( xk(i ) yk 1 ) n

i 1 (2.66)

Se obtiene la media estimada como

N
xk k E ( xk yk ) xk(i ) p( xk(i ) yk ) n

i 1 (2.67)
37

En la literatura, se registra la utilización del método basado en grillas para resolver la


ecuación de Bayes, aplicado a varios problemas de navegación en dos dimensiones.
También se registran análisis de desempeño en términos de las cotas de Cramer-Rao.
Inclusive, se han estudiado muchos tópicos de aplicación y varias indicaciones acerca
de cómo usar este tipo de método con grillas de tamaño adaptable.

Respecto a las aplicaciones en los sistemas de navegación con modelos de espacio de


estado de orden superior, se lograron incorporaciones de términos al filtro; resultando
que para evitar implementaciones de grillas de grandes dimensiones, se prefirió el uso
de filtros de partículas que se verá posteriormente (Ahlstrom and Calais, 2000). En el
trabajo de Tanizaki (Tanizaki, 1997) se analizó el problema de sistemas no lineales no
Gaussianos, en contraste con integración por métodos de Monte-Carlo para predicción
y suavizado.

2.3.3 Filtro de Kalman Unscented

Julier, Uhlmann, and Durrant-Whyte (Julier et al., 1995) argumentaron que con un
número fijo de parámetros debe ser más fácil aproximar una distribución Gaussiana
que una función no lineal arbitraria, e introdujeron una nueva generalización del filtro
de Kalman, la cual llamaron filtro de Kalman no perfumado, en inglés, Unscented
Kalman Filter (UKF) (se le llamará el filtro de Kalman Unscented, ya que la
traducción no es apropiada para su significado). Este filtro permite la propagación de
las medias y las covarianzas a través de las ecuaciones del sistema no lineal.

En la transformación Unscented (Julier et al., 1995), (Julier and Uhlmann, 1997),


sobre la cual se basa el UKF, se eligen determinísticamente un conjunto de puntos
sigma, debido a que algunas propiedades de esos puntos coinciden con los de la
distribución previa. Cada uno de esos puntos se propaga a través de una función no
lineal y se calculan las propiedades del conjunto transformado. Con este conjunto
nuevo de puntos la transformada Unscented garantiza el mismo desempeño que el
filtro truncado de segundo orden, con el mismo orden de cálculos del Filtro de Kalman
Extendido pero sin la necesidad de calcular las matrices Jacobianas o Hessianas (Julier
et al., 2000). El vector de estados del sistema y su valor esperado sobre los cuales se
trabaja es:
38

xk 1k 1
a
x k 1k 1
vk 1 (2.68)
k 1

xk 1k 1
a qx1
E x k 1k 1
0 (2.69)
0rx1

Donde 0qx1 y 0rx1 son vectores de ceros y q y r son las dimensiones de las matrices de
covarianza Q y R de los estados y la salida ruidosa del sistema, respectivamente. El
superíndice a significa vector ampliado.

Se plantea una matriz de covarianza aumentada, del vector de estados, de la siguiente


forma

Pk 1k 1 0nxq 0nxr
Pak 1k 1
0qxn Qk 1 Pk 1
vw
(2.70)
rxn wv
0 Pk 1 Rk 1

vw wv
Donde n es la dimensión del vector de estados original y Pk 1 y Pk 1 son las
correlaciones entre los ruidos del sistema y la salida medida.

*
En el paso siguiente, un conjunto de 2(n+q+r)+1 puntos sigmas simétricos se
calculan de la siguiente forma:

*
k 1k 1
0, n q r K Pka 1 k 1 , n q r K Pka 1 k 1
(2.71)

Donde K es un parámetro para la sintonía fina de los parámetros de aproximación


(Julier and Uhlmann, 1997).

Para cualquier distribución previa simétrica con k, elegido tal que 0 < n+q+r+K ≤ k,
las predicciones de las medias y covarianzas son más confiables que las del Filtro de
Kalman extendido y, particularmente para distribuciones de tipo Gaussianas, debe
usarse n + q + r + K = 3. Se sabe que esta matriz de raíz cuadrada no tiene solución
única, sin embargo, las propiedades del algoritmo se mantienen para cualquier
elección de esa forma. Julier y sus colaboradores, recomiendan la descomposición de
39

Cholesky como un método robusto y eficiente, en especial para aplicaciones de tiempo


real (Julier et al., 1995).

El conjunto de puntos sigma * tiene media cero y tiene la misma varianza


aumentada del vector de estados. Para corregir la media, los estimados xak-1|k-1 se
agregan a cada punto sigma en un vector y el vector resultante de los puntos sigma es

a a
* *
k 1k 1 k 1 k 1,1
xk 1k 1 ,..., k 1 k 1,2 n a 1
xk 1k 1
(2.72)

Donde na es la dimensión del vector de estados aumentado. El subíndice es el punto


sigma correspondiente. La actualización temporal de los estados consiste en dos pasos
en los cuales el vector X se mapea a través del sistema no lineal.

kk 1
f k 1k 1
, uk 1
(2.73)

Y la media predicha se calcula como,

2 na 1
xk k 1 Wi k 1k 1
i 1 (2.74)

Donde W es un vector de pesos de tamaño 2na+1 con elementos del tipo

k
,i 1
na k
Wi (2.75)
1
, de otra forma
2 na k

Y la covarianza se predice de la siguiente forma

2 na 1 T
Pk k 1
Wi k 1k 1
xk 1k 1 k 1k 1
xk 1k 1
i 1 (2.76)

Las estadísticas para la secuencia de innovación deben determinarse de forma similar.


Su definición, media y covarianza son respectivamente
40

yk h kk 1
, uk
a
2n 1
yk Wi yi , k (2.77)
i 1
2 na 1 T
Py Wi yi , k yk yi , k yk
i 1

El subíndice i,k indica la medición i, en el tiempo k. La correlación cruzada entre la


estimación de los estados y la secuencia de medidas es

2 na 1 T
Pxy Wi i,k k 1
xk k 1 yi , k yk (2.78)
i 1

No debe olvidarse el objetivo de calcular la ganancia de Kalman, la cual se convierte


en
Kk Pxy Py 1
(2.79)

La ecuación de actualización se conserva

xˆk k xˆk k 1
K k yk h xˆk , 0 (2.80)
y la matriz de covarianza

Pk k Pk k 1
K k Py K T k
(2.81)

En la Figura 2.2 se muestra un ejemplo simple del desempeño, para un sistema de 2


dimensiones: las Figura de la izquierda muestran la propagación de la media y la
covarianza verdadera usando muestreo de Monte-Carlo, las Figura del centro muestran
el desempeño del Filtro de Kalman Unscented (note que solo se necesitan 5 puntos
sigma); y las gráficas de la derecha muestran los resultados usando la linealización del
filtro de Kalman extendido. Puede notarse que la estimación realizada con el Filtro de
Kalman Unscented concentra la estimación.
41

Figura 2.1. Ejemplo gráfico comparativo de esquemas de muestreo

Como parte del desarrollo de esta tesis, se desarrolló una aplicación de algunas de las
técnicas de estimación presentadas anteriormente, como lo son el filtro de Kalman y el
filtro de Kalman extendido, a un proceso de fermentación alcohólica en continuo
(Echeverry et al, 2003) (a definir específicamente en el Capítulo 6), superando los
resultados del trabajo de (Quintero et al, 2004). Los resultados obtenidos de la
aplicación del filtro de Kalman fueron reportados en (Quintero y di Sciascio, 2005)
del cual puede afirmarse: en el EFK la distribución de los estados es aproximada por
variables aleatorias de tipo Gaussianas, las cuales se propagan a posteriori a través de
la linealización de primer orden del sistema no lineal, este procedimiento puede
introducir errores grandes en las media y varianza a posteriori y verdaderas de las
variables aleatorias, lo que generalmente lleva a un desempeño subóptimo y algunas
veces a la divergencia o inestabilidad del filtro (Anderson and Moore, 1979; Maybeck,
1982; Sorenson, 1985).
42

Capítulo 3
MÉTODOS SECUENCIALES DE MONTE
CARLO Y FILTROS DE PARTÍCULAS
Estado del Arte

3.1 Métodos de Monte Carlo

En las últimas décadas las técnicas de Monte Carlo han atraído muchísima atención de
algunos investigadores y han sido aplicadas en diferentes áreas, en las cuales se usan
el muestreo estadístico y técnicas de estimación para evaluar soluciones a problemas
matemáticos intratables analíticamente. A continuación se presentan las tres categorías
en las cuales estas técnicas se encuentran clasificadas:

Muestreo de Monte Carlo: desarrolla una técnica de muestreo eficiente para


estimación de variables, la cual esta principalmente orientada a la reducción
de la varianza de las muestras.
Cálculo de Monte Carlo: está orientado al diseño de varios generadores de
números aleatorios o pseudo aleatorios.
Optimización de Monte Carlo que aplica la idea de Monte Carlo para
optimizar algunas funciones (no convexas, no diferenciables), realizar
optimización de ponderaciones dinámicas y aplicaciones a problemas
específicos.

La solución completa al problema de estimación bayesiana, es proporcionada por la


densidad a posteriori p( xt / yt ) de la cual se habló anteriormente en la definición del
problema y la regla de Bayes (Capítulo 2). Esta densidad contiene toda la información
válida acerca del vector de estados.

El objetivo de la implementación de las técnicas de Monte Carlo es estimar


recursivamente en el tiempo, la densidad a posteriori y sus características asociadas,
como lo son la densidad de filtrado p( xt / yt ) y el valor esperado de los estados
respecto a las observaciones que tiene la forma,

E p ( xt / yt ) g ( xt ) p ( xt / yt )dX t
(3.1)

Donde g ( xt ) una función de los estados, que componen el vector X t . Esta función
que define el valor esperado, contiene la información de la mejor estimación de los
43

estados. Como se ha demostrado en el capítulo anterior, a partir de la literatura


(Kushner, 1967), el filtro de Kalman es un caso concreto del filtrado no lineal donde
se asume que el sistema es lineal y está sujeto a ruido gaussiano, y se puede probar
que la densidad a posteriori es también gaussiana. En este caso, la densidad a
posteriori pertenece a una clase de funciones que pueden ser parametrizadas usando
dos parámetros (la media y la covarianza). Esto significa que idealmente, sería
necesario actualizar estos dos parámetros cada instante de muestreo.

Sin embargo, en el caso general es muy difícil y generalmente es imposible, encontrar


una clase de funciones que parametrice la densidad a posteriori. La idea central en los
métodos de Monte Carlo secuenciales es usar un conjunto de muestras aleatorias, con
unos pesos asociados para representar la densidad a posteriori en vez de una clase de
funciones parametrizadas. De esta forma es posible considerar problemas no lineales
y no gaussianos de una forma sistemática.

El concepto de aproximación de Monte Carlo es simple, considerando la integral de


Lebesgue-Stieltjes:

f ( x ) dP ( x ) (3.2)
X

Donde f ( x) es una función integrable en el espacio de medida X. Como método de


fuerza bruta, Monte Carlo usa un número de variables aleatorias independientes en un
espacio de probabilidad , F , P (ver apéndice A), para aproximar la integral
verdadera. Los Métodos de Monte Carlo son la base de los filtros de partículas y por
esta razón se presenta a continuación una tabla que resume los métodos de Monte
Carlo y el nombre de los filtros en los cuales son usados como método de estimación.

Métodos de Monte Carlo Métodos de Filtrado de Partículas


Muestreo de Importancia Muestreo de Importancia Secuencial (SIS)

Muestreo de Rechazo, re muestreo Re Muestreo, Filtro Importancia Secuencial


con Re muestreo (SIR)
Muestreo de Importancia secuencial Filtros SIR/SIS Mejorados

Re muestreo de importancia Filtro de Partículas Auxiliar, (Auxiliary


Sampling Importance Resampling Filter,
ASIR)
Muestreo Estratificado Filtro de Partículas Regularizado
(Regularizad Particle Filter, RPF)
44

Monte-Carlo y Cadenas de Markov Filtro de Partículas de rechazo

Algoritmo de Metrópolis Hastings Filtro con Rao-Blackwelización


Monte Carlo Hibrido Suavizado de Kernel y regularización
Cuasi Monte-Carlo Filtros de Partículas Mixtos
Tabla 3.1 Tabla resumen de los métodos de Monte Carlo y los métodos de filtrado no
lineal

Para estudiar a fondo la teoría de filtrado no lineal, se citará cada uno de los métodos
de muestreo y su respectiva inclusión en los algoritmos de filtrado, así mismo, se
analizarán las ventajas y desventajas que posee cada uno de ellos, según la literatura
analizada. Luego de cada etapa de estudio se realizará la escritura del código de cada
algoritmo planteado.

3.2 Métodos de Muestreo

3.2.1 Muestreo de Importancia

El muestreo por importancia está orientado a muestrear la distribución de las


partículas o muestras asociadas, en la región de mayor importancia de modo que sea
posible alcanzar mayor eficiencia computacional. Es un método importante
especialmente para espacios de dimensiones grandes, donde generalmente son escasos
los datos, y la región de interés donde se encuentra el objetivo es relativamente
pequeña comparada con el tamaño de todo el espacio de datos.

La idea del muestreo por importancia es elegir una función de distribución propuesta
q(x) (en la región de interés) denominada función de importancia en lugar de la
función de densidad de probabilidad (de masa) real p(x), la cual es difícil de
muestrear. Se asume que el soporte de la función q(x) debe cubrir a la función p(x)
(ver apéndice A).

Luego, escribiendo de nuevo el problema de integración (3.2)


p( x)
I f ( x) p( x)dx f ( x) q( x)dx (3.3)
X X
q( x)

El muestreo por importancia de Monte Carlo usa un número N p de muestras


independientes tomadas de q(x) para obtener una suma ponderada que aproxime la
función I. La discretización de esta función proviene de la teoría de los Métodos
Secuénciales de Monte Carlo.
45

La aproximación I , de la función I está dada por

Np
1
I W ( xi ) f ( xi )
Np i 1
(3.4)

Donde los pesos que ponderan dicha suma están determinados por:

p( xi )
W ( xi )
q( xi )
(3.5)

Éstos son los pesos de importancia, de los cuales dependerá la convergencia de la


función de importancia q al valor real de I. Si no se conoce el factor de normalización
de p(x), los pesos de importancia pueden ser únicamente evaluados sobre una
constante de normalización, por ejemplo:

Np
p( xi )
(3.6)
i 1 q( xi )

Con el fin de garantizar que la suma ponderada de ellos sea igual a 1

Np
W ( xi ) 1
i 1 (3.7)

Luego, se deben normalizar los pesos de importancia y se obtienen estimaciones de la


función deseada

Np
1
W ( xi ) f ( xi ) Np
Np i 1
I Np
W ( xi ) f ( xi ) (3.8)
1 j i 1
W (x )
Np j 1

W ( xi )
W ( xi ) Np
(3.9)
j
W (x )
j 1

No debe olvidarse que el objetivo principal de este tipo de muestreo es transmitir


información de las características estadísticas de la función.
46

En términos de las características transmitidas en el algoritmo, se calcula la varianza


del muestreador de importancia, como:

1
Var I Varq f ( x )W ( x )
Np
(3.10)
1 p ( x)
Var I Varq f ( x)
Np q( x)
(3.11)
2 2
1 f ( x) p ( x) E p f ( x)
Var I dx
Np q( x) Np
(3.12)

Siendo E p el valor esperado sobre p. Para conservar mayor fidelidad de la


información, es necesario obtener una reducción progresiva de la varianza
anteriormente planteada, y para esto se elige una función de importancia q(x)
apropiada para que cumpla que

(i) la forma de p(x) coincida tanto que aproxime la varianza verdadera


(ii) la forma de q(x) coincida con la forma de f ( x) p( x) para lograr reducir
la varianza verdadera

El tipo de muestreo de importancia señalado como (3.8) incluye una desviación, pero
a su vez es consistente7, ya que la desviación desaparece rápidamente a una velocidad
proporcional al número de muestras o de partículas Np.

Si se elige q apropiadamente cuando N p , de la ley fuerte de grandes números,


puede obtenerse que

Eq W ( x ) f ( x )
I
Eq W ( x )
(3.13)

Geweke y Tanizaki (Geweke y Tanizaki, 1999), demostraron que E W ( x) y

que E W ( x) f 2 ( x) , luego la aproximación f converge casi seguro a E p f ( x)


y el teorema del límite central de Lindeberg-Levy enuncia que:

7
Un estimador es consistente si el estimador converge al valor real casi seguro cuando el número de
observaciones se aproxima a infinito.
47

N p f Ep f N 0, f

f Varq W ( x ) f ( x ) E p f ( x )
(3.14)

Ahora bien, debería obtenerse una medida de la eficiencia del muestreador de


importancia. Esta puede estar dada por la versión normalizada de la ecuación anterior,
de la forma:

f
medida de efectividad
Varp f
(3.15)

Relacionada con el tamaño efectivo de muestreo. El muestreo de importancia es útil


en el sentido que proporciona una forma adecuada de reducción de la varianza del
estimador (posiblemente menor que la varianza real) y que puede ser usada cuando se
encuentren dificultades de muestrear a partir de las distribuciones de probabilidad
directamente.

Por otro lado, la función de importancia, debe tener un gran soporte y ser insensible a
los errores. Usualmente las distribuciones súper gaussianas tienen la función de
activación de la forma:

d log q ( x)
( x)
dx (3.16)

Si ésta es acotada, q tiene una cola larga, de otro modo no. El muestreo por
importancia puede mezclarse con métodos de grilla o con el algoritmo de Metrópolis
Hastings para mejorar las técnicas.

3.2.2 Muestreo de Rechazo

El muestreo de rechazo propuesto por Handschin y Mayne (Handschin y Mayne,


1969), es útil cuando se conocen las cotas superiores de la distribución de
probabilidad. Las bases para este tipo de muestreo son similares a las del muestreo por
importancia. Se asume que existe una constante conocida C < 1 tal que p(x) < Cq(x)
para cada x que pertenece al vector de estados, entonces se propone un procedimiento
de muestreo tal que:

Se generan variables aleatorias uniformes u U(0, 1).


48

Se tome una muestra x q(x) (distribuida de acuerdo a la función de


densidad e probabilidad q).
Si el valor de la variable uniforme u (generada anteriormente), cumple u<
p(x)/(Cq(x)), se acepte la muestra x, de otro modo se rechaza y debe
repetirse el procedimiento.

Las muestras tomadas del muestreo por rechazo son exactas y la probabilidad de
aceptación de una variable aleatoria es inversamente proporcional a la constante C.
Ahora bien, en la práctica, la elección de la constante C es muy crítica, dado que se
basa en el conocimiento de la función p(x): si C es muy pequeña, las muestras no son
confiables ya que hay una tasa de aceptación alta; si C es muy grande, el algoritmo se
vuelve ineficiente ya que la tasa de aceptación es baja.

Desde una perspectiva bayesiana, el muestreo por rechazo incorpora naturalmente la


normalización del denominador en la constante C, lo que garantiza que los pesos estén
en el orden deseado.

Planteando la posible solución entregada por el muestreo de rechazo, debe observarse


que si el previo p(x) se usa como la distribución propuesta q(x), y la probabilidad se
plantea como p(y/x)/C, donde se asume que C es conocida, la cota del estimado C ' , a
posteriori está dada por:

p( y / x) p( x) Cq( x)
p( x / y ) C ' q( x)
p( y ) p( y )
(3.17)

Donde la tasa de aceptación para cada x que pertenece al vector de estados, se puede
calcular como

p( x / y ) p( y / x)
C ' q( x) C
(3.18)

Como se mencionara anteriormente, las muestras tomadas del muestreo por rechazo
son exactas, pero el prerrequisito de este tipo de muestreo es el conocimiento previo
de C, el cual en ciertas ocasiones no se conoce. El algoritmo toma algún tiempo
cuando la tasa p(x)/(Cq(x)) es cercana a cero. En la siguiente Figura (3.1) se observa
una comparación de las técnicas anteriormente descritas. Puede observarse que para el
muestreo por importancia (izquierda), la función q(x) no necesariamente cubre en su
totalidad a la función p(x) lo que puede representar para algunas de las partículas que
se encuentren en la zona de diferencia sea asignado un peso no apropiado; en cambio,
para el muestreo por rechazo, la constante C asegura el cubrimiento de la función p(x)
49

logrando de este modo que las partículas se ubiquen lo mas cerca posible de la
distribución objetivo:

Figura 3.1 Comparación del muestreo por Importancia y muestreo por rechazo.

Es necesario mencionar la siguiente proposición acerca del muestreo por rechazo


(Fearnhead, 1998):

PROPOSICIÓN (Fearnhead, 1998): La salida x aceptada en el paso de re muestreo,


está distribuida exactamente como si fuera una muestra tomada directamente de la
densidad p(x).

Ventajas y desventajas del muestreo por rechazo: La ventaja de este método es que la
partícula resultante es una muestra verdadera e independiente, obtenida de la función
de densidad a aproximar. El método compensa naturalmente los errores que se
pudieran generar cuando la densidad propuesta no sea similar a la densidad objetivo.
En este caso, el promedio de la probabilidad de aceptación será pequeño, y el
algoritmo generará más puntos a partir de la densidad propuesta. Una desventaja de
los métodos de aceptación y rechazo es que para problemas de tiempo real, es mas
ventajoso tener un método que no posea tiempos fluctuantes para completar un paso
completo. Usando estos métodos, pueden obtenerse resultados con pocos números de
partículas aceptadas en el tiempo que el filtro deba generar las muestras del próximo
tiempo de muestreo.

Comparación con el muestreo de importancia: Liu (Liu, 1996), compara el muestreo


por rechazo con el re muestreo de importancia, para estimar el valor esperado de
alguna función f de una variable aleatoria X. Liu asume que la densidad propuesta es
la misma en ambos casos y que el mismo número de puntos propuestos (partículas),
Np, se genera usando de ambos métodos. La eficiencia de los estimadores que
resultaron, se definió como la tasa de la varianza del estimador con la Var(f(X))/Np.

El estimador basado en muestreo por rechazo no tiene sesgo, y su eficiencia depende


del promedio de la probabilidad de aceptación; mientras que el estimador por
50

muestreo de importancia tiene una desviación, y esta es de O( N p 1 ) (del orden de Np-


1
). Su eficiencia depende de la función f(X) y el valor de Np. Sin embargo, Liu
concluyó que en general, para Np grandes, el muestreo de importancia es más eficiente
que el muestreo de rechazo.

Posibles mejoras: en el muestreo por rechazo, así como en el muestreo de


importancia, existe ineficiencia si la densidad propuesta no es similar a la real.
Entonces, la aproximación del filtro de partículas auxiliar que se verá en este capítulo
(Auxiliary Sampling Importante resampling ASIR) puede adaptarse para usar el
muestreo por rechazo, en vez de muestreo de importancia cuando sea el caso. Esta
propuesta hecha por Fearnhead (Fearnhead, 1998) podría incrementar el promedio de
la probabilidad de aceptación y aumentar la velocidad del algoritmo (Pitt and
Shephard, 1997).

3.2.3 Muestreo de Importancia Secuencial

Para lograr la eficiencia del muestreo de importancia es necesario tener una buena
distribución propuesta, de ahí que la elección correcta de la función de distribución de
importancia q(x), es la clave para aplicar exitosamente el muestreo por importancia.
Sin embargo, es muy difícil encontrar una función de importancia adecuada para
espacios de grandes dimensiones. Una forma natural de atenuar este problema es
construir una distribución propuesta secuencialmente, los cual es la idea de este tipo
de muestreo por importancia secuencial, en inglés Sequential Importance Sampling
(SIS) que se expondrá a continuación

En particular, se elige una distribución en una forma factorizada

k
q( x0:k / y0:k ) q( x0 ) q( xi / x0:i 1 , y0:i ) (3.19)
i 1

Simplificando la explicación, se tiene que la función de densidad de probabilidad no


condicionada, derivará en una expresión fácil de entender, al aplicar la ley telescópica
de probabilidad y así pueden plantearse las ecuaciones de muestreo (Chen, 2003):

p ( x0:k ) p ( x0 ) p ( x1 / x0 )... p ( xk / x0 , xk 1 )
(3.20)
q ( x0:k ) q0 ( x0 )q1 ( x1 / x0 )...qk ( xk / x0 , xk 1 )

Para pasos de muestreo 0:k. Cuyos pesos pueden ser escritos de la forma:
51

p( x0 ) p( x1 / x0 )... p( xk / x0 , xk 1 )
W ( x0:k ) (3.21)
q0 ( x0 )q1 ( x1 / x0 )...qn ( xk / x0 , xk 1 )

Calculados recursivamente como

p( xk / x0 , xk 1 )
Wk ( x0:k ) Wk 1 ( x0:k ) (3.22)
qk ( xk / x0 , xk 1 )

La desventaja es que los pesos de importancia pueden tener varianzas grandes,


entregando una estimación poco confiable.

Dado que la varianza no condicional de los pesos de importancia crece con el tiempo,
el algoritmo presenta el llamado problema de degeneración, el cual hace que en pocas
iteraciones del algoritmo, algunos de los pesos W(x(i)) sean cero (se busca que sean
todos diferentes de cero). Esto representa una desventaja si se gastan grandes
esfuerzos computacionales para actualizar pesos triviales. Para evitar estas situaciones
se usa el paso de re muestreo antes de la normalización de los pesos.

3.2.3.1Método de Filtrado basado en Muestreo de Importancia Secuencial filtro SIS

El Método de Monte Carlo que forma la base de muchos filtros desarrollados es


conocido como bootstrap, algoritmo de condensación, filtro de partículas,
aproximación de interacción de partículas y survival fittest. Usaremos la sigla SIS para
referirnos a él en este trabajo. Este método implementa un filtro bayesiano por medio
de simulaciones de Monte Carlo. La clave es representar la función de densidad
posterior requerida, por unas muestras aleatorias con pesos asociados y calcular su
estimación con esa información. Si el número de muestras aumenta, la caracterización
de Monte Carlo se vuelve una representación equivalente y el filtro se aproxima al
estimado óptimo.

El mecanismo de trabajo de los filtros de partículas es el siguiente: el espacio de


estados esta particionado en tantas partes, como las partículas recubran, de acuerdo a
alguna medida de probabilidad. A mayor probabilidad, más densamente se
condensarán las partículas y el sistema de partículas evolucionará a través del tiempo
de acuerdo a la ecuación de estados, con la evolución de la función de densidad de
probabilidad (pdf) siendo determinada por la ecuación de Focker Plank Kolmogorov 8.

8 p( xt )
La ecuación de Focker Plank Kolmogorov (FPK) está dada por Lt p( xt ) la cual puede ser
t
interpretada de la siguiente forma:
52

Siempre que la pdf pueda ser aproximada por un histograma de puntos de masa, por
medio de un muestreo aleatorio del espacio de estados, se obtendrá un número de
partículas que representan la pdf que está evolucionando. Además, en caso que el
modelo de la densidad de probabilidad a posteriori sea desconocido o difícil de
muestrear, puede elegirse otra distribución para lograr un muestreo eficiente.

Anteriormente se mencionó la función de importancia o función de densidad de


probabilidad propuesta, la cual es una distribución de probabilidad q( x0:k y0:k ) que
depende de las observaciones hasta el instante n, a partir de la cual se puede muestrear
fácilmente. Este método se basa en la condición simple de que si p( x0:k y0:k ) 0 ,
implica que q( x0:k y0:k ) 0.

De este modo, aproximando la densidad posterior en función de los pesos y de una


función delta de Dirac:

Np
p( x0:k / y1:k 1 ) Wki ( x0:k x0:i k )
i=1 (3.23)

Donde los pesos Wki se eligen por muestreo por importancia. Las suposiciones acerca
de las funciones de densidad de probabilidad involucradas son las siguientes: la
densidad de probabilidad de evaluación de las muestras es proporcional a la función
de importancia elegida p( x) q( x) y el vector x i de las muestras serán generadas a
partir de la función de densidad de importancia x i q( x) .

Luego, se elige la función de importancia y los pesos se factorizan de modo de hacerla


dependiente solo de xk 1 . De este modo los pesos pueden expresarse como:

p ( yk / xki ) p ( xki / xki 1 )


Wki Wki 1
q ( xki / xki 1 , yk )
(3.24)

El primer término es la ecuación de movimiento para una nube de partículas con distribución p( xt ) , cada
dx
punto de la cual obedece la ecuación de f ( xt , t ) .
dt
El segundo término describe la perturbación provocada por un movimiento Browniano. La solución de la
ecuación de FPK puede ser encontrada usando la transformada de Fourier, ya que invirtiéndola, puede
obtenerse una distribución gaussiana de una trayectoria determinística.
53

Y la densidad a posteriori se plantea en proporción a los pesos anteriores

Np
p( xk / y1:k ) Wki ( xk xki )
i=1 (3.25)

El algoritmo, descrito a continuación, consiste en la propagación recursiva de los


pesos y los puntos de soporte cada vez que una medida se reciba secuencialmente
(Chen, 2003).

Np Np
xki , Wki SIS xki 1 ,Wki 1 , yk
i 1 i 1

For i 1: Np
xki q xk / xki 1 , yk
p ( yk / xki ) p( xki / xki 1 )
Wki Wki 1
q ( xki / xki 1 , yk )
endfor

Desventajas del algoritmo: este algoritmo permite la evolución de la información de


la pdf a través de la actualización de los pesos. Sin embargo, pueden presentarse
fenómenos que eviten que la varianza de la estimación se reduzca. A continuación se
mencionarán algunos de ellos:

Degeneración: este fenómeno ocurre cuando una partícula, luego de unas cuantas
iteraciones no tiene un peso considerable, lo que implica que la varianza de los pesos
pueda crecer. La degeneración de los pesos proporciona aumento en el costo
computacional, ya que se siguen considerando partículas (de poco peso) que no
aportan a la estimación de la pdf a posteriori. Para evitarla, existe una medida factible
de la degeneración de los pesos, en función de la varianza de los pesos verdaderos, la
cual puede ser modificada por una estimación cercana del tipo (Arumpalam et al.,
2002):

ˆ 1
Neff Np
2
Wki
i 1 (3.26)
54

Donde Wki es el peso normalizado calculado en el algoritmo. Es muy importante decir


que N̂eff Np , y que un valor pequeño de N̂eff indica una medida de gran
degeneración.

Otra posible solución para el problema de degeneración de los pesos es comenzar el


algoritmo con una buena función de importancia, o bien ir evaluando su
comportamiento en el algoritmo, como se muestra a continuación:

Elección de la función de densidad de importancia q(x): planteado anteriormente


como punto clave del algoritmo, esta función debe ser elegida para minimizar la
varianza de los pesos óptimos Wk* , maximizando la medida de degeneración un
esfuerzo óptima N̂eff . Así pues, la función de importancia puede plantearse de la
siguiente forma:

q xk / xki 1 , yk p( xk / xki 1 , yk ) (3.27)


óptima

p ( yk / xk , xki 1 ) p ( xki / xki 1 )


q xk / xki 1 , yk (3.28)
óptima p ( yk / xki 1 )

Operando en la expresión de los pesos se obtiene:

Wki Wki 1 p ( yk / xki ) p ( xki / xki 1 )dxki


(3.29)

Para esta posible solución al problema existen distintos inconvenientes como la


habilidad de muestrear la función a priori p ( xk / xki 1 , yk ) o de evaluar la integral para
la obtención de los pesos en cada uno de los estados nuevos. Esta función de
importancia óptima no siempre es fácil de plantear, por esta razón se presentan a
continuación al menos dos de los casos en los cuales puede plantearse como óptima:

Si los estados xk pertenecen a un conjunto finito, la integral planteada


anteriormente se vuelve tratable y es posible hacer el muestreo de
p ( xk / xki 1 , yk ) . Este es el caso de los Jump Markov Linear System9.

9
Como se verá en este capítulo, los Jump Markov Linear Systems, son usados en seguimientos de objetivos
maniobrables (Doucet, Gordon, and Krishnamurthy, 2001) donde en el estado en modo discreto (que define
el índice de maniobrabilidad) se sigue usando filtros de partículas y el estado continuo (condicionado al
índice de maniobrabilidad) se sigue usando el filtro de Kalman.
55

Si se poseen modelos con densidad de probabilidad p ( xk / xki 1 , yk ) gaussiana,


es posible hacer la evaluación analítica.

En (Arumpalam et al., 2002) los autores proponen que es posible hacer


aproximaciones sub óptimas si se consideran las relaciones entre la función de
importancia y la densidad de probabilidad, de la siguiente forma:

q xk xki 1 , yk p ( xk xki 1 )
(3.30)

Es decir, se elige la densidad de probabilidad a priori de los estados. Tal que la


actualización de los pesos sea de la forma:

Wki Wki 1 p( yk xki )


(3.31)

Y esta, es una de las formas más sencillas e intuitivas de elegir esta función tan
importante en el diseño del filtro de partículas.

3.3 Re muestreo

3.3.1 Re muestreo en Muestreo de Importancia (Sampling Importance Resampling-


SIR)

Motivado por las técnicas de bootstrap, el re muestreo en muestreo de importancia


tiene como característica la capacidad de evaluar las propiedades de un estimador, y la
aplica al algoritmo de muestreo a través de la función de distribución acumulativa
empírica de las muestras, en lugar de la función de distribución acumulativa real, (en
inglés cumulative distribution function CDF).

El paso de re muestreo esta orientado a eliminar las muestras con pesos de menor
importancia y duplicar las muestras con mayores pesos. Una breve descripción es la
siguiente:

Np
i
Se toman N p muestras aleatorias x a partir de la distribución propuesta
i 1

q(x).
i i
Se calculan los pesos de importancia W p( x) / q( x) de cada muestra x .
i
Se normalizan los pesos de importancia W
56
Np
i
Se remuestrea N veces, a partir de el conjunto discreto muestreado x ,
i 1

donde la probabilidad de muestreo de cada x i es proporcional a los pesos


normalizados W i .

El paso de re muestreo puede ser aplicado en cada paso del algoritmo de muestreo de
importancia, si se considera necesario; en el cual las partículas y los pesos de
importancia asociados se reemplazan por muestras de igual importancia. Pero la
inclusión en el algoritmo de muestreo por importancia fue justificada por Liu. El paso
de re muestreo juega un papel importante en el muestreo por importancia, ya que si los
pesos de importancia están irregularmente distribuidos al propagar los pesos triviales
gasta muchísimo la potencia computacional; y por otro lado cuando los pesos de
importancia están sesgados, el re muestreo proporciona una oportunidad de
seleccionar las muestras importantes y de algún modo rejuvenecer el conjunto de
muestras para el uso siguiente. Es probable que el re muestreo no mejore
necesariamente la estimación del estado actual, ya que introduce una variación de
Monte Carlo extra (Liu, et al 2001).

3.3.2 Filtro de Importancia Secuencial con Re muestreo (SIR):

En este tipo de filtro, que se abrevia con sus siglas en inglés SIR, se aplica el paso del
re muestreo para reducir los efectos de la degeneración. Este procedimiento debe
hacerse observando dicha función de degeneración N̂eff y comparándola con un
valor base.
Aplicando esta técnica, debe tenerse en cuenta que el hecho de hacer un re muestreo,
Np
implica generar un conjunto nuevo de muestras xni* por re muestreo o
i 1

reemplazo, para obtener una representación discreta aproximada de p( xn / y1:n ) :

Np
p( xn / y1:n ) Wni ( xn xni )
i=1 (3.32)

Y fijar de nuevo los pesos de la forma:

1
Wni
Np
(3.33)

Existen varios tipos de re muestreo como lo son: Multinomial, Residual, Sistemático y


de Monte Carlo local, que se tratarán más adelante. Efectuar el paso de un re muestreo
57

reduce los efectos de la degeneración pero igualmente, introduce algunos problemas


de tipo práctico como:

Limita la oportunidad de paralelizar ya que deben combinarse todas las


partículas.
Las partículas con pesos grandes son seleccionadas estadísticamente varias
veces. Esto lleva a un empobrecimiento de las muestras (Sample
Impovershment), que es una pérdida de diversidad dado que las partículas
contienen puntos repetidos. Es un problema severo cuando hay un ruido de
proceso pequeño.
Frente al muestreo por rechazo, el cual garantiza muestras exactas para el
posterior; el re muestreo, tiene como debilidad que únicamente garantiza
muestras aproximadas para la distribución a posteriori cuando N p .
A pesar que el re muestreo puede mejorar el problema de la degeneración de
los pesos, desafortunadamente introduce otros problemas (Doucet y de
Freitas, 2000) por ejemplo, que después de un paso de re muestreo las
trayectorias simuladas no continúan siendo estadísticamente dependientes,
entonces la convergencia debido al teorema del limite central, no es valida en
ese caso.

A continuación se presenta el pseudocódigo del Algoritmo de Re muestreo:


58

Np Np
xkj * ,Wk j , i j RESAMPLE xki ,Wki
j 1 i 1

Inicializa el contador
c1 0
For i 2 : Np
Construye la CDF
ci ci 1 Wki
endfor
Comenzar al inicio de la CDF
i 1
Generar el punto de inicio
1
u1 U 0,
Np
For j 1: Np
Moverse a través de la CDF
( j 1)
u j ui
Np
While u j ci
i i 1
end While
Asigna la muestra
xki* xki
Asigna peso
1
Wk j
Np
Asigna parentezco
ij i
endfor

En la Figura 3.2 se explica el paso de re muestreo con 10 partículas, en la cual, la


columna de la izquierda con los círculos de colores representan las partículas antes del
re muestreo, donde el diámetro de los círculos son proporcionales a los pesos de cada
una de ellas. La columna de la derecha muestra los círculos de colores que representan
las partículas de la izquierda del mismo color después del re muestreo. En general las
59

partículas con grandes pesos, se replican y las de pesos pequeños se eliminan. Por
ejemplo, la partícula azul con el mayor peso, se replica 3 veces, la partícula amarilla
se replica 2 veces, mientras que las partículas verdes que tiene pesos pequeños se
eliminan en el paso de re muestreo. Además, después del re muestreo los círculos que
representan las partículas tienen el mismo tamaño, lo que significa, que todos los
pesos se hacen iguales a 1/Np =1/10.

En la Figura 3.3, se representan las medidas aleatorias y la distribución de


probabilidad real de interés, así como también se dibujan los tres pasos del filtrado de
partículas: generación de las partículas, actualización de los pesos y re muestreo. En la
Figura, las líneas oscuras y continuas representan las distribuciones de interés
aproximadas mediante las medidas discretas. Los tamaños de las partículas reflejan los
pesos asignados.
60

Figura 3.2. Descripción esquemática del paso de re muestreo


61

Figura 3.3. Descripción gráfica del filtro de Partículas con re muestreo.

En la Figura 3.4 se presenta un diagrama de flujo que ilustra el algoritmo de filtrado


de partículas con el paso de re muestreo (Djuric y Kotecha, 2003).

Dada la relevancia de la función designada como de importancia dentro del algoritmo,


en la literatura (Chen, 2003) se presentan algunas técnicas usadas como alternativa
para evitar el uso de una Densidad de Importancia sub óptima. En este trabajo se
estudiarán algunas alternativas y se evaluará su participación dentro de la Metodología
de Implementación del Filtrado de Partículas a los problemas de estimación de
estados. Estas son: bridging densities, corrección progresiva, introducción de
distribuciones intermedias entre la previa y la probabilidad, o un muestreo
particionado.
62

Figura 3.4. Diagrama de Bloques del Algoritmo de Filtro de Partículas con re


muestreo.

Continuando con la definición del filtro con re muestreo SIR, puede afirmarse que es
un filtro de tipo SIS con la característica que la densidad de importancia, es
idénticamente igual a la densidad de probabilidad a priori del vector de estado.

q xn xni 1 , y1:n p ( xn xni 1 )


(3.34)

Además de ello, se aplica un paso de re muestreo en cada instante de tiempo. Como la


densidad de importancia de muestreo del SIR es independiente de las muestras yk, el
espacio de estado se explora sin ningún conocimiento de las observaciones. Este tipo
de filtro manifiesta una pérdida rápida de diversidad en los pesos de las partículas, sin
embargo, tiene como ventaja la fácil evaluación de los pesos y un fácil muestreo de la
densidad de importancia. A continuación se describirán algunos de los tipos de re
muestreo relevantes revisados en la literatura, de los cuales se seleccionaran para la
63

aplicación de los algoritmos de estimación de estados sobre los sistemas dinámicos en


esta tesis.

3.3.3 Tipos de Re muestreo

3.3.3.1 Re muestreo Multinomial: El muestreo Multinomial fue introducido por


Smith en el año 1992 (Smith, 1992), genera uniformemente N p partículas nuevas a
partir del conjunto antiguo de partículas, en que cada partícula puede replicarse Ni
veces ( Ni puede ser cero), concretamente, cada x( i ) produce Ni hijos. El
procedimiento puede ilustrarse de la siguiente forma:

Se produce una distribución uniforme u U (0,1) , se construye una cdf para


i
los pesos de importancia y luego se calcula el punto si W ( j) .
j 1

Luego se debe encontrar el si que cumpla que 1 u si , y se elige la


partícula con el índice i .
Dado el par x (i ) , W (i ) , para j 1,..., N p , se deben generar nuevas muestras
x ( j ) duplicando x(i ) de acuerdo al peso asociado W (i ) .
Finalmente debe reiniciarse el valor del peso W (i ) 1/ N p

En este tipo de re muestreo se cumplen las siguientes condiciones:

Np
Ni N p , Ni 0 i 1,..., N p 1
i 1 (3.35)

E Ni N pW (i )
(3.36)

Var N i N pW ( i ) 1 W ( i )
(3.37)

3.3.3.2 Re muestreo Residual: este método fue sugerido por Liu y Chen (Liu y Chen,
1998) y tiene como característica que es menos costoso computacionalmente que el
SIR convencional, garantiza una menor varianza de muestreo y no introduce una
desviación adicional; además de ello, cada una de las partículas del re muestreo
residual se replica en el algoritmo.
64

En cada instante i 1,..., N p , se deben retener un número ki N pW (i ) de


copias de la variable xn(i ) .
Sea el valor N r N p , con k1 ,..., k Np , obtener un número de N r muestras
independientes e idénticamente distribuidas de xn(i ) , con probabilidades
proporcionales a N pW (i ) , ki , i 1,..., N p .
Debe reiniciarse el valor del peso W (i ) 1/ N p

3.3.2.3 Re muestreo Sistemático: también llamado muestreo de mínima varianza, este


tipo de muestreo trata los pesos como variables aleatorias continuas en el intervalo
(0,1), ordenadas aleatoriamente. También se hace un conteo del número de puntos de
grilla en cada intervalo, los cuales tienen la forma u k / N p . Se replica cada una de
las partículas y se elige el nuevo conjunto de partículas con el fin de minimizar la
varianza definida por

Var N i E Ni E Ni
(3.38)
Una descripción en pseudocódigo de este algoritmo es la siguiente:

Se elige una variable distribuida conforme


u U (0,1), j 1, l 0, i 0
while u 1
if l u
entonces
u u 1/ N p
la salida es
x (i )
else
elegir un valor k en j 1,..., N p
i x(k ) , l l W (i )
switch x ( k ) , W ( k ) con x ( j ) ,W ( j )
endif
endwhile
65

3.3.3.4 Re muestreo de Monte Carlo local: en este tipo de esquema se realiza el


tratamiento de las muestras usando el algoritmo de Metropolis Hasting el cual es un
tipo de algoritmo de Cadenas de Markov y Métodos de Monte-Carlo (Markov Chain
Monte Carlo MCMC) que asocia su transición con la probabilidad de aceptación.
Asume que q(x,x’) es la distribución propuesta es decir, el objetivo candidato a
alcanzar (la distribución que se quiere muestrear); y que no satisface la condición de
reversibilidad10.

Sin pérdida de generalidad, se supone que ( x)q x, x ' ( x ')q x ', x , (donde la
función π indica una función de distribución no normalizada). La ecuaciçon anterior
significa que la probabilidad de moverse de x a x ' es mayor (es decir, es mas
frecuente este movimiento) que la probabilidad de moverse de x ' a x .

Lo que se desea es modificar esta situación, para reducir el número de movimientos de


x a x ' . Para ello, se considera la probabilidad de movimiento de modo que
0 x, x ' 1 , si este movimiento no se realiza, el proceso entrega el valor de x
proporcionado por la distribución objetivo. Luego, probabilidad de Metropolis
Hastings de la transición de x a x ' se convierte en:

pMH x, x ' q x, x ' x, x '


(3.39)
Donde x x ' . Y para que la ecuación anterior satisfaga la condición de reversibilidad
de las cadenas de Markov, se condiciona a la función

( x ')q x, x '
min ,1 , si ( x ')q x, x ' 0
x, x ' ( x ) q x, x ' (3.40)
1 , de otro modo

Y la probabilidad que el proceso de Markov llegue al estado x se puede escribir como:

p llegue a x 1 q x, x ' x, x ' dx '


x (3.41)

K MH x, dx ' q x, x ' x, x ' dx ' 1 q x, x ' x, x ' dx ' x (dx ')


x
(3.42)

Donde K MH es el kernel asociado a la la probabilidad de moverse de x a a dx ' .

10
Ver apéndice A
66

Resumiendo el algoritmo:

Para i=1,…,Np, en la iteración n=0, tomar un punto x0, a partir de la densidad


a priori.
Generar una variable uniforme u U 0,1 y x ' q xk ,
Si u xk , x0 , sea xk x0 , si no xk 1 xk
En el tiempo k = k + 1, debe repetirse los dos pasos anteriores, hasta cierto
número de pasos (por ejemplo m pasos), hacer x (i ) xm .
Hacer i=i+1 y repetir el procedimiento hasta cubrir las Np muestras, luego
deben entregarse las muestras x (1) ,..., x ( Np ) .

Si la densidad candidata-generadora es simétrica como la caminata aleatoria


(donde q x, x ' q x ', x ) la probabilidad de movimiento se reduce a ( x ') / ( x) .
De este modo si ( x ') ( x) la cadena se mueve a x’ y se cumple el movimiento en el
mismo sentido. La probabilidad de movimiento no necesita el conocimiento de la
constante de normalización de (.).

Por otro lado, las partículas muestreadas son recordadas como las muestras tomadas a
partir de la densidad objetivo y solo después de que la cadena ha pasado la fase
transitoria, la convergencia de la distribución invariante ocurre bajo malas condiciones
de regularidad como la irreductibilidad y la no-periodicidad. Una de las características
de este algoritmo es que su eficiencia está determinada por la tasa de muestras
aceptadas respecto al número total de muestras. Una varianza muy grande o muy
pequeña, puede generar un muestreo ineficiente.

La Figura 3.5 ilustra el efecto del paso de re muestreo en un filtro de partículas. El


conjunto nuevo de partículas se obtiene generando M números aleatorios
uniformemente distribuidos, tres de los cuales se muestran como líneas punteadas en
la Figura. Después son asociados con una partícula guiada por la suma acumulativa de
los pesos de importancia normalizados. La partícula número 2 se elige una vez y la
partícula número 4 se elige dos veces.
67

Figura 3.5. Ilustración del paso de re muestreo en un filtro de partículas.


68

3.4 Filtros SIR/SIS Mejorados:

Para mejorar los algoritmos presentados anteriormente y teniendo como finalidad


incrementar la eficiencia del filtro, buscando un muestreo eficiente y reducción de la
varianza en los casos que se presentan problemas de limitación espacial algunos
autores usan un Boosting a priori, y otros proponen una mejoría de los filtros con
implementación de filtros estratificados para una reducción de la varianza.
Finalmente, en la literatura se registran algunos esquemas de reubicación de los pesos
(Chen, 2003).

Concretamente, en el instante de muestreo, pueden incrementarse el número de


muestras simuladas a partir de la distribución propuesta y Np’>Np. Pero en el paso de
re muestreo, solo se preservan Np partículas. Carpenter (Carpenter et al, 1999)
propuso el uso de un tipo de muestreo estratificado para el filtrado de partículas. En
particular, se asume que la densidad a posteriori se compone de Np diferentes estratos
mezclados (llamada técnica de muestreo por reconocimiento). Así

Np Np
p( x) ci pi ( x), ci 1
i 1 i 1 (3.43)

De acuerdo a (Carpenter et al, 1999) una cantidad de la población de partículas debe


estimarse eficientemente muestreando un número fijo M de cada uno de los estratos.

Np
Mi N p , (N p Mi )
i 1 (3.44)

La eficiencia se alcanza por medio de la distribución de Neyman dada por


M i ci i (donde i es la varianza de la función genérica f(x) en el i-ésimo estrato), o
por la distribución proporcional M i ci N p , por simplicidad. Se argumentó que en la
mayoría de los casos la distribución proporcional era mas eficiente que el muestreo
aleatorio simple de la función de distribución p(x).

En el contexto de filtrado de partículas, los coeficientes ci y pi ( x) se determinan


recursivamente mediante las relaciones:

p( xk / xk(i )1 ) p( yk / xk )dxk
ci Np p ( xk / xk( i )1 ) p ( yk / xk )
p( xk / x (i )
) p( yk / xk )dxk pi ( xk )
k 1 p ( xk / xk( i )1 ) p ( yk / xk )dxk
i 1 (3.45)
69

Para el i-ésimo estrato, los pesos de importancia asociados con las partículas se
actualizan recursivamente por la siguiente expresión:

p ( xk( j ) / xk(i )1 ) p ( yk / xk( j ) )


Wk( j ) Wk( i )1
ci pi ( xk( j ) )
(3.46)
i 1 i
Para Ml j M l , por muestreo estratificado en el estado de actualización, se
l 1 l 1
alcanza la reducción de la varianza.

Intuitivamente usaron una medida ponderada antes del re muestreo, en vez que usar
una medida no ponderada; debido a que se espera que las muestras ponderadas
contengan más información que el mismo numero de muestras sin ponderar. En el
instante de re muestreo se selecciona una muestra de tamaño Np a partir de los 10 x Np
valores predichos con el fin de hacer que el tamaño del conjunto de partículas no
cambie. El numero 10, fue sugerido por Rubin (Rubin, 1987) donde Np>>10. Se
asume que el número de conjunto de partículas no cambia.

Como referencia, puede tenerse en cuenta que (Carpenter et al, 1999) desarrollaron un
algoritmo de complejidad de orden O(Np) vía muestreo estratificado, aprovechando las
ventajas del método de simulación de las estadísticas de distintos órdenes. Muchos
filtros de partículas mejorados, se deben a la implementación de un paso de re
muestreo. A continuación un tipo de algoritmo sugerido:

Np
Dado un conjunto de Np partículas xk( i ) , Wki , se sugiere crear que nuevo
i 1
Np
conjunto de partículas independiente del anterior xk( j ) ,Wk j , en el instante
j 1

de re muestreo
Para j=1,…,Np, los valores de xk( j ) reeemplacen a xk(i ) con probabilidad
proporcional a a(i ) .
Los nuevos pesos asociados Wk j se actualizan de la siguiente forma :
Wk j Wki / a(i ) .

En el esquema convencional de re muestreo Multinomial citado anteriormente, el


valor de a(i ) N pWki . Sin embargo, en general, las elecciones del valor de a(i ) son

flexibles, por ejemplo: a(i ) Wki , o ai Wki .


70

Liu, Chen y Lovinenko propusieron usar un esquema de reubicación en vez de un


esquema de re muestreo para reducir la variación extra en el paso de re muestreo. Este
algoritmo, se presenta en los siguientes pasos (Liu et al, 2001):

Para i=1,…, Np si el valor de a(i ) 1 , entonces debe retenerse la cantidad de


copias ki a ( i ) (o ki a ( i ) 1) del valor de xk(i ) y asignar el peso
Wk j Wk j / ki para cada una de las copias.
Si el valor de a(i ) 1 entonces se elimina la muestra con probabilidad 1 a(i ) ,
luego se le asigna el peso Wk j Wk j / ai a la muestra sobreviviente.
Debe devolverse la partícula al conjunto x ( j ) ,Wk( j )

3.4.1 Muestreo estratificado

La idea del muestreo estratificado es distribuir las muestras uniformemente (o no


uniformemente de acuerdo a su varianza respectiva) en las subregiones en las cuales
se divide todo el espacio. Para entender mejor esta idea, es necesario partir de lo
siguiente:

Sea f la estadística de interés que indica el promedio muestreado de una función


usando la técnica de Monte-Carlo, obtenido a partir del muestreo por importancia

Nx
f ( x)
(3.47)

Suponiendo que el espacio de estados está descompuesto en dos conjuntos (estratos o


sub. volúmenes) iguales y disjuntos a y b se requiere obtener el mismo numero total
de muestras Np tomadas de los dos conjuntos por separado para realizar el muestreo
estratificado.
'
Entonces, definiendo la media de f como f y la varianza de la media de f como
'
Var f estratificadas:

' 1
f (fa f b) (3.48)
2

' Vara f Varb f ' Vara f Varb f


Var f Var f (3.49)
4 2N p
71

Donde
2Vara f 2Varb f
Vara f Varb f (3.50)
Np Np

Puede probarse que se cumple que

N pVar f Var f
2
Vara f Varb f Ea f Eb f
N pVar f
2 4
2
' Ea f Eb f
N pVar f N pVar f
4
'
N pVar f N pVar f
(3.51)

'
Donde la varianza estratificada Var f nunca es mayor que la varianza convencional

de Monte-Carlo Var f con Ea f Eb f .

El muestreo estratificado trabaja muy bien y es eficiente el espacios de dimensión no


muy grande N x 4 , siendo Nx la dimensión del vector de estados. Y en casos donde
Nx es mayor, esta técnica se limita dado que se necesita estimar la varianza en cada
estrato, implicando un aumento considerable en el costo computacional.

3.4.2 Filtro de Partículas Regularizado (Regularized Particle Filter, RPF)

La idea principal de este tipo de filtro consiste en cambiar la aproximación discreta de


la función de probabilidad a una aproximación continua, de modo que el paso de re
muestreo cambie a simulaciones realizadas a partir de una función de distribución
absolutamente continua; produciendo un nuevo sistema de partículas con N
ubicaciones diferentes. Haciendo esto, se asume implícitamente que el filtro óptimo
tiene una densidad suave, el cual es el caso de muchas de las aplicaciones. Desde el
punto de vista teórico esta condición adicional que se asume, permite hacer
aproximaciones mas precisas del filtro óptimo, en L1 o en el sentido de L2. En la
práctica, esto permite que los filtros aproximados sean más estables que el filtro de
partículas de importancia.
72

Este tipo de filtro se plantea como una solución al problema de pérdida de diversidad
en las partículas debido al re muestreo (donde las muestras se obtienen de una
distribución discreta). Este re muestreo puede llevar a un colapso en las partículas, o a
un posible caso severo de Sample Impoverishment, donde las Np partículas ocupan un
punto en el espacio. Este tipo de filtro es idéntico al SIR, excepto por la fase de re
muestreo donde se re muestrea a partir de una densidad posterior continua aproximada
del tipo:

Np
p( xk / y1:k ) Wki K h xk xki
i 1 (3.52)
Donde los Wki son los pesos normalizados y la función:

1 x
Kh X K
h Nx h (3.53)

Donde K es el kernel de densidad y Nx es la dimensión del vector de estados. El kernel


de densidad es una función de densidad de probabilidad simétrica de tal modo que
cumpla:

2
xK x dx 0, x K x dx
(3.54)

Para cualquier distribución de probabilidad v en Nx , la regularización de v es la


distribución absolutamente continua Kh v con densidad

d ( K h v)
( x) K h ( x u )v(du )
dx (3.55)
y con (*) el operador convolución. Si la densidad de probabilidad v puede expresarse
en términos de las deltas de Dirac, quiere decir que es una densidad de probabilidad
Nx
discreta en y los valores de los estados son muestras tomadas a partir de ella.
Luego,

Np Np
d ( K h v) 1 1
( x) w(i ) K ( ( x x (i ) )) w( i ) K h ( x x ( i ) )
dx h nx i 1 h i 1 (3.56)

K se elige para minimizar el error integral medio cuadrático (en inglés mean
integrated square error MISE) entre la densidad posterior verdadera y la
representación empírica regularizada. En caso que las muestras tienen el mismo peso,
73

existe un kernel óptimo y un ancho de banda óptimo, de la misma forma que una
densidad Gaussiana. De esta forma pueden definirse:

nx 2 2
(1 x ), si x 1
K opt 2cnx
0, de otro modo
(3.57)

Nx
Donde cnx es el volumen de la hiper esfera unitaria en . Cuando la densidad
adyacente es gaussiana, con matriz de covarianza unitaria, el ancho de banda óptimo
esta dado por

hopt AN p1/( nx 4)
(3.58)
1/( nx 4)
1 nx
A 8cnx (nx 4)(2 )
(3.59)

En el caso general de una densidad adyacente arbitraria se hacen dos aproximaciones,


asumiendo que la densidad es Gaussiana con matriz de covarianza S igual a la matriz
de covarianza empírica de la muestra ( x (1) ,..., x ( Np ) ) .

Luego, se aplica una transformación lineal para lograra una covarianza unitaria (este
proceso se llama blanqueamiento, en inglés whitening). Es decir, la muestra x(i ) , se
cambia a A 1 x(i ) , donde AAT S . La matriz de covarianza del nuevo sistema de
partículas es la matriz unitaria, y el ancho de banda se puede usar directamente!. Con
esto, el problema se reduce a usar el siguiente Kernel de regularización:

(det A) 1 1
K ( A 1 x)
hnx h (3.60)

Para poder manejar densidades multi modales, se elige h=hopt/2. Existen dos tipos de
filtros de partículas regularizados, dependiendo en que momento del algoritmo de
filtros de partículas se ubique el paso de regularización: si antes o después del paso de
corrección.

3.4.3 Filtro de partículas de pos regularización

Fue propuesto por Musso y Oudjane en (Musso et al., 2001). Una simple
aproximación a este tipo de filtro es la que se presenta a continuación en tres pasos
que resumen el algoritmo:
74

Predicción del muestreo: se parte de p( xk 1 / y1:k 1 ) p( xk / y1:k 1 )


N
Corrección v t q ( xk / xk 1 , y1:k 1 ) p ( xk / y1:k 1 )
Regularización p ( xk / y1:k ) K h vtN

En términos de complejidad, este algoritmo se compara con el filtro de partículas


clásico solo que se requieren N generaciones adicionales a partir del Kernel en cada
instante de muestreo. Sin embargo, el filtro pos regularizado mejora seriamente el
desempeño del filtro clásico, especialmente en casos donde se esperan ruidos
dinámicos pequeños. El algoritmo puede verse a continuación:

Generar I 1,..., N , con P( I j) wt(/jt)

Generar el kernel Gaussiano

Calcular el valor de xt(/i )t xt(/It) h tK


con h hopt

if (se usa el procedimiento de whitening)


t At
siendo la raíz cuadrada de la matriz de covarianza empírica
else
t I
end

3.4.4 Filtro de partículas pre regularizado:

Básicamente cumple con la base de los filtros de regularización, solo que se realiza
este paso en un momento diferente del algoritmo. Un análisis teórico de este tipo de
filtro puede encontrarse en la publicación de Legland y colaboradores (Legland et al,
1998), los pasos de este algoritmo son los siguientes:

Predicción del muestreo: se parte de p( xk 1 / y1:k 1 ) p( xk / y1:k 1 )


N
Regularización v t /t 1 K h p ( xk / y1:k 1 )
Corrección p( xk / y1:k ) q( xk / xk 1 , y1:k 1 )vtN/ t 1
75

El costo computacional de la predicción de muestreo, se incrementa mucho dado que


requiere implementar el siguiente algoritmo de rechazo, independientemente de la
muestra i.

Paso 1 Generar las muestras I 1,..., N uniformemente

Paso 2 Generar el Kernel Gaussiano y una variable u U [0,1]

Paso 3 calcular el valor de X xt(/It) 1 h t K con h hopt

if (se usa el procedimiento de whitening)


t At
siendo la raíz cuadrada de la matriz de covarianza empírica,
else
t I
end
if q ( xk / xk 1 , y1:k 1 ) U sup q ( xk / xk 1 , y1:k 1 )
nx
X
(i )
xt /t X
else
ir al paso1
end

Ambos filtros convergen al filtro óptimo en sentido débil, con una tasa de h2 1/ N .
El término h2 corresponde al error debido a la regularización. Cuando h=0, se alcanza
la tasa de convergencia del filtro clásico de regularización. En el sentido fuerte del
espacio L1, el error estimado es proporcional a h2 1/ Nhnx para los filtros post y
pre regularizados. De igual forma que para el filtro clásico, estos estimativos del error,
generalmente no están acotados en el tiempo. A continuación, se presenta el modelo
de algoritmo propuesto para el filtro de partículas regularizado (Arumpalam et al.,
2001).
76

Np Np
xni , Wni RPF xni 1 ,Wni 1 , yn
i 1 i 1

For i 1: Np
xni q xn / xni 1 , yn
p ( yn / xni ) p( xni / xni 1 )
Wni Wni 1
q ( xni / xni 1 , yn )
end
Np
PesoTotal Wni
i 1

For i 1 : Np
Wni
Wni
PesoTotal
end
^ 1
Neff Np
2
Wni
i 1
^
if Neff NT
Sk Cov xni ,Wni
se calcula Dk tal que S k Dk DkT
REMUESTREAR : usando el método más apropiado
For i 1: Np
calcular el kernel K
xni* xni hopt Dk K
end
endif

3.4.5 Métodos de Reducción de la Varianza Rao-Blackwellización

La Rao-Blackwellización, motivada por el teorema de Rao-Blackwell, es un tipo de


técnica de marginalización. Fue usada por primera vez por (Gelman y Rubin, 1992)
para calcular la densidad marginal con el método de muestreo de Monte Carlo. Casella
y Robert (Casella and Robert, 1996) también desarrollaron métodos de Rao-
Blackwellizacion para muestreo por rechazo y algoritmos de Metrópolis con
77

procedimientos de muestreo por importancia. La cualidad de esta técnica que mas nos
interesa es su propiedad intrínseca de reducción de la varianza, la cual se usa en
filtrado de partículas para mejorar su desempeño.

El teorema base para esta técnica es el siguiente:

Sea fˆ (Y ) una estimación no desviada de f(x) y una estadística suficiente de x (Ver


apéndice A). Se define:

fˆ ( y) E p ( x ) fˆ Y (Y ) ( y)
(3.61)

Entonces fˆ ( y ) también es una estimación no desviada de y. Por tanto

Varp ( x ) fˆ ( y) Varp ( x ) fˆ Y
(3.62)

Y la igualdad se cumple si y solo si

P fˆ Y fˆ ( y) 1
(3.63)

La importancia de este teorema es, que con la información de estadísticas suficientes,


se puede desarrollar y mejorar un estimador no desviado que no sea función de por
condicionamiento de . Y si es una función única de x, entonces este estimador de
f(x) es una función única de . Además es de mínima varianza (Chen, 2003). Este
método es útil en casos en los que se pueden hacer particiones del espacio de estados
xk en varias partes como x1k , xk2 y marginalizar analíticamente una de las
componentes de la partición, sea x1k o xk2 . Si una de las componentes de la partición
es un modelo en espacio de estados condicionalmente lineal gaussiano, entonces todas
las integraciones pueden hacerse analíticamente y en línea usando el filtro de Kalman.

Definiendo x0:j k x0j ,..., xkj , puede lograrse una expresión para el posteriori de la
siguiente forma:
78

f k x10:k , x0:2 k p y0:k / x0:1 k , x0:2 k p x0:1 k /, x0:2 k d x10:k p x10:k d x10:k
E( fk )
p y0:k / x0:1 k , x0:2 k p x0:2 k / x0:1 k d x0:2 k p x0:1 k d x0:1 k

g x10:k p x10:k d x10:k


p y0:k / x0:1 k , x0:2 k p x0:2 k / x0:1 k d x0:2 k
(3.64)

g x10:k f k x10:k , x0:2 k p y0:k / x0:1 k , x0:2 k p x0:2 k /, x0:1 k d x0:2 k


(3.65)

Debe asumirse que la probabilidad condicional dada una realización de x10:k g x0:1 k y
1
p y0:k / x0: k puedan ser evaluados analíticamente, y de este modo pueden hacerse las
dos estimaciones de la densidad de probabilidad a posteriori basadas en el muestreo
de importancia.

La primera de ellas se obtiene usando el filtro de partículas convencional, con


muestreo de importancia; y la segunda, la Rao Blackwellizada, se obtiene vía
2
integración analítica de x0:k usando como función de importancia la distribución:

q x10:k / y0:k q x10:k , x0:2 k / y0:k dx0:2 k


(3.66)

Así pues, la nueva estimación esta dada por

Np
g x1,( i)
w* x1,( i)

Eˆ ( f k ) i 1 0:k 0:k
Np
w* x1,(
0:k
i)

i 1 (3.67)
Donde los pesos son

w* x1,(
0:k
i)
p x10:k / y0:k / q x10:k / y0:k
(3.68)

Usando la descomposición de la varianza, es fácil mostrar que las varianzas de los


pesos de importancia obtenidos por medio de la Rao Blacwellización son pequeños en
comparación con los obtenidos directamente con el método de Monte Carlo. Ver
(Doucet, 1997), (Doucet, 1998), (MacEachern et al., 1998).

Para la implementación de esta técnica debe tenerse mucha precaución en el momento


de aplicar los métodos de Monte Carlo tradicionales (revisados anteriormente) sobre el
79

espacio marginal x1k , porque si las observaciones y0:k son condicionalmente


1 2
independientes x ,x
0:k 0:k , no serán independientemente condicionales al proceso
independiente representado por x1k . Las modificaciones requeridas son fáciles de
lograr (Doucet et al., 1998).

La siguiente proposición muestra que “si se puede integrar analíticamente una de las
componentes de la varianza del estado obtenido, es más débil que la de la estimación
simple”.

Proposición: Las varianzas de los pesos de importancia, el numerador y el


denominador, obtenidos por Rao Blackwellización, son más pequeñas que las
obtenidas por medio de un método de Monte Carlo Simple.

varp x1 / y0:k
w* , x10:k varp x1 , x0:2 k / y0:k
w* , x0:1 k , x0:2 k
0:k 0:k
(3.69)

La prueba de esta proposición es fácil de demostrar puede verse en (Doucet, 1997) y

puede ser usada para estimar la distribución marginal p x10:k / y0:k , pero

también, puede darse que si fk x10:k , x0:2 k fk x10:k , entonces


g x10:k fk x0:1 k p y0:k / x10:k y que

Np
f k x1,( i)
w x1,( i)

Eˆ ( f k ) i 1 0:k 0:k
Np
w* x1,(
0:k
i)

i 1 (3.70)

Y si fk x10:k , x0:2 k fk x0:2 k entonces g x10:k E p x2 f k x0:2 k p y0:k / x0:1 k y


0:k / y0:k . x10:k

que

Np
i 1
Ep x0:2 k / y0:k . x10:k
f k x0:2 k w x0:1,(ki )
Eˆ ( f k ) Np
w x1,(
0:k
i)

i 1 (3.71)

En todos los casos, es posible usar los Métodos de Monte Carlo desarrollados
anteriormente (Doucet, 1998).
80

3.4.5.1 Algoritmo de Rao Blackwellización:

Dadas Np partículas x0:i k 1 en el instante k-1, distribuidas aproximadamente con la


i
siguiente distribución p x 0:k 1 / y1:k 1 , el procedimiento de Rao Blackwellización
i
permite calcular Np partículas x 0:k distribuidas aproximadamente de acuerdo a la
i
distribución posterior p x 0:k / y1:k en el tiempo k. Esto se logra por medio del
algoritmo que se describirá a continuación:
81

Paso de muestreo de Importancia Secuencial


for i 1,..., Np
xki q xk / x0:i k , y1:k
y
x0:i k xki , x0:i k
end
for i 1,..., N p
Evaluar los pesos de importancia usando
una constante de normalizacion
p x0:i k / y1:k
wk( i ) i i
q x /x k 0:k 1 , y1:k p x0:i k 1 / y1:k
end
for i 1,..., Np
Normalizar los pesos de importancia
wk( i )
wk( i ) Np
wk( j )
j 1

end
Paso de selección
Multiplicar o suprimir las muestras x0:i k con altos o bajos pesos de importancia wk( i )
respectivamente, para obtener N p muestras aleatorias x0:i k distribuidas aproximadamente
de acuerdo a p x0:i k / y1:k
Paso de Monte Carlo y Cadenas de Markov
Aplicando un kernel de transición con una distribución
dad por p x0:i k / y1:k para obtener x0:i k

En caso que las funciones de importancia puedan expresarse de la siguiente forma:

k
q x10:k / y1:k q x0 q x1m / y1:m , x1:m 1
m 1 (3.72)

Es posible obtener fórmulas recursivas para evaluar los pesos de la forma:


w x0 w x0:k 1 wk , y luego obtener w1:k (pesos normalizados). El peso incremental
está dado por
82

p yk / y1:k 1 , x0:k p xk / xk 1
wk
q xk / y1:k 1 , x1:k 1
(3.73)

3.4.6 Kernel Smoothing y regularización

Brevemente se dirá de esta técnica que se utiliza la técnica de Jittering para aliviar el
problema de empobrecimiento de las muestras es decir, en cada tiempo de muestreo se
agrega una cierta cantidad de ruido gaussiano a cada partícula remuestreada. Este
procedimiento es equivalente a usar un kernel gaussiano para suavizar la distribución
a posteriori, previene el problema de la divergencia. Más adelante se encontrarán mas
detalles de posible aplicación en los filtros de partículas.

3.4.7 Solución numérica de la ecuación de Focker Planck

La Ecuación de Focker Planck es una ecuación en derivadas parciales que gobierna la


evolución de las densidades de probabilidad de los estados, condicionados a las
medidas. En caso que sea posible aproximar su solución en tiempo real, el problema
de filtrado queda resuelto inmediatamente. Sin embargo, la complejidad
computacional de este método crece exponencialmente con la dimensión del espacio
de estados; lo que lo lleva a tener el problema de la dimensionalidad, aún en la
actualidad. Para problemas con bajas dimensiones, la solución numérica de dicha
ecuación es viable. Una expresión de la ecuación diferencial es,

2
p p f 1 p
f ptr tr Q 2
t x x 2 x
Q GGT , matriz de coeficientes de ruido (3.74)

En resumen, la solución numérica de la ecuación de Focker Planck propaga la


información estadística de las densidades de probabilidad completas condicionadas a
los estados, usando el método de diferencias finitas o algún otro método de solución
para predecir la información estadística de las medidas en el tiempo siguiente,
mediante el uso de la regla de Bayes para la corrección de las estadísticas predichas en
el tiempo de medida t (continuo).

La exactitud de la estimación del vector de estados estimado, posee desempeño


óptimo si se diseña cuidadosamente, pero con el costo de una altísima complejidad
computacional para problemas de grandes dimensiones, llevando a este algoritmo a
sufrir del problema de la dimensionalidad para definiciones de grillas fijas (Daum,
2005).
83

3.4.8 Filtros de Dimensión Finita

Los filtros que resuelven las ecuaciones de densidad de probabilidad en tiempo real
son los llamados filtros exactos de dimensión finita, porque el vector de estados en si
mismo tiene una dimensión finita fijada previamente. Debe considerarse pues, que las
estadísticas suficientes propuestas por Fisher son las que son propagadas a través del
algoritmo y que la predicción de las se hace mediante la integración numérica de las
ecuaciones diferenciales ordinarias en la familia exponencial de las densidades de
probabilidad. Nuevamente, se aplica la regla de Bayes para la corrección de las
características estadísticas.

Los Filtros Recursivos Exactos No lineales pueden definirse brevemente así: Un filtro
es exacto si proporciona exactitud de la estimación óptima, con un algoritmo que solo
requiera la solución de una ecuación diferencial ordinaria (ODE) en tiempo real, pero
no exige la solución de las densidades de probabilidad de los estados en tiempo real.
Por ejemplo, el filtro de Kalman es exacto para sistemas lineales gaussianos.

3.4.9 Filtro de Daum

Una forma particular de plantear esta solución es la siguiente: Los problemas de


filtrado con dimensión finita que posean estadísticas suficientes, son en algún sentido
intuitivo extremadamente raros; por ello es importante identificar y solucionar
correctamente dicho problema.

Este tipo de filtro, esta basado en el uso de una familia exponencial de distribuciones
de probabilidad del tipo:

T
p xt / yt a x, t b y, t exp x, t y, t
(3.75)

Donde las funciones a y b son funciones escalares no negativas. El filtro de Kalman


esta basado en la densidad de probabilidad Gaussiana, mientras que muchos filtros
exactos usan una familia de exponenciales o densidades de probabilidad
multivariadas. Luego es posible que también el filtro de Kalman pueda ser visto como
un caso particular del filtro de Daum, ya que una densidad Gaussiana es un caso
especial de la familia de exponenciales. Los filtros de Daum, o de familias
exponenciales, incluyen al filtro de Kalman y también al filtro de Bénes (Daum, 1987,
2005)

El significado práctico de una estadística suficiente y de una dimensión finita es que


los requerimientos en el almacenamiento de la información y la complejidad
computacional, no crecen tanto a medida que se acumulan las mediciones.
84

Así pues, para solucionar este tipo de problemas, se asume que la función p no
desaparece en ningún punto, es doblemente continuamente diferenciable en x y
continuamente diferenciable en t; y además, la función p se aproxima a cero lo
suficientemente rápido como x y tiene la propiedad de satisfacer la ecuación
de Focker Planck. Ahora bien, para una condición inicial dada de la función p x, tk ,
la ecuación de Focker Planck tiene una única solución acotada para todo x, en el
intervalo tk t tk 1 .

Aquí pues, la solución se plantea de la siguiente forma:

T
p xt / yt p x, t exp x, t y, t (3.76)

De la ecuación anterior, el primer término de la derecha es la probabilidad no


condicional que junto con el vector T x, t , es estimado fuera de línea mediante la
solución de la ecuación de Focker Planck y la ecuación diferencial en derivadas
parciales independientes de las medidas; y el término y, t estimado en línea usando
ecuaciones diferenciales ordinarias, Así

Fuera de línea

2
p p f 1 p
f ptr tr Q 2
t x x 2 x
Q GGT , matriz de coeficientes de ruido (3.77)

T 1
Q f A
t x 2 (3.78)

En línea
d
AT (t ) (t ) (t )
dt
(tk ) (tk ) C ( yk , tk )
(3.79)
85

Donde (tk ) es el valor de la función antes de la medición y (tk ) es el valor


inmediatamente después de la medida de y al tiempo (tk ) .

3.4.10 Filtro de Partículas Auxiliar, (Auxiliary Sampling Importante Resampling


Filter, ASIR- APF)

Este algoritmo fue introducido por Pitt y Shepard (Pitt y Shepard, 1997) en donde
plantean que el algoritmo típico de filtro de partículas no es completamente robusto.
Para respaldar esta afirmación inician su trabajo sustentando su falta de robustez
debido a dos razones principales: la primera es el diseño de los simuladores y la
segunda es el uso de los soportes discretos de las funciones de probabilidad, para
representar la distribución previa actualizada secuencialmente.

Como consecuencia de estas dos afirmaciones, en su trabajo, plantean realizar una


mejora significativa al algoritmo inicial planteado por (Salmond, Gordon y Smith,
1993) tocando estos dos problemas y obteniendo como resultado, una solución del
primer punto y una reducción considerable en la magnitud de la segunda dificultad.

Esta propuesta de algoritmo, tiene como objetivo aumentar las partículas buenas
existentes dado que las probabilidades predictivas son grandes; y para ello usa la
distribución óptima en los casos que esta sea exacta, en caso contrario, usa la mejor
aproximación. Esta metodología, agrega un componente nuevo al algoritmo de
filtrado: se trata de un índice de componentes mixtas, llamado variable auxiliar, la
cual es el centro de su propuesta.

Brevemente, puede decirse que se implementan dos pasos que son:

Simulación de las partículas con vecindades grandes


Re ponderación de las partículas

Este último paso implica que el paso de re muestreo no se hace, ya que se hace el tipo
de filtrado de un paso adelante basado en un punto de estimación. Cuando el ruido del
proceso es pequeño el desempeño es mejor que el SIR. Ahora bien, cuando el ruido del
proceso es grande, el punto estimado ki no da suficiente información de p ( xk / xki 1 ) .

Como se ha notado en la revisión de las técnicas de filtrado, uno de los problemas


fundamentales con los filtros de partículas básicos es que su estructura mezclada hace
más complicado el mejoramiento del desempeño de las simulaciones en el típico SIR,
el filtro de rechazo o el muestreo de Monte Carlo y Cadenas de Markov; esto es
debido al costo computacional que implica la evaluación de la función de densidad
predictiva de tipo empírica. La cual puede ser combinada con la densidad de las
86

medidas, para producir debido a la proporcionalidad, la llamada densidad de filtrado


de tipo empírica, según (Pitt y Shepard, 1997).

En la literatura, el mecanismo de cambiar el tipo de muestreo se le llama adaptación,


mencionado y evaluado por Schon (Schon, 2005). La falta de adaptabilidad, hace que
los filtros de partículas sean menos atractivos para problemas difíciles, donde su
aplicación es menos efectiva. En el trabajo de Pitt y Shepard argumentan que muchos
de esos problemas se reducen cuando se realizan filtros de mayor dimensión (Pitt y
Shepard, 1997).

La variable auxiliar requiere únicamente la habilidad de propagar y evaluar la


probabilidad, de la misma manera que el filtro básico en su artículo seminal en
(Salmond, Gordon y Smith, 1993). En la práctica, este algoritmo, se ejecuta
ligeramente mas lento que el SIR original debido a que es necesario evaluar
q ( xk ,i , y1:k 1 ) y desarrollar dos boostraps ponderados en vez de uno solo no
ponderado. Sin embargo, las ganancias en el muestreo usualmente dominan estos
pequeños efectos.

Mediante propuestas que tengan probabilidades condicionales grandes se redujeron los


costos del muestreo, muchas veces a partir de partículas que tenían probabilidades
muy bajas y que no serian re muestreadas en la segunda etapa del proceso. Esto
mejora la eficiencia estadística del procedimiento de muestreo y significa que se
puede reducir el valor de la variable auxiliar sustancialmente. También puede
desarrollarse un tipo de filtro de partículas auxiliar con un tipo de re muestreo (Pitt y
Shepard, 1997).

Para este tipo de filtro se introduce una función de importancia q ( xk ,i , y1:k ) , que
Ns
muestrea el par xk , i j , donde ij es el índice de la partícula en el instante k-1.
j 1

p( xk ,i , yk ) p( yk / xk ) p( xk / xki 1 )Wki 1
(3.80)

De este modo, se obtiene una muestra de p ( xk ,i / yk ) , y se omite el índice i en el par


Ns
(xk,i) para producir una muestra xkj a partir de la densidad marginalizada
j 1

p( xk / yk ) .

Entonces, ahora se plantea la densidad de importancia como:


87

q ( xk ,i , y1:k ) p xk / xki 1
(3.81)

Y los pesos asignados son de la forma:

j p ( yk / xki ) p ( xkj / xkij 1 ) p ( yk / xkj )


Wki Wki 1 , Wk j (3.82)
q ( xki , i j / y1:k ) p ( yk / kij )

Donde la media puede escribirse como

i
k E xk / xki 1
(3.83)

El filtro de partículas auxiliar se diferencia del filtro de partículas de muestreo por


importancia, en que intercambia el orden del muestreo y del re muestreo, lo que es
posible cuando los pesos de importancia dependen de xk. Insertando la probabilidad
dentro de la densidad mixta empírica, puede hallarse una expresión para la densidad
de filtrado de la siguiente forma:

Np
p( xk / y0:k ) p( yk / xk ) p( xk / xk 1 ) p( xk 1 / y0:k 1 )dxk 1 Wk(i ) p ( yk / xk ) p ( xk / xk(i )1 )
i 1

(3.84)
Donde
Np
p( xk 1 / y0:k 1 ) Wk(i )1 ( xk / xk(i )1 )
i 1 (3.85)
Ahora bien, el producto Wk(i ) p ( yk / xk ) se trata como la probabilidad combinada,
atribuida a la densidad de filtrado. Al momento de introducir la variable auxiliar,
1,..., Np que juega el papel de índice del componente mixto, la densidad
conjunta aumentada p( xk , / y0:k ) se actualiza de la siguiente manera:

p( xk , i / y0:k ) p( yk / xk ) p( xk , i / y0:k 1 )
p( xk , i / y0:k ) p( yk / xk ) p( xk , i / y0:k 1 ) p(i / y0:k 1 )
(i )
p( xk , i / y0:k ) p( yk / xk ) p( xk / x )Wk(i )1
k 1 (3.86)

De ahí en adelante, una muestra puede seleccionarse a partir de la densidad conjunta,


simplemente ignorando el índice representado por la variable auxiliar , con lo cual
Np
un conjunto de partículas del tipo xk( i ) puede ser obtenida a partir de la densidad
î 1
88

marginalizada p( xk / y0:k ) y los índices se simulan con probabilidades proporcionales


a p( / y0:k ) . De este modo, p( xk / y0:k ) puede aproximarse de la siguiente manera:

Np
p( xk / y0:k ) Wk(i )1 p ( yk / xk( i ) . i ) p( xk / xk( i )1 ) (3.87)
i 1

i
Donde denota el índice de la partícula xk(i ) en el instante de tiempo k-1,
Np
llámese i
i . La distribución propuesta usada para muestrear xk( i ) . i
se
î 1

elige de forma factorizada:

q xk . / y0:k q / y0:k q xk . / y0:k (3.88)

Donde

i (i )
q / y0:k p yk / k Wk(i )1
q xk . i / y0:k p xk / xk(i )1
(3.89)

Donde k( i ) es el valor medio asociado a p ( xk / xk(i )1 ) a partir de la cual, se muestrea la


i-ésima partícula. Luego, el posterior verdadero se aproxima mediante la expresión:

Np
p( xk / y0:k ) Wk(i )1 p( yk / (
k
i)
) p( xk / xk( 1
i)
)
i 1 (3.90)

De las ecuaciones anteriores, puede obtenerse una expresión para la obtención de los
pesos importantes, los cuales serán actualizados recursivamente.

p( yk / xk(i ) ) p( xk(i ) / xk( i)


)
Wk(i ) Wk( 1 i ) i
1

q xk . y0:k
(i )
p ( yk / x )
Wk(i ) k

p( yk / k( i ) )
(3.91)

Como se mencionó anteriormente el filtro de partículas auxiliar tiene esencialmente


dos pasos, el primero de los cuales simula las partículas con probabilidades predictivas
grandes y en el segundo paso, se re ponderan nuevamente las partículas y se extraen
los estados aumentados. Esto es equivalente a hacer una función propuesta que tiene
89

una probabilidad a priori grande, y de esta forma eliminar el muestreo ineficiente. La


idea de la variable auxiliar, puede ser usada para los filtros SIS y los Filtros SIR. Un
pseudo código del algoritmo de filtro de partículas auxiliar es el siguiente:

for i 1,..., Np
calcular
(i )
k E p xk xk( i )1
end
for i 1,..., Np
calcular los pesos del primer paso
Wk( i ) Wk( i )1 p yk (i )
k

y normalizar los pesos


Wk( i )
Wk( i ) Np
Wk( j )
j 1

end
Usar el procedimiento de remuestreo del SIR
i Np
para obtener las nuevas partículas xn( i ) ,
i 1

for i 1,..., Np
muestree
xn( i ) p xn( i ) xn(i )1 , i

actualizar los pesos de la segunda etapa de acuerdo a


p( yk / xk( i ) )
Wk( i )
p ( yk / k( i ) )

Vale la pena hacer una comparación entre el filtro de partículas auxiliar y el filtro de
partículas de muestreo por importancia, sobre la eficiencia estadística en el contexto
de la medida aleatoria E W 2 xk . Los pioneros Pitt y Shephard mostraron que
cuando la probabilidad no varia sobre diferentes valores de , entonces la varianza
del ASIR es más pequeña que la del filtro tipo SIR. El ASIR puede entenderse como un
filtrado de un paso adelante en el cual la partícula xk( i )1 se propaga a k(i ) en el
próximo tiempo, para poder permitir que se haga el muestreo del posterior.

Por otro lado, el ASIR hace un re muestreo de p( xk 1 / y0:k ) en vez del re muestreo de
p( xk / y0:k ) que se hace normalmente en el SIR, lo que hace que usualmente se alcance
90

menores varianzas porque el estimado pasado es mas confiable. De este modo, el ASIR
toma ventaja de la anticipación de la información a partir del modelo de probabilidad,
para evitar el muestreo ineficiente porque las partículas con bajas probabilidades son
consideradas menos informativas. En otras palabras, las partículas a ser muestreadas
son empujadas intuitivamente a la región de más alta probabilidad.

Pero cuando la probabilidad condicional no es sensitiva a los estados, la diferencia


entre los filtros de partículas ASIR y SIR es insignificante. El ASIR calcula dos veces
la probabilidad y los pesos de importancia; éste en general alcanza mayor desempeño
que los filtros SIS y los SIR.

Comentarios acerca de este tipo de filtro de partículas: En los filtros de partículas


convencionales la estimación se realiza usualmente después del paso de re muestreo,
lo que es menos eficiente debido a que el re muestreo introduce variación extra
aleatoria en el estado actual (Casella, 1997). El ASIR básicamente supera este
problema, realizando una estimación de un paso adelante basada en el estimado del
punto k( i ) , que caracteriza la probabilidad p xk(i ) / xk( i )1 .

Usualmente cuando el ruido de proceso es pequeño, el desempeño del ASIR es mejor


que el del filtro tipo SIR. Sin embargo, cuando el ruido de proceso es grande la
estimación del punto k( i ) no entrega cierta información acerca de p xk(i ) / xk( i )1 ,
entonces la superioridad del ASIR no está garantizada (Arumpalam, Maskell y
Gordon, 2002).

En el ASIR, la distribución propuesta es una densidad mixta que depende de los


estados pasados y de las observaciones más recientes. Si se le compara con los
Métodos de Monte-Carlo, es idéntico al Método local (Amer. Stat. Asoc, 1998) en el
cual los autores propusieron dos métodos para muestrear x, , basadas ya sea en la
distribución conjunta o en la marginal.

La desventaja del ASIR es que el muestreo se hace sobre un espacio aumentado y si el


índice auxiliar varía bastante en el punto previo, el muestreo entrega un espacio
mayor, la ganancia es despreciable y la varianza de los pesos de importancia
incrementa.

Finalmente, debe argumentarse que el ASIR es computacionalmente más lento, debido


a que la distribución propuesta se usa dos veces. Fearnhead, argumentó que el paso de
re muestreo en ASIR es innecesario, lo cual no introduce nada pero si puede introducir
un poco con inexactitud. Esta afirmación no fue justificada suficientemente
(Fearnhead, 2001). La idea de la variable auxiliar también puede ser usada en los
91

Métodos de Monte Carlo y Cadenas de Markov (MCMC) (Higdon, 1998), (Meng y


van Dyk, 1999).

3.4.11 Filtros de Partículas Marginalizados

En las matemáticas y en las ciencias en general, el hecho de explorar ciertas


estructuras presentes en el problema sobre el cual se esta haciendo la investigación, es
bastante ventajoso. Los Métodos de Monte Carlo no son una excepción y de esta
forma, si se posee una sub estructura lineal y gaussiana disponible dentro de las
ecuaciones del modelo del problema, es factible usarla para hacer estimaciones con
varianza baja o al menos no muy grande (Doucet et al, 2000a), (Chen y Liu, 2000).
La razón por la cual se hace uso de esta estructura, es que los estados lineales
correspondientes pueden ser estimados óptimamente usando el filtro de Kalman, lo
cual puede ser evidenciado en las aplicaciones que poseen muchos estados y ven
reducida su complejidad computacional, al usar el filtro de Kalman en estados lineales
y filtro de partículas en los restantes. Para explicar un poco el tema de la
marginalización, debemos remitirnos al tema de Rao Blackwellización donde se usa
una técnica de marginalización, de esta forma y similarmente, se asume que dentro del
modelo de los estados, se encuentra disponible una sub estructura y el vector de
estados puede ser dividido de la siguiente forma:

xk x1k , xk2
(3.92)

Donde x1k y xk2 se usan para denotar las variables de estado lineales y no lineales,
respectivamente. La idea básica debajo del filtro de partículas marginalizado es partir
la probabilidad p x10:k , x0:2 k / yk de acuerdo a la siguiente expresión:

p x1k , xk2 / yk p x1k / xk2 , yk p xk2 / yk (3.93)

Lo que permite usar el filtro de Kalman para estimar óptimamente la función de


densidad de probabilidad de las variables lineales p x1k / xk2 , yk si el ruido es
gaussiano. La densidad de probabilidad p xk2 / yk que es función de las variables de
estado no lineales se estima usando el filtro de partículas de la siguiente forma:
92

f k x10:k , x0:2 k p y0:k x0:1 k , x0:2 k p x0:1 k , x0:2 k d x0:1 k p x0:1 k d x0:1 k
E( fk )
p y0:k x0:1 k , x0:2 k p x0:2 k x0:1 k d x0:2 k p x0:1 k d x0:1 k

g x10:k p x0:1 k d x0:1 k


p y0:k x0:1 k , x0:2 k p x0:2 k x0:1 k d x0:2 k
(3.94)

g x10:k f k x10:k , x0:2 k p y0:k x10:k , x0:2 k p x0:2 k , x10:k d x0:2 k


(3.95)

En las expresiones anteriores se han marginalizado analíticamente las variables de


estado lineales. Esto motiva a que sea el nombre de marginalización, el asignado al
procedimiento de usar ambos filtros, el de Kalman y el filtro de partículas, lo mismo
que el filtro de partículas con Rao Blackwellización (Casella y Robert, 1996),
(Doucet et al, 2000a). La idea de usar un filtro que contiene un filtro de Kalman para
los estados lineales y uno de partículas para las variables de estado no lineales no es
nueva. Fue discutida previamente en la literatura por Doucet, Chen, Norlund, Andrieu
y sus colaboradores (Doucet et al, 2000a), (Doucet et al, 2001b), (Chen y Liu, 2000),
(Nordlund, 2002), (Andrieu y Doucet, 2002). Y la contribución de Schön en el año
2005 fue el planteamiento de un filtro de partículas marginalizado para el espacio de
estado que sea una mezcla de variables lineales y no lineales, mas general, expresado
como Modelo 5 en (Schön, 2005). El algoritmo resultante es el siguiente:

Paso 1: Inicialización Inicializar las partículas y establecer los valores


iniciales para las variables de estado lineales, que serán usadas con el filtro de
Kalman.
Paso 2 Actualización de las medidas del filtro de partículas: evaluar los
pesos de importancia y normalizar.
Paso 3 Remuestrear con reemplazo.
Paso 4 Tiempo de Actualización del filtro de partículas y del filtro de
Kalman: Actualización de Medidas del filtro de Kalman, actualización de
filtro de partículas: predicción de nuevas partículas, Actualización del filtro
de Kalman
Paso 5 Iterar desde el paso 2 del algoritmo.

Si el filtro de partículas estándar se usa para todos los estados, la dimensión del
espacio en el cual las partículas residen será dimensión (n x t) =dimxt, mientras que si
se usa el filtro de partículas marginalizado, la dimensión correspondiente será
dimensión (n x nt) = dimxnt. Intuitivamente, como dimxnt < dimxt. Nótese que para
tener una mejor estimación, aplicando el filtro de partículas tradicional, deben usarse
más partículas, que las que se usarían con el filtro de partículas marginalizado. En el
93

trabajo de Schön y el trabajo de Karlsson (Karlsson et al., 2004), se investigaron los


problemas y la complejidad computacional del filtro de partículas marginalizado.

Este tipo de filtro de partículas, el marginalizado ha sido usado con éxito en muchas
aplicaciones, por ejemplo, en seguimiento de objetivos con auto movimiento (Eidehall
et al., 2005), posicionamiento de agentes autónomos (Svenzén, 2002), aeronavegación
[Nordlund, 2002], navegación subacuática (Karlsson y Gustafsson, 2003),
comunicaciones (Chen et al., 2000), (Wang et al., 2002), identificación de sistemas no
lineales (Schön y Gustafsson, 2005), (Li et al., 2003), (Daly et al., 2005) y separación
de fuentes de audio (Andrieu y Godsill, 2000). Además, en el trabajo H en la tesis
doctoral de Schön, se describió el filtro de partículas desde el punto de vista de las
aplicaciones, utilizando muchas de ellas.

A continuación se describe superficialmente algunas observaciones hechas por Schön


acerca de estimación de parámetros con el filtro de partículas de marginalización:

La estrategia empleada en esta aproximación es ampliamente conocida. La idea es


aumentar los estados en un nuevo vector de estados (Åström y Eykhoff, 1971), (Ljung
y Söderström, 1983).

zn xn ,
(3.96)

Asumiendo que la variación de los parámetros se rige por una caminata aleatoria, el
problema de identificación de sistemas puede tratarse como un caso de estimación de
estados no lineales, lo que hace posible el uso de varios algoritmos en este tipo de
problema. El modelo dinámico resultante es:

xt 1 f1 xt , ut , t f 2 xt , ut , t wt
t 1 t wt
yt h1 xt , ut , t h2 xt , ut , t et
(3.97)

El cual es un caso especial del modelo 5 de Schön, lo que implica que el filtro de
partículas marginalizado puede usarse. Aquí, este algoritmo puede utilizarse para
obtener la solución al problema de identificación de parámetros. Los detalles de esta
aproximación se dan en el trabajo E de la tesis de Schön (Schön, 2005). También, una
aproximación similar fue desarrollada por (Li et al., 2003), (Andrieu y Godsill, 2000)
y también fue empleada por (Daly et al., 2005). Esta idea fue explorada anteriormente
por (Ljung, 1979), donde existe la salvedad que el problema de estimación resultante
fue manejado usando el filtro de Kalman. El trabajo de (Kitakawa, 1998) también es
94

interesante en este contexto, donde los parámetros se estiman usando la técnica de


suavización (smoothing) en vez de un filtro.

En el trabajo de (Ba y Odobez, 2005) ellos introducen un tipo de filtro de partículas


llamado “A Rao-Blackwellized Mixed State particle filter, MSPF,” que se basa en los
conceptos de Rao Blackwellización y marginalización de los estados, sumado con el
concepto de filtro de partículas de estados mixtos, el cual, permite representar
conjuntamente, en el mismo espacio de estados, tanto variables discretas como
variables continuas. Los resultados de los experimentos realizados por Ba y Odobez
(Ba y Odobez, 2005) sobre la aplicación en estimación de posición de las cabezas y su
trayectoria, demostraron los beneficios del filtro de partículas Rao Blackwellizado con
un modelo de pocas partículas, en contraste con el filtro de partículas de estados
mixtos; estos experimentos realizados en muestras de personas en una sala de
reuniones, mostraron que el seguimiento hecho por el Rao Blackbellized particle filter
(RBPF) es mejor que el de MSPF, que había probado ser mejor que el filtro de
partículas simple en dicha aplicación. Con ello demostraron que el RBPF es el que
mejor funciona en este tipo de aplicaciones.

3.4.12 Filtro de densidad de hipótesis de probabilidad (probability hypothesis density


PHD)

El autor lo presenta como una aproximación de primer momento a la evolución de un


punto de proceso dinámico, que puede usarse para aproximar las ecuaciones optimas
de filtrado de un problema de seguimiento multi objetivo. Johansen y su equipo
(Johansen et al., 2005) demostraron que bajo condiciones razonables, las
aproximaciones vía métodos de Monte Carlo secuenciales del filtro de hipótesis de
probabilidad, convergen en media de orden mayor que 1, y de forma casi segura al
filtro verdadero. Mostraron con el teorema del limite central para la aproximación de
Monte Carlo, que la varianza es finita bajo condiciones similares, dando una
justificación teórica a para la implementación de una metodología manejable para
filtrado de múltiple objetivo y generaliza algunos resultados a partir de la teoría
secuencial de Monte Carlo.

Johansen basa su propuesta en los modelos de Markov ocultos (Hidden Markov Model
HMM), el estado y las medidas en un tiempo k son dos vectores, posiblemente con
dimensiones diferentes y que pertenecen a espacios E y F respectivamente. Esos
vectores evolucionan aleatoriamente a través del tiempo, pero sus dimensiones son
fijas. El propósito del filtrado es obtener un cálculo recursivo en el tiempo de la
distribución del estado oculto, dadas todas las observaciones que se hallan hecho. En
el filtrado multi objetivo, que ha sido introducido recientemente y estudiado por las
comunidades de fusión de datos y estudiosos en seguimiento (Goodman et al, 1997),
(Mahler, 2003); el objetivo es realizar un filtrado cuando las variables de estado y
observación son subconjuntos finitos de E y F. Conceptualmente, este problema puede
95

ser pensado como que se realiza un filtrado cuando los espacios de estado y
observación son uniones disjuntas, respectivamente. Es importante anotar que
desarrollar herramientas eficientes computacionalmente en este aspecto es
extremadamente difícil. (Gentil et al., 2005). Una alternativa que es fácil de aproximar
computacionalmente es el filtro de densidad de hipótesis de probabilidad (Probability
Hypothesis Density PHD), propuesto recientemente por (Mahler et al, 2003), el cual es
un algoritmo recursivo que propaga el primer momento, llamado también la intensidad
del posterior multiobjeto; el primer momento, es una medida definida apropiadamente
en el espacio E (puede usarse este término para definir también la derivada de Radon-
Nikodym de esta medida, respecto alguna medida dominante apropiadamente definida
en el mismo espacio). Mientras que el primer momento es una función en el espacio
E, la dimensión del espacio esta fija, la recursividad del filtro PHD aún envuelve el
uso de integrales múltiples que no tiene una expresión en forma cerrada en general.
Así pues, el filtro de densidad de hipótesis de probabilidad (PHD Filter), es un
método de actualización de una medida, dado un conjunto aleatorio de observaciones
que puede ser interpretada como la aproximación de primer momento de la ecuación
usual de filtrado Bayesiano. Dentro de este contexto, la cantidad de interés es la
medida de un punto de proceso. Aunque pueda ser descrita por una medida, no es una
medida de probabilidad en general, y es necesario mantener una estimación de la masa
total y la distribución de esa masa. A continuación se dará una explicación:

Antes de resumir la formación matemática del filtro de PHD, debe explicarse


brevemente qué significa el primer momento de un conjunto finito aleatorio, o de un
vector, que es simplemente la esperanza (valor esperado) de ese vector aleatorio, bajo
una medida de probabilidad factible. La densidad de la medida de intensidad respecto
a una medida factiblemente dominante , cuando existe es también llamada , y se
le puede llamar función de intensidad. En la literatura de seguimiento, puede
llamársele la densidad de hipótesis de probabilidad PHD. Que es el primer momento
de un conjunto aleatorio finito y para una región cualquiera, a partir de ella se puede
obtener información acerca del número de elementos esperados en esa región. En el
contexto de filtrado multi objeto, la recursividad del PHD descrita a continuación,
propaga la densidad de la medida de intensidad.

k ( A) : E N Ek ( A) y1 ,..., yk , k 0
(3.98)

La cual es claramente una representación útil en el filtrado multi objeto y en otras


aplicaciones, y proporciona descripciones simultaneas de el numero y la ubicación de
los elementos de Ek dentro del espacio. A continuación se describirá la recursividad
del filtro PHD en términos de los paso de predicción y de actualización, como una
recursividad de filtrado optima.
96

ˆ k (dx) k k 1 dx k 1 Kk dx k dx
( x)
(dx) ˆk dx vk ( x)
ky
ˆ k (dx)
k k
y Yk kk ( y ) ˆk ( ky )
(3.99)

El operador de predicción k es descrito en términos de un kernel K k , y una medida


aditiva k . El Kernel de predicción describe la dinámica de los elementos existentes y
puede descomponerse como:

Kk x, dy ek ( x) f k x, dy bk x, dy
(3.100)

Donde ek ( x) es la probabilidad de un elemento x en el tiempo k-1 de sobrevivir en el


tiempo k, f k x, dy es un kernel markoviano que describe las dinámicas de
supervivencia de los elementos y bk x, dy es un kernel de semillas que describe la
probabilidad de un elemento en x en el tiempo k-1, acercándose a un elemento en la
vecindad dy en el tiempo k.

El operador de actualización k en la ecuación 3.99, es un operador no lineal, que se


parece a una combinación lineal de operadores del tipo Boltzman Gibbs 11 con
diferentes potenciales asociados. Sin embargo, algunas diferencias sutiles pueden
llegar a tener relevancia. El término Yk se refiere al conjunto de observaciones en el
tiempo k, ky ( x ) es la función de probabilidad asociada con una observación en el
tiempo k, y kk ( y ) es la intensidad de la medida falsa del proceso en y. Finalmente,
vk ( x) es la probabilidad de falla para observar un elemento en x en el instante de
tiempo k. Una implementación del filtro de tipo PHD se propuso en (Vo et al., 2005).
En el trabajo de (Johansen et al., 2005) se hace un análisis de convergencia de la
implementación secuencial de Monte Carlo del filtro PHD que se propuso en (Vo et
al., 2005) contribuyendo a extender los resultados existentes a este sistema que tiene
un número de dificultades agregadas, particularmente que la masa total del filtro es
una cantidad variante con el tiempo y la recursividad no es estándar.

3.4.13 Filtro de partículas marginal

En el año de 2005, Klaas y sus coautores, generaron una propuesta que mejora el
trabajo realizado por Pitt y Shepard (Pitt y Shepard, 1997), en ese trabajo, ellos
presentaron un algoritmo secuencial de Monte Carlo llamado, el Filtro de Partículas

11
Uno de los cuales describe la ecuación de actualizacion del filtrado bayesiano.
97

Marginal, el cual opera directamente sobre la distribución marginal, de modo que se


evita realizar el paso de muestreo de importancia en un espacio de dimensión
creciente.

Usando esta idea, llegaron a una versión mejorada del filtro de partículas auxiliar,
mencionado como Filtro de Partículas Marginal; mostraron resultados teóricos y
empíricos con lo cual demostraron la reducción en la varianza sobre el filtro de
partículas convencional, y presentaron técnicas para reducir el costo del filtro de
partículas marginal con N partículas del orden O(N2) al orden O(N logN).

Como fue mencionado anteriormente, el muestreo de importancia secuencial estima


p(x1:k/y1:k) haciendo una estimación de p(x1:k-1/y1:k-1) y aumentándola con una nueva
muestra de xk en el tiempo k. Cada partícula en el tiempo t se lleva sobre un espacio de
probabilidad conjunto p(x1:k/y1:k), muestreado secuencialmente, lo que puede ser
pensado como una trayectoria a través de el espacio de estado en el tiempo 1 . . . k. En
cada instante de muestreo, la dimensión de las trayectorias muestreadas incrementa
con la dimensión del espacio de estado en el tiempo k, lo que hace que rápidamente se
obtenga un espacio de grandes dimensiones. La naturaleza secuencial del algoritmo
hace que la varianza sea grande, destacando que más trayectorias posean una
probabilidad pequeña que se vaya desvaneciendo. Este problema es conocido como la
degeneración de los pesos, mencionado anteriormente en la tesis, y usualmente
proporciona mayor importancia a los pesos cuya varianza tienda a incrementar sin
ningún tipo de acotamiento.

Una estrategia empleada es usar el paso de re muestreo después de la actualización de


los pesos de las partículas para multiplicar las partículas (trayectorias) con pesos
grandes y eliminar las partículas con pesos despreciables (algoritmo SIR). El filtro de
partículas Marginal usa un poco mas que la aproximación citada al comienzo; en este
caso, se hace filtrado de partículas directamente sobre la distribución marginal
p(xk|y1:k) en vez de hacerla sobre el espacio conjunto.

La densidad predictiva se obtiene por marginalización de la forma:

p xk / y1:k 1 p xk / x1:k 1 p xk 1 / y1:k 1 dxk 1


(3.101)

Y de aqui, la actualización de filtrado se convierte en

p xk / y1:k p yk / xk p xk / y1:k 1
(3.102)
p xk / y1:k p yk / xk p xk / x1:k 1 p xk 1 / y1:k 1 dxk 1
(3.103)
98

El algoritmo que propone (Klaas et al., 2005) puede ser resumido en el siguiente
código:

Filtro de Particulas Marginal


for i 1,..., Np
Muestrear a partir de la distribucion propuesta
usando muestreo estratificado
N
xk( i ) wk( j )1q xk yk , xk( j )1
j 1

end
for i 1,..., Np
Evaluar los pesos de importancia
N
p yk xk( i ) wk( j )1 p xk( i ) x1:( kj ) 1
(i) j 1
w k N
wk( j )1q xk yk , xk( j )1
j 1

end
Normalizar los pesos de importancia
wk( i )
wk( i )
wk( i )
j

Como se mencionó anteriormente, el filtro de partículas auxiliar fue diseñado para


mejorar el desempeño de los métodos de Monte Carlo secuenciales en modelos con
probabilidades con picos (lo que es otra fuente de varianza de los pesos de
importancia). El algoritmo que el filtro de partículas marginal (Marginal particle
filter, MPF) propone, es una combinación de esta aproximación con la mencionada
como filtro de partículas marginal. Cuando una probabilidad es estrecha, es
conveniente elegir una distribución propuesta que muestrea las partículas que
deberían estar en las regiones de alta probabilidad del modelo de observación. El
ASIR trabaja re ponderando las partículas en el tiempo k-1 para hacerles el boosting en
estas regiones. Ahora bien, el interés se centra en muestrear a partir de la siguiente
distribución objetivo:

Np
pˆ xk / y1:k p yk / xk wk( j )1 p xk / xk( j )1 (3.104)
j 1
Np
pˆ xk / y1:k wk( j )1 p yk / xk( j )1 p xk / xk( j )1 , yk (3.105)
j 1
99

Para llegar a la aproximación del filtro marginal, debemos retomar, del filtro de
partículas auxiliar donde se usa la siguiente distribución conjunta

pˆ m, xk / y1:k wk( m1) p yk / xk( m1) p xk / xk( m1) , yk


(3.106)

Donde m es la variable auxiliar, mencionada anteriormente, y es un índice dentro de la


distribución mixta. Entonces,

pˆ m, xk / y1:k wk( m1) p yk / xk( m1) (3.107)


pˆ m, xk / y1:k w (m)
k 1 p yk / xk p xk / x (m)
k 1 dxk (3.108)

La evaluación exacta de la expresión anterior es usualmente imposible, de modo que


esta expresión debe aproximarse por medio de los pasos de simulación: Para cada
indice m en el tiempo k-1, k( m ) se elige asociado con la distribución p xk / xk( m1) en
alguna característica determinística ( k( m ) puede ser el valor esperado). Se definen pues
los pesos de simulación para el índice m como:

(m)
wk( m1) p yk / (m)
k
k 1 Np
(3.109)
wk( j )1 p yk / ( j)
k
j 1

Usando estos pesos, el filtro de partículas auxiliar define la siguiente distribución


conjunta propuesta:

q m, xk / y1:k q m / y1:k q xk / y1:k , m (3.110)

Donde

(m)
q m / y1:k k 1 , y, q xk / y1:k , m q xk / xk( m1) , yk
(3.111)

Los pesos de importancia se obtienen de la siguiente manera

pˆ xk / y1:k , m
w m, xk (3.112)
q xk / y1:k , m
wk( m1) p yk / xk( m1) p xk / xk( m1) , yk
w m, xk (m)
(3.113)
k 1 q xk / xk( m1) , yk
100

En el filtro de partículas marginal, se usa la misma distribución de importancia pero en


vez de hacer el muestreo de importancia entre p(m,xk|y1:k) y q(m,xk|y1:k), directamente
se realiza el muestreo de importancia entre p(xk|y1:k) y q(xk| y1:k) para calcular los
pesos de la siguiente manera:

N
wk( j )1 p yk / xk( j )1 p xk / xk( j )1 , yk
pˆ xk / y1:k j 1
w xk , w m, xk N
(3.114)
q xk / y1:k ( j)
k 1 q xk / xk( j )1 , yk
j 1

Un pseudo código para la programación de filtro de partículas marginal con variable


auxiliar (Auxiliary Marginal Particle Filter AMPF) es el siguiente:
101

Filtro de Particulas Marginal con variable Auxiliar


for i 1,..., Np
(i)
Hacer la simulación de t y calcular los pesos mixtos
(i) (i )
k p xk x k 1

(i )
(i )
k 1 wk( i )1 p yk (i )
k , (i )
k 1 Np
k 1

( j)
k 1
j

end
for i 1,..., Np
Muestrear de la distribución propuesta
Np
xk( i ) ( j)
k 1 q xk yk , xk( j )1
j 1

end
for i 1,..., Np
Evaluar los pesos de importancia
Np
p yk xk( i ) wk( j )1 p xk( i ) xk( i )1
j 1
wk( i ) Np
( j)
k 1 q xk( i ) yk , xk( i )1
j 1

end
Normalizar los pesos de importancia
wk( i )
wk( i ) Np
wk( j )
j 1

De este modo, se espera que haciendo el muestreo de importancia directamente entre


las distribuciones de interés, se llegue a una reducción de la varianza. Ahora bien,
puede afirmarse que la varianza de los pesos del filtro de partículas marginal con
variable auxiliar es menor o igual que la de los pesos del filtro de partículas auxiliar.
De (Klaas et al., 2005), puede extraerse la siguiente proposición:

Proposición 1. La varianza de los pesos de muestreo de importancia en el AMPF


w(xk) es menor o igual a la de los pesos de importancia del filtro ASIR w(k, xk).

Prueba. Por el lema de la descomposición de la varianza se tiene que:

var w m, xk var E w m, xk xk E var w m, xk xk (3.115)


102

var w m, xk var w m, xk E var w m, xk xk (3.116)

Debido que

E var w m, xk xk 0
(3.117)

Puede continuarse con la siguiente desigualdad

var w m, xk var w m, xk xk
(3.118)

El filtro de partículas marginal mejora los filtros SIR y ASIR, siempre y cuando una
partícula tenga una probabilidad marginal mayor, pero con poca probabilidad conjunta
a través de la trayectoria. Esto puede ocurrir debido a las distribuciones de
importancia con colas largas o modelos con previos de transición angostos o sin
especificaciones. Desde otro punto de vista, las mejoras del MPF sobre el SIR no
serán muy pronunciadas si el modelo de observación tiene comportamiento de pico en
ciertas regiones (por ejemplo, si la probabilidad esta bastante concentrada en algún
punto), como esto puede influenciar los pesos de importancia mucho mas que el efecto
de muestrear en el espacio conjunto. En esos casos, debería usarse el AMPF.
Finalmente, debe notarse que los métodos secuenciales de Monte Carlo aplican a
dominios fuera del filtrado Bayesiano, y, puede derivarse como consecuencia de ello,
en un algoritmo marginal de Monte Carlo secuencial análogo dentro del contexto de
los sequential monte carlo methods (SMC).

Una anotación importante es la de citar el caso en el cual los filtros SIR y MPF son
equivalentes y este es cuando el previo de la transición se usa como distribución
propuesta, entonces la ecuación de actualización de los pesos en el filtro marginal se
convierte en la siguiente:

Np
p yk xk(i ) wk( j )1 p xk( i ) xk( j )1
j 1
wk(i ) Np
(3.119)
( j)
wk 1 p xk(i ) xk( j )1
j 1
(i )
w k p yk xk( i ) (3.120)

Respecto a el costo computacional del algoritmo, fue mostrado por Klaas que puede
ser reducido de O Np 2 a ordenes de O Np log Np y en algunos casos del orden de
103

O Np . A continuación se mencionan dos de los métodos usados para reducir la


varianza del algoritmo.

Métodos de arboles duales (Dual-tree methods): la formula recursiva de árboles duales


requiere de un kernel parametrizado con una función de distancia K(x, y) _ K(ä(x, y)),
lo cual abarca las densidades mas continuas y algunas distribuciones discretas (en le
ultimo caso, depende usualmente de los parámetros de la distribución). Este método
primero construye un árbol espacial en los puntos fuente y objetivo. Puede acotarse la
respuesta del Kernel de un nodo de puntos en la fuente, a un nodo de puntos en el
objetivo, basándose en las distancias nodo a nodo. Las cotas pueden estar ajustadas
por ambos árboles recursivos. (Gray y Moore, 2003) dan una explicación mas
profunda.

Métodos de kernel gaussiano: si el kernel es gaussiano, entonces puede usarse tanto la


Transformada Rápida de Gauss (Fast Gauss Transform, FGT) como la Transformada
Rápida de Gauss Mejorada (Improved fast Gauss Transform, IFGT) para hacer una
ponderación del tipo de estimación de densidad de kernel (kernel density estimation,
KDE) sobre O Np (Gray y Moore, 2003). Estos métodos trabajan mediante la
partición de el espacio en el cual los datos se radican dentro de grupos de datos
clusters, y aproximando la suma Gaussiana desde un cluster a otro con el polinomio
de Hermite (FGT) o la expansión en series de Taylor (IFGT). Mientras que la IFGT es
generalmente más rápida, no se conoce como sintonizar los parámetros para garantizar
la cota del error mientras que se mantiene un desempeño aceptable.

3.5 Teoría de Markov, Monte Carlo - Cadenas de Markov y aplicaciones

Nx
Para las siguientes definiciones debe considerarse un vector de estados x en un
espacio de probabilidad , F , P , y el kernel de transición en ese espacio, K(-,-) , el
cual representa la probabilidad que los estados se muevan de un punto x a un punto en
el conjunto S B (siendo B el álgebra de sigma álgebra de Borel de RNx). Una cadena
de Markov es una secuencia de variables aleatorias xk k 0 de modo que se
cumpla:

Pr xk B x0 ,..., xk 1 Pr xk B xk 1 (3.121)
K xk 1 , xk p xk xk 1 (3.122)

Una cadena de Markov se caracteriza por la propiedad de sus estados, como su


periodicidad, transitividad, irreductibilidad y ergodicidad. La base de las cadenas de
104

Markov es el teorema de ergodicidad, que establece bajo que condiciones, una cadena
de Markov puede ser analizada para determinar su comportamiento en estado estable.

TEOREMA DE ERGODICIDAD: Si una cadena de Markov es ergódica, existe una


distribución única en estado estable independiente del estado inicial.

La teoría de las cadenas de Markov está orientada principalmente a encontrar las


condiciones bajo las cuales existe una distribución invariante Q y las condiciones bajo
las cuales las iteraciones del kernel de transición convergen a dicha distribución
invariante. Esta distribución invariante satisface las siguientes condiciones:

Q (dx ' ) K x, dx ' ( x)dx K xk 1 , xk p xk xk 1 (3.123)


x

( x' ) K x, x ' ( x)dx K xk 1 , xk p xk xk 1 (3.124)


x

Donde x' S Nx
y es la densidad que determina que la medida de Lebesgue de
Q sea tal que Q(dx’) = (x’)dx’. La n-ésima iteración está dada por

Kn 1
x, dx ' K ( x ' , S )
x (3.125)

Cuando n tienda a infinito, el estado converge a la distribución invariante Q.

Los algoritmos de Monte-Carlo y Cadenas de Markov giran en torno a la teoría de


cadenas de Markov. Se asume que la distribución invariante Q es conocida, y que
corresponde a la densidad objetivo (x), pero el Kernel de transición es desconocido.
Si el problema es generar muestras de , los métodos de Monte-Carlo y Cadenas de
Markov lo que hacen es encontrar un kernel K, tal que para la n-ésima iteración, la
distribución converja a aunque se parta de un punto arbitrario.

Una de las propiedades de Markov es la reversibilidad que dice que la probabilidad no


condicional de moverse de x a x’ es la misma de moverse de x’ a x, ambas generadas
por el kernel K, en otras palabras:

( x) K x, x ' ( x' ) K ( x' , x)


(3.126)

Y la distribución Q es la distribución invariante para K. Con π una densidad no


normalizada. Desde este punto de vista, cuales fueren los métodos usados para la toma
de las muestras (sean muestreo por importancia o por rechazo), las muestras se
generan con una cadena de Markov homogénea, ergódica y reversible con una
105

distribución invariante Q. Lo que no se puede asegurar es que tan rápido va a


converger la cadena de Markov al punto de equilibrio, tampoco la velocidad de
convergencia ni las cotas del error. Aplicándolo al muestreo por importancia puede
considerarse lo siguiente: Sea K(x,x’) un kernel de transición para una cadena de
Markov en RNx con una densidad p(x) de su distribución invariante, y sea q(x) la
distribución propuesta con los pesos de importancia W(x), entonces

W ( x)q ( x) K x, x ' dx p ( x ' ), x ' Nx

(3.127)

Sin pérdida de generalidad se supone que ( x)q x, x ' ( x ')q x ', x , (donde la
función π indica una función de distribución no normalizada) lo que significa que la
probabilidad de moverse de x a x ' es mayor (es decir, es mas frecuente este
movimiento) que la probabilidad de moverse de x ' a x . Lo que se desea es cambiar
esta situación, para reducir el numero de movimientos de x a x ' . Haciéndolo, se
considera la probabilidad de movimiento 0 x, x ' 1 . Si este movimiento no se
realiza, el proceso entrega el valor de x proporcionado por la distribución objetivo.
Luego, la transición de x a x ' se convierte en:

pMH x, x ' q x, x ' x, x '


(3.128)

Donde x x ' . Y para que la ecuación anterior satisfaga la condición de


reversibilidad de las cadenas de Markov, se condiciona a la función

( x ')q x, x '
min ,1
x, x ' ( x ) q x, x ' , si ( x ')q x, x ' 0 (3.129)
1, de otro modo

Y la probabilidad que el proceso de Markov llegue al estado x se puede escribir como:

1 q x, x ' x, x ' dx '


x (3.130)

K MH x, dx ' q x, x ' x, x ' dx ' 1 q x, x ' x, x ' dx ' x (dx ')


x
(3.131)

Resumiendo el algoritmo:
106

Paso 1: Para i=1,…,Np, en la iteración n=0, tomar un punto x0, a partir de la


densidad a priori.
Paso 2: Generar una variable uniforme u U 0,1 y x ' q xn ,
Paso 3: Si u xn , x0 , haga xn x0 , si no xn 1 xn
Paso 4: En el tiempo n = n + 1, debe repetirse los pasos 2 y 3, hasta cierto
numero de iteraciones (por ejemplo k iteraciones), hacer x ( i ) xk .
Paso 5: Hacer i=i+1 y repetir el procedimiento hasta cubrir las Np muestras,
luego deben entregarse las muestras x (1) ,..., x ( Np ) .

Si la densidad candidata-generadora es simétrica, como la caminata aleatoria,


donde q x, x ' q x ', x , la probabilidad de movimiento se reduce a ( x ') / ( x) de
este modo si ( x ') ( x) la cadena se mueve a x’, y se cumple en el mismo sentido.
La probabilidad de movimiento no necesita el conocimiento de la constante de
normalización de (-). Por otro lado, las partículas muestreadas son recordadas como
las muestras tomadas a partir de la densidad objetivo. Solo después de que la cadena
ha pasado la fase transitoria, la convergencia de la distribución invariante ocurre bajo
malas condiciones de regularidad como la irreductibilidad y la no-periodicidad.

Una de las características de este algoritmo es que su eficiencia está determinada por
la tasa de muestras aceptadas respecto al número total de muestras. Una varianza muy
grande o muy pequeña, puede generar un muestreo ineficiente.

3.5.1 Monte Carlo y Cadenas de Markov (MCMC)

Es una herramienta poderosa para generar muestras aleatorias que pueden ser usadas
para calcular estimaciones estadísticas y probabilidades marginales y condicionales.
Los métodos de Monte Carlo y Cadenas de Markov (MCMC) se basan en secuencias
de Markov dependientes, que poseen una distribución limitada correspondiente a la
distribución de interés. El término “Cadena de Markov” en las técnicas de MCMC no
es completamente consistente con su uso estándar en los procesos estocásticos. Este
término se reserva generalmente para su uso con procesos que tienen salidas discretas.

Los términos densidad y distribución se usan bastante en la literatura de estimación


estadística y bayesiana, en algunos trabajos, se usan dichos términos de forma
intercambiable, para referirse al mecanismo para generar un proceso aleatorio; lo que
no implica, por supuesto que una función de densidad es lo mismo que una función de
distribución. El problema que se usa como prototipo es el siguiente: suponga que
existe un proceso, generando un vector aleatorio x, y se desea calcular el valor
esperado de una función f aplicada a dicho vector:
107

E f x f x p x dx
(3.132)

La idea es proponer una serie de esquemas que eliminen la necesidad de realizar el


muestreo directamente de la función p. En particular, se usan los métodos de Monte
Carlo, basados en Cadenas de Markov, para producir eficientemente secuencias
dependientes; usando a la función p como distribución limitante sin la dificultad o el
propósito imposible de muestrear directamente de ella.

El teorema de ergodicidad garantiza que la suma normalizada dada por la ecuación


3.133, aproximará a el valor medio de la función f(x) (usualmente en sentido de media
cuadrática o de casi seguridad) a medida que n para todo M fijo; donde la media
se calcula respecto a la aproximación de p, p*(x).

n
1
f xk
n M k M 1 (3.133)

Las condiciones necesarias y suficientes que deben cumplirse, para la convergencia en


media cuadrática del teorema de ergodicidad son las siguientes:

i) La cov(f(j),f(k )) esta acotada uniformemente en magnitud para todo j, k


ii) La correlación entre fn(x) y la media de las muestras en 3.133 tiende a
cero a medida que n

El proceso es ergódico en media cuadrática si hay menor correlación entre la


observación terminal fn(x) y la media de la muestra dada en 3.133 a medida que n
incrementa. La idea clave en el MCMC es diseñar cadenas de Markov que sean
ergódicas y tengan una función p*(x) que trate de igualarse a la densidad objetivo p(x),
tal y como se desea.

3.5.2 Modelos de Markov ocultos

Considere el siguiente modelo:

dx dy
xk 1 f xk , Ak 1 ,Wk , yk g xk , Ak ,Vk
(3.134)

Donde xk es el estado del sistema escondido, yk es la observación del estado y


Wn y Vn son términos de ruido independientes e idénticamente distribuidos. Diferente
al modelo clásico de Modelos de Markov, la evolución del estado y del proceso de
da
observación dependen de un parámetro de entrada An el cual es la acción de
108

control. En los modelos tipo Modelos de Markov Ocultos (Hidden Markov Models) es
primordial resolver el problema de estimar los estados ocultos, lo cual se hace
propagando la distribución posterior (o densidad de filtrado). Con una elección
correcta de la secuencia de control, la evolución del estado y de la observación del
proceso puede ser orientada con el fin de obtener densidades de filtrado que den
estimaciones mas certeras de los estados de proceso. Este problema se conoce como
planificación de sensores.

La planificación de sensores ha sido un tópico de interés dentro de la comunidad de


investigadores en el area de seguimiento de trayectorias, la investigación en este
campo, ha hecho que se le de importancia actual en las investigaciones acerca de redes
de sensores y robótica. Para resumir, el problema de planificación o de programación
de sensores, puede ser planteado como un modelo de Markov oculto HMM controlado
y en algunos casos, se considera que los espacios de estado, observación y acción son
continuos notando así que uno de los objetivos es encontrar las acciones correctas para
controlar el sistema en cuestión. Este caso, es importante en muchas aplicaciones, pero
en planificación de sensores, se plantea como objetivo principal, minimizar la varianza
de el error de estimación en el estado oculto respecto a la secuencia de acciones de
control. (Singh et al., 2005) presentaron un método nuevo basado en simulación que
usa el gradiente estocástico para encontrar estas acciones optimas de control, en
contraste con otros trabajos en la literatura que solo resuelven aproximaciones al
problema original.

Formulación del problema de planificación de sensores: En el tiempo k, los vectores


aleatorios xk y yk modelan los estados de dimensión dx y sus observaciones de
dimensión dy, respectivamente. Se supone que una acción Ak R da se aplica en el
tiempo k. El estado xk k 0 es un proceso de Markov no observado con distribución
inicial y ley de transición dada por

x0 p0 , xk 1 p . xk , Ak 1
(3.135)

El proceso de observación yk k 1 se genera de acuerdo al estado y a la acción


dependiente de la densidad de probabilidad

yk q . xk , Ak
(3.136)

Dada la secuencia de acciones, a1:k : a1 ,..., ak y las mediciones y1:k : y1 ,..., yk ,


y1:k , a1:k
la densidad de filtrado en el tiempo k se escribirá como: k ( k para enfatizar la
dependencia de las acciones y de las mediciones), y satisface la regla de Bayes. Para
109

poder plantear bien el problema de planificación óptima de sensores, es necesario


considerar una función de prueba adecuada : dx , donde por ejemplo, la
función puede resaltar una componente de interés del vector de estados, que se
desea estimar. Ahora bien, el problema de planificación óptima de sensores es resolver
el siguiente funcional de costo, minimizándolo respecto a las acciones de control:

N
N n 2
min J A1:N E 0 , A1:N
Xn n ,
A1:N A
n 1
(3.137)

da N
Donde A es un conjunto abierto, y para cualquier 1 n N y la función
n n dy n
dx da
integrable h : .Y 0,1 es un factor de descuento y
su inclusión favorece mejor desempeño en las tareas de seguimiento en las últimas
épocas de simulación.

Para esta función h, se puede calcular el valor esperado respecto a la distribución


inicial y la secuencia de acciones óptima:

E 0 , A1:k
h x1:k , A1:k , y1:k :
k
(3.138)
h x1:k , A1:k , Y1:k i 1
q yi xi , Ai p xi xi 1 , Ai 0 x0 dx0:n dy0:n

Singh y sus colaboradores (Singh et al, 2005) resolvieron el problema de planeamiento


de sensores con espacio de acciones continuas directamente, y no sustituyeron el
problema definiéndolo a través de la Cota Inferior de Cramer Rao a posteriori o en
ingles Posteriori Cramer Rao Lower Bound (PCRLB). En su trabajo no se asumieron
condiciones de gaussianidad por conveniencia analítica ni se hicieron discretizaciones
de los estados, las observaciones o el espacio de las acciones; y evitaron esas
condiciones de modelado tan restrictivas por medio del uso de las cadenas ocultas de
Markov de estado continuo y de recursos de métodos basados en simulaciones
computarizadas. Dado que la política de acción que se debe encontrar, será una
función de la densidad de filtrado, (Singh et al., 2005) emplearon la simulación para
aproximar la densidad a posteriori, por medio de una suma finita de distribuciones de
puntos de masa ponderadas. La principal ventaja de la simulación sobre los demás
métodos numéricos, es que es mas fácil de implementar, además se cuenta con la
propiedad de consistencia fuerte y existe bastante literatura acerca de su
implementación eficiente para la aproximación de densidades a posteriori (Doucet et
al., 2002).
110

Dado que no se hicieron discretizaciones de ningún tipo, para resolver el problema de


encontrar una secuencia de acciones de valor continuo, usaron un algoritmo de
gradiente estocástico iterativo y encontraron el gradiente del criterio de desempeño
respecto a la trayectoria de las acciones de control, demostrando como las
estimaciones de baja varianza, pueden obtenerse con técnicas de control variate
(Glynn y Szechtman, 2002). La ventaja principal del método basado en el gradiente
estocástico es que pueden obtenerse fácilmente las condiciones que generan garantías
teóricas; y bajo condiciones de regularidad adecuadas puede garantizarse la
convergencia a un optimo local del criterio de desempeño, mientras que es mas difícil
hacer este tipo de conjeturas acerca de la calidad de las soluciones que se obtiene por
otros métodos aproximados propuestos anteriormente para resolver este mismo
problema.

da N
Con el fin de minimizar el criterio antes visto, cuando A es un conjunto
abierto y continuo sin posibilidades de discretización, la técnica de la simulación con
Aproximación Estocástica es un algoritmo de gradiente descendiente que requiere
únicamente estimaciones ruidosas del gradiente de la función de costo respecto a la
secuencia de acciones:

A1:N , k 1 A1:N , k k J A1:N A1:N A1:N , k ruido , k 0


(3.139)

El tamaño de paso denominado como k es una secuencia no creciente (descendiente)


positiva que tiende a cero. Nótese que no se tiene una expresión cerrada para el
gradiente de J, por las mismas razones que no se tiene una expresión en forma cerrada
de J: la densidad de filtrado denominada anteriormente como n y la integración
respecto a ella no se pueden evaluar en forma cerrada. Por lo tanto es conveniente
conseguir una expresión aproximada del gradiente de J en cuestión.

La técnica de la Variable de Control o Control Variates es usada ampliamente para


reducir la varianza de las aproximaciones basadas en simulación. El método incluye
recolectar estadísticas adicionales a partir de las muestras y es muy simple de
implementar; se ha mostrado recientemente que otras técnicas de reducción de la
varianza populares en la literatura de SMC, como el Monte Carlo condicional,
variables antithetic, muestreo rotacional y estratificación pueden ser vistas como
implementaciones varias del mismo método (Glynn and Szechtman, 2002). Para mas
detalles acerca del método remitirse a (Singh et al., 2005).
111

3.6 Muestreo de Independencia de Metropolis – Hastings

El algoritmo de Metropolis – Hastings algoritmo es un algoritmo general para hacer


estimaciones através del método de Monte Carlo y Cadenas de Markov. Fue
introducido por Hastings en (1970), como una generalización del algoritmo propuesto
por (Metropolis et al., 1953). Una buena introducción al algoritmo, esta presente en el
trabajo de (Chib y Greenberg, 1995). La idea del algoritmo, es similar a la del
muestreo de aceptación y rechazo estudiado anteriormente, en el cual las muestras
generadas son aceptadas o rechazadas. Sin embargo, cuando una muestra se rechaza,
el valor actual se usa como una muestra tomada de la densidad objetivo. A
continuación se presenta el algoritmo de Metropolis Hastings de muestreo de
independencia, es un caso especial del algoritmo tradicional de Metropolis Hastings.
Para ampliación de detalles de la teoría de los métodos de MCMC en relación a los
métodos secuenciales de Monte Carlo ver, (Andrieu et al., 2001), (Bergman, 1999).

L
a. Inicialice con x x,i L 1

b. Genere x s( z ) , y calcule la probabilidad de aceptación

i 1
t x s x
q min i 1
,1
t x s x

c. Donde t es la probabilidad de la variable x , asignar x(i ) x con


(i ) ( i 1)
probabilidad q, de otro modo asignar a x x .

d. Repita los pasos b y c para i= -L+2,…,M

Las L muestras iniciales pertenecen a la fase de “burn-in” del algoritmo y son


rechazadas automáticamente. Esto, debido a que la simulación ya ha alcanzado su fase
estacionaria, antes de que las muestras sean consideradas para originar la distribución
objetivo estacionaria. Un análisis detallado de este algoritmo se hace en (Liu, 1996).
El punto candidato W es aceptado con probabilidad p(x ,w), donde:

p w q xw
p x, w min ,1
p x q wx
(3.140)

En aplicaciones bayesianas, la densidad objetivo representa una densidad posterior


que esta condicionada en algún sentido al conjunto de datos (el condicionamiento a los
112

datos no afecta la mecánica del algoritmo de M-H). El algoritmo puede ser


implementado de muchas formas, la variación mas obvia es la elección de la
distribución propuesta q(x/w). Otra variación puede ser, correr varias cadenas
independientes, cada cadena terminando en M-1. De esta forma, el valor esperado
E(f(x)) se estima mediante la formación de una media de las muestras de valores
independientes.

3.7 Muestreo tipo Gibbs

Una limitación grande, a través de la implementación común de las aproximaciones


bayesianas es que, obtener la distribución posterior requiere a menudo, la integración
de funciones de grandes dimensiones. Este caso, puede representar un esfuerzo
computacional muy alto, pero han sido propuestas muchas aproximaciones que
acortan el camino de la integración directa (revisiones de (Smith, 1991), (Evans and
Swartz, 1995), (Tanner, 1996)). Focalizando en los métodos de Monte Carlo Basados
en Cadenas de Markov (MCMC), los cuales, apuntan a la simulación de muestras
directas a partir de alguna distribución de interés compleja; es útil afirmar que MCMC
usa los valores previos de la muestras, para generar aleatoriamente el nuevo valor de
la muestra, y de esta forma, genera una Cadena de Markov (debido a que las
probabilidades de transición entre las muestras son solo función de el valor mas
reciente). A comienzos de los 90, realizaron un método de MCMC muy particular.
Este es el llamado Muestreador de Gibbs (Gelfand y Smith, 1990), que ha sido
ampliamente aplicado a problemas bayesianos, ha alcanzado su mayor aplicación en el
área de analisis bayesiano, y al parecer, el interés sobre él continúa expandiéndose
para su aplicación en diferentes áreas.

El muestreo tipo Gibbs representa una implementación del algoritmo de Metropolis,


anteriormente presentado, pero en una base elemento-por-elemento para las
componentes en x. El nombre Gibbs fue introducido por German, en una
implementación específica de la distribución de Gibbs para muestreo en grillas (su
nombre obedece al físico Josiah W. Gibbs, 1839-1903, basado en las conexiones a los
campos de Gibbs aleatorios identificados en su trabajo). Este nombre se usa mas
generalmente (y casualmente) para referirse al caso especial cuando la distribución
propuesta se construye directamente de la densidad de interés p.

El método es mas restrictivo que el de Metropolis, debido a conexión cercana; sin


embargo, en algunas ocasiones, estas restricciones conllevan a ventajas en la
eficiencia y en la implementación vía eliminación de parámetros de sintonización
(tunning) necesarios en el algoritmo de M-H. El muestreo tipo Gibbs es especialmente
importante en implementaciones bayesianas, y esta diseñado únicamente para
problemas multivariable. De hecho, como fue citado por (Spall, 2003) “el problema
fundamental de reemplazo del muestreo de un vector de altas dimensiones, por el
113

muestreo de bloques componentes de bajas dimensiones, rompe el curso de la


dimensionalidad”.

El muestreo de Gibbs requiere un punto inicial de los parámetros. Luego, uno al


tiempo, se muestrea un valor por cada parámetro de interés, dados los valores de los
otros parámetros y los datos. Una vez que todos los parámetros de interés se han
muestreado, los parámetros que sobran o no sirven (estorban o fastidian), se muestrean
dados los parámetros de interés y los datos observados. En este punto, el proceso ha
terminado. La potencialidad del muestreo de Gibbs es que la distribución conjunta de
los parámetros converge a la probabilidad conjunta de los parámetros dados los datos
observados.

El método está basado en una concatenación de m algoritmos de M-H, uno para cada
variable en el vector de interés, de la siguiente forma:

px / y , z w y, z q x y , z
p x, w min ,1 min 1,1 1
px / y , z x y, z q w y , z
(3.141)

La relación implica que, en contraste con el algoritmo general de M-H, el nuevo


punto W siempre se acepta como una representación de x.

Como consecuencia de la teoría de los procesos de Markov, los valores X, Y, o Z


generados vía muestreo de Gibbs serán como limite, una representación de las
observaciones a partir de la densidad conjunta px, y, z X , Y , Z . Asimismo, X, Y, y Z
tienen distribuciones individuales que aproximan sus marginales respectivas
px X , py Y y pz Z . La condicional completa es una densidad de muestreo
univariada en el caso mas común en el cual cada variable aleatoria X es univariada.
Entonces, aunque el vector X sea de grandes dimensiones, el muestreo es univariado.
114

Capítulo 4
APROXIMACIÓN AL PROBLEMA DE
DISCRETIZACIÓN DE MODELOS NO
LINEALES Y MODELADO DE
INCERTIDUMBRES PARA FILTRADO NO
LINEAL
“Most control designs are based on the use of a design model. The relationship
between models and the reality they represent is subtle and complex. A
mathematical model provides a map from inputs to responses. The quality of a
model depends on how closely its responses match those of the true plant. Since no
single fixed model can respond exactly like the true plant, we need, at the very least,
a set of maps. However, the modeling problems is much deeper - the universe of
mathematical models from which a model set is chosen is distinct from the universe
of physical systems. Therefore, a model which includes the true physical plan can
never be constructed. It is necessary for the engineer to take a leap of faith
regarding the applicability of a particular design based on a mathematical model.
To be practical, a design technique must help make this lead small by accounting
for the inevitable inadecuacy of models. A good model should be simple enough to
facilitate design, yet complex enough to gives the engineer confidence that designs
based on the model will work on the true plant” Kemin Zhou with John C. Doyle and
Keith Glover. Robust and optimal control, Prentice Hall, NJ

Motivación:

En los capítulos anteriores se ha hecho una revisión de las técnicas de filtrado usadas
en estimación de estados e identificación de sistemas. Asimismo se ha proporcionado
una descripción detallada de las técnicas de filtrado no lineal y filtrado de partículas
como aplicación de los métodos secuenciales de Monte Carlo en una aproximación a
las posibles soluciones al problema de filtrado óptimo. No debe olvidarse que todas
estas técnicas que han sido aplicadas desde hace décadas y que serán utilizadas en esta
tesis para la obtención de información de sistemas dinámicos con características no
lineales no Gaussianas, tiene como objetivo la reconstrucción de la información
faltante en un sistema.
115

A pesar que las técnicas bayesianas representan una poderosa herramienta de


estimación, es necesario que el modelo en el cual basen sus observaciones y alrededor
del cual gire el algoritmo de estimación, sea lo más cercano posible a las dinámicas
reales. Sin ello, ni el más poderoso de los algoritmos, podrá aproximarse a una
solución convincente para la información buscada.

Debe tenerse en cuenta que aquella información recolectada, puede ser usada en la
mayoría de los casos para fines de monitoreo, optimización y/o finalmente dentro de
lazos de control para múltiples aplicaciones.

Recordado este objetivo, entonces puede hacerse hincapié en que para la ingeniería de
sistemas de control, es necesario recolectar el mayor conocimiento posible del sistema
que se va a tratar y para este propósito se ha dedicado mucho esfuerzo en la
construcción de modelos y una teoría alrededor de ello.

Generalmente, los modelos para sistemas continuos en el tiempo toman la forma de


ecuaciones diferenciales no lineales. Es bien sabido que estas ecuaciones diferenciales
no reproducen precisamente el comportamiento dinámico de un problema en cuestión
y que, a pesar de su origen muchas veces fenomenológico, quedan algunos tipos de
interacciones que no están bien modeladas ni caracterizadas.

Para la correcta caracterización de estas otras dinámicas desconocidas, en este capítulo


se abordaran brevemente los temas que llevarán a construir un modelo de mayor
veracidad acerca del sistema considerado. Así pues, en primera instancia se hará una
aproximación a un desarrollo de modelos de incertidumbre de varios tipos basados en
la concepción de un término aditivo en conjunción con un término de difusión que
conlleve a la construcción de una ecuación diferencial estocástica en la cual se tratará
de contemplar dichas dinámicas. Se van a presentar algunas opciones que pueden
servir para complementar el término aditivo de la incertidumbre.

Como alternativa, se va a tomar en cuenta una nueva perspectiva en la cual se


construyen modelos alternativos que describan las relaciones entre las acciones
tomadas sobre el sistema (de manera discreta) y las muestras tomadas de las señales
de salida. En esta parte de la tesis, se va a dedicar parte de la atención a los modelos
de datos muestreados para los sistemas no lineales propuestos por Yuz (Yuz, 2005).

Contemplando que el desarrollo de modelos de incertidumbre no es el tema central de


esta tesis, solamente se hará una introducción al tema y se darán algunas definiciones
que servirán como previa a la comprensión del capítulo 5. En el capítulo 5 se
presentan los resultados no solo de la aplicación de diferentes técnicas de filtrado no
lineal sobre varios tipos de aplicaciones, sino también se citarán los modelos de
incertidumbre que fueron desarrollados para mejorar el nivel de confianza del modelo
dinámico del sistema utilizado.
116

4.1 Modelos de incertidumbre

Alcanzar el objetivo de controlar un sistema, requiere un buen entendimiento del


comportamiento dinámico del sistema bajo estudio. La información acerca de este
comportamiento se obtiene de tres posibles fuentes: los primeros principios, datos
empíricos entrada/salida, conocimiento empírico cualitativo y cuantitativo. La
información acerca de esas fuentes se combina, procesa y presenta en varias formas
como modelos fenomenológicos o cajas blancas, series de tiempo, modelos tipo auto
regresivos de varios tipos (por ejemplo, los modelos integrados auto regresivos de
media móvil Auto Regressive Integrated Moving Average, ARIMA), modelos basados
en lógica difusa o redes neuronales.

Los modelos existentes no explican completamente todos los mecanismos que


gobiernan esos sistemas, y como resultado sus predicciones no siempre son idénticas a
la realidad. Como consecuencia, muchos investigadores o ingenieros prácticos se
preguntan: que tan cerca (o que tan lejos) está el modelo desarrollado del
comportamiento dinámico real del sistema que se trata de representar.

Un modelo matemático no puede ser una representación exacta de un sistema real,


debido a que tanto el modelo, como el sistema pertenecen a conjuntos distintos aunque
muy cercanos el uno del otro. Lo máximo que puede lograrse es una aproximación de
manera tal que los modelos habiten en conjuntos lo suficientemente próximos
(Scaglia, 2002)

La incertidumbre representa la brecha de información que existe entre las predicciones


del modelo del sistema y su realidad. Para citar un caso particular, se asume que por
ejemplo estamos interesados en una variable del sistema, y se construye un modelo en
espacio de estados del mismo. La diferencia entre el valor medido y el valor predicho
del modelo es, evidentemente una medida de incertidumbre.

Guergachi y Patry (Guergachi y Patry, 2001) propusieron prestar una mayor atención
al modelado del sistema físico en sí mismo, y de esta forma modelar la incertidumbre
que rige su comportamiento.

El propósito de modelar la incertidumbre es responder varias preguntas como: que


hace que la incertidumbre sea grande o pequeña? Como puede controlarse y hasta que
punto puede reducirse?

Así pues, el objetivo del modelado de la incertidumbre no es precisamente eliminarla


(lo cual generalmente no es posible), es reducirla y controlarla.
117

Se presentan los diferentes modelos de incertidumbre que se analizan en esta tesis. A


partir de la ecuación diferencial estocástica general 4.1.

dxt f xt , t dt 1 xt , t dwt
(4.1)
dyt g xt , t dt 2 xt , t dvt

Donde xt son los estados y yt las salidas medibles, f , g y son funciones


vectoriales o matriciales de las dimensiones adecuadas (funciones no lineales) y los
vectores vt , wt son procesos de Wiener independientes, componentes de difusión de
la integral de Itô.

Se propone llamar modelo de incertidumbre al segundo término de las ecuaciones


tanto de los estados como de la salida, junto con las características del término de
difusión respectivo. Y mediante diferentes técnicas encontrar diversas formas que lo
caractericen y que al mismo tiempo, no incrementen sustancialmente el grado de
complejidad del modelo. Se busca cumplir con el principio de parsimonia. Esto con el
fin de hacer variaciones que permitan según el sistema dinámico en cuestión, modelar
apropiadamente las incertidumbres entre el comportamiento real y el modelo básico
determinístico.

4.1.1 Caso 1: Modelo de incertidumbre simple

Este modelo básico se describe simplemente en los casos que se tiene las funciones
1 xt , t y 2 xt , t iguales a uno, y el modelo de incertidumbre esta descrito
únicamente por las componentes dwt y dvt para los estados y las salidas,
respectivamente. Esto indicaría que se modela la diferencia entre la realidad observada
y el modelo como únicamente un proceso de Wiener caracterizados. Simulando que en
los estados no hay conocimiento preciso de la forma en la que los estados del modelo
difieren de la realidad y respecto a la salida o medidas, se considere imprecisión de
sensores o altos ruidos de señales aditivas.

4.1.2 Caso 2: Transformación lineal fraccional

El diagrama de bloques bçasico para el modelo de incertidumbre de transformación


lineal fraccional en ingles, (lineal fractional transformation LFT) se muestra en la
Figura 4.1.
118


w z

u P0 y

Figura 4.1 Modelo de incertidumbre de transformación lineal fraccional.

Este diagrama muestra un sistema desconocido con entradas observadas u y salidas y,


que se modela como una planta lineal nominal P 0, perturbada por algún sistema lineal
desconocido llamado ∆. Las señales w y z son estados internos que relacionan el
sistema desconocido con la planta. Rangan y Polla (Rangan y Polla, 1998) en su
trabajo proponen que la planta P0 esté particionada de la siguiente manera:

z w P11 P12 w
P0 (4.2)
y u P21 P22 u

Y denotando la conección de realimentación de P0 y ∆ por

1
Fu P0 , : P22 P21 I P11 P12 (4.3)
De modo que

y Fu P0 , u (4.4)

El sistema ∆ represente el modelo dinámico de la incertidumbre y que pertenece al


conjunto dado ∆. El conjunto ∆ especifica las cotas del modelo de incertidumbre. Se
considera que la validación del problema se hace para dos posibles conjuntos de
incertidumbre:

∆ = ∆LTI (linear time invariants) y ∆ = ∆LTV (linear time variants), correspondiente


a las incertidumbres lineales invariantes con el tiempo (LTI) o LTV respectivamente.

El conjunto ∆LTI se define de la forma:

diag 1 ,..., N
1
LTI i es nxn y i i (4.5)
i es LTI y causal
119

El número de bloques N, las dimensiones de los bloques n y los parámetros i 1 son


conocidos a priori.
Y ∆LTI se define de manera similar. La estructura en bloques diagonal de la
incertidumbre es estándar en los modelos de transformación lineal fraccional.

Cada bloque representa una de las componentes de la incertidumbre del sistema. El


tamaño de la incertidumbre se representa por la norma inducida i y los parámetros
1 1
i , especificando la cota de la incertidumbre: valores bajos de i representan un
sistema con mayor incertidumbre.

El modelo de transformación lineal fraccional (LFT) explicado anteriormente no


incluye términos de perturbación explícitos. Modelos determinísticos y acotados
pueden ser incorporados dentro del marco de las LFT, aumentando apropiadamente la
estructura de la incertidumbre ∆ y adicionando entradas ficticias.

Como mejora a esta aproximación de manejo de incertidumbres, debe tenerse en


cuenta que (Rangan y Polla, 1998) no trataron la validación del modelo con
perturbaciones estocásticas. Este problema es interesante y merece ser estudiado.

4.1.3 Caso 3: Modelos tipo ARIMA

Para presentar este enfoque es necesario pensar en las incertidumbres en las variables
de estado, como series de tiempo. Éstos representan cómo se diferencia el modelo del
sistema (planta real) en un tiempo determinado, del cual se disponen datos para la
construcción del modelo de incertidumbre.

El acrónimo ARIMA proviene de las palabras en inglés "Auto Regressive Integrated


Moving Average". Los modelos ARIMA son en teoría, la clase más general de
modelos de predicción de datos ordenados en series de tiempo que pueden ser
estacionalizados por transformaciones como la diferenciación. De hecho, la mejor
forma de pensar un modelo del tipo ARIMA es como una versión bien sintonizada y
fina de los modelos de caminatas aleatorias y tendencias aleatorias: la sintonía fina
consiste en agregar los retardos de las series diferenciadas y/o los retardos de los
errores de predicción a la ecuación de predicción, tanto como sea necesario para
eliminar las últimas trazas de auto correlación surgidas de los errores de predicción.
Los retardos de las series diferenciadas que aparecen en la ecuación de predicción son
llamados términos “auto regresivos”, los retardos de los errores de predicción son
llamados términos de “media móvil” y la serie de tiempo que necesita ser diferenciada
para hacer la estacionarización se dice que es una versión integrada de las series
estacionarias. Los modelos de caminatas aleatorias o de tendencias aleatorias, modelos
120

auto regresivos, y modelos de suavizado exponencial como los promedios móviles


ponderados exponencialmente, son todos casos de los modelos tipo ARIMA.

Un modelo ARIMA no estacionario puede ser clasificado de la forma ARIMA (p, d,


q) donde p es el número de términos auto regresivos, d es el número de diferencias no
estacionarias, y q es el número de errores de estimación retrasados en la ecuación de
predicción. Por ejemplo, un modelo ARIMA(1,1,1) con una constante tendrá la
siguiente forma:

Yˆ t Y t 1 Y t 1 Y t 2 e t 1 (4.6)

Donde es la entrada exógena, el vector de parámetros auto regresivos -


diferencias no estacionarias y el vector de parámetros de media móvil - número de
errores de estimación retrasados en la ecuación de predicción.

Mínimos cuadrados lineales versus no lineales: Los modelos ARIMA que incluyen
solamente términos (auto regresivos, AR) son casos especiales de modelos de
regresión lineales, ya que pueden ser aproximados usando mínimos cuadrados
ordinarios. Las predicciones (AR) son una función lineal de los coeficientes así como
una función lineal de los datos pasados.

En principio, las estimaciones de los coeficientes auto regresivos (AR) por mínimos
cuadrados pueden ser calculados exactamente a partir de correlaciones en una sola
iteración. En la práctica, se puede aproximar un modelo (AR) en el procedimiento de
regresión múltiple (solo hacer regresión del diferencial en los retardos en sí mismo).
Pero deberían tenerse resultados levemente diferentes del procedimiento ARIMA.

Los modelos ARIMA que incluyen términos de media móvil (MA) son similares a los
modelos de regresión, pero no pueden ser aproximados de ninguna manera por
mínimos cuadrados ordinarios: las predicciones son una función lineal de los datos
pasados, pero ellos son funciones no lineales de los coeficientes, por ejemplo un
modelo ARIMA sin constante es un promedio móvil exponencialmente ponderado en
el cual las predicciones son funciones no lineales de los términos de media móvil MA
llamados θ.

Otra manera de ver el problema es que no es posible aproximar los modelos MA


usando regresión múltiple ordinaria porque no hay manera de especificar los errores
como variable independiente (los errores no son conocidos hasta que el modelo está
bien aproximado). Ellos deben ser calculados secuencialmente, periodo a periodo,
dada la estimación actual de los parámetros. Los modelos MA requieren un algoritmo
de estimación no lineal, parecido al algoritmo de “resolver” en Excel. El algoritmo usa
121

un proceso de búsqueda que requiere típicamente de 5 a 10 iteraciones y puede,


ocasionalmente no converger.

Para identificar correctamente el modelo ARIMA para una serie de datos, en nuestro
caso, una componente del vector de estados, es necesario comenzar por identificar el
orden o los órdenes de diferenciación necesarios para estacionarizar las series y
remover las características de algún tipo de etapas, en conjunción con la
transformación de estabilización de la varianza como el llamado “logging” o el
“deflating”.

El primer y más importante de los pasos de construcción de un modelo tipo ARIMA


es la determinación del orden de diferenciación para estacionarizar las series.
Normalmente la cantidad correcta de diferenciación es el menor orden de
diferenciación que supone una serie de tiempo que fluctúa alrededor de un valor
medio bien definido y cuya grafica de la función de auto correlación (del inglés, auto
correlation function ACF) decae rápidamente a cero, sea desde arriba o debajo. Si el
valor de la serie continua mostrando una tendencia que obedece a un término grande
(recordar que las tendencias son manejadas por su orden también), o cualquiera de las
tendencias que lo hacen retornar a su valor medio, o en caso que sus auto
correlaciones sean positivas en un numero bastante grande de retardos (por ejemplo 10
o más); entonces es necesario que se use un orden mayor de diferenciación. Esta es la
primera regla para identificar un modelo tipo ARIMA.

4.1.4 Caso 4: Modelos muestreados de datos

Para el caso de los modelos de incertidumbre basado en datos muestreados, debe


tenerse en cuenta que éstos pueden ser de naturaleza lineal o no lineal. En esta corta
aproximación abordaremos directamente el caso no lineal con las componentes
estocásticas.

Únicamente es posible obtener modelos de datos muestreados aproximados, es decir,


modelos no exactos, tanto en el caso lineal, como en el caso no lineal. Sin embargo, sí
es posible caracterizar de manera precisa el grado de veracidad de esos modelos (Yuz,
2005). Para poder hacer una aproximación a los modelos muestreados de datos es
necesario conocer algunos pormenores del caso de modelos basados en ecuaciones
diferenciales determinísticas antes de abordar el caso estocástico, este conocimiento es
básico para quienes han tratado con solución de ecuaciones diferenciales mediante
métodos numéricos y expansiones de series de Taylor.

El uso de los modelos de datos muestreados radica en la relación que existe entre los
modelos de tiempo discreto que describen las muestras tomadas del sistema y los
modelos de tiempo continuo originales. Lo que se suele hacer es simplemente
muestrear rápidamente y después reemplazar las derivadas de los modelos de tiempo
122

continuo por diferencias divididas en el modelo de datos muestreados (por ejemplo,


simplemente reemplazar el operador diferencial de métodos numéricos ρ, por el
operador δ). Este procedimiento que es más que intuitivo, nos lleva a un modelo
aproximado. Sin embargo, pueden obtenerse otros tipos de modelos más confiables.
Para el caso linear pueden generarse modelos de datos muestreados lineales que
pueden generarse a partir de la inclusión de ceros extras debido al proceso de
muestreo (Astrom et al., 1984) (Wahlberg, 1988). De manera razonable, puede
esperarse que en el marco de los sistemas no lineales puedan obtenerse resultados
parecidos.

Sin embargo, la situación es más compleja que en los sistemas lineales. De hecho,
cuando Yuz hizo su investigación de los modelos de datos muestreados lineales,
encontró que la caracterización explícita de las dinámicas de muestreo de ceros no
había sido resuelta. No obstante, en el trabajo de Mónaco y Normand-Cryrot (Monaco
y Normand-Cryrot, 1988) ya se había reportado una caracterización de el muestreo no
lineal de ceros. Por otro lado, en el trabajo de Kazantzis y Kravaris (Kazantzis y
Kravaris, 1997) se estudiaron las propiedades de los modelos de datos muestreados
para sistemas no lineales.

En general, cualquier modelo de datos muestreados será una descripción aproximada


de la combinación de dos elementos: el sistema de tiempo continuo, junto con los
dispositivos de muestreo y retenedor. En muchos casos, se desconoce una descripción
exacta de un sistema no lineal híbrido o es imposible de calcular (Nesic et al, 1999).
Como consecuencia es necesario tener claridad acerca de la confiabilidad alcanzada
por algún modelo. De hecho, la confiabilidad del modelo de datos muestreados
aproximado de la planta ha probado ser un problema clave en el contexto del diseño
de sistemas de control; en el cual, un controlador diseñado para estabilizar un modelo
aproximado puede fallar en el momento de estabilizar un modelo de tiempo discreto,
no importa cuán pequeño sea el tiempo de muestreo elegido.

En este capítulo se consideran modelos de datos muestreados para sistemas no lineales


estocásticos. Estos sistemas están expresados usualmente en tiempo continuo usando
ecuaciones diferenciales estocásticas (stochastic differential equations, SDEs). Las
ecuaciones diferenciales estocásticas son parte del interés actual de muchas áreas de la
ciencia y de la ingeniería. Han sido aplicadas exitosamente en problemas como
modelos de crecimiento de población, estimación de señales, control óptimo,
problemas de valores frontera, y matemáticas financieras (Øksendal, 2003). Los
modelos de ecuaciones diferenciales estocásticas han sido usadas también para
identificación de sistema no lineales (Bohlin y Graebe, 1995)(Kristensen et al,
2003)(Kristensen et al, 2004) y control de sistemas estocásticos (Deng y Krstic,
1997a)(Deng y Krstic, 1997b)(Pan, 2001)(Pan, 2002). Se está interesado en el uso de
las SDEs para modelar sistemas en tiempo continuo estocásticos (también llamados
modelos de ruido, que son necesarias para expresar la incertidumbre), y a partir de
123

esos modelos, obtener descripciones de datos muestreados que sean confiables en un


sentido bien definido. El tratamiento matemático de las SDEs tiene similaridades y
también algunas diferencias con la teoría común de ecuaciones diferenciales. Cuando
se consideran los métodos numéricos para resolverlas, es necesario tener en cuenta
esas similaridades y esas diferencias. Este punto es importante en el contexto de este
capítulo, donde se estudia cómo obtener modelos de tiempo discreto para sistemas no
lineales basados en soluciones numéricas de ecuaciones diferenciales estocásticas.

Las ecuaciones diferenciales estocásticas solucionables de manera explícita son raras


en aplicaciones prácticas (Kloeden y Platen, 1992). Entonces, las soluciones
numéricas juegan un papel clave, llenando la brecha entre la teoría bien desarrollada y
las aplicaciones. En este contexto, los modelos muestreados de datos pueden ser
entendidos como algoritmos numéricos para resolver (aproximadamente) una
ecuación diferencial estocástica dada.

La teoría básica de las SDEs está basada principalmente en el trabajo de (Øksendal,


2003) y los tópicos relacionados a los métodos numéricos para la solución de ellas
están en el trabajo de (Kloeden y Platen, 1992). También existen muchas otras
referencias en el área de cálculo estocástico aplicado a control y a estimación (Bucy y
Joseph, 1968), (Astrom, 1970), (Jazwinski, 1970), (Kallianpur, 1980). Pueden
encontrarse muchos detalles matemáticos en (Protter, 1990), (Kushner y Dupuis,
1992), (Klebaner, 1998).

Así pues, se presentarán los modelos de datos muestreados para representar sistemas
no lineales estocásticos. Debe afirmarse que encontrar la solución exacta de una
ecuación diferencial (estocástica) es usualmente imposible. Como consecuencia,
serán obtenidos modelos de datos muestreados, sin embargo la confiabilidad del
modelo propuesto será caracterizada en términos de un orden de convergencia muy
específico.

Se obtendrá un modelo de datos muestreados para esta clase de sistemas basados en


una expansión similar en las diferentes variables de estado. Se considerará que esos
sistemas pueden ser expresados en una descripción particular de espacio de estados
que representa la llamada forma normal para sistemas no lineales determinísticos. Las
formas normales para las ecuaciones diferenciales estocásticas han sido estudiados por
(Arnold and Kedai, 1995; Arnold and Imkeller, 1998).

El siguiente desarrollo fue propuesto por Yuz en su tesis doctoral, luego de una base
matemática y de procesos estocásticos que puede ser encontrada en el Apéndice A de
esta tesis.

Se asume que dado el sistema no lineal estocástico presentado en el capítulo 1 de esta


tesis.
124

dxt f xt , t dt 1 xt , t dwt
(4.7)
dyt g xt , t dt 2 xt , t dvt

Con 2 xt , t 0 y c xt , t g xt , t dt con condiciones iniciales nulas. Entonces

dxt
f xt , t 1 xt , t wt
dt (4.8)
yt c xt , t

Se asume que existe una transformación Z = Φ(X), de modo que en las coordenadas
nuevas, el sistema pueda ser expresado como:

dZ t
AZ B * f Z,t 1 Z , t wt
dt (4.9)
yt z1

En el cual las matrices A y B son

0 0
In 1
A B (4.10)
0 0
0 0 1

Renombrando las variables de estado, lo que se asumió de primera instancia implica


que se restringirá a sistemas no lineales estocásticos que puedan ser expresados como
el siguiente conjunto de ecuaciones diferenciales estocásticas:

dx1 x2 dt

(4.11)
dxn 1 xn dt
dxn f ( x)dt ( x)dwt

Donde las salida es y = x1. Las funciones f(·) y σ(·) son analíticas. Nótese que si se
expande la ecuación de estados se puede usar la primera expansión de Itô-Taylor:
125

xn ( ) x0 (0) f (X0 ) ( X 0 ) wn (4.12)

T
donde X 0 x1 (0), x2 (0),..., xn (0) y ( X 0 ) wn es el término que agrupa los demás de
la serie.

T
W w1 w2 wn
n l

wn dw (4.13)
0
n l !
l 1,..., n

Y se obtiene

2
xn 1 ( ) xn 1 (0) xn ( ) d xn 1 (0) xn (0) f (X0) ( X 0 ) wn 1 (4.14)
0
2

Donde los valores de wn son

wl I (4.15)
1,0,...,0
n l ceros

Para sustituir I 1,0 wn 1 . Haciendo lo mismo para el resto de las componentes de


estado se puede obtener la expansión truncada de Taylor para el primer estado como

n 1 n
x1 ( ) x1 (0) x2 (0) ... xn (0) f (X0) ( X 0 ) w1 (4.16)
n 1! n!

Nótese que la ultima ecuación corresponde de hecho, a la expansión de Itô-Taylor


para el sistema con salida y=x1 de orden n. Nótese también que las expansiones de Itô-
Taylor obtenidas anteriormente para cada componentes del vector de estados puede
ser reescrita y resumida en términos del operador δ.

X X0
X AX B f (X0 ) ( X 0 )W (4.17)

Donde
126

n 1
n 1
x1 0 1 n!
n 1! n 2
x2 1
X A 0 B W W (4.18)
n 1!
1
xn
0 0 0
1

El desarrollo anterior se resume en el teorema de Yuz:

Teorema Considere el sistema estocástico continuo en el tiempo con salida y=x1, y el


siguiente modelo de datos muestreados:

X k AX k B f( k ) (k )Wk (4.19)
1
Donde A y B están definidas anteriormente y Wk Wk corresponde a

T
W w1 w2 wn
n l (4.20)
wn dw ; l 1,..., n
0
n l !

Donde el intervalo de integración debe ser cambiado a k ,k (por


estacionariedad de wt , los vectores Wk y W tienen la misma covarianza).

Entonces la salida y k x1 k de este modelo converge fuertemente a la salida


verdadera con orden n / 2 , con

2 n
E y0 y 0 C0 para alguna constante C0. (4.21)

Presentadas las anteriores posibilidades de modelos de incertidumbre, quedan


cubiertos los requisitos para presentar las aplicaciones centrales de este trabajo de
tesis, en su etapa de estimación e identificación de estados en sistemas dinámicos No
lineales No gaussianos del Capítulo 5.
127

Capítulo 5
IMPLEMENTACIÓN DE LA TÉCNICA DE
FILTRADO NO LINEAL EN SISTEMAS
DINÁMICOS NO LINEALES NO
GAUSSIANOS. ESTIMACIÓN DE ESTADOS,
IDENTIFICACIÓN DE SISTEMAS
“Bayesian filtering based on particle algorithms have recently emerged as an active
research field because, for many application areas it is becoming important to
consider non linearity and non Gaussianity. Bioprocesses are examples of such non
linear and non Gaussian systems. However, to my knowledge no use of particle
algorithms on biotechnological processes has been reported so far. Consequently,
the paper is novel in the sense that proposes to use for states estimation the above
mentioned algorithms”.

Motivación

Los bioprocesos son sistemas dinámicos con características no lineales y no


gaussianos, representan un reto para la ingeniería de control desde el punto de vista de
las complejas interrelaciones que intervienen, lo que hace que su modelo sea una tarea
complicada. En segundo lugar, la falta de instrumentación accesible y adecuada hace
que el conocimiento de las variables principales del bioproceso sea limitado; lo que
conlleva a la imposibilidad de establecer técnicas de control adecuadas que influyan
directamente sobre las variables tecnológicas.

En los últimos años es evidente el progreso alcanzado en la tecnología empleada para


el desarrollo de sensores en línea. A pesar de ello, en el área de los bioprocesos es
frecuente la falta de información real de variables químicas y biológicas. Dichas
variables pueden ser, entre otras: la concentración de biomasa, la actividad bacterial
específica, la concentración de productos intermedios. En muchos procesos
biotecnológicos, estas variables constituyen los estados del bioproceso. Sin el
conocimiento de las variables principales, no es posible establecer estrategias para el
control efectivo del bioproceso. Esto hace que su conocimiento sea de gran
importancia para el monitoreo y control de los procesos biológicos. Con esta premisa
se establecen dos problemas principales: la falta de información y el posterior
desarrollo de técnicas para el control efectivo. El presente capítulo enfrenta el primero
de los problemas. Como posible solución al problema de la falta de información, en la
128

ingeniería de control se practican técnicas como el modelado e identificación y la


estimación u observación de estados. El segundo, se tratará en el Capítulo 6.

La elección de un observador o estimador de estados depende inherentemente de las


especificaciones particulares del problema. En la práctica, sobre la elección del
observador influyen significativamente la disponibilidad de un modelo que sea lo
suficientemente representativo del proceso, así como la fidelidad de los datos
experimentales. Cuando se dispone de un modelo adecuado pueden usarse filtros de
Kalman extendidos, observadores de alta ganancia, o varios estimadores que emplean
el modelo del proceso (generalmente basado en primeros principios); bajo condiciones
especiales de confiabilidad, para realizar la estimación de las variables. Por el
contrario, pueden emplearse observadores asintóticos cuya dependencia con el modelo
no es tan estricta, pero su convergencia depende de las condiciones de operación.
También pueden utilizarse observadores basados en herramientas de inteligencia
artificial, por ejemplo, lógica borrosa y redes neuronales artificiales, entre otros.

En general, cuando el conocimiento a priori sobre la planta es incompleto, pueden


emplearse diferentes técnicas de aproximación procurando la estimación de estados a
partir de la información de entrada/salida. En la literatura se encuentran diversas
propuestas para la estimación de estados en bioprocesos, entre las más destacadas
pueden mencionarse los trabajos de (Dochain, 2002), (Dochain, 2003), (Boillereaux y
Flaus, 2000), (Leal Ascencio, 2001), (Adilson y Rubens, 2000), (Rallo et al, 2002).
También en los trabajos de (Quintero et al., 2004, 2005, 2007, 2008a, 2008d) se
reportaron varios estimadores para un proceso de fermentación alcohólica en continuo,
éstos son resultados de el proceso de realización de esta tesis.

En este capítulo se presenta el uso de los filtros de partículas como solución al


problema de estimación. Se aplica filtrado para sistemas dinámicos no lineales no
gaussianos sobre plantas de tipo biotecnológico en simulación y en contraste con datos
reales.

Retomando lo anteriormente expuesto en los Capítulos 2 y 3, en general se usan


técnicas de filtrado óptimo para la estimación de los estados de un sistema dinámico
cuyas entradas y salidas son observadas mediante mediciones perturbadas con ruido.
Se entiende por “estados de un sistema” a la mínima información necesaria en un
tiempo t t0 que conjuntamente al valor de las entradas definidas en todo tiempo a
partir de t≥t0 permite determinar el comportamiento del sistema para cualquier t≥t0. Las
mediciones generalmente son inciertas, por ello se habla de “ruido de medición”. Aún
si se conocieran los estados verdaderos del sistema, las mediciones no son una función
determinística de dichos estados sino que poseen una componente aleatoria. En este
contexto, la evolución de los estados se modela mediante un sistema dinámico
perturbado por un proceso estocástico (ruido de los estados) mediante una ecuación
129

diferencial estocástica. El ruido o perturbación de los estados se incorpora al modelo


para representar las incertidumbres del sistema dinámico, las cuales pueden ser de
naturaleza aleatoria, como también señales o dinámicas no consideradas en el modelo.
Según el paradigma bayesiano, la solución del problema de filtrado óptimo en el
instante t consiste en obtener la distribución de probabilidad condicional de los estados,
dada la información disponible de las observaciones hasta ese instante t.

Específicamente en la tesis se desarrollan variantes de un filtro bayesiano recursivo


tipo SIR con diferentes esquemas de re muestreo (Doucet, 1998). Esta técnica se
fundamenta básicamente en la teoría bayesiana y en los Métodos Secuenciales de
Monte Carlo del Capítulo 3. Existen innumerables variantes de este método, el cual fue
propuesto inicialmente por (Gordon et al., 1993) y se conoce con distintos nombres en
la literatura: filtro de partículas, filtros bayesianos recursivos, filtros recursivos de
Monte Carlo y filtros recursivos basados en simulación, entre otros. Ver (Doucet,
1998), (Crisan et al, 2002) y las referencias que allí se indican.

Esta metodología presenta la ventaja de no utilizar linealizaciones del sistema a


aproximar, además posee un gran potencial para la implementación en paralelo en
sistemas que requieran mayor complejidad y carga computacional. Al aplicar la técnica
se realiza una formulación discreta del problema. Esto es, se discretizan las ecuaciones
diferenciales estocásticas que caracterizan el sistema en tiempo continuo para obtener
ecuaciones estocásticas en diferencias. En este punto, es posible plantear una
formulación válida en forma probabilística bajo la teoría Bayesiana12, donde se obtiene
una solución optima a partir de la función de densidad de probabilidad del estado (pdf).

Como primera aplicación se propone el uso de técnicas de filtrado no lineal para la


estimación de estados de una fermentación alcohólica en continuo a partir de
Zymomonas mobilis. Esta bacteria ha atraído la atención de la industria y los
investigadores, como una bacteria prometedora, en función de mejorar la producción
de etanol (Daugulis et al, 1997). Estos microorganismos exhiben un comportamiento
cinético altamente no lineal y oscilatorio, además varios de los estados del proceso son
difíciles o imposibles de medir, estos son: concentración de biomasa y variables
intermedias para representar la tasa de cambio en la producción de etanol y para
determinar el efecto de inhibición. Particularmente, el proceso de fermentación en
continuo de la Zymomonas mobilis (Z.m) está caracterizado como un problema de
difícil solución, no solo desde el punto de vista de análisis dinámico, sino también
desde el punto de vista de control. La fermentación alcohólica llevada a cabo mediante
Zymomonas mobilis tiene algunas ventajas frente a otros microorganismos. Estas son:
Z. m proporciona niveles de etanol cercanos a los de la producción teórica a partir de
glucosa, posee una pérdida reducida de biomasa, no existe ningún requisito en cuanto a
requerimientos de oxígeno, la fermentación se produce a bajos pH y exhibe una

12
Debe recordarse que la teoría bayesiana está formulada en un dominio discreto.
130

productividad específica alta, (98%) de eficiencia en la producción y una tasa


específica de producción el doblemente grande (O’Mullan et al, 1991). Estas
características tiene como resultado una producción alta de etanol y altas
productividades específicas (Kesava y Panda, 1996), (Kesava et al., 1996) entre otras,
siendo esta última característica el beneficio de principal interés.

Además, la naturaleza aleatoria de las reacciones en escala molecular ha sido


mencionada y estudiada por algunos autores, por ejemplo (Gillespie, 2000). A escala
macroscópica (Kurtz, 1978) modeló el efecto total de esas reacciones individuales en
las concentraciones globales, por medio de un término de ruido aditivo de varianza
proporcional a la cinética de la reacción (o en inglés, propensity function). En este
contexto dos de los estados, la biomasa (X) y el sustrato primario (S) pueden modelarse
como Procesos de Markov que satisfacen la ecuación química de Langevin (Gillespie,
2000). En (Quintero et al, 2004) se exploró la posibilidad de usar el filtro de Kalman y
el filtro de Kalman extendido, para la estimación de biomasa de esta fermentación. Se
obtuvieron estimaciones no satisfactorias debido a las fuertes no linealidades presentes
en todos los estados del proceso.

Específicamente, en la implementación de FKE para la estimación de los estados y el


parámetro β, el cual determina el periodo en el retardo de inhibición de la Zymomonas
mobilis en el proceso de fermentación alcohólica en continuo, se obtuvieron los
siguientes resultados: En la estimación de estados con FKE se obtuvo una buena
estimación de la biomasa X y de la variable de inhibición I considerando el rango en
que dichas variables evolucionan. Para los demás estados se presentan errores de
estado estacionario; para la estimación del parámetro β no se logró la convergencia al
valor real del parámetro y para la estimación simultanea mediante un filtro dual de los
estados y el parámetro β se observó que la estimación de los estados mejoró levemente
mientras que la de β no mejoró. Finalmente, se observó durante el desarrollo del
trabajo que el comportamiento de los FKE están sujetos a la influencia de las
condiciones iniciales de las variables a estimar y también a las condiciones iniciales de
sus características estadísticas (matrices de covarianza). Las características
anteriormente mencionadas, lo convierten en una aplicación atractiva para el uso de
las herramientas de Filtrado No lineal para el diseño de observadores de estados. La
aplicación de esta técnica en este bioproceso, se justifica debido a que el mismo es
altamente no lineal y de características estadísticas no Gaussianas y, como se
mencionara anteriormente, otras técnicas de estimación no brindaron resultados
satisfactorios. En el trabajo se estiman los estados del sistema (concentración de
biomasa, concentración de sustrato, concentración de producto y las variables
intermedias antes mencionadas) a partir de información de entrada/salida y de un
modelo disponible del bioproceso (Amicarelli, 2009).

Otra aplicación sobre la cual se hace uso de las técnicas de filtrado no lineal, es un
proceso de fermentación por lotes, para la producción de δ-endotoxinas de Bacillus
131

thuringiensis (Bt). Esta es una bacteria formadora de esporas, la cual durante el proceso
de esporulación produce uno o más cuerpos cristalinos de naturaleza proteica
adyacentes a la espora conocidos como δ-endotoxinas. Posee dos etapas en su ciclo de
vida, una donde sólo presenta crecimiento y una segunda etapa de esporulación. Al
final de crecimiento vegetativo, el agotamiento del medio induce el inicio de la
esporulación. Normalmente la esporulación está acompañada por la síntesis de δ-
endotoxina. Después de la esporulación se completa el proceso con la ruptura de la
pared celular y la liberación de las esporas y los cristales al medio, etapa que se conoce
como lisis celular.

Se trata de un proceso discontinuo (batch), generalmente, este tipo de proceso no puede


ser linealizado alrededor de un único punto de equilibrio porque se comporta de
manera transitoria en la duración total del Batch. Otra característica interesante, es la
irreversibilidad que presentan (Sontag, 1998), (Haddad et al., 2005) y a raíz de esto, su
gran dependencia con las condiciones iniciales. En el contexto expuesto por (Joanides
et al., 2005) para el desarrollo de observadores de estados para bioreactores con
modelos estocásticos; dos de los estados, la biomasa y el sustrato primario (Bt, Sp)
también pueden modelarse como Procesos de Markov que satisfacen la ecuación
química de Langevin (Gillespie, 2000) al igual que el proceso de fermentación
alcohólica anteriormente mencionado.

Existen muchos aspectos del problema de estimación en sistemas por lotes (batch),
que son relevantes a nuestra discusión. Por ejemplo, el hecho que los procesos por
lotes sean procesos de transición sin estados estacionarios, bien definidos significa que
es muy frecuente el uso de una técnica no lineal de estimación. Como resultado,
comúnmente se afirma que no es válido asumir que las distribuciones de las variables
son Gaussianas. Adicionalmente, la complejidad del modelo usado para el cálculo en
línea debe mantenerse en un nivel razonable, ya que debe existir una correspondencia
estructural suficiente entre el modelo y la planta.

Un punto muy importante a ser resaltado es que los procesos batch operan de forma
muy dependiente a sus condiciones iniciales y su desempeño cronológico esta
determinado en mayor parte a ellas. Como consecuencia, la característica que
diferencia la estimación de estados aplicada a los procesos por lotes de la estimación
de estados en los procesos continuos, como el presentado anteriormente, es el efecto
de las condiciones iniciales.
132

5.1 Aplicación en un bioreactor en continuo de fermentación alcohólica para


producción de etanol a partir de Zymomonas mobilis.

5.1.1 Justificación

El consumo mundial de energía está aumentado debido al incremento de la población


humana. En los años recientes el uso de fuentes renovables como la energía hidráulica,
geotérmica, a partir de biomasa, eólica y solar para la producción de energía ha
ganado gran atención debido a las limitadas reservas de las fuentes de energía
tradicional no renovable como los combustibles fósiles.

La atención sobre la conversión de biomasa en etanol ha venido aumentando, dado


que el etanol es considerado el combustible líquido alternativo más limpio.
Consecuentemente se han hecho avances significantes en la tecnología de la
fermentación de etanol. Se entiende que es importante usar energía de biomasa como
medio para proveer nuevas fuentes de energía para la cantidad de personas que
actualmente la necesitan. La mezcla de energía renovable del futuro puede estar
compuesta también de fuentes de energía como la solar, eólica o algunas
complementarias, pero una de las aplicaciones más importantes e inmediatas de
sistemas de energía a partir de biomasa puede ser precisamente el de la fermentación
de etanol a partir de biomasa. La biomasa es uno de los recursos de energía renovable
más importantes. Su consumo para la producción de energía se ha incrementado
significantemente en los últimos años.

Actualmente el principal proceso biológico que puede ser usado para producción de
líquidos que transporten energía, son las fermentaciones para la producción de etanol,
y la mezcla de acetona, butanol y etanol (ABE). Otro líquido de interés es el biodiesel.
El biodiesel, es un combustible renovable para motores diesel (diesel no es un
combustible exclusivo para motores, también sirve para turbinas, calentadores,
hervidores, etc), que se deriva de los aceites vegetales como la soja. Esos aceites se
convierten en éteres de metanol o de etanol. El biodiesel no es el tópico de esta parte
del trabajo dado que no se produce a partir de la fermentación (Rogers et al., 2007).

La biomasa es una fuente de energía interesante por muchas razones. La razón


principal es que la bioenergía puede contribuir al desarrollo sostenible. Los recursos
están disponibles localmente y la conversión en portadores de energía secundaria es
totalmente factible, sin usar grandes inversiones de capital. Además, la energía a partir
de biomasa puede jugar un papel importante en la reducción de las emisiones de
invernadero; debido a que el CO2 que proviene de residuos de biomasa ha sido
originalmente absorbido del aire. En adición, las plantaciones de fuentes de biomasa
también pueden crear fuentes de empleo y nuevas oportunidades en áreas rurales, esto
también contribuye al aspecto social de la sustentabilidad. La aplicación de los
residuos agro-industriales en bioprocesos no solo provee sustratos alternativos si no
133

que también soluciona el problema de su desecho. Con el advenimiento de las


innovaciones biotecnológicas, principalmente en el área de enzimas y tecnología de
fermentación, se abren muchos panoramas para su utilización. En su mayoría el etanol
producido es obtenido por fermentación de glucosa en Estados Unidos, o sucrosa en
Brasil, pero cualquier país con una economía basada en agronomía puede acceder al
uso de la tecnología actual para la fermentación de etanol (Karashev et al, 2007). Esto
es posible debido a que en las últimas dos décadas, la tecnología para la producción de
etanol a partir de fuentes de plantas no comestibles ha sido desarrollada al punto de
que una producción a mediana y larga escala será posible en los próximos años. Por lo
tanto, residuos agronómicos como las cañas y hojas de maíz (mazorcas de maíz y
tallos), residuos de la caña de azúcar, paja de trigo o arroz, y los residuos de las
fábricas de papel, pueden convertirse en etanol. En este campo, la producción de
bioetanol ha sido mejorada significantemente con nuevas tecnologías, pero todavía
hay retos que hacen necesarios más investigaciones. Es necesario alcanzar un mayor
entendimiento de la fermentación de etanol. Así podrán aplicarse muchas técnicas
ampliamente desarrolladas en otras áreas y con ello mejorar su proceso productivo
(Lin, 2006).

Alternativamente, parece que el uso de residuos de lignocelulosa de las industrias


forestales o la producción tradicional de cultivos para alimentación es más atractivo.
Hay muchas propuestas para la producción de etanol a partir de biomasa
lignocelulósica, pero todavía no hay aplicaciones a gran escala. Respecto a la
microbiología, las características deseadas en un microorganismo para la producción
comercial de etanol son la amplia utilización de sustrato (habilidad de usar hexosas y
pentosas para fermentación), altos rendimientos de etanol y productividad, tolerancia a
los inhibidores presentes en los hidrolisatos y una tolerancia alta al etanol, actividad
celulolítica y habilidad para la fermentación de azúcar preferiblemente a altas
temperaturas (para menor contaminación y el decremento del costo de recupero de
etanol por destilación) (Rogers et al., 2007).

5.1.2 Descripción del proceso

Los microorganismos tradicionales usados para la fermentación son la Saccharomyces


cerevisiae y algunas bacterias como la Thermoanaerobacter, y otras que son
genéticamente modificadas a través de la tecnología del ADN recombinante. Un
productor de etanol que promete mucho, en comparación con los tradicionales es la
bacteria Zymomonas mobilis, que alcanza rendimientos de etanol cercanos a el valor
estequiométrico de 0.51 g etanol/g glucose (Lynd et al., 1996). Esos rendimientos son
los mas altos reportados en la literatura. Además, Zymomonas mobilis tiene una
temperatura óptima mayor que la de saccharomyces cerevisiae que reduce el costo de
enfriamiento durante la fermentación. (Claasen et al., 1999). La principal desventaja
de las cepas nativas de S. cerevisiae y Z. mobilis es su inhabilidad de usar pentosas
(xilosa, arabinosa). Z. mobilis tienen la ventaja de tolerar altas temperaturas producto
134

de su fermentación. Las ventajas de la fermentación de etanol a temperaturas elevadas


incluye las altas productividades y conversiones de sustrato, bajo riesgo de
contaminación, facilitación para el recupero de producto, eficiencia alta de los
reactores y la utilización de un rango amplio de sustratos.

Zymomonas mobilis es una bacteria Gram negativa que atrae la atención de los
investigadores debido a que usa la trayectoria de Entner-Doudoroff para producir
energía a partir del catabolismo de glucosa. Esta trayectoria es ineficiente al producir
una molécula de ATP (trisfosfato de adesosina), por molécula de glucosa consumida.
Esta ineficiencia se compensa por la capacidad de la bacteria en metabolizar glucosa a
altas proporciones (Parker et al., 1997). El interés industrial en el uso de la
Zymomonas mobilis, es su capacidad de producción de etanol y sorbitol (Oliveira et
al., 2005). Para la industria de producción, esto es un requisito fundamental, en la
búsqueda de microorganismos etanologénicos más competitivos.

En la Z. m existen dos posibles mecanismos que envuelven lípidos, para explicar la


tolerancia al etanol. En el primer mecanismo, se asume que los niveles altos de los
lípidos cíclicos en las membranas de las células, protegen la bacteria de los efectos
tóxicos del etanol. En el segundo mecanismo, los niveles altos de acido cis-vaccenico
en los fosfolípidos de la membrana de la bacteria, protegen la bacteria de la toxicidad
de etanol. (Tano et al, 2000).

La presente aplicación está basada en un reactor quimióstato para la fermentación en


continuo de las Zymomonas mobilis (Echeverry et al, 2003). Dicho bioproceso se
caracteriza por presentar un problema de difícil solución para el control, ya que los
microorganismos usados para esta fermentación exhiben un comportamiento cinético
altamente no lineal y oscilatorio, acompañado del beneficio de principal interés que es
su alta productividad de etanol. En la Figura. 5.1. se presenta un diagrama del proceso
continuo en consideración. Este consta de un reactor quimióstato, y de un separador
en el cual se asume un 100 % de eficiencia en la separación de microorganismos
asumiendo que divide su corriente afluente en ¼ hacia la recirculación y ¾ hacia la
corriente efluente final rica en etanol.
135

X, S, F2 X, S, P, F2 P

X, S, F6

X, S, F4,
R

Figura. 5.1. Diagrama de proceso de Fermentación alcohólica en continuo

El modelo matemático propuesto está caracterizado por un sistema de ecuaciones


diferenciales-algebraicas, el cual contempla el comportamiento oscilatorio del proceso
de cultivo y fermentación en continuo de la Z. m. Para este microorganismo el efecto
de inhibición producido por el histórico de la concentración de etanol es
insignificante, mientras que el efecto de inhibición producido por un aumento en la
concentración de etanol es muy intenso (Daugulis et al., 1997). Esto demuestra que
existe un retardo en el efecto de inhibición, ya que las células no responden
inmediatamente a cambios en el ambiente circundante (caldo de cultivo), lo que
sugiere que requieren tiempo para dar una respuesta metabólica.

Desde el punto de vista del control, se cuenta con un sistema altamente no lineal con 5
variables de estado, planteado como un sistema de 5 ecuaciones diferenciales de las
siguientes variables: Concentración de Biomasa (X), Sustrato (S), Producto (P),
tiempo de retardo del efecto de inhibición que es modelado como el efecto de la media
ponderada de la tasa de cambio de la concentración de etanol (Z) y la variable
intermedia auxiliar para la determinación del efecto de inhibición (I). Adicionalmente,
el modelo fenomenológico se completa con 3 ecuaciones algebraicas en términos de
136

las variables de estado y constantes cinéticas (a, b, , , , ) asociadas a la Z. m: Tasa


de crecimiento específica del microorganismo ( e), Tasa de producción de etanol (Qp)
y un Término asociado al efecto de inhibición, f , con el cual se establece la tasa de
crecimiento dinámico. Las ecuaciones que describen el sistema son:

dX F4 F6 (3.1)
R DS 4 1 X
dt V F2

Donde R es el término de recirculación de microorganismos, F2 , F4 y F6 son los flujos


de salida del bioreactor, salida de fondo del separador y corriente de realimentación de
biomasa respectivamente (ver Figura. 1) (Echeverry et al, 2003), (Maher y Zeng,
1995). La variable D que es la tasa de dilución total, es decir que Ds + Dr; en la cual
el término Dr es la tasa de dilución asociada al término de recirculación de Biomasa R
y la variable Ds es la tasa de dilución de sustrato.

dS 1 (3.2)
Qp X DSin DS
dt Yp / s
dP (3.3)
Qp X DP
dt
dZ (3.4)
I Z
dt
dI (3.5)
Qp X DP I
dt
Z Z
e e
f 1/ 2 1 Z Z
(3.6)
e e
a b
P P Pob
max S 1 1
Pma Pmb Pob (3.7)
e
S S Si
Ks S
K i Si

Donde Pma y Pob son factores de inhibición de etanol para la tasa específica de
crecimiento expresados en (g/l), Pmb el factor de máxima inhibición de etanol para el
crecimiento de las células en (g/l). Sin es la concentración de sustrato a la entrada,
Yp/s es el rendimiento producto sustrato, a y b son variables para el modelado de la
tasa de crecimiento estática e , Ks Ki y Si son constantes usadas para el mismo
propósito; max es la tasa de crecimiento máxima. Con las condiciones de:
137

P Pob
0, P Pob
Pmb Pob
(3.8)
S Si 0, S Si
P Pob
1, P Pmb
Pmb Pob

y donde la tasa de crecimiento dinámica se define como:

f * e
(3.9)

Qp Qpmax
S
1
P (3.10)
K mp S Pme

Siendo Qp la tasa específica de producción, y Pme el factor de máxima producción de


etanol para la tasa de producción (g/l).

Donde:

α Exponente de inhibición por producto, por la tasa de producción de etanol


β Parámetro histórico ponderado para la tasa de cambio en la concentración de etanol
δ Parámetro 1 del factor de inhibición para la tasa de cambio en la concentración de
etanol
λ Parámetro 2 del factor de inhibición para la tasa de cambio en la concentración de
etanol

Estudiando el comportamiento oscilatorio presentado por la Z. m y teniendo en cuenta


sus altos rendimientos a etanol comparados con los presentados por otros
microorganismos, es muy importante encontrar el punto óptimo de las variables para
maximizar el rendimiento de la bacteria y por ende, potencializar su utilización como
productora de etanol. Experimentalmente se ha encontrado que se puede incidir sobre
el comportamiento oscilatorio combinando determinadas concentraciones de sustrato
de alimento y tasas de dilución (Onder et al., 1998), (Mc Lellan et al., 1999),
(Echeverry et al., 2003).

En este tipo de proceso, es importante lograr mediante filtrado una buena estimación
de los estados no medibles del sistema como Z e I . También es importante lograr una
buena estimación de la concentración de microorganismos en el bioreactor, puesto que
su medición es muy costosa y es posible que no pueda ser realizada en línea. Los
experimentos de (Bravo et al, 2000) han mostrado también que la síntesis de etanol
está asociada con su tasa de crecimiento. Debido a esto, es necesario conocer los
estados del sistema para diseñar posteriormente una estrategia de alimentación
138

adecuada para mantener el cultivo a una alta tasa constante que pueda mejorar la
productividad de etanol.

Para diseñar estrategias de alimentación y acciones dinámicas para mejorar el


desempeño de la Z.m algunos autores han estudiado y desarrollado modelos
alternativos para explicar su comportamiento dinámico (Mc Lellan et al, 1999),
(Bravo et al, 2000), (Pinheiro, 2001), (Echeverry et al., 2003), (Oliveira et al., 2005),
(Rogers et al, 2007), fijado algunos parámetros de modelos (Raposo et al, 2005),
propuesto estrategias de control (Bravo et al, 2000), (Echeverry et al., 2004) y
estimado algunas variables (Quintero et al, 2004, 2005, 2007, 2008a, 2008d) estas
publicaciones son parte de los resultados obtenidos en el desarrollo de esta tesis. En
Quintero et al, 2004 se reportó el uso de un sensor virtual dentro de una estrategia de
control, en Quintero et al, 2005 se reportaron las primeras pruebas de estimación
usando filtros de kalman y kalman extendido, en Quintero et al, 2007 se reportaron las
primeras pruebas de estimación usando filtros de partículas sobre el modelo en
simulación sin uso de datos reales, mientras que en Quintero et al, 2008a y 2008d se
reportaron las estimaciones usando datos reales y pruebas de control de seguimiento
de trayectoria en lazo cerrado con estimadores.

Esto significa que la Z. mobilis ha sido un tópico de investigación, en búsqueda de su


posible implementación en producción de etanol a mayor escala.

Para poder evidenciar mejor las interacciones entre las variables definidas
previamente, se puede escribir el sistema anterior en términos de las variables de
estado. De las ecuaciones (5.1) a (5.6) se tiene que:

F4 F6
x1 R DS 4 1 x1
V F2

1
x2 Qp x1 D * Sin Dx2
Yp / s
x3 Qp x1 Dx3 (3.11)
x4 x5 x4
x5 Q p x1 Dx3 x5

Trabajando en estas ecuaciones y reemplazando las ecuaciones (5.6), (5.7), (5.9) y


(5.10) se tiene que,
139

a b
x3 x3 Pob
max x2 1 1
1 e x4
e x4 Pma Pmb Pob F4 F6
x1 1 x4 x4
R DS 4 1 x1
2 e e x2 x2 Si V F2
Ks x2
K i Si

1 x2 x3
x2 Q pmax 1 x1 D * Sin Dx2
Yp / s K mp x2 Pme
(3.12)
x2 x3
x3 Q pmax 1 x1 Dx3
K mp x2 Pme

x4 x5 x4

x2 x3
x5 Q pmax 1 x1 Dx3 x5
K mp x2 Pme

Considerando la ecuación (5.12) y trabajando con los flujos definidos (Echeverry et


al., 2003) el término que se refiere a la biomasa puede ser expresado en función de la
variable D que es la tasa de dilución total, es decir que Ds + Dr; en la cual el término
Dr es la tasa de dilución asociada al término de recirculación de Biomasa R y la
variable Ds es la tasa de dilución de sustrato. Entonces, se puede considerar que el
sistema se rige por el siguiente conjunto de ecuaciones diferenciales,

a b
x3 x3 Pob
max x2 1 1
1 e x4
e x4 Pma Pmb Pob
x1 1 x4 x4
x1
2 e e x2 x2 Si
Ks x2
K i Si

RD / 4 Ds R 1 x1

1 x2 x3
x2 Q pmax 1 x1 D * Sin Dx2 (3.13)
Yp / s K mp x2 Pme

x2 x3
x3 Q pmax 1 x1 Dx3
K mp x2 Pme

x4 x5 x4

x2 x3
x5 Q pmax 1 x1 Dx3 x5
K mp x2 Pme
140

5.1.3 Primera aproximación: Estimación de Biomasa en el proceso de fermentación


alcohólica en continuo, simulación del proceso

Para la primera aproximación a la aplicación de la técnica de filtrado no lineal usando


filtros de partículas sobre este proceso de fermentación, se usaron los parámetros
estimados por Daugulis y sus colaboradores a finales de los años noventa (Li et al.,
1995), (Daugulis et al., 1997), (Mc Lellan et al. 1999) que son los mismos usados en
los trabajos de modelado simulación y control de Echeverry (Echeverry et al., 2003),
(Echeverry et al., 2004). Asimismo, estos parámetros fueron usados por el autor, para
la primera aproximación a estimación de estados usando filtros en (Quintero y di
Sciascio, 2004; Quintero y di Sciascio, 2005) cuyos resultados se presentaron
brevemente en la sección anterior. Los datos en simulación fueron generados por el
juego de parámetros de las tablas 5.1 y 5.2.

Parámetros Oscilatorio
8.77
0.0366
0.824
21.05
a 0.3142
b 1.415
Qpmax 2.613
max
0.41
Yp / s 0.495
Tabla 5.1. Parámetros Comportamiento Oscilatorio sostenido

Pma 217 g/l


Pob 50 g/l
Pmb 108.0 g/l
Ks 0.5 g/l
Ki 200 g/l
Si 80.0 g/l
Pme 127 g/l
Kmp 0.5 g/l
Tabla 5.2. Parámetros del Bioreactor

La solución propuesta de simulación del sistema dinámico de la fermentación


alcohólica en continuo, fue realizada usando Matlab®, usando los métodos numéricos
de Euler y Runge Kutta. Dichas soluciones fueron programadas manualmente para su
141

inclusión como parte de los algoritmos de estimación y control que serán descritos en
el Capítulo 6. Los tiempos de muestreo considerados fueron desde 0.05 a 0.1 hora es
decir, entre 3 y 6 minutos. Estos tiempos fueron elegidos ya que se consideran
apropiados para este tipo de sistema dinámico con base en un análisis de las dinámicas
involucradas. Debe anotarse también que normalmente las fermentaciones de tiempos
de duración largas como 150 horas, son muestreadas cada hora ya que los métodos de
medida son fuera de línea.

Los primeros resultados están basados únicamente en simulación y resultados


numéricos. Antes que ser negativo para esta parte de la tesis, es por el contrario
positivo ya que este trabajo es pionero en el uso de filtros de partículas en el área
biotecnológica. La implementación y pruebas de este filtro en fermentaciones reales es
una continuación lógica en esta área de investigación, los cuales serán analizados más
adelante en este capítulo.

Para la aplicación del filtro de partículas dentro de la tesis, se utilizó el modelo


anteriormente planteado al cual se le adicionó modelos de perturbación considerando
que existen incertidumbres de modelado y de medición, de naturaleza diferente. El
esquema de estimación es el de la Figura 5.2 (Quintero et al., 2007). Debe anotarse
que se mantendrá la estructura, pero los modelos de perturbación se construirán
mediante la manipulación de las funciones que se refieren a las componentes
aleatorias en la Ecuación 4.1.

u t MODELO DE PROCESO
y t

dxt f xt , t dt 1 xt , t dwt
dyt g xt , t dt 2 xt , t dvt

MODELO DEL FILTRO

xt 1 f xt , t dt 1 xt , t dw,t
yt g xt , t dt 2 xt , t dv ,t
xˆt
Figura 5.2: Esquema de Estimación en simulación para el proceso de fermentación
de Z.m

Las señales del vector de entrada u(t) de la Figura 5.2 corresponden a la concentración
de sustrato a la entrada S in , la tasa de dilución D y el término de recirculación de
microorganismos R ; y las señales del vector de salida y(t) hacen referencia a la
142

concentración de Sustrato S y de Producto P en el efluente. Éstas corresponden al


modelo usado como planta real que alimenta el modelo del filtro que es el que realiza
las estimaciones de los estados. Estas estimaciones son las que se comparan con las
entregadas con el modelo considerado como patrón. La simulación del bioreactor, se
realizó a lazo abierto, las entradas u(t) fueron consideradas constantes. En el grupo de
Figura 5.3 se pueden observar claramente las dinámicas y los retardos de inhibición
que hacen que este sistema sea altamente no lineal.

El modelo de incertidumbre corresponde al caso en el que al sistema de ecuaciones de


estados del bioproceso (5.13) como en la ecuación general del espacio de estados
(4.1), se agrega la función 1 xt , t que es un ruido gaussiano que depende de una
variable interna distribuida uniformemente; actualizada cada instante de tiempo
partícula a partícula, en combinación con su correspondiente término de proceso de
Wiener generalizado dwt para el modelo de simulación que actuará de planta real y un
término análogo pero diferente de característica que se llamará dw,t para la
componente correspondiente a los estados del modelo usado dentro del filtro,
respectivamente.

Y el valor de la función del modelo de perturbación correspondiente al vector de


salida en la ecuación (4.1) 2 xt , t 1 fue combinado con diferentes muestras de
ruido gaussiano con diferentes características a las de los estados; en este caso dvt para
el modelo de simulación de proceso, y dv , t (prima) para el modelo del filtro con el fin
de simular perturbaciones desconocidas relacionadas al equipo de medición simulado.
Este modelo de incertidumbre básico, sugiere introducir diferencias entre los modelos
de simulación de proceso y de modelo del filtro vía simulación, ya que ambos modelos
básicos son estructural y paramétricamente idénticos.

Entonces, es importante recalcar que las mediciones usadas para alimentar el filtro,
como información externa, son las tomadas del modelo que corresponde en este caso a
la “planta real” y están ya contaminadas con la incertidumbre asociada 1 xt , t dwt
(porque el sustrato y el producto son también estados del sistema). A estas mediciones
(sustrato y el producto) se les adiciona su término correspondiente de incertidumbre
de medida 2 xt , t 1 y dvt , mediante el ruido gaussiano y su término de difusión
para simular los efectos del ruido electrónico en sensores, que fue discutido
anteriormente.

Descripción de los experimentos realizados: a continuación se presentarán los


conjuntos de resultados más representativos obtenidos en esta investigación, parte del
conjunto original de pruebas que los cuales fueron numerados desde experimento 1 en
adelante. Estos experimentos fueron planeados usando diferentes tipos de estructuras
143

de filtrado y modelos de perturbación para el caso de simulaciones de proceso y de


esta misma forma en la sección 5.1.4 se presentarán resultados usando datos reales en
vez de plantas de proceso simuladas combinados con modelos de filtro con
variaciones de modelos de perturbación. Dado que los experimentos variaron uno a
uno, algunos de ellos no dieron resultados satisfactorios ya que se probaban diferentes
modelos de perturbaciones no gaussianos e inclusive metodologías de filtrado o
variaciones al algoritmo; por ello fueron eliminados. Consecuentemente, la
numeración de los experimentos no seguirá un estricto orden, pese a no tener una
continuidad, se trata de presentarles en su numeración original

Experimento 1:

La estructura del filtro tiene como planta real el modelo de (Daugulis et al, 1997)
validado en la tesis de Li, 1999, con los parámetros dinámicos encontrados y
reportados por Raposso et al., 2005. Presentados en las Tablas 5.1 y 5.2. Como
modelo del filtro, se uso el mismo modelo con ruidos aditivos descritos a
continuación.

El modelo utilizado para el filtrado de partículas es del tipo tipo 3 de Schon (Schon,
2005) definido como: Espacio de estados no linear discreto con ruido aditivo
(Nonlinear discrete state-space model with additive noise) de la forma

x t 1 f x t w t
y t h x t v t
(5.14)

Donde los ruidos aditivos w t y v t , respectivamente, tienen las siguientes matrices


de covarianzas

2
estado1 0 0 0 0 0.0625 0 0 0 0
2
0 estado 2 0 0 0 0 0.04 0 0 0
2
R1 0 0 estado 3 0 0 0 0 .04 0 0
2
0 0 0 estado 4 0 0 0 0 .01 0
2
0 0 0 0 estado 5
0 0 0 0 .01

2
salida1 0 0.0625 0
R2 2
0 salida 2
0 0.0625
144

y las componentes w t y v t , tienen la forma


w t B z (t ) z (t 1) R1 ( 1 , R1 ) , con B n, Np, z (t ) z (t 1) dónde
z(t ) p( z(t ) z(t 1)), z(t ) U a, b .
Y v t ( 2 , R2 ) donde el símbolo (~) significa "distribuido de acuerdo a" y
, R2 ) significa “distribución gaussiana multivariable de media
( 2 2
2
y
matriz de covarianza R2 2 2

En las Figura 5.3 se encontrará que el filtro sigue bien el modelo, que estando en
concurrencia con los parámetros de la fermentación experimental de (Raposso et al.,
2005), se convierte en otro modelo diferente al de (Daugulis et al., 1997), (Li, 1999).
Estas fermentaciones en continuo tienen esas características cuando se les cambian las
condiciones iniciales, y se reflejan en estos parámetros de modelo. Los datos
marcados con asteriscos en la Figura 5.3.a son los datos reales de esas
experimentaciones. Con estas difusiones a medida que aumenta el número de
partículas, disminuye el error al comienzo de la estimación. Nótese de la Figura 5.3a.
que hay una diferencia entre el modelo del filtro (Filtro) y el usado para simular el
bioproceso (Modelo), debido a la diferencia de los valores de ruido aditivo del modelo
de Schon w t y v t para el filtro en contraste con los de 1 xt , t , dwt , 2 xt , t 1 y
dvt con los que se simuló la planta real.

Estimación de células de Z.m Simulación


Concentración Biomasa [g/L]

2.5

1.5

1
Filtro
0.5
Modelo
Dato Real como referencia
0
0 10 20 30 40 50
Tiempo [Horas]
Figura. 5.3. a. Estimación de biomasa con 50 partículas y esquema de re muestreo
Multinomial
145

Figura. 5.3. b. Errores en la estimación de los estados del bioreactor, durante una
prueba en simulación de 150 horas con un tiempo de muestreo de 0.1 horas.

Es de observar de la Figura 5.3.b que los errores de estimación de los estados no


medibles del bioreactor, inclusive en simulación comienzan a aumentar en el tiempo
de simulación, lo que indica que es posible que se presenten errores de degeneración
de partículas o de elección de la función de importancia. En el desarrollo de esta tesis,
estas primeras aproximaciones en simulación han de permitir el desarrollo de
estrategias para su posterior implementación sobre datos reales (sección 5.1.4) y en
combinación con controladores en lazo cerrado (Capítulo 6). A continuación una tabla
que presenta los tiempos de cómputo del algoritmo, para número de partículas y
esquemas de re muestreo. Según la tabla, puede verse que se demora,
aproximadamente entre 0.0291 segundos (10 partículas) a 3.18segundos (1000
partículas), por cada tiempo de muestreo de 0.1 horas en simulación durante una
prueba en simulación de 150 horas.

Número Re muestreo Re muestreo Re muestreo


de partículas Residual Determinístico Multinomial
10 0.5338 0.5308 0.5376
50 2.5285 2.5471 2.6378
100 5.3604 5.0899 5.1642
500 25.2538 25.2 25.22
1000 48.8934 58.3814 50.0848
Tabla 5.3. Tiempo de cómputo en minutos para cada prueba del proceso de estimación
experimento 1.

Los resultados de simulación para este sistema fueron satisfactorios. Es importante


decir que al final del tiempo de estimación, la magnitud del error incrementa, es decir
que la calidad de la estimación disminuye debido a que el esquema de re muestreo
determinístico no es eficiente para este partículas, en adición a el efecto de las
características (máximas) de ruido agregados, usadas como prueba para robustez en la
estimación del filtro (ver Figura 5.3) (Quintero et al., 2007). Como hipótesis, se dice
146

que el incremento en la magnitud del error se mantiene debido a la elección de la


función de importancia para este caso particular, y la posibilidad de usar otra diferente
se plantea como posible solución (Crisan et al., 2002).

De los resultados de simulación, puede verse que el desempeño de los filtros de


partículas es bueno para estos datos simulados. Los resultados (ver Figura 5.4) son
remarcables desde el punto de vista del nivel de confianza usados de los modelos
como base (Daugulis et al, 1997), (Mc Lellan et al, 1999), (Raposso et al, 2005) y su
cercanía con los datos reportados en la literatura.

La importancia de las Figura 5.4 radica en el hecho que las variables biotecnológicas
no son siempre muy fáciles de muestrear y ésta aproximación entrega un valor de
estimación suficientemente aproximado, que puede llegar a reemplazar la medida real
en un intervalo de tiempo teniendo en cuenta el modelo de ruido y difusión de gran
magnitud agregado. De la misma manera, el desempeño del filtro nos permite asumir
las incertidumbres en las medidas y perturbaciones en los mismo métodos de
medición.

Las variables auxiliares para representar el efecto de la tasa de cambio de etanol, I y Z,


presentes en el comportamiento dinámico de la Z.m fueron observadas en simulación.
Dichas variables son relevantes en el sentido de la información que ellas proveen
acerca del efecto de la tasa de cambio de la concentración de etanol, no solo como
promedio ponderado, sino también como variables intermedias para la determinación
del efecto de inhibición de alcohol. El filtro se desempeña satisfactoriamente en la
estimación de esas variables y ésta maneja con propiedad la posible influencia de las
medidas ruidosas de producto, y sus efectos en la estimación. El filtro sigue bien el
modelo, como primera aproximación al problema real y la implementación en línea en
función de los tiempos de muestreo fue probada y resultó satisfactoria. Las dinámicas
modeladas están propiamente relacionadas al comportamiento real y la robustez frente
a las perturbaciones y las incertidumbres de modelado (simuladas) como puede verse
de los resultados de simulación.

Los resultados de esta sección son producto de la implementación de la técnica


utilizando desde 100 a 1000 partículas. Se realizaron variaciones de las componentes
aleatorias de los modelos agregados para el sistema dinámico. Se utilizó un conjunto
de pruebas para medir la efectividad del filtro frente al costo computacional de la
aplicación y así poder analizar la eficiencia de los esquemas de re muestreo usados en
esta configuración.
147

Estimación de células de Z.m


Concentración Biomasa [g/L]

0.5

-0.5 Filtro SIR


Simulada como Real
-1

90 100 110 120 130 140 150


Tiempo [Horas]
Figura. 5.4a Concentración de biomasa estimada por el filtro SIR. La línea punteada
describe la estimación mientras que la línea continua describe el valor del modelo
considerado como real.
Concentración Biomasa [g/L]

Estimación de células de Z.m


1

0.5

0
Filtro SIR
Simulado como Real
-0.5

-1
10 20 30 40 50 60 70 80 90
Tiempo Horas
Figura. 5.4b. Concentración de biomasa estimada por el filtro SIR. La línea punteada
describe la estimación mientras que la línea continua describe el valor del modelo
considerado como real.

En la Tabla 5.4 se resume el esquema de pruebas utilizado y algunas características


relevantes. Debe observarse que se registran los errores máximos obtenidos entre
todas las pruebas para 100-500-1000 partículas sin hacer distinción entre las
variaciones de las características de difusión. Para los valores referenciados como
medios mostrados en la tabla, se usan los valores correspondientes a los máximos de
los errores medios de las mismas pruebas, sin distinción entre las características de
difusión. ( medium max mean error ) . El objetivo perseguido es ilustrar los
peores casos obtenidos.
148

Tabla 5.4. Errores obtenidos en diferentes pruebas, ilustración de los peores casos

En la Figura 5.4a 5.4b, puede observarse el resultado de una prueba realizada para 500
partículas, usando el esquema de re muestreo determinístico para el bioproceso
continuo. Se consideró como salida medible del sistema el Sustrato y el Producto (S y
P). Para el modelo de ruido aditivo a las mediciones, se utilizó ruido blanco normal,
con media y varianza de adecuada y considerable magnitud.

Es importante el hecho de que al final de la estimación realizada, la magnitud de los


errores tiende a aumentar, es decir, la calidad de la estimación comienza a disminuir
debido a que el esquema de re muestreo determinístico no es eficiente en este caso.
Esto constituye una evidencia del fenómeno llamado “empobrecimiento de las
muestras” (Sample Impovershiment) sumado al efecto de las características de ruido
que son significativas, usadas como prueba de robustez en la estimación del filtro.

Se plantea como hipótesis que el aumento de los errores obedece a deficiencias en la


elección de la función de importancia para este caso particular y se considera la
posibilidad del uso de una más compleja.

Se realizaron modificaciones al mecanismo de estimación para mejorar los resultados.


Se propusieron cambios en las características de modelos de incertidumbre y al
aumentar la influencia del modelo de difusión y utilizar el esquema de re muestreo
Multinomial, se obtuvieron resultados mejorados respecto a los anteriores.

Al aumentar el número de partículas en los filtros a 1000, usando el esquema de re


muestreo determinístico, se observo que los errores tienden a aumentar
considerablemente (se observa un máximo de 0.2 al final de la estimación), respecto a
los presentados anteriormente. En comparación con el esquema anterior, usando el
mismo tipo de re muestreo, se encontró como particularidad que al disminuir
considerablemente el número de partículas usado (100 partículas), la estimación se
mantendría deficiente, lo que lleva a concluir, que independiente del número de
partículas usadas en este problema, la mayor influencia en la solución la tienen las
características de difusión de las mediciones y el esquema de re muestreo utilizado.
149

En las Figura 5.5 a y b pueden observarse las estimaciones de las variables Z y I que
corresponden a las variables de inhibición. Cabe aclarar que este par de variables
hacen parte del vector de estados, pero no son medibles físicamente. Lo que se
persigue es lograr una buena estimación de dichas variables a partir de los datos de
Sustrato y Producto, ya que en caso de un implementación en línea, la buena
estimación de estas variables hará mucho más viable su monitoreo con fines de
optimización e inclusive de producción.

1
Variable de Inhibición Z
Filtro SIR
0.5 Real

-0.5

80 90 100 110 120 130 140 150


Tiempo [Horas]
Figura. 5.5a Dinámica de inhibición Z estimada por el filtro SIR. Línea punteada
representa las estimaciones y las líneas continuas son consideradas las dinámicas
reales del sistema
Variable de Inhibición I
0.8

0.6

0.4
Filtro SIR
0.2 Real
0

-0.2

-0.4

-0.6

-0.8

-1
70 80 90 100 110 120 130 140 150
Tiempo [Horas]

Figura. 5.5b. Dinámica de inhibición I estimada por el filtro SIR. Línea punteada
representa las estimaciones y las líneas continuas son consideradas las dinámicas
reales del sistema.

En la Figura 5.6 se presenta el resultado de estimación de Biomasa para una de las


pruebas realizadas con mayor precisión en sus resultados.
150

Figura. 5.6. La línea punteada describe la concentración de biomasa estimada por el


filtro SIR mientras que la línea continua describe el valor “real”.

En la Figura 5.7 a y b se presentan los errores de estimación de las variables no


medibles Biomasa e Inhibición Z e I, y la concentración de Biomasa considerada real,
en contraste con la estimación del filtro, respectivamente. En las Figura 5.7 c y d se
presentan sus correspondientes variables asociadas Z e I en las cuales se muestra la
calidad de la estimación en la primera experiencia en simulación.

1.5
Error
1
Porcentaje %

0.5

-0.5

-1 Biomasa
Inhibición Z
-1.5 Inhibición W

-2
0 50 Tiempo [Horas] 100 150

Figura. 5.7a Valor de los errores de estimación.


151

Biomasa

0.5

-0.5
Filtro SIR
Real
-1
134 136 138 140 142 144 146 148 150
Tiempo [Horas]
Figura. 5.7b Estimación de Biomasa

Figura. 5.7c Estimación de estado de Inhibición Z


Inhibición I
0.4

0.35 Filtro SIR


Real

0.3

0.25

0.2

0.15
53 53.2 53.4 53.6 53.8 54 54.2
Tiempo [Horas]

Figura. 5.7d Estimación de estado de Inhibición I.


152

5.1.4 Segunda aproximación: Estimación de biomasa en el proceso de


fermentación alcohólica en continuo – Regiones de operación definidas por
(Raposso et al., 2005).
En la segunda aproximación que se presentará, se aplicarán las técnicas de filtrado de
partículas al mismo sistema no lineal pero esta vez usando no solo el modelo de
(Daugulis et al., 1997) posteriormente completado por (Echeverry et al., 2003) con
propósitos de control, y validado con datos reales para regímenes transitorios, estables
y oscilatorios por (Oliveira et al., 2005) sino que se transformará en un modelo que
opera en las regiones definidas por los parámetros estimados de (Raposso et al., 2005)
quien realizó pruebas experimentales para su análisis y parametrización.
De la misma manera que en la aproximación anterior se uso el método numérico de
Euler y Runge Kutta para modelar el comportamiento del bioreactor. Esta
aproximación permite seleccionar un tiempo de muestreo adecuado, así pues la
evolución en el tiempo de las dinámicas del sistema pueden ser correctamente
simuladas. Tal y como se comentó en el capítulo 4, el uso de un modelo en tiempo
discreto obliga a preguntarse acerca de la relación entre la descripción en tiempo
discreto de las muestras y el modelo original en tiempo continuo. Conforme a esto, la
idea de muestrear rápidamente y reemplazar las derivadas en el modelo en tiempo
continuo por diferencias divididas, es bastante tentadora. Sumar la componente de
difusión como ruido blanco gaussiano, en caso que los modelos de incertidumbre
sean simples es la aproximación más básica. Este hecho se tendrá en cuenta como
primera alternativa para la simulación, el filtrado y posterior control. Al modelo base
se le agregaron modelos de perturbaciones más complejos bajo las consideraciones ya
mencionadas, eso hace que el modelo del filtro se comporte como una ecuación
diferencial estocástica. El tratamiento de las ecuaciones diferenciales estocásticas
tiene algunas similaridades y también diferencias con la teoría de las ecuaciones
diferenciales determinísticas. Hay que tener en cuenta esas similaridades al considerar
métodos numéricos para resolverlas. Así mismo se pueden obtener modelos de datos
muestreados para los sistemas no lineales, basados en las soluciones de las ecuaciones
diferenciales estocásticas tal y como se menciono en el caso 4 del Capítulo 4.

Por esta razón, solamente se lograrían aproximaciones. Debe recalcarse que en este
caso particular no estamos interesados en la solución exacta de la ecuación diferencial
estocástica, pero si estamos interesados en las muestras que puedan ser tomadas del
modelo para calcular la solución aproximada de la función de densidad de
probabilidad de los estados (pdf) a través de simulaciones recursivas de Monte Carlo,
para finalmente estimar los estados.

El modelo de incertidumbre para los estados, usado en el primer caso para aproximar
los datos reales consiste de un proceso estocástico definido por las siguientes
componentes:
153

z (t ) p ( z (t ) z (t 1)), z (t ) U a, b
1 xt , t p ( x(t ) z (t t 1), x(t 1)) (5.14)
,
1 xt , t p( x(t ) z (t t 1), x(t 1))dw t

Análogo a la ecuación 5.14, se uso como modelo de perturbación de las mediciones el


valor de, 2 xt , t 1 y una componente simple de ruido blanco gaussiano V , t
consistente con la aproximación discreta al movimiento Browniano, generado con
estadísticas que varían de acuerdo a la evolución temporal, el numero de partículas y
al tipo de prueba desarrollada.

ut yt
DATOS REALES
PROCESADOS

MODELO DEL FILTRO

xt 1 f xt , t dt 1 xt , t dw,t
yt g xt , t dt xt , t dv ,t
2
xt

Figura. 5.8 Esquema de estimación usado para la prueba con datos reales

Para la configuración se usa el modelo dentro del filtro y se toman datos reales de
sustrato y producto, de los datos de las fermentaciones reportadas por (Raposso et al,
2005). Para el modelo interno del filtro se le agregaron modelos de perturbación y de
incertidumbre al modelo base bajo las consideraciones de incertidumbres de modelado
y medición de diversa naturaleza. El modelo se convierte de esta forma en un modelo
de ecuaciones diferenciales estocásticas.

La Figura 5.8 presenta el esquema de estimación para la primera prueba con datos
reales. Las señales de entrada u(t) (concentración de entrada de sustrato Sin , tasa de
dilución D y el término de recirculación de microorganismos R ), las señales de
salida y(t) (salida de sustrato S y de producto P ) alimentan el filtro que hace la
estimación de los estados. La simulación se hace en condiciones de lazo abierto
sostenido oscilatorio, con entradas constantes determinadas en la experimentación.
Los resultados se comparan con los datos reales. A partir del modelo patrón que
considera las incertidumbres, se observaron las dinámicas de inhibición, que hacen
que el proceso sea altamente no lineal.
154

Los datos reales reportados por (Raposso et al, 2005) se han muestreado a la velocidad
de 2-3 muestras por hora. Para propósitos de filtrado, los datos fueron preprocesados
y el vector de datos original fue completado usando una herramienta de interpolación
de Matlab®. Es importante resaltar que los datos de sustrato y producto son mucho
más factibles de medir, que los datos de concentración de biomasa que se obtienen
generalmente usando métodos fuera de línea. Los valores de sustrato y producto
usados como señal de entrada del filtro para los experimentos en estado oscilatorio se
pueden ver en la Figura 5.9

Estimación de Células de Z.m


Concentración de Biomasa [g/L]

2.5

1.5

Interpolación de Datos Reales


1 Datos Reales

0.5
0 10 20 30 40 50 60 70 80 90
a. Tiempo [Horas]
Datos Reales de Sustrato
Concentración de Glucosa [g/L]

120

100
Interpolación Datos Reales
80 Datos Reales

60

40

20
0 10 20 30 40 50 60 70 80 90
b. Tiempo [Horas]
155

Datos Reales de Producto


Concentración de Etanol [g/L]

110

100

90 Interpolación de Datos Reales


Dato Real
80

70

60

50

40
0 10 20 30 40 50 60 70 80 90
c. Tiempo [Horas]
Figura 5.9. Interpolación de datos reales. a. Concentración de Biomasa real b.
Concentración de sustrato. c. Concentración de producto.

La simulación del bioreactor se efectuó en lazo abierto, mostrando su comportamiento


oscilatorio y las entradas permanecieron constantes tal y como lo indicaron Raposso y
colaboradores. El conjunto de parámetros que se usaron para el modelo del filtro
fueron los reportados por (Raposso et al, 2005) y (Pinheiro et al, 2005) calculados
usando técnicas de enjambre de partículas (particle swarm). Ver Tabla 5.5.

Parámetro Valor
α 0.1000*100
β 0.430457*0.1
δ 0.10000*0.01
λ 0.241458*10
a 0.1000000*10
b 1.72620*10
Qpmax 0.3828880*10
Yps 0.514353
µmax 0.41
Tabla 5.5. Parámetros usados para estimación con datos reales de Zymomonas
mobilis.

Para aproximar los datos reales mediante el filtrado de partículas se usaron un número
de partículas desde 10 hasta 1000, usando tres tipos de re muestreo diferentes:
residual, determinístico y multinomial, mencionados en el Capítulo 3. Se realizaron
pruebas haciendo no solo variaciones en el número de partículas sino también en las
componentes aleatorias de los modelos de incertidumbre.

Otro de los objetivos de hacer pruebas de varias mediciones era probar la efectividad
del filtro, respecto a su costo computacional, analizando la eficiencia de los esquemas
de re muestreo utilizados en esta configuración del filtro de partículas. Para ello, se
156

conFiguraron cinco números de partículas con las cuales hacer la prueba, en tres
esquemas de re muestreo mencionados anteriormente. Se fijaron las componentes de
difusión y no se hicieron las demás variaciones en las componentes aleatorias, ya que
el objetivo era medir el tiempo de cálculo. El procesador principal de prueba fue un
Intel Core duo 3.0 GHz 1GB RAM, cuyos resultados en tiempo de simulación se
reportan en la Tabla 5.6. También se probaron los mismos algoritmos en un
procesador AMD Sempron 2200 192 RAM; los resultados obtenidos fueron cercanos
a 2 o tres veces el tiempo de cálculo que presentó el primer procesador.
Posteriormente se realizaron test en un procesador Intel Core 2 duo T5600@ 1.83 Ghz
2GB RAM reduciendo el tiempo de cálculo del primero a aproximadamente la mitad.

Esquema de Re muestreo Re muestreo Re muestreo


re muestreo Residual Determinístico Multinomial
Número de Partículas (min) (min) (min)
10 0.6497 0.6554 0.7728
50 3.1026 3.0876 3.0746
100 6.1467 6.1255 6.15
500 30.79 30.7588 30.5231
1000 61.6689 60.7491 60.6271
Tabla 5.6 Tiempo de estimación de Biomasa en simulación (minutos) para una
simulación completa de 150 horas.

El tiempo de muestreo seleccionado para la simulación y el muestreo de los datos de


la fermentación fue de 6 minutos, es decir, 0.1 hora. Este tiempo de muestreo es
adecuado para este proceso de fermentación porque sus dinámicas permiten no solo
desarrollar el procedimiento de muestreo, sino también producir resultados de
estimación e inclusive hacer cálculo de acciones de control, como se verá en el
capítulo siguiente. Puede verse de la Tabla 5.6 que si el tiempo de muestreo es de 0.1
horas, el algoritmo puede gastar desde 4.3313e-004 minutos (es decir, 0.0260
segundos cada tiempo de muestreo) hasta 0.0405 minutos (2.4300 segundos cada
tiempo de muestreo) desde 10 a 1000 partículas, lo que es en términos de
comportamiento dinámico, el tiempo es más que suficiente para usar esta información,
inclusive en un lazo de control.

Para las variables de inhibición, que dependen de la tasa de cambio en la


concentración de producto, los errores que se presentaron fueron en algunos casos
menores que los de las demás variables, lo que puede ser usado como una variable de
monitoreo en una fermentación en continuo a mayor escala para saber cómo manejar
el proceso de fermentación en sí. Esta información es relevante en el sentido de que
puede ser importante para la supervisión y el control, y que si el modelo tiene la
confiabilidad suficiente, es decir, ya ha sido validado y usado dentro de un filtro; es
157

posible que la estimación generada sea adecuada, y puede ser usada para propósitos
reales de control.

Resultados:

En la Figura 5.10 pueden verse los resultados de la prueba realizada en el experimento


5, sobre el bioproceso en continuo. Se consideraron las salidas medibles del proceso
real presentadas anteriormente (S y P). Los resultados son considerables desde la
perspectiva del nivel de confiabilidad del modelo usado y validado, en contraste con
los resultados de los modelos originales (Daugulis et al, 1997), (Mc Lellan et al,
1999), (Raposso et al, 2005) y su cercanía a los datos. La importancia de la Figura 10
radica en el hecho que, para variables biotecnológicas las medidas no pueden ser
muestreadas fácilmente y esta aproximación entrega un valor de estimación
aproximado, que puede reemplazar la medida real sobre un intervalo de tiempo. De la
misma manera, el desempeño del filtro permite indicar que las incertidumbres
asumidas y las perturbaciones en las mediciones fueron adecuadas.

Las experiencias consisten en usar la estructura de filtro, que muestrea directamente


de los datos reales de las fermentaciones, los cuales se completan siguiendo la
metodología en (di Sciascio y Amicarelli, 2008) para datos perdidos. La estructura del
filtro tiene como planta el modelo de (Daugulis et al, 1997), validado en la tesis de
(Li, 1999), con los parámetros dinámicos encontrados y reportados por Raposso et al,
2005 ver Tablas 5.1 y 5.2.

Nuevamente el modelo utilizado para el filtrado de partículas es del tipo 3 de Schon


(Schon, 2003): Espacio de estados no linear discreto con ruido aditivo (Nonlinear
discrete state-space model with additive noise). A continuación se presentan los
resultados de los filtros usados en estimación, la organización de los experimentos es
consistente con la explicada en la sección 5.1.3.

Experimento 5: el ruido aditivo, tiene las siguientes características


'
1 0, 0.1, 0.1, 0, 0
2
estado1 0 0 0 0 0.04 0 0 0 0
2
0 estado 2 0 0 0 0 0.25 0 0 0
2
R1 0 0 estado 3 0 0 0 0 0.25 0 0
2
0 0 0 estado 4 0 0 0 0 0.01 0
2
0 0 0 0 estado 5
0 0 0 0 0.01
158
'
2 0, 0
2
salida1 0 0.0625 0
R2 2
0 salida 2
0 0.0625

y las componentes w t y v t , tienen la forma:


w t B z (t ) z (t 1) R1 ( 1 , R1 ) , con B n, Np, z (t ) z (t 1) dónde
z(t ) p( z(t ) z(t 1)), z(t ) U a, b .
Y v t ( 2 , R2 ) donde el símbolo (~) significa "distribuido de acuerdo a" y
, R2 ) significa “distribución Gaussiana multivariable de media
( 2 2
2
y
matriz de covarianza R2 2 2

Resultados:

Se realizaron 15 pruebas con el filtro de partículas, para células de Z.m a diferentes


números de partículas y esquemas de re muestreo como se referencia en la Tabla 5.7.
En las Figura. 5.10. a b c d se observa que el filtro no sigue bien el modelo, el cual, de
acuerdo con los parámetros de la fermentación experimental de (Raposso et al, 2005),
se convierte en otro modelo diferente, que entrega buenos resultados. Los datos
marcados con * son los datos reales de esas experimentaciones. Se grafican para que
hacer una comparación con el trabajo de modelado. Debe resaltarse que se usan dos
tipos de datos reales para la prueba con este filtro.

3
Estimación de células de Z.m
Concentración Biomasa [g/L]

Filtro
2.5 Interpolación de Datos Reales
Datos Reales
2

1.5

0.5
0 10 20 30 40 50 60 70 80 90
Tiempo [Horas]
Figura. 5.10 a. Estimación de Biomasa experimento 5 usando 10 partículas y
re muestreo residual
159

Estimación de células de Z.m


Concentración Biomasa [g/L]

3.5
Filtro
3 Interpolación de Datos Reales
Datos Reales
2.5

1.5

0.5
0 10 20 30 40 50 60 70 80 90 100
Tiempo [Horas]
Figura. 5.10 b. Estimación de Biomasa experimento 5 usando 10 partículas y
re muestreo multinomial
3
Estimación de células de Z.m
Concentración Biomasa [g/L]

Filtro
2.5 Interpolación de Datos Reales
Datos Reales
2

1.5

0.5
0 10 20 30 40 50 60 70 80 90
Tiempo [Horas]
Figura. 5.10 c. Estimación de Biomasa experimento 5 usando 10 partículas y
re muestreo determinístico
Estimación de células de Z.m
Concentración Biomasa [g/L]

3.5
Filtro
3 Interpolación de Datos Reales
Datos Reales
2.5

1.5

0.5
0 10 20 30 40 50 60 70 80 90
Tiempo [Horas]
Figura. 5.10 d. Estimación de Biomasa experimento 5 usando 100 partículas
y re muestreo multinomial
Figura. 5.10. a. b. c. d. Experimento 5. La línea discontinua describe la concentración
de biomasa estimada por el filtro SIR y la línea punteada el valor de la interpolación
160

de los datos reales. Los datos reales se muestran como asteriscos. Esta prueba contiene
desviación de la media de los términos de difusión.

A continuación en la Tabla 5.7 se muestran los tiempos de cómputo del algoritmo


(Intel Core 2 duo T5600@ 1.83 Ghz 2GB RAM), para diferentes números de
partículas y esquemas de re muestreo. Según la tabla, puede verse que se demora,
aproximadamente entre 30 segundos (10 partículas) a 45 minutos (1000 partículas),
por cada tiempo de muestreo de 0.1 horas en simulación.

Numero Re muestreo Re muestreo Re muestreo


de Residual Determinístico Multinomial
partículas (min) (min) (min)
10 0.4988 0.4834 0.5830
50 2.3313 2.3148 2.3236
100 4.6159 4.5748 4.5851
500 Mal 22.44 22.4712
1000 44.9500 45.2446 Mal 45.700 Mal
Tabla 5.7. Tiempo de cómputo en minutos para cada ejecución del proceso de
estimación experiencia 5.

Los experimentos marcados como Mal en la Tabla 5.7 presentaron problemas de


estimación ya que en algún punto de la simulación, se presentó sobreflujo o la
estimación tendió hacia infinito.

Experimento 7: El ruido aditivo, tiene las siguientes características

'
1 0, 0, 0, 0, 0
2
estado1 0 0 0 0 0.04 0 0 0 0
2
0 estado 2 0 0 0 0 0.04 0 0 0
2
R1 0 0 estado 3 0 0 0 0 0.04 0 0
2
0 0 0 estado 4 0 0 0 0 0.01 0
2
0 0 0 0 estado 5
0 0 0 0 0.01

'
2 0, 0
2
salida1 0 0.0625 0
R2 2
0 salida 2
0 0.0625
161

y las componentes w t y v t , tienen la forma


w t B z (t ) z (t 1) R1 ( 1 , R1 ) , con B n, Np, z (t ) z (t 1) dónde
z(t ) p( z(t ) z(t 1)), z(t ) U a, b .
Y v t ( 2 , R2 ) donde el símbolo (~) significa "distribuido de acuerdo a" y
( , R2 ) significa “distribución gaussiana multivariable de media
2 2
2
y
matriz de covarianza R2 2 2

Igualmente, se realizaron 15 pruebas con el filtro de partículas con la configuración


anterior de los modelos de perturbación, para células de Z.m a diferentes números de
partículas y esquemas de re muestreo. En las Figura 5.11 se puede observar que el
filtro sigue bien el modelo, parametrizado según (Raposso et al, 2005) con el conjunto
adecuado para los datos de la fermentación experimental de (Daugulis et al, 1997).
Las fermentaciones en continuo tienen esas características al cambiar las Condiciones
Iniciales, y se reflejan en estos parámetros de modelo.

En la Tabla 5.8 se presentan los tiempos de cómputo del algoritmo (Intel Core 2 duo
T5600@ 1.83 Ghz 2GB RAM), para distintos números de partículas y esquemas de re
muestreo, ilustrando los casos de rendimiento del algoritmo. Igualmente se usaron dos
tipos de series de datos reales para las pruebas de estimación por filtro.

Numero Re muestreo Re muestreo Re muestreo


de partículas Residual Determinístico Multinomial
10 0.6497 0.6554 0.7728
50 3.1026 3.0876 3.0746
100 6.1467 6.1255 6.15
500 30.79 30.7588 30.5231
1000 61.6689 60.7491 60.6271
Tabla 5.8. Tiempo de cómputo en minutos para cada ejecución del proceso de
estimación prueba 7.
162

Estimación de células de Z.m


Concentración Biomasa [g/L]

3
Filtro
Interpolación de Datos Reales
2.5 Datos Reales

1.5

10 20 30 40 50 60 70 80
Tiempo [Horas]
a. Estimación de Biomasa experimento 7 usando 10 partículas y re muestreo
residual
Estimación de células de Z.m
Concentración Biomasa [g/L]

3.5 Filtro
Interpolación de Datos Reales
3 Datos Reales
2.5

1.5

0.5
0 10 20 30 40 50 60 70 80 90 100 110
Tiempo [Horas]
b. Estimación de Biomasa experimento 7 usando 10 partículas y re muestreo
multinomial
Estimación de células de Z.m
Concentración Biomasa [g/L]

2.5

1.5

Filtros
1 Interpolación de Datos Reales
Datos Reales
10 20 30 40 50 60 70 80
Tiempo [Horas]
c. Estimación de Biomasa experimento 7 usando 10 partículas y re muestreo
determinístico
163

Estimación de células Z.m


Concentración Biomasa [g/L]

3
Filtro
Interpolacion de Datos Reales
2.5 Datos Reales

1.5

10 20 30 40 50 60 70 80
Tiempo [Horas]
d. Estimación de Biomasa experimento 7 usando 100 partículas y re muestreo
determinístico

Figura. 5.11. a. b. c. d Experimento 7. La línea discontinua describe la concentración


de biomasa estimada por el filtro SIR y la línea punteada el valor de la interpolación
de los datos reales. Los datos reales se muestran como asteriscos. Esta prueba contiene
desviación de la media de los términos de difusión.
Valor de la estimación de biomasa y los datos reales durante 150 horas en una
simulación con 0.1 horas de tiempo de muestreo.

La concentración de biomasa mostrada en las Figura 5.10 y 5.11 presentan el valor


obtenido y los errores de estimación. Los resultados son satisfactorios más allá de las
expectativas de la prueba y pueden reflejar correctamente el comportamiento
oscilatorio de la población bacteriana, teniendo en cuenta que el modelado de
incertidumbre no es muy complejo. En los tiempos 60-65 horas se presenta una
desviación grande de la estimación de los valores reales, esto se debe a que el modelo
de perturbación es simple. es de notoria importancia que este comportamiento sugiere
el uso de un modelo de incertidumbre mas complejo para aumentar el desempeño del
filtro (este tema se verá en la sección 5.2)

Resultados:

Se realizaron modificaciones a las características de los modelos de incertidumbre


usados hasta el momento; como resultado fue posible observar como incrementa la
influencia del modelo de difusión y además usando el esquema de re muestreo
Multinomial, se pueden alcanzar mejores resultados respecto a los primeros.

Experimento 9: Donde el ruido aditivo tiene las siguientes características


'
1 0, 0, 0, 0, 0
164
2
estado1 0 0 0 0 0.0001 0 0 0 0
2
0 estado 2 0 0 0 0 0.0025 0 0 0
2
R1 0 0 estado 3 0 0 0 0 0.0025 0 0
2
0 0 0 estado 4 0 0 0 0 0.01 0
2
0 0 0 0 estado 5
0 0 0 0 0.01
'
2 0, 0
2
salida1 0 0.0625 0
R2 2
0 salida 2
0 0.0625

y las componentes w t y v t , tienen la forma


w t B z (t ) z (t 1) R1 ( 1 , R1 ) , con B n, Np, z (t ) z (t 1) dónde
z(t ) p( z(t ) z(t 1)), z(t ) U a, b .
Y v t ( 2 , R2 ) donde el símbolo (~) significa "distribuido de acuerdo a" y
, R2 ) significa “distribución gaussiana multivariable de media
( 2 2
2
y
matriz de covarianza R2 2 2

Las Figuras 5.12 presentan los resultados del experimento 9 donde se incluyen
también las variables de inhibición presentes en el comportamiento dinámico de la
bacteria Z.m. Esos valores son importantes en el sentido de la información que
proporcionan acerca de el efecto del cambio de la concentración de etanol en el
bioreactor. El filtro tiene un buen desempeño en la posible estimación de estas
variables a partir de datos ruidosos de las mediciones de sustrato y producto. En la
Tabla 5.9 se resumen los tiempos de cómputo del algoritmo (Intel Core 2 duo
T5600@ 1.83 Ghz 2GB RAM), para los diferentes números de partículas (desde 10
hasta 1000) y esquemas de re muestreo. Según la tabla, puede verse que se demora,
aproximadamente entre 40.32 segundos (10 partículas) a 61.3448 minutos (1000
partículas), por cada tiempo de muestreo de 0.1 horas en simulación.

Número Re muestreo Re muestreo Re muestreo


de partículas Residual Determinístico Multinomial
10 0.6794 0.6721 0.7670
50 3.0849 3.0802 3.0790
100 6.1523 6.1198 6.1344
500 30.3520 30.6531 30.7147
1000 61.3448 60.3180 61.3097
Tabla 5.9. Tiempo de cómputo en minutos para cada ejecución del proceso de
estimación experiencia 9.
165

4 Estimación de células Z.m


Concentración Biomasa [g/L]

3.5 Filtro
Interpolación de Datos Reales
3 Datos Reales
2.5

1.5

0.5
0 10 20 30 40 50 60 70 80 90 100
Tiempo [Horas]
a. Estimación de Biomasa experimento 9 usando 10 partículas y re muestreo
multinomial
Estimación de células de Z.m
Concentración de Biomasa [g/L]

3.5
Filtros
3 Interpolación de Datos Reales
Datos Reales
2.5

1.5

0.5
0 10 20 30 40 50 60 70 80 90
Tiempo [Horas]
b. Estimación de Biomasa experimento 9 usando 50 partículas y re muestreo
determinístico
Estimación de células de Z.m
Concentración de Biomasa [g/L]

3
Filtro
Interpolación de Datos Reales
2.5 Datos Reales

1.5

10 20 30 40 50 60 70 80
Tiempo [Horas]
c.
Estimación de Biomasa experimento 9 usando 100 partículas y re muestreo
multinomial
Figura. 5.12. a. b. c. Experimento 9. La línea discontinua describe la concentración de
biomasa estimada por el filtro SIR y la línea punteada el valor de la interpolación de
los datos reales. Los datos reales se muestran como asteriscos.
166

Se observó que al aumentar el número de partículas a 100 y usando el esquema de re


muestreo determinístico, los errores tienden a aumentar (al máximo de 0.1 al fin de la
estimación), respecto a la prueba presentada anteriormente. En comparación con el
esquema anterior, usando el mismo tipo de re muestreo se encontró un detalle
particular: al disminuir considerablemente el número de partículas (100 partículas), la
estimación no mejora; lo que nos permite proponer como hipótesis que
independientemente del número de partículas usadas para resolver este problema, la
mayor influencia sobre la calidad de la solución la ejercen los términos de difusión y
el esquema de re muestreo usado.

Experimento 11: Donde el ruido aditivo, tiene las siguientes características

'
1 0, 0, 0, 0, 0
2
estado1 0 0 0 0 1 0 0 0 0
2
0 estado 2 0 0 0 0 1 0 0 0
2
R1 0 0 estado 3 0 0 1.0e 4 0 0 1 0 0
2
0 0 0 estado 4 0 0 0 0 1 0
2
0 0 0 0 estado 5
0 0 0 0 1
'
2 0, 0
2
salida1 0 0.0625 0
R2 2
0 salida 2
0 0.0625

y las componentes w t y v t , tienen la forma


w t B z (t ) z (t 1) R1 ( 1 , R1 ) , con B n, Np, z (t ) z (t 1) dónde
z(t ) p( z(t ) z(t 1)), z(t ) U a, b . Y v t ( 2 , R2 ) donde el símbolo (~)
significa "distribuido de acuerdo a" y , R2 ) significa “distribución gaussiana
( 2

multivariable de media 2
2
y matriz de covarianza R2 2 2

La concentración de biomasa de la prueba 11 se muestra en las Figura 5.13. En este


experimento, se usaron dos tipos de datos reales con el fin de probar el modelo de
incertidumbre en dos fermentaciones. Puede notarse que la estimación realizada
comienza a mejorar gradualmente en comparación con los resultados anteriores.
167

La Tabla 5.10 resume los tiempos de cómputo del algoritmo, para diferente número de
partículas y esquemas de re muestreo. Según la tabla, puede verse que se demora,
aproximadamente entre segundos (10 partículas) a segundos (1000 partículas), por
cada tiempo de muestreo de 0.1 horas en simulación. Las pruebas fueron realizadas
con un procesador inferior a las de los experimentos 1-10, las características del
sistema son: 192 MB de RAM, AMD sempron 2200+. En las pruebas marcadas con
no, se presentaron interrupcoines en el algoritmo dado que no se terminó la prueba por
limitaciones de hardware. Consecuente con esto, los tiempos de cómputo del
algoritmo aumentaron:

Número Re muestreo Re muestreo Re muestreo


de partículas Residual Determinístico Multinomial
10 2.4482 2.4485 2.8760
50 6.4771 5.8086 5.7912
100 11.3010 11.2901 11.2953
500 55.4495 55.2029 55.2497
1000 651.3016 no no
Tabla 5.10. Tiempo de cómputo en minutos para cada ejecución del proceso de
estimación experiencia 11.

Estimación de células de Z.m


Concentración de Biomasa [g/L]

3.5 Filtro
Interpolación de Datos Reales
3 Datos Reales
2.5

1.5

0 10 20 30 40 50 60 70 80
Tiempo [Horas]
a. Estimación de Biomasa experimento 11 usando 10 partículas y re muestreo
residual
168

Estimación de células de Z.m


Concentración de Biomasa [g/L]

3.5 Filtro
Interpolación de Datos Reales
3
Datos Reales
2.5

1.5

10 20 30 40 50 60 70 80
Tiempo [Horas]
b. Estimación de Biomasa experimento 11 usando 10 partículas y re muestreo
determinístico
Estimación de células de Z.m
Concentración de Biomasa [g/L]

3.5 Filtro
Interpolación de Datos Reales
3
Datos Reales
2.5

1.5

0.5
0 10 20 30 40 50 60 70 80 90 100
Tiempo [Horas]
c. Estimación de Biomasa experimento 11 usando 10 partículas y re muestreo
multinomial.
Estimación de células de Z.m
Concentración de Biomasa [g/L]

3.5 Filtro
Interpolación de Datos Reales
3 Datos Reales

2.5

1.5

0.5
0 10 20 30 40 50 60 70 80 90
Tiempo [Horas]
d. Estimación de Biomasa experimento 11 usando 50 partículas y re muestreo
determinístico
Figura. 5.13. a. b. c. d. Experimento 11. La línea discontinua describe la
concentración de biomasa estimada por el filtro SIR y la línea punteada el valor de la
interpolación de los datos reales. Los datos reales se muestran como asteriscos.
169

Experimento 3: Donde el ruido aditivo tiene características de alta potencia con


medias negativas desviadas lejos del valor real de los estados. Este tipo de
perturbación se realizó para probar la sensibilidad del filtro.

'
1 0, 0.5, 0.5, 0, 0
2
estado1 0 0 0 0 0.04 0 0 0 0
2
0 estado 2 0 0 0 0 0.25 0 0 0
2
R1 0 0 estado 3 0 0 0 0 0.25 0 0
2
0 0 0 estado 4 0 0 0 0 0.01 0
2
0 0 0 0 estado 5
0 0 0 0 0.01

'
2 0, 0
2
salida1 0 0.0625 0
R2 2
0 salida 2
0 0.0625

y las componentes w t y v t , tienen la forma


w t B z (t ) z (t 1) R1 ( 1 , R1 ) , con B n, Np, z (t ) z (t 1) dónde
z(t ) p( z(t ) z(t 1)), z(t ) U a, b . Y v t ( 2 , R2 ) donde el símbolo (~)
significa "distribuido de acuerdo a" y , R2 ) significa “distribución gaussiana
( 2

multivariable de media 2
2
y matriz de covarianza R2 2 2

Las condiciones sobre las cuales se diseño este experimento, permiten predecir que la
estimación no será satisfactoria. Este experimento se realizó con el fin analizar la
sensibilidad del filtro a las características de la componente estocástica. En la Figura
5.14 pueden verse los resultados.
170

Estimación de Z.m
Concentración de Biomasa [g/L]

3
Filtro
2.5 Interpolación Datos reales
Datos Reales
2

1.5

0.5

0
0 10 20 30 40 50 60 70 80 90
Tiempo [Horas]
Figura. 5.14. Estimación de Biomasa, las líneas continuas son las de la interpolación
de los datos reales, las líneas punteadas corresponden a la estimación del filtro. Los
modelos de perturbación tienen media cero en el término de difusión y una potencia
alta de ruido correspondiente a la prueba 3.

Observaciones generales:

La necesidad de desarrollar una metodología para la implementación correcta de los


filtros de partículas en los sistemas no lineales, radica en las particularidades que esos
sistemas tienen; estas características hacen realmente difícil la tarea de caracterizarlos
y también de encontrar una vía de solución correcta a esos casos particulares. Dentro
de la técnica de filtrado de partículas usando el muestreo de importancia, es
importante considerar que para lograr el objetivo es necesario proponer una función de
importancia adecuada, y el diseñador del filtro debe elegirla dependiendo del caso
puntual. Lo que hace que aproximar las densidades de filtrado (funciones de densidad
objetivo), sea extremadamente cercano a la efectiva o negativa elección de la función
de importancia por parte de el diseñador. Un hecho que es remarcable de esta
aplicación es que el filtro sigue propiamente el modelo, y como aproximación al
problema real se probó su desempeño para una implementación en línea.

Para aplicar la metodología de métodos secuenciales de Monte Carlo, precisamente el


filtrado de partículas, fue necesario asumir un modelo de datos muestreados para las
ecuaciones diferenciales estocásticas de esta manera el conjunto de ecuaciones se
planteó como un modelo nuevo y mejorado, que incluye incertidumbres y
perturbaciones. Los filtros SIR son satisfactorios pero aunque esta sea una aplicación
nueva de los métodos secuenciales de Monte Carlo, podría requerir un métodos
secuencial a la solución de problema real (Briers, 2004), (Briers, 2005), (Briers,
2006), (Klaas et al, 2006). Posteriormente se explorará la posibilidad de implementar
un filtro desarrollado por Mark Briers en su tesis doctoral (Briers, 2006), para la
comparación con los filtros básicos implementados.
171

Las Figuras 5.15 muestran los resultados de la prueba 4 en la cual se usó un ruido de
baja potencia como perturbación de las medidas. Es importante recalcar que los filtros
de partículas pueden no ser aplicados a sistemas con perturbaciones de bajo ruido. En
comparación con los demás métodos de estimación reportados para este proceso
fermentativo, los filtros implementados satisficieron las expectativas y se encontró que
fueron superiores, inclusive en lazo abierto bajo las condiciones más altas de
oscilación.

Estimación de Z.m
Concentración de Biomasa [g/L]

3.5 Filtro
Dato Real
3

2.5

1.5

0.5
0 10 20 30 40 50 60 70 80 90 100 110
Tiempo [Horas]
a. Concentración de Biomasa estimada en la prueba 4 con baja potencia en la
componente de ruido.
Inhibición Z
0.5
Filtro SIR
0.4 Real

0.3

0.2

0.1

10 20 30 40 50 60 70 80 90 100 110
Tiempo [Horas]
b. Estimación de la variable de Inhibición Z
172

Inhibición I
1.5

Filtro SIR
1 Real

0.5

-0.5

-1
0 10 20 30 40 50 60 70 80 90 100 110
Tiempo [Horas]
c. Estimación de la variable de Inhibición I
Figura 5.15. Resultados de la prueba 4 en la cual se usó un ruido de baja potencia
como perturbación de las medidas

Prueba de estimación de entradas:

A continuación se verán los resultados de una prueba de estimación de entradas,


usando menor información de la que se obtuvo con la interpolación de los datos. Este
procedimiento se realizó, con el fin de lograr que el estimador continúe siendo
confiable, inclusive en el caso especial en el que los datos de entrada al filtro se
pierdan por varios tiempos de muestreo, simulando perdida de información cuando un
sensor esta desconectado o fuera de servicio; o solo en casos en que la medida
disponible sea solo sustrato o producto. Los resultados que se presentan en la Figura
5.16 muestran el buen desempeño del filtro en casos de pérdida de información. Esta
característica puede ser explotada y usada en optimización, control y procesos de
información.

Las variables ambientales como temperatura y presión están generalmente bien


controladas en cualquier aplicación de biotecnología, y garantizan buenas condiciones
operacionales para la fermentación, esta es la razón por la cual no se tiene en cuenta
en este trabajo. La importancia de esta aplicación también radica en la necesidad de
observar detenidamente un proceso fermentativo, teniendo en cuenta las variables
biotecnológicas, para alcanzar una producción exitosa de etanol. Un reto importante y
una meta interesante para los ingenieros de control es alcanzar un nivel alto de
confianza en los resultados de un estimador y cerrar efectivamente el lazo de control
para las trayectorias óptimas de biomasa, sustrato y producto. Esa idea ha sido
estudiada en simulación (Quintero et al, 2007) (Quintero et al, 2008b) y será
presentada en el capítulo siguiente en el cual se desarrolla una serie de controladores
basados en métodos numéricos que se pondrán en lazo cerrado con el estimador.
173

Estimación de Producto
Concentración de Etanol [g/L]

110

100 Filtro
Interpolación de Datos reales
90 Datos reales
80

70

60

50

40
0 10 20 30 40 50 60 70 80 90
Tiempo [Horas]
a. Estimación de producto, en línea continua los datos de la interpolación de los
datos reales, en punteado las estimaciones del filtro

Estimación de Sustrato
Concentración de Glucosa[g/L]

120
Filtro
100 Interpolación de Datos reales
Datos reales
80

60

40

20

0
0 10 20 30 40 50 60 70 80 90 100 110
Tiempo [Horas]
b. Estimación de sustrato, en línea continua los datos de la interpolación de los
datos reales, en punteado las estimaciones del filtro
Figura. 5.16. Estimación de entradas. a) Estimación de producto, en línea continua los
datos de la interpolación de los datos reales, en punteado las estimaciones del filtro b)
Estimación de sustrato, en línea continua los datos de la interpolación de los datos
reales, en punteado las estimaciones del filtro.
174

5.2 Aplicación en un bioreactor por lotes (batch) para producción δ-endotoxinas


de bacillus thurin-giensis (bt)

Como se mencionó anteriormente, los procesos biotecnológicos son retos desde el


punto de vista del control, pero como primer paso para un control exitoso, se debe
garantizar la mayor observabilidad del sistema dinámico en cuestión. A diferencia del
anterior, este proceso se desarrollará en el sistema por lotes (batch) y las dinámica a
observar es la cantidad de oxígeno disuelto para llevar a cabo el proceso biológico de
producción de δ-endotoxinas a partir de Bacillus thurin-giensis (Bt).

Este microorganismo requiere una fuente de carbono, aminoácidos y algunas sales


para incrementar el crecimiento y la producción de los cristales proteicos pero no es
muy exigente en cuanto al pH en su crecimiento. Crece adecuadamente en valores
entre 5.5 y 8.5, (pH óptimo entre 6.5 y 7.5). Puede crecer desde los 15ºC hasta los
45ºC pero la temperatura óptima se sitúa entre 26ºC y 30ºC.

Por su parte la planta consiste en un reactor de tanque agitado con volumen nominal
de 20 litros. Las fermentaciones se desarrollaron en 11 litros de medio de cultivo
(volumen efectivo) y se inocularon al 10% (v/v) con el cultivo de Bt. Mediante lazos
de control tipo ON/OFF se mantiene la temperatura alrededor de 30ºC y el pH entre
6.5– 8.5. Se evita la formación de espuma con el agregado de antiespumante. El flujo
de aire se fija en 22 (litros.min-1). Los valores de porcentaje de OD, pH y temperatura
(T) se registran durante toda la fermentación. La fermentación se suspende cuando
presenta 90% o más de lisis celular.

5.2.1 Modelo fenomenológico del bioproceso

A continuación se presenta un modelo fenomenológico del proceso propuesto por


(Atehortua et al, 2005), (Atehortua et al, 2006), éste es una modificación y corrección
al modelo de (Rivera et al, 1999).

Balance total de masa

dV
Fin F fresh.means FR Fout (3.14)
dt

Balance de células vegetativas

dX v FR Fin F fresh.means FR
X v, R Xv ks ke X v (3.15)
dt V V

Balance de células esporuladas


175

dX s FR Fin F fresh.means FR
X s,R Xs ks X v kl X s (3.16)
dt V V

Balance de células totales. Suma de (5.16) y (5.17)

dX FR Fin F fresh.means FR
XR X Xv ke X v kl X s (3.17)
dt V V

Velocidad de crecimiento específica (Monod)

Sp
max
(3.18)
Ks Sp

Balance de sustrato primario

dS p Fin Ff resh.means F fresh.means


Sp Sp ms X v (3.19)
dt V V fresh.means Yx / s

Donde: F es flujo volumétrico, S p es la concentración de sustrato primario, S s es la


concentración de sustrato secundario, V es el volumen, X v es la concentración de
células vegetativas, X s es la concentración de células esporuladas, X es la
concentración de células totales, es la densidad, k s es la velocidad especifica de
esporulación, k l es la velocidad específica de lisis, k e es la velocidad específica de
muerte, K s es la constante de saturación de sustrato, YX / S es el coeficiente de
rendimiento biomasa-sustrato. Además se utilizan los siguientes subíndices: in son las
corrientes de entrada de reactivos, fresh means es la corriente de entrada de medio
fresco, R son las corrientes de reciclo del filtro, F son corrientes provenientes del
filtro, out son corrientes de salida.

En (Amicarelli et al, 2005) se hizo el modelado de las dinámicas del proceso desde el
punto de vista fenomenológico, en este trabajo se parte del balance general de OD en
el medio de cultivo. La ley de conservación puede aplicarse a la masa total del sistema
o a la de cualquier componente individual que pertenezca a éste.

Velocidad de Acumulación o Disminución dentro del Sistema = Velocidad de Entrada


– Velocidad de Salida + Velocidad de Generación – Velocidad de Consumo
176

En lo que sigue, se analizan los distintos casos:

a. Proceso continuo: Realizando este balance para el Oxígeno Disuelto en fase


líquida se tiene:

d (V COD ) (3.20)
Fin CODin Fout COD V rg V rc
dt

Donde: rg es la velocidad de transferencia de O2 a la fase gaseosa y rc es la velocidad


de consumo de O2 en el bioreactor. Por otra parte el volumen de cultivo variará en el
tiempo según sean Fin y Fout de la ecuación general

dV (3.21)
Fin Fout
dt

b. Proceso por lotes Alimentado (fed - batch): el caudal de salida es nulo Fout=0
por lo que V aumentará en el tiempo en función del caudal de entrada
dV/dt=Fin. La ecuación (5.21) queda:

d (V C OD ) (3.22)
Fin C ODin V (rg rc )
dt

V Permanece dentro del operador diferencial porque varía con el tiempo. El proceso
por lotes alimentado, a diferencia del caso anterior, tiene duración limitada ya que el
volumen no puede incrementarse más allá del volumen útil que posee el bio reactor.

c. Por lotes (batch): ambos caudales son nulos Fin=Fout=0 por lo que los dos
primeros términos de la ecuación (5.21) desaparecen y dV/dt=0.

d (COD ) (3.23)
(rg rc )
dt

La duración del cultivo por lotes es también limitada y depende de las condiciones
iniciales del cultivo. Una vez inoculado el medio, la concentración de biomasa
aumenta a expensas de los nutrientes y cuando el sustrato que limita el crecimiento se
agota, finaliza el lote.

Sólo una parte del caudal de aire (N2 y O2 pero el de interés es el Oxígeno),
introducido en los reactores se disuelve en el medio, dependiendo de la eficiencia de
los elementos de aireación y de la proximidad a la concentración de saturación del O2
en el medio líquido (COD* ) . Esto se evidencia en el modelo de la forma:
177

rg K3 QA (COD * COD ) (3.24)

Donde: K 3 es la constante de aireación (litro-1), medida de la capacidad de un bio


reactor para suministrar O2, COD es la concentración de OD en el medio, (g.litro-1),
COD* es la concentración de equilibrio de O2 (concentración de OD en equilibrio con
la presión parcial de oxígeno de la fase gaseosa). (g.litro -1) y Q A es el caudal de aire
que ingresa al Bioreactor (litro.min-1).

Término de Consumo de Oxigeno:

dXv (3.25)
rc K1 K2 X v
dt

Donde dXv / dt : es el cambio en la concentración de células vegetativas presentes en


el medio, que consumen oxígeno, X v es la concentración de células vegetativas, K1 es
la constante de consumo de oxígeno por crecimiento y K 2 es la constante de consumo
de oxígeno para mantenimiento. En la Tabla 5.11. se presenta un resumen de la
dinámica de OD para los diferentes tipos de cultivo.

Tipo de cultivo Modelo propuesto para Dinámica de Oxígeno Disuelto (OD)

Continuo dCOD K1 dX v K2
V F (CODin COD ) V [ K3 QA (COD * COD )] [ ( ) Xv]
dt Yx / O2 dt Yx / O2
FedBatch d (V C OD ) K dX v K2
Fin C ODin V [ K 3 Q A (C OD * C OD )] [( 1 ) Xv]
dt Yx / O2 dt Y x / O2
Batch d (COD ) K dX v
[( K 3 QA (COD * COD ))] [ 1 K2 X v ]
dt Yx / O2 dt
Tabla 5.11. Dinámica del Oxígeno Disuelto

En la práctica se utiliza el concepto de concentración crítica (Cc) de OD que es la


concentración por encima de la cual la velocidad específica de consumo es
independiente de la concentración de O2 disuelto. Por lo tanto, el crecimiento de
microorganismos no está limitado por O2. La Cc de O2 para la mayoría de los
microorganismos está entre 0.1-1mg.litro-1. Valores relativamente bajos si se compara
con el de la solubilidad del O2, que a 30°C en medios acuosos diluidos es
178

aproximadamente 7.8 mg.litro-1. Esto podría hacer suponer que no constituye un


problema satisfacer los requerimientos de O2, pero lo que realmente ocurre es que en
poco tiempo (dependiendo del proceso) el crecimiento comenzará a estar limitado por
O2, y eventualmente tenderá a detenerse cuando la concentración caiga por debajo del
valor crítico, a menos que sea repuesto O2 continuamente y a una velocidad
comparable a la de consumo.

Este aspecto es fundamental en el diseño de bio reactores destinados a cultivos


aerobios, los cuales deberán ser capaces de suministrar O 2 a velocidades adecuadas.
La concentración de O2 disuelto no sólo es importante para que el modelo refleje los
efectos antes mencionados, sino además porque resulta útil para el control del proceso.
Adicionar esta dinámica al modelo del proceso significa incorporar una acción de
control más, ganando un grado de libertad. En este caso no se tiene un control de OD
por lo tanto el O2 aunque esté en exceso, decae inclusive a valores menores que el
valor crítico y es allí donde se convierte en una dinámica importante para este proceso
en particular. El OD puede también ser utilizado para la estimación de
microorganismos en el caldo de cultivo, siempre que se conozca el consumo de O2
característico del microorganismo presente.

Consideraciones:

Frecuentemente, una fuente de perturbaciones en este tipo de sistemas son las


variaciones de la corriente de sustrato que alimenta al proceso (o parámetros
constantes cuyas variaciones decrementan lote a lote). Para propósitos de estimación,
la incertidumbre en las condiciones iniciales o el sustrato inicial, debería ser modelada
(usualmente como variables aleatorias). Sin embargo, un grado alto en la
incertidumbre de las condiciones iniciales o un pobre modelado pueden tener como
consecuencia un mal desempeño de los estimadores, especialmente en término de la
velocidad de convergencia.

La mejor forma de manejar la incertidumbre inicial es estimar las condiciones


iniciales, teniendo en cuenta que algunas de ellas pueden ser medidas. Estimar las
perturbaciones en las condiciones iniciales puede ser beneficioso para el monitoreo
de la condición real de los procesos por lotes, así como también, la reducción de las
incertidumbres iniciales de los lotes subsecuentes, para los casos en los cuales se
presentan alimentaciones persistentes (lotes en cadena).

Estimar correctamente las condiciones iniciales de un proceso por lotes, puede


permitir la convergencia mucho más rápida de los estimadores de estados a sus valores
verdaderos; lo que permite mejorar la calidad del monitoreo y del control. Desde el
punto de vista de control la velocidad de convergencia de los estimadores es muy
importante, en términos de una fracción de la longitud del tiempo total del proceso por
lotes. Típicamente, existe una ventana pequeña de tiempo, para acciones de control
179

efectivas si los estimadores no han presentado convergencia al final de esta ventana,


los controladores no podrán realizar acciones efectivas y el proceso, podría perderse.
En síntesis, los procesos por lotes poseen estados transitorios que nunca alcanzan
equilibrio y la calidad de la estimación de los estados depende de estimar rápida y
adecuadamente las condiciones iniciales. Esto último esencialmente es un problema de
suavizado no lineal.

Desde el punto de vista estocástico (Rossi y Vila, 2005) propusieron una formulación
como un problema de filtrado. Los términos estocásticos se introducen en las
dinámicas, en las medidas y en las condiciones iniciales. El objeto de interés es la ley
de probabilidad condicional del estado completo dadas unas medidas ruidosas de
algunos componentes. En los trabajos de (Rossi et al, 2005), (Rossi et al 2006) se
presenta el modelamiento de incertidumbre de las dinámicas, mediante un sistema
diferencial estocástico consistente con la noción de invariante. Luego, diseñaron un
conjunto de observadores asintóticos, que usaron en conjunto con las componentes
observadas, para aproximar la ley de probabilidad de las no observadas. Los autores
mencionados, además establecieron la relevancia del modelado estocástico en la
biotecnología, lo que permite usar el “know how” existente en biología y en
optimización. Además de ello tuvieron éxito mostrando la factibilidad de usar esta
aproximación en simulaciones numéricas.

El uso de observadores de estado en procesos por lotes debe atender sobre todo a la
variabilidad e incertidumbre (estructural o paramétrica) de los mismos. Russell,
asegura que el problema de control de calidad en procesos por lotes y semi continuos
se puede reducir a la estimación de los estados del proceso a partir de las condiciones
iniciales y de las de proceso (Russell et al 2000). En el trabajo de (Dondo y Marqués,
2002) se enumeran algunas características típicas de estos procesos a tener en cuenta.
Se pueden mencionar trabajos en donde se realiza estimación de estados en
bioprocesos como (Quintero et al, 2004, 2007, 2008a), (Silveira y Molina, 2005), (Leal
et al, 1997) entre otros. Dochain, propone un observador de estados para un bioproceso
con cinética de estructura conocida y de parámetros cinéticos desconocidos (Dochain,
2002). A tal fin propone el uso de estos parámetros como parámetros extras de diseño
para garantizar un error de estado estacionario igual a cero. El autor divide a los
observadores en dos clases: los clásicos como el de Luenberger y el de Kalman y los
asintóticos. La primera clase depende completamente de la precisión del modelo, la
segunda supone que la incertidumbre del modelo radica en la cinética de los
bioprocesos. En los trabajos de (Leal et al, 1997), (Leal et al, 2001) se realiza la
estimación de biomasa en un bioproceso usando como observador diferentes redes
neuronales artificiales (RNA) y provocando luego la fusión sensorial. (Dorsey y Lee,
2003) abordaron la predicción de variables en procesos discontinuos empleando
técnicas de identificación por subespacios. De forma general, tanto en procesos
continuos como discontinuos, la incertidumbre en el modelo y los parámetros hace que
surjan los observadores asintóticos los cuales no requieren el conocimiento perfecto del
180

modelo. Pero estos observadores presentan gran dependencia de las condiciones de


operación (Dochain, 2003).

En (Amicarelli et al, 2006) se presentan algunos estimadores de biomasa para este


proceso, utilizando técnicas basadas en primeros principios y valiéndose del empleo de
redes neuronales artificiales (RNA) para obtener diferentes estimadores y luego
realizar la fusión de los mismos a través de un filtro de Kalman descentralizado. Debe
notarse que, a excepción del filtro de Kalman, estas técnicas fueron completamente
desarrolladas en un contexto determinístico. Las incertidumbres en modelado, se tienen
en cuenta únicamente a través de la variación de los parámetros, y el desempeño en
presencia de entradas o de medidas ruidosas se evalúan por medio de simulación
numérica (Joannides et al, 2005).

5.2.2 Filtrado de Partículas

Resultados:

En esta sección, se presentan los resultados obtenidos y las gráficas muestran las
estimaciones de las variables de estado que resumen el rendimiento de los filtros. Se
realizan algunas observaciones acerca del número de partículas usadas, el esquema de
re muestreo, el costo computacional y de los criterios de calificación de la efectividad
de la solución propuesta. Finalmente, se sugieren mejoras posibles de realizar sobre
esta aproximación usando técnicas avanzadas de filtrado no lineal. Estos resultados
presentan una innovación al utilizar las técnicas de filtrado no lineal no gaussiano en
bioprocesos por lotes.

De la misma forma que en la sección 5.1.3, se realizarán dos aproximaciones a la


solución del problema de estimación de estados en este bioproceso, de tal modo que
primero se presentan los resultados obtenidos en simulación y posteriormente, los
resultados obtenidos a partir de los datos reales de fermentaciones batch.

Primera Aproximación:

En la primera aproximación en simulación, se consideró que el modelo es el proceso


real, usando como salidas medibles dos de los cinco estados del proceso:
concentración de Sustrato Primario y concentración de Oxígeno Disuelto. Esto es, los
datos de concentración de Sustrato Primario y concentración de Oxígeno Disuelto se
usaron como información para la estimación de la concentración de Biomasa total
durante el proceso de fermentación.

Inicialmente se conFigurauró de modo que el modelo de simulación sirviera como


planta, usando como salidas medibles, 2 de los 5 estados del bio reactor. Debido que
el modelo utilizado no es exacto, se agregaron modelos de incertidumbre
181

independientes (iid) a los estados y a las salidas que se consideraban medibles. Se


realizaron pruebas con diferentes tiempos de muestreo, desde 0.2 horas a 1 hora para
la fermentación batch de aproximadamente 20 horas de duración. De la misma forma,
este modelo desarrollado por (Amicarelli, 2007) se uso como modelo del filtro,
completado con un modelo de mayor incertidumbre.

En la Figura. 5.17 se presenta el diagrama de bloques del estimador. Donde las señales
u(t) y y(t) correspondientes al bloque denominado “Modelo de Proceso”, alimentan el
“Modelo del Filtro” quien realiza la estimación de la biomasa (células esporuladas
mas vegetativas). Estas estimaciones son las que se comparan con las entregadas por el
modelo patrón (considerado el proceso real) (Quintero et al, 2007). Se realizaron
pruebas con diferentes tiempos de muestreo para la fermentación por lotes, de la cual
se consideran aproximadamente las 20 primeras horas.

Puede verse que al igual que en la sección 5.1.3, los términos de difusión tanto del
filtro como del modelo del proceso, fue la expresión de 1 xt , t como un ruido
gaussiano dependiente de una variable interna distribuida uniformemente, actualizada
cada instante de muestreo y partícula a partícula; en combinación de distintos ruidos
gaussianos en dwt y dw,t . Para el valor de la componente de las mediciones, se usó el
valor de 2 xt , t 1 igualmente combinado con muestras de distintos ruidos
gaussianos en las componentes de dvt y dv ,t .

ut MODELO DEL PROCESO yt


dxt f xt , t dt xt , t dwt
dyt g xt , t dt dvt

MODELO DEL FILTRO

xt 1 f xt , t dt xt , t dw,t
,
yt g xt , t dt dv t
xt

Figura. 5.17 Diagrama de Bloques del Estimador de Biomasa

En simulación (modelo de la planta-modelo del filtro) se usaron diferentes tiempos de


muestreo, para evaluar no solo el comportamiento dinámico del filtro, sino también la
dificultad de la aproximación. El parámetro a utilizar para medir la efectividad del
estimador se define como el supremo entre los valores máximo (para cada uno de los
182

esquemas de re muestreo, en la misma configuración) del valor absoluto del error


entre el estado real y el estimado, tal como se describe a continuación:

error sup( max x x ) (3.26)


remuestreo

La Tabla 5.12 resume las pruebas de la primera configuración de filtro usando el


modelo reportado por (Amicarelli et al, 2006a) resaltando la influencia del número de
partículas en la disminución o aumento del error de la aproximación sobre las
variables de interés. La Tabla 5.12 presenta los errores de estimación para algunos de
los casos en los cuales la estimación lograda es de mayor relevancia.

Muestreo 1 hora 0.5 horas


Número de partículas 100 500 100 500
C. Vegetativas 0.0011 0.0005 0.0007 0.0024
C. Esporuladas 0.0007 0.0008 0.0003 0.0011
S. Primario 0.0019 0.0010 0.0003 0.0002
S. Secundario 0.0022 0.0013 0.0003 0.0025
O. Disuelto 0.0013 0.0008 0.0011 0.0006
Tabla 5.12: Resumen del error máximo de estimación de estados en las pruebas
iniciales para Bacillus Thuringiensis

A continuación se presentan algunos resultados de la aproximación lograda mediante


la técnica de filtrado de partículas. Para la configuración inicial de la simulación se
usaron tiempos de muestreo desde 1 hora disminuyendo hasta 0.01 horas. Los
siguientes resultados se obtuvieron a partir de una simulación usando 500 partículas.
183

Estimación deBiomasa

10

9
Concentración de Células [g/l]

6
Datos de Modelo Sin incertidumbre
Filtro SIR Residual
5

3 4 5 6 7 8 9
Tiempo [Horas]

Figura. 5.18 Estimación de Biomasa con modelos en simulación y componentes de


difusión adicionadas. Tiempo de muestreo (t0) de 1 hora, re muestreo residual.
Estimación de Biomasa

11

10

9
Concentración de Células [g/l]

5 Datos de Modelo Sin incertidumbre


Filtro SIR Determinístico
4

1
2 4 6 8 10 12 14
Tiempo [Horas]
Figura. 5.19. Estimación de Biomasa con modelos en simulación y componentes de
difusión adicionadas. Tiempo de muestreo (t0) de 0.01 horas re muestreo
determinístico
184

De la Figura 5.19 puede observarse que los resultados son satisfactorios y que el
algoritmo converge para este tipo de estimación. Los esquemas de re muestreo tienen
una influencia en el tiempo de simulación, pero respecto a la calidad de los resultados,
sus variaciones no son significativas. Los resultados de las pruebas realizadas con
tiempos de muestreo más cortos (de 0.2 horas), para esquemas de re muestreo
determinístico, arrojaron el menor tiempo de ejecución del algoritmo de filtrado, para
una caracterización del ruido de medición de mayor magnitud. Las estimas logradas
son adecuadas y satisfactorias de acuerdo con la magnitud de los errores de estimación,
frente a los obtenidos con mayores tiempos de muestreo. Los siguientes resultados
mostrados en las Figuras 5.20-5.24. se obtuvieron a partir de una simulación con
tiempos de muestreo de 1 hora, usando 500 partículas

Celulas Vegetativas
0.5
Real
Filtro SIR

-0.5

-1
0 5 10 15 20 25 30
Tiempos de Muestreo
Figura. 5.20. Resultados normalizados de estimación de células vegetativas para la
prueba 7 del filtro SIR con esquema de re muestreo residual. Línea continua el modelo
considerado como real, puntos el resultado del filtro.
185
Celulas Esporuladas

Real
-0.4 Filtro SIR

-0.5

-0.6

-0.7

-0.8

-0.9

-1

5 10 15 20 25 30
Tiempos de Muestreo
Figura. 5.21. Resultados normalizados de estimación de células esporuladas para la
prueba 7 del filtro SIR con esquema de re muestreo residual. Línea continua el modelo
considerado como real, puntos el resultado del filtro.
Sustrato Primario

Real
0.8
Filtro SIR
0.6

0.4

0.2

-0.2

-0.4

-0.6

-0.8

-1

5 10 15 20 25 30
Tiempos de Muestreo

Figura. 5.22. Resultados normalizados de sustrato primario para la prueba 7 del filtro
SIR con esquema de re muestreo residual. Línea continua el modelo considerado
como real, en puntos el resultado del filtro
186

Sustrato Secundario

-0.2 Real
Filtro SIR
-0.3

-0.4

-0.5

-0.6

-0.7

-0.8

-0.9

-1

5 10 15 20 25 30
Tiempos de Muestreo
Figura. 5.23. Resultados normalizados de sustrato secundario para la prueba 7 del
filtro SIR con esquema de re muestreo residual. Línea continua el modelo considerado
como real, en puntos el resultado del filtro.
Oxigeno Disuelto
0.6

0.4

0.2

-0.2 Real
Filtro SIR
-0.4

-0.6

-0.8

-1
0 5 10 15 20 25 30
Tiempos de Muestreo

Figura. 5.24. Resultados normalizados de oxígeno disuelto para la prueba 7 del filtro
SIR con esquema de re muestreo residual. Línea continua el modelo considerado
como real, en puntos el resultado del filtro

Comentarios:

Los resultados muestran que las aproximaciones son buenas y satisfactorias, y en


relación con las magnitudes de los errores de estimación en frente a los obtenidos con
mayores tiempos de muestreo, disminuyeron. A continuación en las Figuras 5.25-
187

5.28se muestran las graficas de las superficies generadas por los errores de las pruebas
con tiempos de muestreo de 0.5 horas y 1 hora, con características de las varianzas de
las mediciones correspondientes a 0.04 y 0.25 usando 100 y 500 partículas:
Celulas Vegetativas

-3
x 10

2.5

2
Error Máximo

1.5

0.5
500
400 0.25
0.2
300 0.15
200 0.1
0.05
Particulas 100 0
Varianzas de Medida

Figura. 5.25. Superficie generada por el máximo de los errores de estimación de


células vegetativas, usando los 3 tipos de re muestreo a 0.5 horas de muestreo.
-4
x 10
Celulas Vegetativas
14

12
Error Máximo

10

0.4
0.3
0.2
0.1 200 150 100
350 300 250
500
0 450 400
Varianzas de Medida Particulas

Figura. 5.26. Superficie generada por el máximo de los errores de estimación de


células vegetativas, usando los 3 tipos de re muestreo a 1 hora de muestreo.
188
Oxigeno Disuelto

-3
x 10

1.6

1.4
Error Máximo

1.2

0.8

0.6
500
400 0.25
0.2
300 0.15
200 0.1
0.05
Particulas 100 0
Varianzas de Medida
Figura. 5.27. Superficie generada por el máximo de los errores oxigeno disuelto
usando los 3 tipos de re muestreo a 1 hora de muestreo.

Oxigeno Disuelto

-4
x 10
14

12
Error Máximo

10

600
8
400
6
200 0.25
0.2
0.1 0.15
40 0.05
Varianzas de Medida
Figura. 5.28. Superficie generada por el máximo de los errores oxigeno disuelto
usando los 3 esquemas de re muestreo a 0.5 horas de muestreo

Posteriormente, se disminuyó el tiempo de muestreo usado para la toma de las


mediciones de las salidas del bio reactor, con miras a evaluar el costo computacional
que tiene un cálculo de estas magnitudes, orientándolo hacia el análisis final que se
hará sobre los datos reales que fueron tomados con tiempos de muestreo de 0.01
189

segundos, con el fin de de evaluar su implementación en línea. Algunos resultados de


las pruebas realizadas con tiempos de muestreo más cortos, de 0.2 horas, se muestran
a continuación en las Figura 5.29 a 5.34, para esquemas de re muestreo determinístico,
con el cual se obtuvo el menor tiempo de ejecución del algoritmo de filtrado, para una
caracterización del ruido de medición de mayor magnitud. En la Figura 5.29 se
muestran los errores de estimación para la primera aproximación de la estimación de
estados en el proceso.
-3
x 10 Valor Absoluto del Error
4

3.5
Celulas Vegetativas
Celulas Esporuladas
3 Sustrato Primario
Sustrato Secundario
Oxgeno Disuelto
2.5

1.5

0.5

0
0 50 100 150
Tiempos de Muestreo

Figura. 5.29. Error en la estimación de los estados para la prueba de el filtro SIR
usando muestreo residual, a 0.2 horas de tiempo de muestreo.
Celulas Vegetativas

0.6

0.4

0.2

-0.2

-0.4
Real
-0.6 Filtro SIR

-0.8

-1
10 20 30 40 50 60 70 80
Tiempos de Muestreo
Figura. 5.30. Resultados normalizados de Células Vegetativas para la prueba del filtro
SIR usando muestreo residual, a 0.2 horas de tiempo de muestreo. Línea continua el
resultado del filtro, en puntos el modelo considerado como real.
190
Celulas Esporuladas

Real
-0.8 Filtro SIR

-0.85

-0.9

-0.95

-1

-1.05

10 15 20 25 30 35
Tiempos de Muestreo

Figura. 5.31. Resultados normalizados de Células Esporuladas para la prueba del


filtro SIR usando muestreo residual, a 0.2 horas de tiempo de muestreo. Línea
continua el resultado del filtro, en puntos el modelo considerado como real.
Sustrato Primario

0.8 Real
Filtro SIR
0.6

0.4

0.2

-0.2

-0.4

-0.6

-0.8

-1

-1.2
5 10 15 20 25 30 35 40 45 50 55
Tiempos de Muestreo
Figura. 5.32. Sustrato primario para la prueba del filtro SIR usando muestreo residual,
a 0.2 horas de tiempo de muestreo. Línea continua el resultado del filtro, en puntos el
modelo considerado como real.
191
Sustrato Secundario

-0.8 Real
Filtro SIR
-0.82

-0.84

-0.86

-0.88

-0.9

-0.92

-0.94

-0.96

-0.98
30 35 40 45 50 55 60
Tiempos de Muestreo

Figura. 5.33. Resultados normalizados de Sustrato secundario para la prueba del filtro
SIR usando muestreo residual, a 0.2 horas de tiempo de muestreo. Línea continua el
resultado del filtro, en puntos el modelo considerado como real.
Oxigeno Disuelto

0.4 Real
Filtro SIR

0.2

-0.2

-0.4

-0.6

-0.8

-1
10 20 30 40 50 60
Tiempos de Muestreo
Figura. 5.34. Resultados normalizados de Oxígeno disuelto para la prueba del filtro
SIR usando muestreo residual, a 0.2 horas de tiempo de muestreo. Línea continua el
modelo considerado como real, en puntos el resultado del filtro.

Resultados:

Los resultados muestran como las aproximaciones realizadas son buenas y


satisfactorias para ser un esquema modelo/modelo. Estas disminuyen respecto a la
magnitud de la estimación comparadas con la obtenida en tiempos de muestreo
mayores. Ahora bien, ya que el filtro resulto efectivo en simulación sometido a
variaciones en las características de difusión se presentara a continuación en la sección
5.2.2 los resultados de el trabajo más complejo en frente a los datos reales, que
representan el verdadero reto y objetivo principal de la estimación de estados.
192

5.2.3 Segunda Aproximación

En la segunda aproximación se consideraron los datos reales del proceso de


fermentación por lotes, y como modelo del filtro el modelo ampliado de (Amicarelli et
al, 2006a), y el modelo de incertidumbre desarrollado con base en el capitulo 4 de este
trabajo.

La colección de datos disponibles corresponde a un conjunto de fermentaciones de las


cuales se poseen mediciones de Oxígeno Disuelto ( OD ), Sustrato Primario ( Sp ), y
Células vegetativas ( Xv ) que fueron muestreados a diferentes velocidades, 10 por
hora para la concentración de Oxígeno Disuelto y Sustrato primario - Glucosa, 1 por
hora para la concentración de biomasa que fue cuantificada a través del método del
peso seco (fuera de línea). Se aclara que Sp y OD pueden ser medidos prácticamente
en forma continua. Dicho esto, por conveniencia se fija el tiempo de muestreo en
Ts 1 / 10 horas .

Primero se presentan los resultados de la aproximación lograda mediante la técnica de


filtrado de partículas, usando el modelo básico que se uso primero en simulación. Los
resultados son contrastados con datos reales del experimento de fermentación “A”.
Para la configuración inicial de la simulación se usaron tiempos de muestreo desde 1
hora disminuyendo hasta 0.01 horas, en caso de los datos reales correspondientes a la
fermentación.
Celulas Vegetativas
1
Real
0.8 Filtro SIR

0.6

0.4

0.2

-0.2

-0.4

-0.6

-0.8

-1
0 500 1000 1500 2000 2500 3000
Tiempos de Muestreo

Figura. 5.35. Celulas vegetativas para la prueba de el filtro SIR usando muestreo
residual, a 0.01 horas de tiempo de muestreo. Línea continua el resultado del filtro, en
puntos el modelo considerado como real.
193
Sustrato Primario
0.8
Real
0.6 Filtro SIR

0.4

0.2

-0.2

-0.4

-0.6

-0.8

-1

-1.2
200 250 300 350 400 450 500 550 600
Tiempos de Muestreo

Figura. 5.36. Sustrato primario para la prueba de el filtro SIR usando muestreo
residual, a 0.01 horas de tiempo de muestreo. Línea continua el resultado del filtro, en
puntos el modelo considerado como real.

Oxigeno Disuelto
0.8

0.6
Real
0.4 Filtro SIR

0.2

-0.2

-0.4

-0.6

-0.8

-1

-1.2
0 500 1000 1500 2000 2500 3000
Tiempos de Muestreo

Figura. 5.37. Oxígeno disuelto para la prueba de el filtro SIR usando muestreo
residual, a 0.01 horas de tiempo de muestreo. Línea continua el resultado del filtro, en
puntos el modelo considerado como real.

Resultados:

Nótese que los resultados no son satisfactorios como se desearía y que es necesario
hacer ajustes para lograr unos resultados más confiables y de mayor precisión, es por
esto que se realizó más cuidadosamente una nueva aproximación, más compleja de
acuerdo a lo planteado en el capítulo 4.
194

La segunda configuración propuesta consiste en que el modelo, se emplea como


modelo de información incluido dentro del filtro, pero aumentado o completado por un
modelo que represente la incertidumbre entre el conjunto de datos reales, y los
resultados del modelo fenomenológico. El modelo de incertidumbre intenta disminuir
la brecha o diferencia de información que existe entre las predicciones del modelo y la
realidad, con el objetivo de mejorar la estima de la biomasa.

Para el uso del filtro de partículas como estimador de Biomasa, fue necesario utilizar
la información muestreada de Sustrato Primario y Oxígeno Disuelto, obtenidas del
experimento de fermentación “A” de 18 horas de duración y del experimento “B” de 8
horas de duración. Los datos de Oxígeno disuelto fueron tomados con una placa de
adquisición de datos cada 0.01 horas. El periodo de muestreo seleccionado
previamente como el más representativo en este tipo de sistema dinámico, es 6
minutos (0.1 hora), ya que aunque las medidas de oxígeno, son posibles de obtener a
menores tiempos de muestreo, el comportamiento dinámico en ese intervalo, no tiene
cambios significativos.

Para el modelo del sistema dinámico dentro del filtro, se usó una aproximación
discreta al comportamiento dinámico del bio reactor. En la Figura 5.38 se muestra el
esquema de información utilizado para la aproximación comparativa con los datos
reales.

u t DATOS EXPERIMENTALES y t
FERMENTACIONES BATCH
A-B-C

MODELO DEL FILTRO


CON INCERTIDUMBRE
MODELADA
xt 1 f xt , t dt INC xt , t dw,t
yt g xt , t dt dv,t

x̂ t
Figura 5.38. Diagrama de Bloques del Estimador de Biomasa

Para alcanzar el objetivo propuesto, estimación de Biomasa, se requiere un buen


conocimiento del comportamiento dinámico del sistema en estudio. Tres fuentes,
195

brindan información confiable en este caso: los primeros principios o fenomenología,


los datos empíricos de entrada/salida, y el conocimiento heurístico cualitativo y
cuantitativo del sistema. Toda la información disponible, se combina, procesa y
presenta en varias formas a través de modelos (caja blanca, series de tiempo tipo
ARMAX, fuzzy o redes neuronales, etc.). Los modelos, como tales, no logran
reproducir totalmente los mecanismos que gobiernan el comportamiento dinámico de
los sistemas y como resultado, sus predicciones no siempre son consistentes con la
realidad.

Consecuentemente, al modelo del proceso descrito anteriormente se le agregaron


modelos de incertidumbre y de perturbaciones en tiempo discreto, considerando las
incertidumbres de modelado y de ruidos de medición de diversa naturaleza. De esta
manera, el modelo se convirtió en una ecuación diferencial estocástica. De la misma
manera que en el fermentador en continuo, no se está interesado en la solución exacta
de las ecuaciones diferenciales estocásticas, pero si en las muestras que se pueden
obtener de su comportamiento simulado tomadas de un modelo. Este procedimiento se
hace con el fin de calcular la aproximación a las funciones de densidad de
probabilidad de los estados, mediante la aplicación de las técnicas de monte Carlo
para la estimación de los estados.

En este caso se focalizará en la búsqueda de un modelo de incertidumbre de las


variables del sistema que posteriormente será incluido dentro de la configuración del
filtro de partículas para la estimación de Biomasa. Respecto al modelo del bioreactor,
usado internamente en el filtro, se realizó una corrección mediante el Modelado de
Incertidumbre, con lo cual, se busco hacer una compensación entre los datos reales y el
modelo utilizado.

El modelo usado para los términos de difusión del modelo del filtro, fue una
componente 1 xt , t INC xt , t
con la estructura de la ecuación 4.6 como un modelo
ARIMA en Matlab®, construidos a partir de los errores entre los datos reales y los
datos simulados por el modelo base previamente descrito. Usando como banco de
datos tres fermentaciones “A”, “B” y “C” de diferentes duraciones y con condiciones
iniciales alrededor del mismo punto de operación, con esto se lograría tener una mayor
cercanía entre las trayectorias del proceso fermentativo. En las Figura 5.39 a 5.41
puede observarse claramente los modelos de incertidumbre desarrollados para cada
una de las fermentaciones anteriormente mencionadas.

Este modelado de incertidumbre se realizo provechando las características de los


modelos tipo ARIMA que pueden ser estacionalizadas mediante transformaciones
como la diferenciación. Además se tuvo en cuenta la componente de perturbación que
ofrecen los sensores electrónicos que se evidencian en los datos reales de oxígeno. En
la práctica puede ajustarse un modelo AR en el procedimiento de regresión múltiple.
196

Los modelos ARIMA, que incluyen términos de promedio móvil, (en inglés Moving
Average, MA), son similares a los modelos de regresión, pero no pueden ser ajustados
por métodos de mínimos cuadrados ordinarios las predicciones son funciones lineales
de los datos pasados, pero son funciones no lineales de los coeficientes, por ejemplo,
un modelo sin términos constantes es un promedio móvil ponderado
exponencialmente, en el cual las predicciones son funciones no lineales de los
parámetros de la MA.

De la Figura 5.39 puede concluirse que el modelo de incertidumbre desarrollado para


la Biomasa trata de mejorar la desviación que presenta el modelo determinístico, pero
no logra alcanzar la exactitud de los datos reales. Es de notable importancia afirmar
que dicho modelo con incertidumbre incluida permite aproximar la tendencia del
comportamiento de la colonia de bacterias, sin embargo este modelo está sujeto a las
posibles perturbaciones que sufrió el proceso real en el momento de tomar los datos de
la fermentación A. Respecto al modelo de la concentración de sustrato dentro del
reactor batch, puede afirmarse que el modelo de incertidumbre construido permite
ajustar mucho mejor el modelo a los datos reales completados mediante la técnica de
splines cubicos13. El modelo de la concentración de oxígeno disuelto mejoró
notablemente y logró eliminar los ruidos de medición que registraban los datos
experimentales.
Modelo Células Totales
12
Concentración de Biomasa [g/L]

10

4 Modelo sin Incertidumbre


Dato Real
2 Con Incertidumbre Modelada

-2
0 2 4 6 8 10 12 14 16 18
Tiempo [Horas]
a. Modelado de Incertidumbre de la concentración de Biomasa para la
fermentación A

13
Un spline es una curva definida en porciones mediante polinomios.
197

Modelo de Sustrato
40
Concentración de Sustrato [g/L]

35

30

25
Modelo sin incertidumbre
20 Dato Real
15
Con Incertidumbre Modelada

10

-5
0 2 4 6 8 10 12 14 16 18
Tiempo [Horas]

b. Modelado de Incertidumbre para la concentración de sustrato para la


fermentación A.
-3
x 10
Modelo Oxígeno
9

7
Modelo sin Incertidumbre
Dato Real
Oxígeno [g/L]

6 Con Incertidumbre Modelada


5

0
0 2 4 6 8 10 12 14 16 18
Tiempo [Horas]

c. Modelado de Incertidumbre para la concentración de oxígeno disuelto de la


fermentación A.
Figura 5.39. Modelos de Incertidumbre para las fermentaciones A

Es de notar que los datos reales del oxígeno disuelto fueron obtenidos mediante una
tarjeta de adquisición de datos, su característica ruidosa se debe a la adquisición de la
señal (ver Amicarelli, 2009).

En lo correspondiente a los modelos de incertidumbre realizados para la fermentación


B, puede afirmarse que de la Figura 5.40, los tres modelos de incertidumbre
198

desarrollados para las variables principales de proceso, permitieron que la dinámica de


la fermentación pudiera ser replicada correctamente.
Modelo de Células Totales
14
Concentración de Biomasa [g/L]

12

10

8
Modelo sin incertidumbre
6 Dato Real
Con Incertidumbre Modelada

0
0 2 4 6 8 10 12 14 16 18
Tiempo [Horas]
a. Modelado de incertidumbre para la concentración de Biomasa de la
fermentación B.
Modelo de Sustrato
35
Concentración de Sustrato [g/L]

30

25

Modelo Sin incertidumbre


20
Dato Real
Con Incertidumbre Modelada
15

10

0
0 2 4 6 8 10 12 14 16 18
Tiempo [Horas]
b. Modelado de incertidumbre de la concentración de sustrato de la fermentación
B
199

-3
x 10
Modelo Oxígeno
10

8 Modelo sin incertidumbre


Dato real
Con incertidumbre Modelada
Oxígeno [g/L]

-2
0 2 4 6 8 10 12 14 16 18
Tiempo [Horas]

c. Modelado de incertidumbre de la concentración de Oxigeno Disuelto


fermentación B
Figura 5.40. Modelos de Incertidumbre para las fermentaciones B

En las Figura 5.41 puede observarse el resultado del modelamiento de la incertidumbre


para la fermentación C, en la cual los modelos desarrollados respondieron de manera
adecuada a la comparación con los datos reales.
200

Modelo Sustrato
7
Concentración de Sustrato [g/L]

Modelo Sin incertidumbre


5
Dato real
Con incertidumbre Modelada
4

0
0 1 2 3 4 5 6 7 8
Tiempo [Horas]

x 10
-3 Modelo Oxígeno
8

6
Oxígeno [g/L]

3 Modelo sin Incertidumbre


Dato real
2 Con incertidumbre Modelada

0
0 1 2 3 4 5 6 7 8
Tiempo [Horas]
Figura 5.41. Modelos de incertidumbre para las fermentaciones C

En función de los datos arrojados por las simulaciones de las tres diferentes
fermentaciones (“A”, “B” y “C”) del modelo fenomenológico base en Simulink y los
datos reales se crearon tres tipos de modelos de incertidumbre para cada una de las
variables principales. Con dicha información se pudieron construir los modelos
ARIMA y se combinaron para encontrar el mejor modelo conjunto que pudiera ser
combinado con el modelo fenomenológico establecido.

Dadas las características de memoria infinita de los sistemas batch, y en particular la


fuerte dependencia de las condiciones iniciales de este tipo de fermentación aeróbica,
es difícil encontrar un modelo compacto que reproduzca de manera exacta tres
fermentaciones con distintas condiciones iniciales, pese a que estén alrededor del
201

mismo valor. Tuvo que tenerse en cuenta que el modelo fenomenológico estaba siendo
simulado en tiempo continuo, y que el modelo de incertidumbre debería acoplarse a la
información que éste entregaba. Luego, se tuvo en cuenta este acoplamiento de
modelos con desempeño del filtro y de los datos “muestreados” reales de las
fermentaciones.

El modelo de perturbación e incertidumbre de medición (sensores) considerado fue el


mismo que en las pruebas de simulación, es decir, el proceso estocástico definido por:

z (t ) p( z (t ) z (t 1)), z (t ) U a, b
2 xt , t p( x(t ) z (t t 1), x(t 1)) (3.27)
,
2 xt , t p( x(t ) z (t t 1), x(t 1))dw t

A continuación se presenta en la Figura 5.42 las entradas seleccionadas para el


esquema de estimación de filtrado no lineal presentado en la Figura 5.38, y la
comparación con el modelo de incertidumbre incluido de tipo ARIMA anteriormente
descrito.

Entrada para el Filtro - Sustrato

35
Concentración de Sustrato [g/lt]

30

25

20

15 Modelo sin Incertidumbre


Real
Con Incertidumbre Modelada
10

0
2 4 6 8 10 12 14 16 18

a) Tiempo [Horas]
202

x 10
-3 Entrada para el Filtro - Oxígeno Disuelto
8

Modelo sin Incertidumbre


7
Real

Concentración de Oxígeno [g/lt]


Con Incertidumbre Modelada
6

0
0 2 4 6 8 10 12 14 16 18 20

b) Tiempo [Horas]

Figura 5.42. Entradas para el estimador de Biomasa propuesto a) Concentración


de Sustrato primario (Sp) en Modelo sin incertidumbre modelada, Dato real y con
Incertidumbre Modelada. b) Concentración de Oxígeno Disuelto (OD) en Modelo sin
incertidumbre modelada, Dato real y con Incertidumbre Modelada.

En las Figura. 5.43 a 5.46 se presentan resultados de la estimación de biomasa. Se


empleó un Filtro de partículas tipo SIR con diferentes esquemas de re muestreo. La
estructura utilizada condensa el Modelo desarrollado por Amicarelli et al, 2006 y el
modelado de la incertidumbre propuesto. Para validar los resultados se usaron datos
reales completando los datos faltantes de biomasa mediante la técnica de regresión
Bayesiana de di Sciascio F, y Amicarelli A, 2008.

Estimación de Biomasa con Modelos Arima B


Fermentación Real B
15 Filtro SIR
Células[g/l]

10

0
0 2 4 6 8 10 12 14 16 18
Tiempo [Horas]
Figura 5.43. Estima de Biomasa para la fermentación B usando como modelo de
incertidumbre el construido a partir de la fermentación B
203

Estimación de Biomasa Modelo Arima C


20

15
Células[g/l]

10

Fermentación Real B
5 Filtro SIR

0
0 2 4 6 8 10 12 14 16 18
Tiempo [Horas]
Figura 5.44. Estima de Biomasa para la fermentación B usando como modelo de
incertidumbre el construido a partir de la fermentación C

Es posible hacer una estimación de la biomasa de la fermentación B, a partir del filtro


construido con el modelo estructural definido en las ecuaciones 5.15 a 5.25 y la adición
del modelo de incertidumbre de las variables del bioproceso a partir de los datos de la
fermentación B y fermentación C en las Figura 5.40 y 5.41, respectivamente. Es de
anotar que el filtro presenta valores por encima de los reales en la fase final del
transitorio desde la hora 2 a la hora 6, pero corrige los errores de estimación de manera
adecuada en las 2/3 partes finales de la fermentación, lo que hace que los resultados
sean satisfactorios. Los tiempos de cálculo del algoritmo permiten la implementación
en línea del mismo.

A continuación en las Figura 5.45 y 5.46 se presentan los resultados obtenidos en la


estimación de la concentración de Biomasa para los datos reales de le fermentación C,
en contraste con el filtro de partículas construido con los modelos de incertidumbre
desarrollados a partir de la fermentación B y fermentación C, respectivamente.

Igualmente que en la estimación para la fermentación B, los resultados son


satisfactorios y se encuentran dentro de los valores permitidos para la estimación de los
estados en bioprocesos, con esto se considera que la estimación de la concentración de
Biomasa en el proceso de producción de endotoxinas de Bacillus thuringiensis usando
filtros de partículas podría ser usada también en lazo cerrado junto con una estructura
de control, pero no será en esta tesis que se desarrolle dicho controlador.
204

Estimación Biomasa con Modelos Arima B


3.5

2.5
Células[g/l]

2
Fermentación Real C
1.5 Filtro SIR

0.5

0
0 1 2 3 4 5 6 7 8 9
Tiempo [Horas]
Figura 5.45. Estima de Biomasa para la fermentación C usando como modelo de
incertidumbre el construido a partir de la fermentación B
Estimación de Biomasa Modelos Arima C
3.5

2.5
Células[g/l]

1.5 Fermentación Real C


Filtro SIR
1

0.5

0
0 1 2 3 4 5 6 7 8 9
Tiempo [Horas]
Figura 5.46. Estima de Biomasa para la fermentación C usando como modelo de
incertidumbre el construido a partir de la fermentación C
205

Capítulo 6
CONTROLADORES BASADOS EN MÉTODOS
NUMÉRICOS PARA BIOREACTOR DE
FERMENTACIÓN ALCOHÓLICA EN
CONTINUO

Motivación

Un bioproceso típico hace referencia a reactores por lotes, semi lotes o continuos en
los cuales la materia prima se transforma en los productos biológicos deseados. En
muchas aplicaciones, los preferidos son los bio reactores en continuo, debido a su
mayor posibilidad de manejo en la operación y una alta productividad (Lee, 1992). Un
bioreactor tipo tanque continuamente agitado (continuous stirred tank bioreactor
CSTB) conocido también como fermentador en continuo, se muestra en la Figura 6.1.
Se dice en continuo ya que el medio de cultivo se suministra de forma continua al
reactor para sostener el crecimiento de la población microbiana. El medio sintético
contiene los sustratos metabolizados por las células durante la fase de crecimiento, así
como también otras componentes como minerales y sales que se necesitan para poder
reproducir un ambiente natural para los microorganismos.

El cultivo se llama aeróbico si las reacciones bioquímicas que se realizan en el


crecimiento de las células necesitan el oxígeno como reactante. En este caso debe
suministrarse una corriente de aire para mantener la concentración de oxígeno disuelto
necesario. En contraste, los cultivos anaeróbicos no necesitan el oxígeno para el
crecimiento de las células. Como característica, cada microorganismo tiene un rango
único de temperatura y pH en su cultivo con el fin de mantener el crecimiento de las
células. Un bioreactor típico tiene unos lazos simples de realimentación que
mantienen la temperatura y el pH a determinados valores de referencia que se eligen
para maximizar el crecimiento de las células (Pons, 1992).

Para mezclar continuamente los contenidos del reactor se usan agitadores y la


velocidad del agitador se elige para obtener un mezclado satisfactorio y que no sea
excesiva como para generar daño en las células (Lee, 1992). Se extrae continuamente
una corriente del reactor con el fin de alcanzar una operación a volumen constante. La
tasa a la cual se remueve el fluido se le llama la tasa de dilución, que es el reciproco
206

del tiempo de residencia del reactor. La tasa de dilución se controla con un lazo simple
de realimentación que manipula la tasa media de flujo. La corriente efluente contiene
sustrato que no reaccionó, trazas de producto y biomasa, que es una mezcla compleja
de células y varios metabolitos producidos por las células. Los productos deseados
pueden ser las células mismas, uno o más metabolitos o alguna combinación de
células y metabolitos. Los productos son separados de los otros componentes vía
series de recuperación, separación y purificación. En adición a la corriente líquida de
producto, también como bioproductos de las reacciones bioquímicas se pueden
producir gases como el dióxido de carbono.

Air

F2,X2,S,D F2,X,S
HLFC

F1,S1,Ds Stream
Water TT

pHT
F3,X3,S3
PC
Separator

F4,X4,S4

F6,X4,S4,Dr
F5,X4,S4

Figura. 6.1. Diagrama del proceso continuo de fermentación

Una operación exitosa de un bioreactor en continuo requiere mucho más que una
estrategia simple para dar los nutrientes necesarios y extraer los productos deseados.
Es esencial que haya una preparación cuidadosa del medio de cultivo ya que los
microorganismos se ven afectados fuertemente por los cambios en el ambiente de
cultivo. El microorganismo debe inocularse en el reactor al iniciar el crecimiento
celular. La inoculación típica se alcanza vía un procedimiento de múltiples pasos en el
que las células crecen en unidades externas y se transfieren a bioreactores de
volúmenes incrementales hasta que el bioreactor de producción es inoculado (Lee,
1992). El procedimiento mencionado es necesario para alcanzar una población lo
suficientemente grande como para sostener el crecimiento. Un requerimiento crítico es
mantener la esterilidad del medio y todo el equipo de procesamiento. Inclusive una
cantidad pequeña de contaminantes puede llevar a una pérdida completa de
productividad y un paro total del bioreactor. Como resultado de esas complejidades, la
operación efectiva de un bioreactor es un problema que representa un reto importante.
207

Oportunidades para el modelado del proceso y el control: el modelado matemático de


las cinéticas del crecimiento de las células en bioreactores en continuo, sigue siendo
foco de investigaciones en ingeniería bioquímica. El impacto potencial de esos
modelos es significativo en la simulación, el escalado, la optimización y el control de
bioprocesos. Comparados con los reactores químicos tradicionales, los bioreactores
son particularmente difíciles de modelar, debido a la complejidad de las reacciones
bioquímicas, las características únicas de las células y la falta de medidas de las
variables claves del proceso. El consumo de sustratos y la producción de metabolitos
es el resultado de cientos de reacciones bioquímicas acopladas (Mauch et al., 1997).
La identificación y el modelado de esas redes de reacciones complejas son problemas
no fáciles de resolver que usualmente no están presentes en otros sistemas de
reacciones químicas.

Aunque es conveniente considerar un cultivo como una mezcla homogénea de células


idénticas, muchos de los cultivos son una mezcla heterogénea de células que difieren
en tamaño, masa y concentración de proteínas intracelulares, ADN y otros
componentes químicos. Un modelado confiable de la cinética del crecimiento celular
y la formación de productos requiere que las células individuales sean diferenciadas
basándose en esas características previamente mencionadas. Es de anotar también que
a pesar que los sensores en línea para las variables secundarias como el dióxido de
carbono estén disponibles, las medidas de las variables primarias del proceso como la
concentración de biomasa y producto requieren una instrumentación y un equipo
analítico mucho más costoso. Para desarrollar y validar modelos matemáticos, a
menudo se requiere tener una medida bastante precisa y confiable de las variables
primarias. En el capítulo anterior se presentó una aproximación a la obtención de esta
información a partir de estimadores basados en filtros de partículas, planteando una
posible solución a este problema.

Las dinámicas de la población de células en los bioreactores en continuo, desempeña


un papel importante en las oscilaciones sostenidas observadas en los bioreactores para
producción de etanol presentado en el capítulo 5. En referencia a este fenómeno
común en los bioreactores en continuo, algunos investigadores (Munch et al., 1992),
(Strassle et al., 1989) han mostrado que la aparición de oscilaciones sostenidas está
relacionada con la formación de diferentes subpoblaciones de células vía un
mecanismo conocido como ciclo de sincronía de las células. Un cultivo sincronizado
se reconoce porque se manifiesta con picos bien definidos en la distribución de las
células que corresponde a grandes grupos de células que pasan colectivamente a través
del ciclo. Zhang (Zhang et al., 2001) propuso que los bioreactores en continuo pueden
manifestar un estado estable y un ciclo limite estable en las mismas condiciones de
operación como consecuencia del ciclo de sincronía de las células. El protocolo
experimental usado, incluyó una manipulación cuidadosa de la tasa de dilución, para
establecer las diferentes condiciones iniciales para la distribución de células. Una
208

condición inicial correspondiente a una población de células sincronizadas tiene como


resultado la convergencia a un ciclo límite estable. En contraste, una solución de
estado estable parece ser consecuencia de una población de células menos
sincronizadas. Entonces, es necesario usar una técnica de control para garantizar el
desempeño satisfactorio del bioreactor en continuo en presencia de perturbaciones
externas y/o cambios en los requerimientos operacionales.

Un sistema de control típico para un bioreactor en continuo consiste de controladores


simples de realimentación para regular el tiempo de residencia del reactor, la
temperatura y el pH. El sistema de control se diseña para suministrar el flujo de
nutrientes prescrito, además evadiendo condiciones ambientales que afecten
adversamente la productividad del bioreactor. Con el objetivo de mantener las
variables primarias como la biomasa y las concentraciones de producto, se han
implementado estrategias a lazo abierto basadas en la consideración poco realista que
las perturbaciones no medidas tienen un efecto negativo en el desempeño del
bioreactor, lo cual no siempre es así. Entonces, como consecuencia de lo mencionado
anteriormente, el desarrollo de las estrategias en lazo cerrado para la estabilización del
reactor y la optimización de la relación biomasa/producto, puede representar una
mejora significativa en el proceso de producción.

Como se observa en la Figura 6.1, un sistema de control típico de un bioreactor


consiste de lazos simples que regulen las variables básicas mencionadas, diseñados
para mantener las condiciones ambientales de los bioreactores al mismo tiempo que se
promueve el crecimiento celular. Estos esquemas simples no incluyen un control
directo de variables como la concentración de biomasa que determine el desempeño
óptimo del bioreactor.

Durante la última década se han hecho muchos esfuerzos en el desarrollo de técnicas


mas avanzadas (no lineales o adaptables) para el control de bioreactores, algunos
referentes en el área son (Bastin and Dochain, 1990), (Hoo and Kantor, 1986), (El
Moubaraki et al., 1993), (Pons, 1992), (Kurtz et al., 2000). Esos trabajos están
basados en modelos continuos que reflejan la naturaleza distribuida de la población
celular. Estas aproximaciones radican en las mediciones y el control de las
propiedades promedio de las poblaciones de células en el bioreactor. Una estrategia de
control mas avanzada incluye la manipulación de la tasa de dilución o la
concentración de sustrato de alimento para maximizar la concentración de biomasa.

Este hecho ha motivado investigaciones en el desarrollo de estrategias de control


basadas en modelos de balance de masa de poblaciones de células que incluyen una
variedad de objetivos de control. Específicamente en el trabajo (Zhang et al., 2001) se
trato el problema de la atenuación de las oscilaciones en lazo abierto a través del
diseño de un controlador lineal por realimentación que manipula la tasa de dilución y
controla los momentos correspondientes a los ceros en la distribución de masa de las
209

células. El diseño de leyes de control de realimentación con linealización que


manipulan la tasa de dilución también fue usado en (Mantzaris et al., 1998), (Zhu et
al., 2000) empleando una estrategia de control predictivo que manipula la tasa de
dilución y la concentración de sustrato de entrada. Finalmente, (Mantzaris et al., 1999)
referencia el control de productividad para un cultivo de células donde el producto
deseado se produce solo en la segunda fase del ciclo de las células, usando una
estrategia de control por realimentación lineal que manipula la concentración de
sustrato de entrada.

En este capítulo se propone usar métodos numéricos no solo para simular la evolución
y el comportamiento dinámico de la fermentación alcohólica a partir de Zymomonas
mobilis (Capítulo 5) sino también para encontrar las acciones de control que permitan
llevar las variables de estado del bioreactor desde el estado actual al estado deseado
con el fin de maximizar su productividad. Para el diseño de los controladores se hace
uso del modelo presentado en el capítulo anterior usando la tasa de dilución, la
concentración de sustrato de entrada y la recirculación de microorganismos para el
control de la concentración de sustrato, producto y posteriormente el de biomasa, bajo
condiciones de observabilidad total de las variables primarias del bioproceso. La
contribución de esta parte del trabajo se basa en que no es necesario hacer cálculos
complejos para obtener las acciones de control del bioreactor, tampoco se usan
linealizaciones del modelo dinámico; lo que hace que esta solución sea fácil de
implementar para afrontar el reto de control de este bioreactor en continuo (Quintero,
Scaglia et al., 2008b, 2008e).

La metodología usada fue desarrollada por (Scaglia, 2006) y aplicada sobre robots
móviles para seguimiento de trayectorias (Scaglia et al., 2005)(Scaglia, Quintero, et
al., 2006, 2007, 2008a, 2008b).

Después de probar en simulación el rendimiento de los controladores, se usa el


estimador desarrollado en el Capítulo 5 para hacer pruebas en lazo cerrado con los
controladores basados en métodos numéricos (Quintero, Scaglia et al., 2008c) y de
esta forma hacer una aproximación más realista al problema de control que se presenta
en esta fermentación alcohólica.

6.1 Estrategia de control basada en métodos numéricos (Scaglia, 2006)

Considérese el siguiente sistema de ecuaciones diferenciales no lineales,

x1 f1 ( x1 , x2 , t )u
(6.1)
x2 f 2 ( x1 , x2 , t )u
210

donde x1, x2 representan los estados del sistema, u la señal de control, y t , el tiempo.
Los valores de x1 y x2 en instantes discretos de tiempo t = nT0, donde T0 es el período
de muestreo y n 0,1, 2,3, se simbolizará como x1n y x2n.

Si se desea calcular el valor de x1n+1 conociendo x1n, la ec.(6.1) se puede integrar en el


intervalo de tiempo nT0 t (n 1)T0 , como se muestra en la ec. (6.2),

( n 1)To

x1n 1 x1n f1 ( x1 , x2 , t )udt (6.2)


nTo

Existen distintos métodos de integración que permiten obtener el valor de x1n+1. Por
ejemplo, el método de Euler (6.3) y el de Runge Kutta de 2do orden (6.4).

x1n 1 x1n T0 f1 ( x1n , x2n , tn )un (6.3)


T0
x1n 1 x1n f1 ( x1n , x2n , tn )un f1 ( x1n 1 , x2n 1 , tn 1 )un 1 (6.4)
2

De la misma manera para x2,

x2n 1 x2n T0 f 2 ( x1n , x2n , tn )un (6.5)

T0
x2n 1 x2n f 2 ( x1n , x2n , tn )un f 2 ( x1n 1 , x2n 1 , tn 1 )un 1 (6.6)
2

Por simplicidad de notación se considerará,

f1n f1 ( x1n , x2n , tn ) , f1n 1 f1 ( x1n 1 , x2n 1 , tn 1 ) , f2n f2 ( x1n , x2n , tn ) , f2n 1 f2 ( x1n 1 , x2n 1 , tn 1 ) .

El objetivo es determinar la señal de control en cada período de muestreo de manera


que el sistema pueda seguir una trayectoria previamente calculada. Por ejemplo si se
utilizan la ecs. (6.4) y (6.6) en el instante nT0 se cumple,

2
( x1 x1 )
f1n f1n 1 un T0 n 1 n
(6.7)
f 2n f 2n 1 u n 1 2
( x2 x2n )
T0 n 1
211

Donde la Ecuación (6.7) representa un sistema de dos ecuaciones con dos incógnitas,
las acciones de control un y un+1, si se conocen las trayectorias deseadas por los
estados x1d y x2d, se puede reemplazar x1n+1 y x2n+1 por x1dn+1 y x2dn+1 y de esta manera
calcular un y un+1. Las trayectorias a considerar son continuas por partes y con
derivadas continuas por partes. Del sistema de Ecuaciones (6.7) se puede ver que
debido a la aproximación utilizada, es posible calcular en el instante nT0, el valor de la
señal de control un y un+1, lo cual representa la señal de control en el próximo instante
de muestreo. Esto representa una ventaja importante por dos motivos, primero para
sistemas complejos, las Ecuaciones (6.7) se pueden resolver utilizando métodos
iterativos para la solución de sistemas de ecuaciones lineales, los cuales solo necesitan
un valor inicial para comenzar la iteración que puede ser precisamente la estima
calculada en el instante de muestreo anterior. La segunda es que se pueden combinar
un y un+1 y así eliminar algunas oscilaciones indeseables en la señal de control y
también en los estados.

Asimismo existe una ventaja adicional al plantear el cálculo de las señal de control
como la solución de un sistema de ecuaciones, ya que ahora es más sencillo sacar
conclusiones acerca de los estados que puede alcanzar el sistema, por ejemplo, si la
matriz de coeficientes

f1n f1n 1
A (6.8)
f 2n f 2n 1

Tiene rango 2, entonces la Ecuación (6.7) tendrá solución lo cual indica que existe una
secuencia de control que llevará al sistema al estado deseado. Si el rango de la matriz
T
de coeficientes A es 1, en este caso quiere decir que el vector f1n 1 f 2n 1 se puede
T
obtener como una combinación lineal del vector f1n f 2n y entonces en este caso
se puede utilizar las Ecuaciones (6.3) y (6.5),

x1dn 1 x1n
f1n T0
un (6.9)
f 2n x2 dn 1 x2n
T0

lo cual representa un sistema de dos ecuaciones y una incógnita, cuya solución óptima
según mínimos cuadrados es, (Strang, 1980),
212

1 x1dn 1 x1n x2 dn 1 x2n


un 2 2
f1n f 2n (6.10)
f1n f 2n T0 T0

Para que el sistema de Ecuaciones (6.9) tenga solución se debe cumplir que,

f1n x1dn 1 x1n


(6.11)
f 2n x2 dn 1 x2n

Para x2dn 1 x2n 0 , si esta condición no se cumple, se tendrá una solución


aproximada, esto es, el controlador llevará al sistema al estado alcanzable que se
encuentre mas cerca del estado deseado. La Ecuación (6.11) se puede utilizar también
para encontrar el valor deseado de las variables de estado para que el sistema siga con
el menor error posible la trayectoria de referencia (ver sección 5.3.2 (Scaglia, 2006)).
Si en los sistemas de Ecuaciones (6.9) y (6.10) en vez de ( x1dn 1 x1n ) y ( x2dn 1 x2n )
se considera kn ( x1dn 1 x1n ) y kn ( x2dn 1 x2n ) donde 0 kn 1 n el próximo estado
será,

x1n 1 x1n kn ( x1dn 1 x1n ) (6.12)


x1n

x2n 1 x2n kn ( x2 dn 1 x2n ) (6.13)


x2n

se puede observar que cuando kn se aproxime a 1 disminuye el error de seguimiento,


pero si la diferencia entre el estado actual y el deseado es elevada, las señales de
control serán muy violentas. De esta manera cuando el sistema se encuentre alejado de
la trayectoria de referencia se puede utilizar un valor de kn bajo e ir incrementando
kn a medida que el error disminuya.
213

6.2 Diseño de los controladores

Basados en las consideraciones previas, se diseñará un controlador para el bioreactor


alcohólico en continuo para obtención de etanol a partir de la bacteria Zymomonas
mobilis definido en el capítulo 5.

6.2.1 Controlador 1

Para este propósito, serán usadas las ecuaciones de estado definidas por las
Ecuaciones (5.1) - (5.10). Primero se diseñará un controlador para las variables
principales sustrato y producto, usando la tasa de dilución, la concentración de
sustrato de entrada y eliminando la influencia de la recirculación de microorganismos
propuesta por (Echeverry et al., 2003, 2004).

Con el fin de hacer un estudio detallado de la estrategia de control propuesta, se


comienza con un controlador simple en el cual se considera que el sistema es
totalmente observable y más adelante se harán las consideraciones dinámicas
necesarias para obtener una solución más realista al problema.

Sean las ecuaciones que definen el comportamiento dinámico del bioreactor, bajo las
consideraciones anteriores:

dX (6.14)
DS X
dt

dS 1
Qp X DsSin Ds S
(6.15)
dt Yp / s
dP (6.16)
Qp X Ds P
dt
dZ (6.17)
I Z
dt
dI (6.18)
Qp X DsP I
dt

Donde X, S, P, Z, I, representan los estados del bioreactor previamente definidos en el


capitulo 5 y también las variables S y P representan las salidas del sistema a controlar.
Ds y Sin son las acciones de control y t, el tiempo. Los valores de las salidas en tiempo
discreto son S n y Pn , con t nT0 donde T0 es el tiempo de muestreo
yn 0,1, 2,3, .
214

Si se desea calcular el valor de Sn 1 y Pn 1 , conociendo los valores actuales S n y Pn


en las ecuaciones 6.14 - 6.18, debe hacerse una integración en el intervalo de
tiempo nT0 t (n 1)T0 de la misma forma que en la sección 6.1. En consecuencia,
elegimos aproximar el sistema mediante el método de Euler, para calcular los valores
de X n 1 , Sn 1, Pn 1 , Z n 1 , I n 1 .

Xn 1 Xn (6.19)
n Dsn X n
T0
Sn 1 Sn 1
Qpn X n Dsn Sinn Dsn Sn
(6.20)
T0 Yp / s
Pn 1 Pn
Q pn X n Dsn Pn (6.21)
T0
Zn 1 Zn (6.22)
In Zn
T0
In 1 In (6.23)
Qpn X n Dsn Pn In
T0

Donde los valores X n 1 , Sn 1, Pn 1 , Z n 1 , I n 1 en el lado izquierdo de las ecuaciones son


desconocidos y pueden ser estimados a través del conjunto de ecuaciones (6.19-6.23).
El uso de los métodos numéricos en la simulación de este sistema se basa
principalmente en la posibilidad de determinar un estado del sistema en el instante de
tiempo n 1 a partir del estado, la acción de control y otras variables conocidas en el
instante n . Los valores de X n 1 , Sn 1, Pn 1 , Z n 1 , I n 1 , pueden sustituirse por las
trayectorias deseadas de esas variables y después de esto, puede calcularse la acción
de control necesaria para hacer que el sistema evolucione desde el valor actual al valor
deseado.

Para lograr este objetivo, es necesario resolver un sistema de ecuaciones en cada


instante de tiempo. Esta parte de la tesis propone esta aproximación para el modelo
dinámico del fermentador alcohólico en continuo y con esto obtener las acciones de
control que permiten que el fermentador siga una trayectoria preestablecida durante el
tiempo experimental (Scaglia, 2006).

Reescribiendo el conjunto previo de ecuaciones

Xn 1 X n T0 n Dsn X n (6.24)

Sn Sn T0
1
Q pn X n Dsn Sinn Dsn S n
(6.25)
1
Yp / s

Pn 1 Pn T0 Qpn X n Dsn Pn (6.26)


215

Zn 1 Z n T0 In Zn (6.27)
In 1 I n T0 Qpn X n Dsn Pn In (6.28)

Las ecuaciones (6.24) a (6.28) pueden expresarse en forma compacta o matricial

X n T0 X n n

Xn T0 X n 0 1
1 Sn Q pn X nT0
Sn 1 T0 S n To Yp / s (6.29)
Dsn
Pn 1 T0 Pn 0 Pn T0Q pn X n
Dsn Sinn
Zn 1 0 0 Z n T0 In Zn
In 1 T0 Pn 0
I n T0 Qpn X n In

Desarrollando la expresión previa para alcanzar la expresión deseada,

X n T0 X n n

T0 X n 0 Xn 1
1 Sn Qpn X nT0
T0ToSn To Sn 1
Yp / s (6.30)
Dsn
T0 Pn 0 Pn 1 Pn T0Q pn X n
Dsn Sinn
0 0 Zn 1 Z n T0 In Zn
T0 Pn 0 In 1
I n T0 Q pn X n In

Re escribiendo el sistema en la forma matricial AU b , en la cual U es el vector de


acciones de control,
Xn 1 X n T0 X n n

T0 X n 0 1
Sn 1 Sn Q p X nT0
T0 Sn To Yp / s n (6.31)
Ds
n
T0 Pn 0 Pn 1 Pn T0Q p X n
Ds Sin n

0 0 n n
Z n 1 Z n T0 In Zn
T0 Pn 0 U
I n 1 I n T0 Qp Xn In
A n

Re ordenando las filas 4 y 5, se obtiene:


216

Xn 1 X n T0 X n n

T0 X n 0 1
Sn 1 Sn Qpn X nT0
T0 S n To Yp / s (6.32)
Dsn
T0 Pn 0 Pn 1 Pn T0 Q pn X n
Dsn Sinn
T0 Pn 0 In I n T0 Q pn X n In
1
0 0
Zn 1 Z n T0 In Zn

Reduciendo la Matriz A y eliminando el estado definido por la variable de inhibición


Z donde no hay acciones de control, se obtiene la siguiente expresión:

Xn 1 X n T0 X n n
T0 X n 0 1
T0 S n To Dsn Sn 1 Sn Qpn X nT0 (6.33)
Yp / s
T0 Pn 0 Dsn Sinn
Pn 1 Pn T0 Q pn X n
T0 Pn 0
In 1 I n T0 Q pn X n In

A partir de la ecuación (6.33) puede verse que:

En esta solución propuesta las acciones de control Ds y Sin están acopladas.


Las columnas de la matriz A son linealmente independientes.
Hay más ecuaciones que número de variables desconocidas.
El rango de la matriz A es 2, el mismo que el número de vectores en el
espacio columna de A.

En consecuencia, si el vector b pertenece al espacio columna de la matriz A, la


solución para el sistema definido por la ecuación (6.33) será única. Por el contrario la
solución será aproximada por la proyección del vector b sobre el espacio generado por
las columnas de la matriz A, y resuelve el sistema de ecuaciones. También esta
solución será única. La solución aproximada puede ser expresada como:

Xn 1 X n T0 X n n
T0 X n 0 1
Dsn Sn 1 Sn Q pn X nT0 (6.34)
T0 Sn T0 Yp / s
pinv
Dsn Sinn T0 Pn 0
Pn 1 Pn T0Q pn X n
T0 Pn 0
A I n 1 I n T0 Q pn X n In

b
217

Donde pinv indica la pseudoinversa de la matriz. El escenario de pruebas de


simulación para este controlador, fue el proceso de fermentación de Zymomonas
mobilis durante 150 horas. Se utilizó el modelo de Daugulis usando los parámetros de
estado estacionario calculados por Raposso (Raposso et al, 2005) para reproducir las
fermentaciones que allí se reportan.

Las trayectorias deseadas fueron diseñadas con base en los datos reales del proceso de
fermentación reportado por Raposso (Raposso et al, 2005), que alcanzan los estados
estables a partir de 3 condiciones iniciales reales diferentes.

El conjunto de parámetros utilizados permite considerar el proceso de fermentacion


simulado lo mas cercano a las condiciones reales, que permitirán alcanzar las
condiciones de máxima productividad de la bacteria como las reportadas por
(Daugulis et al, 1997), (Mc Lellan et al, 1999), (Li, 1999), (Raposso et al., 2005),
(Pinheiro et al., 2005). Este hecho es muy importante ya que permite aproximarse al
comportamiento original de la bacteria, lo que mejorara la posibilidad de desarrollar
controladores factibles para la implementación en línea.

Los resultados de simulación se presentan en las Figuras 6.2, 6.4 y 6.6 en las cuales se
tiene como trayectorias deseadas las seguidas por los datos reales del trabajo de
Raposso et al, 2005. Las acciones de control usadas están dentro de las condiciones
físicas, definidas por los flujos y la velocidad de actuadores reales. Las acciones de
control están limitadas a valores entre 0.03< Ds<0.2 y 10<Sin<250. Éstas se presentan
en las Figuras 6.3, 6.5 y 6.7 respectivamente.

En la Tabla 6.1 se muestran las condiciones iniciales de los 6 diferentes tipos de


fermentaciones caracterizadas, de las cuales se van a usar como referencia para la
obtención de las trayectorias óptimas a seguir por el sistema usando para ello los
controladores diseñados en este capítulo.

Parámetros 1 2 3 4 5 6
Cond. Inic. (Daugulis (Raposso (Pinheiro (Raposso (Raposso (Raposso
Osc) Osc) Osc) EE 1) EE 2) EE3)
X(1) (g/l) 3 1.5 1.25 0.05 0.07 0.4
S(1) (g/l) 60 57 60 145 160 150
P(1) (g/l) 70 57 60 0.01 0.01 0.01
Sin(1) (g/l) 187 200 200 187 187 187
Ds(1) (1/h) 0.0879 0.0675 0.067 0.06 0.0675 0.07
Tabla 6.1 Resumen de datos de las simulaciones para prueba de controladores

Puede verse de la Figura 6.2 que el sistema (en línea sólida) sigue de manera aceptable
la trayectoria deseada (en línea punteada); en el tiempo 60 horas el sistema fue
218

sometido a una perturbación en la corriente de alimento, lo que hace que el sistema se


desvíe temporalmente de la referencia que debe seguir. Dicha trayectoria está basada
en los datos reales de fermentaciones reportadas, como se mencionó anteriormente.
Además debe anotarse que aunque los modelos usados para simulación fueron
anteriormente parametrizados y validados por varios autores, pero pese a ello, los
valores experimentales graficados no están exactamente dentro de las trayectorias del
sistema ya que fueron usados como base para el diseño de una nueva trayectoria
optima que maximice la producción de etanol.

Igualmente, para la concentración de producto se obtuvieron mejores resultados que


los reportados (Echeverry et al, 2004)dado que como puede verse en la ecuación 6.34,
se tiene una influencia directa de las acciones de control sobre este estado, mientras
que para la concentración de producto, las acciones de control tienen una influencia
menor. Observese que en la fase transitoria de la fermentación el sistema (en línea
sólida) sigue mucho mejor la trayectoria deseada (en línea punteada). Lo que sugiere
que para una manipulación mas fina de la concentración de producto debe buscarse
una relación que aumente la velocidad de la influencia de las acciones de control sobre
la concentración del producto.

Concentración de Producto
Concentración de Etanol [g/L]

60

50

40

30
Modelo
Trayectoria Deseada
20
Datos Experimentales
10

0
0 50 100 150
Tiempo [Horas]
a. Desempeño del controlador de producto, asumiendo observabilidad completa
siguiendo la trayectoria definida por datos experimentales.
219

Concentración de Sustrato
Concentración de Sustrato [g/L]

200

150

Modelo
100 Trayectoria deseada
Datos Experimentales

50

0
0 50 100 150
Tiempo [Horas]
b. Desempeño del controlador de sustrato, asumiendo observabilidad
completa siguiendo la trayectoria definida por datos experimentales.
Figura 6.2 Desempeño del controlador de sustrato y producto, para fermentación 1

De la Figura 6.3 puede observarse las acciones de control usadas en la fermentación 1


para el control de las variables de las Figura 6.2. Puede verse que para la fase
transitoria se tiene una saturación de la acción de control del sustrato de alimento, lo
que indica que en esta fase no se esta aumentando la concentración del mismo, ya que
la colonia de bacterias no lo necesita después de las 10 primeras horas de
fermentación hasta aproximadamente la hora 30 en la que alcanza el final de la fase
transitoria en su pico máximo de producción de etanol (Figura 6.2 a.) y el mínimo de
concentración de sustrato (Figura 6.2 b.). A partir de ese momento es cuando las dos
acciones de control se complementan para mantener los niveles de alimento necesarios
para que se lleve a cabo de manera óptima la fermentación además de mantenerlo lo
más estable posible dentro del reactor.

Acción de Control Sustrato de Entrada Sin


200
Concentración de Sin [g/l]

150

100

50

0
0 50 100 150
Tiempo [Horas]
a. Acción de Control Sustrato de alimento de la ecuación 6.34 para la
fermentación 1
220

Acción de Control Ds
0.12
Tasa de Dilución [1/h]

0.1

0.08

0.06

0.04

0.02
0 50 100 150
Tiempo [Horas]
b. Acción de control tasa de dilución, de la ecuación 6.34 para la fermentación 1
Figura 6.3 Acciones de control Ds y Sin para fermentación 1

Para la fermentación 1, se obtienen resultados aceptables para el control de la


concentración de sustrato (Figura 6.4 a.) y producto (Figura 6.4 b.) las respuestas de
los controladores ante las perturbaciones de los tiempo 70 y 110 horas están dentro de
los valores satisfactorios para el desempeño de la fermentación. Se espera que al
agregar una variable de control más al sistema, en la próxima sección, el rendimiento
aumente considerablemente.
Concentración de Sustrato
Concentración de Glucosa [g/L]

200

Modelo
150
Trayectoria deseada
Datos Experimentales
100

50

0
0 20 40 60 80 100 120
Tiempo [Horas]
a. Concentración de sustrato de alimento dentro del reactor (línea sólida) y
trayectoria deseada (línea punteada) en la fermentación 2
221

Concentración de Producto
Concentración de Etanol [g/L]
70

60

50

40 Modelo
Trayectoria Deseada
30 Datos Experimentales
20

10

0
0 20 40 60 80 100 120
Tiempo [Horas]
b. Concentración de etanol (línea sólida) y trayectoria deseada (línea punteada)
dentro del reactor para la fermentación 2
Figura 6.4 Desempeño del controlador de Sustrato y producto, para fermentación 2

De manera análoga se tiene en la Figura 6.5 las acciones de control que se usaron en la
fermentación 2 para el control de las concentraciones de sustrato y producto de las
Figura 6.4 a y b. Puede notarse que la mayoría del tiempo de la fermentación las
acciones de control estuvieron saturadas, precisamente en la fase batch.
Específicamente se encontró que los parámetros del controlador estaban aumentando
las magnitudes de las acciones de control y estaban perdiendo la suavidad necesaria
para el seguimiento de las trayectorias, lo que sugirió una reducción de las constantes.
Acción de Control Sustrato de Entrada Sin
200
Concentración de Sin [g/L]

150

100

50

0
0 20 40 60 80 100 120
Tiempo [Horas]
a. Acción de control de sustrato de alimento para la fermentación 2.
222

Acción de Control Ds
Tasa de Dilución de sustrato [1/h]

0.12

0.1

0.08

0.06

0.04

0.02
0 20 40 60 80 100 120
Tiempo [Horas]
b. Acción de control de tasa de dilución para la fermentación 2
Figura 6.5 Acciones de control Ds y Sin para fermentación 2

En las Figuras 6.6 y 6.7 se presentan los resultados de la fermentación 3. Puede verse
que la concetración de sustrato de alimento, la concentración de producto siguen lñas
trayectorias deseadas y las acciones de control son mas suaves en el transcurso de la
fermentación, mejorando asi los resltados anterioemente descritos.

Concentración de Sustrato
Concentración de Glucosa [g/L]

200

150 Modelo
Trayectoria Deseada
Datos Experimentales
100

50

0
0 20 40 60 80 100 120
Tiempo [Horas]
a. Concentración de sustrato de alimento para la fermentación 3
223

Concentración de Producto
Concentración de etanol [g/L]

70

60

50

40
Modelo
30 Trayectoria Deseada
Datos Experimentales
20

10

0
0 20 40 60 80 100 120
Tiempo [Horas]
b. Concentración de producto dentro del reactor para la fermentación 3
Figura 6.6 Desempeño del controlador de Sustrato y producto, para fermentación 3
Acción de Control Sustrato de Entrada Sin
200
Concentración de Sin [g/L]

150

100

50

0
0 20 40 60 80 100 120
Tiempo [Horas]
a. Acción de control de sustrato de alimento para la fermentación 3
Acción de Control Ds
Tasa de Dilución de sustrato [g/L]

0.12

0.1

0.08

0.06

0.04

0.02
0 20 40 60 80 100 120
Tiempo [Horas]
b. Acción de control de la tasa de dilución para la fermentación 3
Figura 6.7 Acciones de control Ds y Sin para fermentación 3
224

6.2.2 Controlador 2

Con el propósito de desarrollar un análisis dinámico mas profundo, se diseñó un


controlador nuevo mediante la modificación del término de la recirculación para
estudiar su efecto sobre el desempeño del controlador de la sección 6.2.1. Se agregó el
término de la recirculación de microorganismos y, de la ecuación (6.14) por medio de
consideraciones algebraicas en los flujos considerados en (Echeverry et al., 2003),
(Echeverry et al 2004), se obtiene

dX (6.35)
X RD / 4 DS R 1 X
dt

Usando el mismo procedimiento que la sección anterior, sobre la ecuación (6.35) se


obtiene la siguiente expresión discreta:

Xn 1 Xn T X n T0 X n RD / 4 Dsn R 1
n 0
(6.36)

Donde el término D es la tasa de dilución total, esto significa que es la suma de la tasa
de dilución de sustrato Ds y la tasa de dilución Dr asociada a la recirculación de
microorganismos R. Es importante recalcar que los términos relaiconados con la
recirculación R permanecerán constantes porque el propósito es analizar su influencia
sobre el valor de las acciones de control Ds y Sin.

Desarrollando la ecuación (6.36) y reagrupando,

Xn 1 Xn n 0 T Xn T0 X n RD / 4 T0 X n Dsn R 1
Xn 1 Xn n 0 T Xn 2
T0 X n Dsn R T0 X n R D / 4 T0 X n Dsn T0 X n RD / 4 (6.37)
2 2
Xn 1 Xn n 0 T X n T0 X n R Dr / 4 T0 X n R Dsn / 4 T0 X n Dsn R T0 X n Dsn T0 X n RDsn / 4 T0 X n RDr / 4
2
Xn 1 Xn n 0 T Xn Dsn T0 X n R / 4 T0 X n R T0 X n T0 X n R / 4 Dr T0 X n R 2 / 4 T0 X n R / 4
3
Xn 1 Xn n ToX n Dsn T0 X n R 2 / 4 T0 X n R T0 X n Dr T0 X n R 2 / 4 T0 X n R / 4
4

Entonces

3
Dsn T0 X n R 2 / 4 T0 X n R T0 X n Xn 1 Xn T Xn
n 0 Dr T0 X n R 2 / 4 T0 X n R / 4
4
(6.38)

De esta forma, la matriz definida en la Ecuación (6.33) cambiará de la siguiente


manera:
225

Xn 1 X n 1 T0 n Dr T0 X n R 2 / 4 T0 X n R / 4
2 3
T0 X n R / 4 ToX n R T0 X n 0
4 1
Dsn Sn 1 Sn Q pn X nT0
T0 S n To Yp / s
Dsn Sinn
T0 Pn 0 Pn 1 Pn T0Q pn X n
T0 Pn 0
In 1 I n T0 Q pn X n In

(6.39)

De esta forma, el controlador de sustrato y producto, a través de las variables Ds y Sin


se ve modificado por la influencia del término de la recirculación. Las acciones de
control en cada instante de muestreo se obtienen a partir de la ecuación:

Xn 1 X n 1 T0 n Dr T0 X n R 2 / 4 T0 X n R / 4
3
T0 X n R 2 / 4 ToX n R T0 X n 0
4 1
Dsn Sn 1 Sn Q pn X nT0
pinv T0 S n To Yp / s
Dsn Sinn
T0 Pn 0 Pn 1 Pn T0 Q pn X n
T0 Pn 0
In 1 I n T0 Q pn X n In

(6.40)

Nuevamente, pinv indica la pseudoinversa de la matriz. Luego de esto, se puede


desarrollar un análisis dinámico para la sintonía correcta de las acciones de control y
su efecto sobre el desempeño del proceso de fermentación. Para probar la capacidad
de los controladores será necesario someterlos a condiciones adversas como las
probadas en (Echeverry et al., 2004). Las perturbaciones que se simulan están
asociadas a las posibles fallas que puede haber en un proceso continuo, como por
ejemplo, fallas en los actuadores o problemas del proceso previo de alimentación.
Estas fallas se reflejan en posibles aumentos de las concentraciones de entrada o tasas
de dilución. Para probar el comportamiento del controlador ante perturbaciones, se
generaron perturbaciones en los flujos de entrada de carácter extremo como las que en
una fermentación real podrían ocasionar la pérdida total de la fermentación. En la
literatura se cita que las fuentes frecuentes de perturbaciones en este tipo de sistemas
son un aumento o decremento de la corriente de entrada (o en los sistemas por lotes,
cambios en los parámetros con variaciones que decrementan lote a lote).

El desempeño del controlador 2 con una recirculación fija del 10%, puede verse de la
Figura 6.8. Como caso de estudio y al igual que en el controlador 1, las trayectorias
deseadas fueron generadas mediante interpolación y suavizado de las trayectorias
definidas con base en los datos experimentales de (Raposso et al., 2005) para Sustrato
y Producto. Solo se presentará los resultados de una fermentación contrario a las tres
presentadas en la sección anterior, como ilustración, dado que este controlador
226

presentó un mejor desempeño general para las tres fermentaciones. El controlador


sigue correctamente la trayectoria predefinida (ver Figuras 6.9) y corrige las
oscilaciones propias de la fermentación real. Esto significa que bajo condiciones
controladas, el medio de cultivo será más propenso para lograr que las Z.m alcance la
productividad máxima de etanol. Las estructuras de control anteriores pueden
diseñarse e implementarse sin mayor dificultad debido a que se usaron técnicas
estándar de métodos numéricos y de álgebra lineal. A través del análisis de las Figura
6.8 a y b se observa que el error entre la trayectoria considerada como real y la
deseada es muy pequeño, cumpliendo con el propósito de lograr estar dentro del 5%
alrededor del punto deseado de operación. Los puntos señalados como datos
experimentales corresponden a los datos en los cuales se basó la trayectoria deseada
para el seguimiento de la concentración de producto y de sustrato.

60
Concentración de Producto
Concentración de Etanol [g/L]

50

40

30 Modelo
Trayectoria Deseada
20 Datos Experimentales

10

0
0 20 40 60 80 100 120 140 160
Tiempo [Horas]
a. Concentración de Producto en la fermentación controlada (línea solida)
trayectoria deseada (línea punteada)
Concentración de Sustrato
Concentración de Glucosa [g/L]

200

150

Modelo
100 Trayectoria Deseada
Datos Experimentales

50

0
0 20 40 60 80 100 120 140 160
Tiempo [Horas]
b. Concentración de sustrato en la fermentación controlada (línea solida)
trayectoria deseada (línea punteada)
227

200
Acción de Control Sustrato de Entrada Sin
Concentración de Sin [g/L]

150

100

50

0
0 20 40 60 80 100 120 140 160
Tiempo [Horas]
c. Acción de control concentración de sustrato de alimento
200
Acción de Control Sustrato de Entrada Sin
Concentración de Sin [g/L]

150

100

50

0
0 20 40 60 80 100 120 140 160
Tiempo [Horas]
d. Acción de control de tasa de dilución.
Figura. 6.8. Desempeño del controlador 2 ante perturbaciones.

Debe recalcarse que la diferencia del controlador 2 de esta sección y la del controlador
1 de la sección 6.2.1 radica esencialmente en la inclusión del término asociado a la
recirculación de microorganismos al reactor, lo que hace que halla modificaciones en
las dinámicas de las concentraciones de microorganismos que afectan
considerablemente las concentraciones de sustrato y de producto dentro del reactor.
En las Figura 6.8 c. y d. se puede ver claramente que las acciones de control
responden dinámicamente a los cambios presentados dentro del reactor y que dado
que dichas variables manipuladas tienen un efecto directo y más rápido sobre la
concentración de sustrato, es ésta la que se mantiene mejor controlada durante toda la
fermentación.

De los resultados de las Figura 6.9, puede concluirse que la metodología propuesta es
simple en el sentido de la selección de los parámetros del controlador para alcanzar un
228

buen desempeño del sistema en lazo cerrado. Esta metodología puede ser aplicada a
otros tipos de sistemas. La precisión requerida del método numérico propuesto para la
aproximación del modelo es menor que la necesaria para simular el comportamiento
del sistema. Esto se debe a que se consideró que la información de los estados
realimentados está disponible en cada instante de muestreo y es corregida cualquier
diferencia debido a errores acumulativos (por ejemplo, errores de redondeo). Como
consecuencia, la aproximación usada para encontrar la mejor forma de ir de un estado
a otro, puede variar de acuerdo a la disponibilidad de la información y del modelo del
sistema. El diseño del controlador puede plantearse como la minimización de un
índice cuadrático, lo que es un problema simple y permite considerar otras
propiedades de las trayectorias.

Concentración de Sustrato
Concentración de Glucosa [g/L]

200

150 Modelo
Trayectoria deseada
Datos Experimentales
100

50

0
0 20 40 60 80 100 120
Tiempo [Horas]
a. Concentración de sustrato en la fermentación controlada (línea solida)
trayectoria deseada (línea punteada)
Concentración de Producto
Concentración de etanol [g/L]

70

60

50
Modelo
40 Trayectoria Deseada
Datos Experimentales
30

20

10

0
0 20 40 60 80 100 120
Tiempo [Horas]
b. Concentración de Producto en la fermentación controlada (línea solida)
trayectoria deseada (línea punteada)
229

0.12
Acción de Control Ds
Tasa de Dilución [1/h]

0.1

0.08

0.06

0.04

0.02
0 20 40 60 80 100 120
Tiempo [Horas]
c. Acción de control de la tasa de dilución

200
Acción de Control Sustrato de Entrada Sin
Concentración de Sin [g/L]

150

100

50

0
0 20 40 60 80 100 120
Tiempo [Horas]

d. Acción de control de la concentración de sustrato de alimento


Figura 6.9. Desempeño del controlador 2 siguiendo trayectorias obtenidas de datos
experimentales.
230

6.2.3 Controlador 3

Básicamente, el objetivo del controlador 3 es incorporar la recirculación de


microorganismos R de manera activa como variable manipulada para el control de la
concentración de microorganismos dentro del bioreactor.

Para el diseño de este controlador, se utilizan las ecuaciones de estado definidas a


partir del conjunto de ecuaciones diferenciales (5.1) - (5.10),

dX RD
X DS R 1 X
dt 4 (6.41)
dS 1
Qp X DSin DS
dt Yp / s
(6.42)
dP
Qp X DP
dt (6.43)
dZ
I Z
dt (6.44)
dI
Qp X DP I
dt (6.45)

donde X, S, P, Z, I, representan los estados del bioreactor definidos previamente y


nuevamente X, S y P representan las salidas del sistema, las acciones de control
consideradas para esta aproximación serán R, Ds y Sin .

De la misma manera que los controladores anteriores, los valores de las salidas en el
tiempo discreto t nT0 , donde T0 es el periodo de muestreo y n 0,1, 2,3, , serán
los valores de X n , S n y Pn . Si se desea conocer el valor de X n 1 , Sn 1 y
Pn 1 conociendo los valores de X n , S n y Pn , el conjunto de ecuaciones previamente
descritas deben integrarse en el intervalo de tiempo nT0 t (n 1)T0 . En
consecuencia, la aproximación de Euler para calcular los valores de
X n 1 , Sn 1, Pn 1 , Z n 1 , I n 1 es la siguiente:

Xn 1 Xn Rn Dn
n Xn Dsn Rn 1 X n
T0 4
(6.46)
231

Sn 1 Sn 1
Qpn X n Dn Sinn Dn Sn
T0 Yp / s
(6.47)
Pn 1 Pn
Qpn X n Dn Pn
T0
(6.48)
Zn 1 Zn
In Zn
T0
(6.49)
In 1 In
Qpn X n Dn Pn In
T0
(6.50)

Donde los valores de X n 1 , Sn 1, Pn 1 , Z n 1 , I n 1 en el lado izquierdo son desconocidos y


pueden ser estimados por las ecuaciones (6.46 – 6.50). El uso de métodos numéricos
en la simulación de este sistema se basa en que es posible determinar el valor del
estado en el instante siguiente n 1 , a partir de la información completa de los estados
y las demás variables en el instante n.

En este punto no se consideran los problemas típicos de falta de información de las


variables principales, tópico que se abordará en la sección 6.3.

Los valores de X n 1 , Sn 1, Pn 1 , Z n 1 , I n 1 , pueden substituirse por los valores de las


trayectorias deseadas y con esto, puede llegar a encontrarse de nuevo una expresión
para las variables de control R, Ds y Sin, que haga que las salidas del bioreactor puedan
ser llevadas al valor deseado. Para lograr dichas expresiones es necesario plantear de
nuevo el problema en el desarrollo de Euler y trabajar con las ecuaciones para
transformarlo en un conjunto de ecuaciones lineales que puedan ser fácilmente
manejables. En esta parte del trabajo se propone hacer el manejo desarrollado
anteriormente para la obtención de los controladores de las secciones 6.2.1 y 6.2.2,
con el sistema que incluye la Recirculación de microorganismos como nueva variable
de control.

Re escribiendo el conjunto de Ecuaciones (6.46) – (6.50),

T0 X n Rn 2 Dn T0 X n Rn Dn
Xn 1 X n 1 T0 n T0 X n Rn Dsn T0 X n Dsn
4 4 (6.51)
1
Sn 1 Sn T0 Q pn X n Dn Sinn Dn S n
Yp / s
(6.52)
Pn 1 Pn T0 Qpn X n Dn Pn
(6.53)
232

Zn 1 Z n T0 In Zn
(6.54)
In 1 I n T0 Qpn X n Dn Pn In
(6.55)

Ordenando el sistema de ecuaciones en forma matricial se obtiene:

T0 X n Rn 2 Dn T0 X n Rn Dn
X n 1 T0 n T0 X n Rn Dsn T0 X n Dsn
4 4
Xn 1
1
Sn T0 Q pn X n T0 Dn Sinn T0 Dn S n
Sn 1
Yp / s
Pn 1 Pn T0Q pn X n T0 Dn Pn
Zn 1 Z n T0 In Zn
In 1
In 1 T0 T0 Q pn X n T0 Dn Pn

(6.56)

Desarrollando la expresión previa (6.56) se alcanza la forma deseada,

Rn 2 Dn X n 1 T0 n
T0 X n T0 X n
Xn 1 T0 X n T0 X n 0 0
4 4 Rn Dsn 1
Sn S n T0 Q pn X n
1 Yp / s
0 0 0 0 T0 T0 S n Rn Dn
Pn 1
0 0 0 0 0 T0 Pn Dsn Pn T0 Q pn X n
Zn 1
0 0 0 0 0 0 Dn Sinn Z n T0 In Zn
In 1 0 0 0 0 0 T0 Pn
Dn In 1 T0 T0 Q pn X n
(6.57)

Re escribiendo el sistema en la forma matricial Ax b , en la cual el vector x es el


vector de acciones de control.
Xn 1 X n 1 T0 n
2
T0 X n T0 X n Rn Dn 1
T0 X n T0 X n 0 0 Sn 1 S n T0 Q pn X n
4 4 Rn Dsn Yp / s
0 0 0 0 T0 T0 S n Rn Dn
Pn 1 Pn T0 Q pn X n
0 0 0 0 0 T0 Pn Dsn
0 0 0 0 0 0 Dn Sinn Zn 1 Z n T0 In Zn
0 0 0 0 0 T0 Pn Dn In In 1 T0 T0 Q pn X n
1

(6.58)
Re ordenando las filas 4 y 5
233

Xn 1 X n 1 T0 n

T0 X n T0 X n Rn 2 Dn 1
T0 X n T0 X n 0 0 Sn 1 S n T0 Q pn X n
4 4 Rn Dsn Yp / s
0 0 0 0 T0 T0 S n Rn Dn
Pn 1 Pn T0 Q pn X n
0 0 0 0 0 T0 Pn Dsn
0 0 0 0 0 T0 Pn Dn Sinn In 1 In 1 T0 T0 Q pn X n
0 0 0 0 0 0 Dn Zn Z n T0 In Zn
1

(6.59)
Reduciendo la matriz A mediante la eliminación de la variable de estado Z, se obtiene
la siguiente expresión

Rn 2 Dn Xn 1 X n 1 T0 n
T0 X n T0 X n
T0 X n T0 X n 0 0 Rn Dsn 1
4 4 Sn S n T0 Q pn X n
Rn Dn 1
Yp / s
0 0 0 0 T0 T0 S n
Dsn
0 0 0 0 0 T0 Pn Pn Pn T0 Q pn X n
1
0 0 0 0 0 T0 Pn Dn Sinn
Dn In 1 In 1 T0 T0 Q pn X n
(6.60)

De la Ecuación (6.60) puede verse que:

Todas las acciones de control están acopladas


Las columnas de la matriz A son linealmente independientes
Hay más ecuaciones que incógnitas

Estas condiciones son similares a las de la sección 6.2.1. la solución óptima según
mínimos cuadrados esta dada por

Rn 2 Dn Xn 1 X n 1 T0 n
T0 X n T0 X n
Rn Dsn T0 X n T0 X n 0 0 1
4 4 Sn 1 Sn T0 Q pn X n
Rn Dn Yp / s
0 0 0 0 T0 T0 Sn
Dsn
0 0 0 0 0 T0 Pn Pn 1 Pn T0Q pn X n
Dn Sinn 0 0 0 0 0 T0 Pn
Dn In 1 In 1 T0 T0 Q pn X n

(6.61)

El signo + sugiere la pseudoinversa de la matriz.De esta forma, se obtiene una


expresión para el vector de acciones de control acopladas, para mantener los valores
de biomasa, sustrato y producto en los valores deseados. Las acciones de control
pueden encontrarse mediante la solución de la ecuación (6.61) y luego de esto, es
234

posible hacer un análisis dinámico que permita ajustar adecuadamente las acciones de
control y sus efectos sobre el desempeño del bioreactor y la evolución temporal del
mismo. De manera similar a los casos anteriores será necesario probar la capacidad
del controlador de responder ante perturbaciones considerables en las corrientes de
entrada del fermentador.

El escenario de prueba será una simulación de 150 horas de duración aproximada, que
busca reproducir las condiciones de los datos reales de la fermentación reportada por
(Raposso et al., 2005) usando sus condiciones iniciales y los parámetros calculados
por ellos.

De esta manera se puede reproducir el comportamiento oscilatorio natural de la


bacteria y se analizará la influencia del controlador sobre la fermentación. Las
trayectorias deseadas para las tres variables primarias del proceso se diseñan con base
en los datos experimentales pero no son idénticas.

Se desea que el controlador siga una trayectoria natural, pero que no contenga picos
indeseados ni oscilaciones que puedan afectar la productividad del microorganismo, ni
lo sometan a condiciones de estrés. Por ellos las trayectorias deseadas son más suaves
que las seguidas en el reporte de Raposso. Estas condiciones de simulación nos
permiten analizar la factibilidad de uso de un controlador para su implementación en
línea, consecuente con la concepción de usar la estrategia de alimentación como
herramienta para la maximización de la productividad de etanol.

Los resultados que se muestran a continuación en las Figura 6.10 son satisfactorios ya
que el controlador tiene un buen desempeño y las variables biomasa, sustrato y
producto siguen las trayectorias dentro de los límites permitidos como aceptables (5%
alrededor del valor deseado). Las acciones de control usadas que se ven en las Figura
6.11, se limitan a los valores condicionados por los actuadores y la capacidad física de
la bacteria, esto es 0.03< Ds<0.2, 10<Sin<250 y para el término de recirculación las
condiciones de 0<R<1.
235

2
Biomasa [g/L]

Modelo
1.5 Trayectoria Deseada
Datos Experimentales
1

0.5

0 20 40 60 80 100 120
Tiempo [Horas]
200
Glucosa[g/L]

Modelo
Trayectoria Deseada
100 Datos Experimentales

0
0 50 Tiempo [Horas] 100 150
80
Etanol [g/L]

60

40
Modelo
20 Trayectoria Deseada
Datos Experimentales
0
0 50 Tiempo [Horas] 100 150

Figuraure 6.10. Desempeño del controlador 3 siguiendo trayectorias obtenidas de


datos experimentales

Las tres acciones de control o variables manipuladas recirculación, sustrato de


alimento y tasa de dilución de sustrato, pueden observarse en la Figura 6.11. Además
se grafica la tasa de dilución total D que es la suma de la variable manipulada
intermedia Dr, asociada a la recirculación R, con la tasa de dilución de sustrato de
alimento Ds. Es evidente la interacción de las mismas en el control de las dinámicas
acopladas del bioreactor. Se espera que este comportamiento asumiendo
observabilidad completa, se mantenga en el momento de realizar la prueba en lazo
cerrado con el estimador de estados del Capítulo 5.
236

Acción de control de recirculación de Biomasa


1
Fracción

0.5

0
0 50 Tiempo [Horas] 100 150
Concentración de Sin [g/L]

Acción de Control de Sustrato de Entrada Sin


200

100

0
0 50 Tiempo [Horas] 100 150

Acción de control Tasa de Dilución de Sustrato Ds


Tasa de dilución [1/h]

0.1

0.05

0
0 50 Tiempo [Horas] 100 150
Acción de Control Tasa de Dilución Total D
Tasa de dilución total [1/h]

0.2

0.1

0
0 50 100 150
Tiempo [Horas]
Figura 6.11. Acciones de control para seguimiento de trayectoria del controlador

En la Figura 6.12 puede verse el desempeño del controlador ante perturbaciones


(tiempos 40, 60, 110 horas) de varias horas de duración en las corrientes de entrada.
Puede observarse que el controlador sigue bien la trayectoria predefinida y corrige las
oscilaciones propias del comportamiento real de la Zymomonas mobilis. Esto significa
que bajo condiciones controladas, el medio de cultivo será más confiable y con ello
podrán alcanzarse los valores máximos de productividad de etanol.
237

2
Biomasa [g/L]

Modelo
1.5 Trayectoria Deseada
1 Datos Experimentales

0.5
0 50 Tiempo [Horas] 100 150
200
Glucosa [g/L]

Modelo
Trayectoria Deseada
100 Datos Experimentales

0
0 50 Tiempo [Horas] 100 150
Etanol [g/L]

50
Modelo
Trayectoria Deseada
Datos Experimentales
0
0 50 Tiempo [Horas] 100 150
a. Variables de control Biomasa, Susutrato y Producto
Acción de Control de Recirculación de Biomasa
1
Fracción

0.5

0
0 50 Tiempo [Horas] 100 150
Acción de Control Sustrato de Entrada Sin
Concentración de Sin [g/L]

200

100

0
0 50 Tiempo [Horas] 100 150
Acción de Control Tasa de Dilución de Sustrato Ds
0.1
Tasa de Dilución [1/h]

0.05

0 Tiempo [Horas]
0 50 100 150
Acción de Control Tasa de Dilución Total D
0.2
Tasa de Dilución [1/h]

0.1

0
0 50 Tiempo [Horas] 100 150

b. Variables manipuladas recirculación de microorganismos, sustrato de entrada, tasa


de dilución de sustrato y tasa de dilución total.
6.12. a y b. Desempeño del controlador 3 ante perturbaciones
238

La estructura de control presentada en la sección 6.2 puede ser diseñada e


implementada fácilmente gracias al uso de las técnicas estándar de tipo algebraicas y
de métodos numéricos. Los resultados obtenidos de simulación sirven como
precedente para el análisis de técnicas de control para procesos fermentativos en
continuo. El comportamiento de los controladores en el particular bioproceso de
obtención de etanol usando la bacteria Zymomonas mobilis arroja resultados que abren
a la posibilidad de contar con control avanzado en caso de implementaciones en escala
piloto e industrial.

El uso de las trayectorias basadas en datos reales mostró que el controlador es factible
y puede ser implementado con acciones de control acotadas para las especificaciones
del proceso real, el término de recirculación que fue agregado en el controlador 3
como acción de control representa la probabilidad de usar la recirculación de biomasa
como variable de control para la fermentación en continuo, y que puede mejorar el
comportamiento dinámico. De los resultados obtenidos en simulación puede verse que
el error entre la trayectoria deseada y la seguida por el proceso es pequeño, dentro de
los límites tolerables alrededor del valor deseado.
239

6.3 Controladores basados en métodos numéricos y estimadores en lazo cerrado

En el proceso de fermentación alcohólica en continuo existen algunos problemas que


han sido abordados de manera puntual. En el capítulo 5 se desarrollaron estimadores
de biomasa y variables intermedias, con el fin de obtener herramientas para el manejo
de la información disponible del proceso, con miras a su uso en monitoreo,
supervisión y posterior control (Quintero et al., 2007, 2008a, 2008d). En las secciones
6.2.1 y 6.2.2 se estudiaron controladores que pueden llegar a ser la respuesta al
problema de control usando como estrategia las variables que regulan la cantidad de
nutrientes (sustrato) y la posibilidad de recircular microorganismos (Quintero et al.,
2008b). Ambas aproximaciones por separado brindan un panorama de lo que puede
llegar a ser el reto de controlar el proceso fermentativo a gran escala.

Con el fin de obtener conclusiones sobre el uso en bioprocesos de las herramientas


desarrolladas en esta tesis (Quintero et al., 2007, 2008a, 2008b, 2008d) y en robótica
móvil (Scaglia, Quintero et al., 2006, 2008a, 2008b), (Scaglia et al., 2007) se propone
la combinación de ambas herramientas bajo condiciones que se aproximen mas a la
realidad. Considerando que el problema de falta de sensores de biomasa estudiado en
el Capítulo 5 esta presente, y que es necesario hacer un control adecuado del proceso
fermentativo, se presenta una aproximación a la solución de ambos problemas con las
herramientas desarrolladas. En la Figura 6.13 se presenta el esquema general de
estimación y control que se desarrollará y detallará a continuación.

MODELO DE
FERMENTADOR
ALCOHÓLICO

ut yt
ESTIMADOR DE
ESTADOS FILTRO DE
PARTÍCULAS

xt
CONTROLADOR
BASADO EN MÉTODOS
NUMÉRICOS

Figura 6.13. Esquema de estimación y control


240

6.3.1Controlador 1-2 y estimador

El objetivo que en esta sección se persigue, es reproducir un escenario en el que se


tiene la posibilidad de controlar el comportamiento del bioproceso mediante la
manipulación de las tasas de dilución de sustrato y la concentración de sustrato en la
corriente del influente. También se tiene una carencia de medida de la concentración
de microorganismos presentes en el caldo de cultivo y de las variables intermedias
para la inhibición. Las mediciones a las que se puede acceder en este caso hipotético
corresponden a las concentraciones de sustrato y producto únicamente.

Este caso nos ubica en el uso del estimador de biomasa en lazo cerrado con los
controladores de las secciones 6.2.1 y 6.2.2 ya que la tasa de recirculación de
microorganismos puede permanecer fija, inclusive en un valor nulo. En la Figura 6.14
puede verse la simulación del controlador de sustrato y producto, en lazo cerrado con
el estimador de estados, se grafican únicamente la trayectoria real y la trayectoria
deseada. En esta simulación se usa una recirculación de microorganismos del 10%

160 80
Prod Model
ProdDesired
Prod Exp Data
70

132

60
Glucose Concentration [g/L]

Ethanol Concentration [g/L]


50
104

40

76
Sust Model 30
SustDesired
Sust Exp Data

20

48

10

20 0
0 30 50 60 90 100 120 150
Time [Hours]

Figura 6.14 Controlador de sustrato y producto en lazo cerrado con estimador de


estados.

La Figura 6.15 presenta el mismo controlador de sustrato y de producto que usa como
deseada, la trayectoria calculada al igual que en la sección 6.2 basada en datos reales.
A través del análisis de estas simulaciones, puede concluirse que el desempeño en lazo
cerrado de ambas soluciones propuestas es aceptable y cumple con las expectativas de
control y de estimación. Es importante resaltar que ambas aproximaciones se realizan
en el tiempo de muestreo simulado de 6 minutos, tiempo suficiente para realizar no
solo las acciones de control sino el cálculo del estimador recursivo inclusive con el
número máximo de partículas usado en este trabajo.
241

Se observó que el uso del estimador basado en filtros de partículas para las variables
de biomasa e inhibición es satisfactorio y provee información que el controlador usa
para llevar el sistema al estado deseado. Este primer resultado supone que ambas
herramientas son implementables en el proceso de fermentación real. El uso de la
herramienta de estimación permite resolver el problema de falta de información de la
concentración de biomasa en línea y las demás variables estimadas permiten
desarrollar estrategias de mayor jerarquía en caso de una aplicación a escala industrial.
Computacionalmente esta metodología puede ser implementada en una computadora
personal de características comunes con acceso a puertos de comunicación con
dispositivos electrónicos de medida.
Concentración de Glucosa [g/L]

Concentración de etanol [g/L]


180 70

60
148
50

116 40
Modelo de Producto
30
Prod Deseado
84 Modelo de Sustrato
Prod Dato Experimental 20
Sust Deseado
Sust Dato Experimental 10
52
0

20 -10
0 30 50 60 90 100 120 150
Tiempo [Horas]

Figura 6.15 Controlador de Sustrato y producto en lazo cerrado con estimador de


estados usando trayectoria basada en datos reales.
242

6.3.2 Controlador 3 y estimador de estados

Retomando el control de la sección 6.2.3, debe recordarse que las acciones de control
R, Ds y Sin están acopladas. En este caso se usa la recirculación de microorganismos
como variable manipulada para hacer que la concentración de biomasa siga una
trayectoria previamente definida. En esta sección en particular se verá con mayor
relevancia, la utilidad del estimador de biomasa, ya que no solo servirá para calcular
acciones de control para el sustrato y el producto, sino también que esta medida está
involucrada directamente en la acciones para controlar la cantidad de
microorganismos de la colonia, lo que exige un cálculo más preciso y un control que
pueda ser menos susceptible a la pérdida de precisión de la medida o los errores de
redondeo, característica con que cuenta el controlador basado en métodos numéricos
(Scaglia, 2006)(Scaglia, Quintero et al., 2006, 2007, 2008a)

En la Figura 6.16 se presentan las trayectorias seguidas por el bioproceso para una
simulación de 150 horas de duración, reproduciendo los datos reales de (Raposso et
al., 2005) bajo las consideraciones de la disponibilidad de información únicamente de
las concentraciones de sustrato y producto, extraídos de los datos reales.

Concentración de Células de Z.m


Concentración de Biomasa [g/L]

1.8
1.6
1.4
1.2 Fermentación
1 Trajectoria Deseada

0.8
0.6
0.4
0.2

0 50 Tiempo [Horas] 100 150


Figura 6.16 Controlador mejorado y estimador de biomasa para control de la
población de Células de Z.m

Puede verse que su desempeño es satisfactorio. En los trabajos realizados durante el


desarrollo de la tesis, se estudiaron el desempeño de estimadores de estado (Quintero
y di Sciascio, 2004, 2005), (Quintero et al, 2007, 2008a, 2008d), y controladores
basados en métodos numéricos (Quintero et al, 2008b,e) por separado; esos resultados
y las mejoras que se fueron desarrollando llevaron a proponer en simulación los
resultados de la sección 6.3.1 (Quintero et al, 2007c) como primera aproximación a
una solución al problema de control que representa la fermentación alcohólica en
continuo a partir de Zymomonas mobilis.
243

Consecuentemente, esta sección ha presentado el que consideramos como la


conjunción de controladores basados en cálculos simples (como ventaja del método)
con estimadores basados en técnicas avanzadas de estimación Bayesiana de estados en
sistemas no lineales no gaussiano.

Concentración de Sustrato
Concentración de Glucosa [g/L]

300

250

200

Fermentación
150
Trajectoria Deseada

100

50

0
0 50 Tiempo [Horas] 100 150

Figura 6.17 Controlador mejorado y estimador de biomasa para control de


concentración de sustrato de alimento
Concentración de Producto
Concentración de Etanol [g/L]

80
Fermentación
70 Trayectoria deseada
60

50

40

30

20

10

0
0 50 Tiempo [Horas] 100 150

Figura 6.18 Controlador mejorado y estimador de biomasa para control de


concentración de producto

Este trabajo es el resultado de la aplicación de las técnicas de estimación y control en


simulación y con el uso de datos experimentales para aproximarse a las condiciones
reales lo más posible. La técnica de control usada no ha sido únicamente
implementada en el control de este bioproceso, sino que fue usada como primera
aplicación, el seguimiento de trayectoria de robots móviles, posicionamiento y
seguimiento de robot líder, todas ellas con resultados satisfactorios que fueron
244

reportados apropiadamente. (Scaglia, Quintero et al, 2006), (Scaglia Quintero et al,


2007), (Scaglia Quintero et al, 2008a, 2008b). Actualmente los biocombustibles como
el etanol están en la mira de muchos investigadores; con el propósito de desarrollar
maneras limpias, seguras, confiables y de alta productividad para obtenerlo buscando
las condiciones óptimas y el ahorro de costos de producción y de energía.
245

Capítulo 7
CONCLUSIONES

Esta tesis ha presentado la aplicación de técnicas de filtrado de partículas como


solución del problema de filtrado óptimo en sistemas dinamicos no lineales no
gausianos mediante el desarrollo recursivo de la regla de Bayes y el uso de los
métodos secuenciales de Monte Carlo. Se usó la metodología mencionada para la
estimación de los estados en dos procesos biotecnológicos como lo es la fermentación
alcohólica en continuo de Zymomonas mobilis (Z.m) y la fermentación batch de
Bacillus Thuringiensis (bt).

Para la aplicación sobre el primero de los bioprocesos se presentó un modelo dinámico


no lineal de cinco variables de estado, tres de las cuales son medibles (Concentración
de Biomasa, Concentración de Sustrato de alimento, Concentración de Producto) y
dos de las cuales son variables que caracterizan el efecto de la concentración de etanol
sobre el comportamiento de la bacteria. Pese a que la concentración de biomasa es
medible, se realizaron estimaciones del estado Biomasa debido a que los sensores
usados para este propósito no están siempre disponibles y para su medición en línea
representan un costo adicional alto que a nivel de laboratorio y piloto e inclusive
industrial, no es factible de asumir. Para lograr una estimación confiable de las
variables de estado, se hicieron dos aproximaciones, la primera en simulación en la
que se usó el modelo como planta real y a su vez una versión modificada del mismo
para alimentar el filtro. Posteriormente, se realizo una aproximación en la cual datos
reales de fermentaciones en continuo se usaron como planta real, y el modelo
ampliado de la planta con un modelo de incertidumbre incluido dentro del filtro. Las
estimaciones de Biomasa y las variables de inhibición por producto fueron
satisfactorias.

Para la fermentación por Lotes de Bacillus Thuringiensis se usó un modelo dinámico


que incluye el modelado de la concentración de células totales, células vegetativas,
células esporuladas, sustrato primario, sustrato secundario y dinámica de oxígeno
disuelto. A partir de este modelo se desarrollaron igualmente dos aproximaciones, la
primera en simulación y la segunda usando un modelo complejo con incertidumbre
modelada tipo ARIMA en contraste con datos reales de tres fermentaciones,
previamente procesados. Las estimaciones de la concentración de Biomasa fueron
igualmente satisfactorias y se sentó un precedente en el modelado de incertidumbres
en sistemas por lotes mediante combinación de modelos determinísticos y estocásticos
con modelado típico de series de tiempo tipo ARIMA.
246

Se aplicaron técnicas de control basado en métodos numéricos para el diseño de tres


controladores para el proceso continuo de fermentación alcohólica en las cuales se
tenían en cuenta: primero las variables de control para sustrato y producto, una
recirculación de microorganismos fija y las variables de control de sustrato y
producto, y recirculación de microorganismos variable para control de biomasa y
variables de control de sustrato y producto, respectivamente. Finalmente, se realizaron
conFiguraciones de las estrategias de control en lazo cerrado con los estimadores de
estados desarrollados para la fermentación de Zymomonas mobilis obteniendo
resultados satisfactorios para el seguimiento de una trayectoria de fermentación
basada en datos reales, usando una estructura de filtro que usa los mismos para el
procedimiento de estimación.

7.1 Producción académica

A continuación se citan en orden cronológico descendiente los trabajos de producción


académica desarrollados durante esta investigación, Podrá notarse que no solo se
realizaron aplicaciones en bioproceoss sino también que se realizaron trabajos en el
campo de la robótica movil, como parte del aprendizaje de la técnica de control basada
em métodos numéricos.

2009
Revistas Indexadas:

G. Scaglia, V. Mut, M. Jordan, C. Calvo, O. Quintero. “Robust control based


controller design for a mobile robot”. J Eng Math (2009) 63: 17–32 DOI
10.1007/s10665-008-9252-0
O. Quintero, A. Amicarelli, G. Scaglia, and F. di Sciascio "Control Based on
Numerical Methods and Recursive Bayesian Estimation in a Continuous
Alcoholic Fermentation Process" in BioResources. 4(4), 1372-1395.

Aceptados para publicación

G. Scaglia, A. Rosales, O. Quintero, V. Mut, R. Agarwal. "A Linear-


Interpolation-based Controller Design for Trajectory Tracking of Mobile
Robots" in Control Engineering Practice.

En primera Revisión

O. Quintero, J. Nieto, A. Amicarelli, G. Scaglia, T. Luna, F. di Sciascio.


“Control Engineering Perspective of a Fermentation Process from
247

Zymomonas mobilis: Modeling, State Estimation and Control” to Brazilian


Journal of Chemical Engineering.

2008
Revistas Indexadas

G. Scaglia, O. Quintero, V. Mut, F. di Sciascio. “Numerical Methods Based


Controller Design for Mobile Robots”. Robotica de Cambridge. Robotica,
Published online by Cambridge University Press 23 Jun 2008.
O. Quintero, A. Amicarelli, F di Sciascio, and G Scaglia. State Estimation in
Alcoholic Continuous Fermentation of Zymomonas Mobilis using recursive
bayesian Filtering: A Simulation approach. Bioresources issue 3 (2) May
2008.

Congresos:

O. Quintero, A. Amicarelli, F. di Sciascio. “Recursive Bayesian Filtering for


States Estimation: An Application Case in Biotechnological Processes”, en
3th joint international Meeting of Institute of matematical Statistics (IMS) –
International Society for Bayesian Anlysist (ISBA), Markov Chain Monte
Carlo Theory and Practice MCMSKi in Bornio Italy, Jan 8-11, 2008.
O. Quintero, G.Scaglia, A. Amicarelli, F. di Sciascio. “Bioprocess control
strategy based on numerical methods and linear algebra: Second Approach”,
en IASTED International Conference in Modelling Identification and Control
MIC 2008 conference en Insbruck Austria, Febrero 11-13 de 2008.
G. Scaglia, O. Quintero, V. Mut, F. di Sciascio. “Numerical Methods based
controller design for mobile robots”. Case Study para el 17 IFAC World
congress in Seoul Korea.
O. Quintero, G.Scaglia, F. di Sciascio, V. Mut. “Numerical Methods Based
Strategy and Particle Filter State Estimation For Bio Process Control”, ICIT
2008 IEEE International Conference on industrial Technology, Chengdu
china, April 24, 2008.
L. Quintero, G. Scaglia, A. Amicarelli, F. di Sciascio. “Control basado em
métodos numéricos para la elaboracion de um biocombustible. XIII Congreso
Latinoamericano de Control Automatico”. VI Congreso venezolano de
Automatización y Control. 25 al 28 de Noviembre – Merida Venezuela.
L. Quintero, J. Nieto, A. Amicarelli, G Scaglia, T. Luna and F di Sciascio.
“Control Engineering Perspective of fermentation process from zymomonas
mobilis: modeling, state estimation and control.” XIII Congreso
Latinoamericano de Control Automatico. VI Congreso venezolano de
Automatización y Control. 25 al 28 de Noviembre – Merida Venezuela.
248

A. Amicarelli, J.M. Toibero, O. Quintero, F. di Sciascio. R. Carelli.


“Estrategias de control de oxigeno disuelto aplicadas a La fermentacion batch
de Bt”. XIII Congreso Latinoamericano de Control Automatico. VI Congreso
venezolano de Automatización y Control. 25 al 28 de Noviembre – Merida
Venezuela.
O. Quintero, J. Nieto, A. Amicarelli, G Scaglia, T. Luna and F di Sciascio.
“Control Engineering Perspective of fermentation process from zymomonas
mobilis: modeling, state estimation and control”. AADECA 2008
O. Quintero, G Scaglia, A. Amicarelli, and F di Sciascio. “Control Basado en
métodos numéricos para la obtención de un biocombustible”. AADECA
2008.
Amicarelli, O. Quintero, F di Sciascio and H. Álvarez. “Comparative Study
for biomass estimation in batch biotechnological process”. AADECA 2008
Amicarelli, J.M. Toibero, O. Quintero, and F di Sciascio. “Control de
Oxigeno disuelto para fermentación batch de BT”. AADECA 2008

2007
Congresos:
G. Scaglia,G., V. Mut, O Quintero et al,. “Tracking Control of a Mobile
Robot using LinearInterpolation” IMAACA, 2007 vol. 1, pp. 11-15, ISBN:
978-2-952071277.
O. Quintero, A. Amicarelli, F. di Sciascio, Estimador de Estados en
Fermentación Alcohólica en Continuo de Z.m Mediante Filtrado Bayesiano
Recursivo .XII Reunión de Trabajo en Procesamiento de la Información y
Control, 2007, Río Gallegos, Argentina

2006
Congresos:
G. Scaglia, O. Quintero, V Mut, F. di Sciascio, “Control de Trayectoria de
Robots Moviles Usando Álgebra lineal”. XII Congreso Latinoamericano de
Control Automático CLCA 2006, Bahia, Brazil.
G. Scaglia, O. Quintero, V Mut, F. di Sciascio, “Control de Trayectoria de
Robots Moviles Usando el método de integración trapezoidal”. XIX
Congreso Argentino de Control Automático AADECA 2004, Buenos Aires,
Argentina, 2006.

2005
O. Quintero, F. di Sciascio, “Observadores De Estados De Un Proceso De
Fermentación Alcohólica En Continuo Mediante Filtros De Kalman
Extendidos” XI Reunión de Trabajo en Procesamiento de la Información y
Control, 21 al 23 de septiembre de 2005, Río IV, Argentina.
249

Bibliografía

Adilson J., Rubens M., “Soft sensors development for on-line bio-reactor state
estimation.” Computers and Chemical Engineering 24 , 1099-1103, (2000)

Aguilar, R. et al, Robust PI2 controller for continuous bioreactors. Process


Biochemistry 36 (2001) 1007-1013.

Ahlstrom, M. and Calais, M. “Bayesian terrain navigation with Monte Carlo Method”.
Master's Thesis LiTH-ISY-EX-3051, Department of Electrical Engineering.
Linkoping University, Linkoping, Sweden, 2000. In Swedish.

Alsayeh O, “Annual Prediction using Particle Filter”, IEEE 2003

Alspach, D. L. and Sorenson, H. W. “Nonlinear Bayesian estimation using Gaussian


sum approximation”. IEEE Transactions on Automatic Control, 17:439–448.1972.

Amicarelli A., di Sciascio F. Álvarez H. and Ortiz O., “Estimación de Biomasa en un


proceso Batch: Aplicación a la producción de δ-endotoxinas de Bt,” XXII
Interamerican Congress of Chemical Engineering, Bs. As., Argentina, (2006).

Amicarelli A., di Sciascio F. and Álvarez H., “Including Dissolved Oxygen Dynamics
to the bacillus thuringiensis δ-endotoxins production process”. Manuscript submitted
to The Canadian Journal of Chemical Engineering, (2007).

Andersen, D. C.; Swartz, J.; Ryll, T.; Lin, N. e Snedecor, B. (2001), Metabolic
oscillations in an E. coli fermentation Dana C. Andersen, Biotechnology and
Bioengineering,, v. 72, n. 2, p. 212 – 218.

Anderson, B.D.O and Moore, J.B. “Optimal Filtering”. Prentice-Hall, Englewood


Cliffs, NJ, 1979.

Andrieu, C. and Godsill, S. J. (2000). A particle filter for model based audio source
separation. In Proceedings of the International Workshop on Independent Component
Analysis and Blind Signal Separation (ICA 2000), Helsinki, Finland.

Andrieu, C. and Doucet A. (2000) Stochastic algorithms for marginal MAP retrieval
of sinusoids in non-Gaussian noise, Proc. Work. IEEE SSAP.
250

Andrieu, C. and Doucet, A. “Particle filtering for partially observed Gaussian state
space models”. Journal of the Royal Statistical Society, 64(4):827–836, 2002.

Arnold, L. and Xu Kedai (1995). Normal forms for random differential equations.
Journal of Differential Equations 116, 484–503.

Arnold, L. and P. Imkeller (1998). Normal forms for stochastic differential equations.
Probabability Theory and Related Fields 110, 559–588.

Arulampalam M. S., Maskell S., Gordon N., and Clapp T., “A Tutorial on Particle
Filters for Online Nonlinear/Non-Gaussian Bayesian tracking,” IEEE Trans. Signal
Processing, vol. 50, no. 2, pp. 174–188, Feb. 2002.

Åström, K.J. Introduction to Stochastic Control Theory. Academic Press. New York.
(1970)

Åström, K. J. and Eykhoff, P. System identification – a survey. Automatica, 7:123–


162. (1971).

Åström, K.J., P. Hagander and J. Sternby. Zeros of sampled systems. Automatica


20(1), 31–38. (1984).

Atehortúa P., Álvarez H., Orduz S. “Comments on: A Sporulation Kinetic Model for
Batch Growth of B. thuringiensis”, The Canadian Journal of Chemical Engineering,
V. 84, No. 3. (2006).

Atehortua P., Alvarez H.D., S. Orduz. Modeling of growth and sporulation of Bacillus
thuringiensis in an intermittent fed batch culture with total cell retention. Bioprocess
Biosyst Eng. 2007 Jul 22. (2007)

Ba, S.O., and Odobez, J.M., “A Rao-Blackwellized Mixed state particle filter for head
pose tracking in meetings”, Workshop MMMMP, ICMI Trento, October 2005.

Bar-Shalom, Y. and Li, X.-R. “Estimation and Tracking: Principles, Techniques, and
Software”. Artech House, Norwood, MA, USA. 1993.

Bartholomaus, R., “Continuation methods for robust controller design for plants with
operating-point-dependent behaviour” Contr. Eng. Practice, 10, 941. 2002.

Bastin, G. and D. Dochain, On-Line Estimation and Adaptive Control of Bioreactors.


Elsevier Science Publishers (1990).
251

Benes, V. “Exact finite dimensional for certain diffusions with nonlinear


drift”Stochastics, vol 5 pp 65-92, 1981.

Benes, V. “New exact finite dimensional with large Lie algebras”Syst. Control Lett,
vol 5, pp 217-221, 1985.

Berger, J.O. Statistical Decision Theory and Bayesian Analysis. Springer- Verlag,
2nd edition, 1985

Bergman, N. “Recursive Bayesian Estimation, Navigation and tracking applications”.


PhD Thesis Linkoping Studies in Science and Technology. Dissertations No. 579
Department of Electrical Engineering Linkoping University, Linkoping, Sweden 1999.

Bernhard Schoolkopf, Max-Planck-Institut four biologische Kybernetik “SVM and


Kernel Methods” 2002

Beuse, M.; Kopmann, A.; Diekmann, H.; Thoma, M. (1999), Oxygen, pH value, and
carbon source induced changes of the mode of oscillation in synchronous continuous
culture of Saccharomyces cerevisiae, Biotechnology and Bioengineering, v. 63, n. 4,
p. 410 – 417.

Bishop, G. and Welch, G. “An Introduction to the Kalman Filter”. University of North
Carolina at Chapel Hill Department of Computer Science, SIGGRAPH 2001, Course
8.

Borzani, W.; Gregori, R. E. e Vairo, M. L. R. (1977), Some observations on


oscillations changes ín the growth rate of saccharomyces cerevisiae in aerobic
continuous undisturbed culture, Biotechnology and Bioengineering, v. 19, : 1363-
1374, 1977.

Boillereaux L., Flaus J., “A New Approach for Designing Model-Based Indirect
Sensors” IEEE Transaction on Control Systems Technology, Vol. 8, N. 4, July
(2000).

Box, G. and Tiao, G. “Bayesian Inference in Statistical Analysis”. Ed. John Wiley,
1992.
Bravo, S, Mahn, A and Shene, C. Effect of feeding strategy on Zymomonas mobilis
CP4 fed-batch fermentations and matemática modelling of the system.. Appl
Microbiol Biotechnol (2000) 54: 487-493

Briers, M. (2006). Improved Monte Carlo Methods for State-Space Models,


Cambridge University PhD Thesis.
252

Briers, M., Doucet, A, and Maskell, S. (2004). “Smoothing algorithms for state-space
models,” Cambridge University Engineering Department Technical Report, CUED/F-
INFENG/TR.498.

Briers, M., Doucet, A., and Singh, S. (2005). “Sequential auxiliary particle belief
propagation,” International Conference on Information Fusion.

Bringer, S.; Hartner, T.; Poralla, K. e Hermann, S. (1985), Influence of ethanol on the
hopanoid content and the fatty acid pattern in batch and continuous cultures of
Zymomonas mobilis. Archives of Microbiology, v. 140, p. 312–316.

Briers M., Doucet, A., “Sequential Auxiliary Particle belief Propagation” Cambridge
University Engineersing department 2005.

Bryson E. and KI. Frazier. “Smoothing for linear and non- I . linear dynamic
systems,” Aeronautical SGstems Div Patterson AFB, Ohio, Tech. Rept. ASD-TDR-
63-119, February 196.3.

Bryson, A.E. Jr., and Henrikson, L.J. “Estimation using sampled data containing
sequentially correlated nose” in Journal of Spacecraft and Rockets, June 1968

Bucy R.S. “Non Linear Filtering Theory”. IEEE Transactions on Automatic Control
1965.

Bucy, R.S. and P.D. Joseph (1968). Filtering for Stochastic Process with Applications
to Guidance. Wiley-Interscience.

Bucy, R. S. and Senne, K. D. “Digital synthesis on nonlinear filters” Automatica,


7:287–298. 1971.

Cai, Z., Le Gland F., and Zhang H., “An adaptive local grid refinement method for
nonlinear filtering”. Internal Pubication. INRIA, Tech. Rep. 954.

Carpenter J., Clifford P., and Fearnhead P., “Improved Particle Filter for Nonlinear
Problems,” IEE Proc. F Radar, Sonar Navigation., vol. 146, no. 1, pp. 2–7, 1999.

Casella, G. and Robert, C. P. (1996). Rao-Blackwellisation of sampling schemes.


Biometrika, 83(1):81–94

Casella G., “Statistical inference and Monte Carlo algorithms” Test, vol. 5, pp. 249–
344, 1997.
253

Chang C., and Ansari, R., “Kernel particle filter: Iterative Sampling for efficient visual
tracking” IEEE 2003.

Chen T, Morris J and Martin E. “Particle Filters for the Estimation of a State Space
Model” Centre for Process Analytics and Control Technology School of Chemical
Engineering and Advanced Materials University of Newcastle, Newcastle upon Tyne,
NE1 7RU, UK 2003.

Chen, R., Wang, X., and Liu, J. S. (2000). Adaptive joint detection in flat-fading
channels via mixture Kalman filtering. IEEE Transactions on Information Theory,
46(6):2079– 2094.

Chen, R. and Liu, J. S. “Mixture Kalman filters”. Journal of the Royal Statistical
Society, 62(3):493–508. 2000.

Chen, Z “Bayesian Filtering: From Kalman Filters to Particle Filters, and Beyond”,
Technical report, the Communications Research Laboratory, McMaster University,
Hamilton, Ontario, Canada 2003

Chi, C. T. e Howell, J. A., (1976), Transient-behavior of a continuous stirred tank


biological reactor utilizing phenol as an inhibitory substrate, Biotechnology and
Bioengineering, v. 18, p. 63-80.

Chi, C. T.; Howell, J. A. e Pawlowsk, U., (1974), Regions of multiple stable steady
states of a biological reactor with wall growth, Chemical Engineering Science, v. 29,
p. 207-211.

Challa S, Bar-Shalom Y. Nonlinear filter design using Fokker–Planck–Kolmogorov


probability density evolutions. IEEE Trans Aerospace Elec Syst 36: 309–315, 2000

Chen, Z and Haykin, S. “On different facets of regularization theory”, Neural comput
vol 14, No 12 pp 279-2846, 2002.

Chib S. and Greenberg, E. “Understanding the Metropolis-Hastings algorithm,” Am.


Stat., vol. 49, pp. 327–335, 1995.

Clancy EA, Bida O, Rancourt D. Influence of advanced electromyogram (EMG)


amplitude processors on EMG-to-torque estimation during constant-posture, force-
varying contractions. J Biomech 39: 2690– 2698, 2006.

Clancy EA, Bouchard S, Rancourt D. Estimation and application of EMG amplitude


during dynamic contractions. IEEE Eng Med Biol Mag 20: 47–54, 2001.
254

Clancy EA, Farry KA. Adaptive whitening of the electromyogram to improve


amplitude estimation. IEEE Trans Biomed Eng 47: 709–719, 2000.

Clancy EA, Hogan N. Single site electromyograph amplitude estimation. IEEE Trans
Biomed Eng 41: 159–167, 1994.

Clancy EA, Hogan N. Multiple site electromyograph amplitude estimation. IEEE


Trans Biomed Eng 42: 203–211, 1995

Clancy EA, Hogan N. Relating agonist-antagonist electromyograms to joint torque


during isometric,
quasi-isotonic, nonfatiguing contractions. IEEE Trans Biomed Eng 44: 1024–1028,
1997.

Clancy EA, Hogan N. Probability density of the surface electromyogram and its
relation to amplitude
detectors. IEEE Trans Biomed Eng 46: 730–739, 1999.[CrossRef][ISI][Medline]

Clancy EA, Morin EL, Merletti R. Sampling, noise-reduction and amplitude


estimation issues in
surface electromyography. J Electromyogr Kinesiol 12: 1–16, 2002.[

Cox, H. “On the estimation of state variables and parameters for noisy dynamic
systems,” IEEE Trans. on Automatic Control, vol. AC-9, pp. 5-12, January 196:.

Crisan, D., Doucet, A. “A survey of convergence Results on Particle Filters for


Practitioners”, IEEE Transaction on signal processing, 2002.

Danner, H e Braun, R (1999), Biotechnology for the production of commodity


chemicals from biomass, Chemical SocietyReview, v. 28, p. 395–405

Daoutidis, P., and M. Henson. 2002. Dynamics and control of cellpopulations in


continuous bioreactors. In Sixth Intl. Conf. on Chemical Process Control. J. B.
Rawlings, B. A. Ogunnaike, and J. W. Eaton,editors. AICHE Press, New York. 274–
289.

Daugulis, A. J.; McLellan, P. J. E. e Li, J. H. (1997), Experimental investigation and


modeling of oscillatory behavior in the continuous culture of Zymomonas mobilis,
Biotechnology and Bioengineering, v. 56, n. 1, p. 99-105.

Daley, D. J. and Vere-Jones, D. (2003). An Introduction to the Theory of Point


Processes second ed. vol. I: Elementary Theory and Methods of Probability and Its
Applications. Springer, New York.
255

Daly, M. J., Reilly, J. P., and Morelande, M. R. “Rao-Blackwellised particle filtering


for blind system identification”. In Proceedings of the IEEE International Conference
on Acoustics, Speech, and Signal Processing, Philadelphia, PA, USA. 2005.
Daoutudis, P., and Henson, M., “Dynamics and Control of Cell Populations in
Continuous Bioreactors”

Daum, F. “Exact finite dimensional nonlinear filter” IEEE Trans, Automatic, Control,
vol 31 no 7, pp 616 – 622, 1986.

Daum F. “Solution of the Zakai equation by separation of variables” IEEE


Transactions on Automatic Control, Vol AC-32 No 10, October 1987.

Daum, F. “New exact nonlinear filters”Bayesian analysis of time series and dynamic
models, J.C Spall, Ed New York: Mariel Dekker, 1988. Pp 199- 226.

Daum F, Nonlinear Filters: beyond The Kalman Filter, IEEE A& E Systems
Magazine, 2005

Deanda, K.; Zhang, M.; Eddy, C. e Picataggio, S. (1996) Development of an


arabinose-fermenting Zymomonas mobilis strain by metabolic pathway engineering,
Applied and Environmental Microbiology, v. 62, n. 12, p. 4465–4470.

de Freitas N, J. F. G. “Bayesian methods for neural networks,” Ph.D. thesis, Dept.


Eng., Univ. Cambridge, 1998. Available on line in:
http://www.cs.ubc.ca/_nando/publications.html. Department of Electrical Engineering
Linkoping University, SE{581 83 Linkoping, Sweden, 2003

Deng, H. and M. Krstic (1997a). Stochastic nonlinear stabilization – i: A backstepping


design. Systems and Control Letters 32(3), 143–150.

Deng, H. and M. Krstic (1997b). Stochastic nonlinear stabilization – ii: Inverse


optimality. Systems and Control Letters 32(3), 151–159.

de freitas, N. Web site, Software. http://www.cs.ubc.ca/%7Enando/software.html.

di Sciascio F, Amicarelli A. “Bayesian Gaussian Process Regression for Biomass


Estimation in Batch Biotechnological Processes” XII Reunión de Trabajo en
Procesamiento de la Información y Control RPIC (2007).

Dien, B. S.; Cotta, M. A. e Jeffries, T. W. (2003), Bacteria engineered for fuel ethanol
production: current status, Applied Microbiology and Biotechnology, v. 63, n. 3, p.
258 – 266
256

Djuric, P. and Kotecha, J. “Particle Filtering” IEEE Signal Processing Magazine,


2003.

Dochain, D.,”State A State Observer for (Bio)Processes with Uncertain Kinetics,”


Proceedings of the American Control Conference. Anchorage, AK May 8-1 0, (2002).

Dochain, D., ”State and Parameter Estimation in Chemical and Biochemical


Processes: A Tutorial”, Journal of Process Control, 13, 801-818, (2003).

Doedel, E.; Champneys, A. R.; Fairgrieve, T. F.; Kuznetsov, Y. A.; Sandstede, B. e


Wang, X. (1997), AUTO97: Continuation and Bifurcation Software for Ordinary
Differential Equations, User’s Guide, Montreal, Concordia University.

Douc R. and Cappé O. “Comparison of Resampling Schemes for Particle Filtering”.


Ecole Polytechnique, France. 2005

Doucet A. “Monte Carlo Methods for Bayesian Estimation of Hidden Markov Models.
Application to Radiation Signals” Ph.D. Thesis (in French with chapters 4 and 5 in
English) Univ. Paris-Sud, Orsay, 1997.

Doucet, A. “On Sequential Simulation Based Methods for Bayesian Filtering”.


Technical report University of Cambridge, 1998.

Doucet A., Godsill S., and Andrieu C. “On Sequential Monte Carlo Sampling
Methods for Bayesian Filtering”, 1998.

Doucet A., de Freitas N., K. Murphy, and S. Russell, “Rao-Blackwellised particle


filtering for dynamic Bayesian networks” in Proc. UAI2000, pp. 176–183, 2000.

Doucet, A., Godsill, S. J., and Andrieu, C. (2000a). On sequential Monte Carlo
sampling methods for Bayesian filtering. Statistics and Computing, 10(3):197–208.

Doucet, A., Godsill, S. J., and West, M. (2000b). Monte Carlo filtering and smoothing
with application to time-varying spectral estimation. In Proceedings of the IEEE
International Conference on Acoustics, Speech, and Signal Processing, volume 2,
pages 701–704, Istanbul, Turkey.

Doucet A., Gordon N., and Krishnamurthy V., “Particle filters for state estimation of
jump Markov linear systems,” IEEE Trans. Signal Processing, vol. 49, pp. 613–624,
Mar. 2001.
257

Doucet A, de Freitas N, and Gordon N J, editors. “Sequential Monte Carlo Methods in


Practice”. Springer-Verlag, 2001.

Doucet, A, de Freitas N, Gordon N, Sequential Monte Carlo methods in Practice.


Springler New York 2002.

Doucet, A., Briers, M. “Efficient Block Sampling strategies for sequential Monte
Carlo Methods” Cambridge University Engineersing Department 2006.

Dondo, R. y Marques, D., “Mass and energy balances as state-space models for
aerobic batch fermentations.,” Lat. Am. Appl. Res.. V. 32, no.2 p.195-204,(2002).

Dupuis, P. “Numerical methods for stochastic control problems in contimuous time”


New York: Springer verlag, 1992.

Echeverry, N., Quintero, O., Ramírez, M. (2003) Modelamiento Simulación y pruebas


de control para un biorreactor alcohólico en continuo. Trabajo Dirigido de Grado
Universidad Nacional de Colombia Sede Medellín, Facultad de Minas.

Echeverry, N., Quintero, O., Ramírez, M “Control de un biorreactor para fermentación


alcohólica en continuo” XI Congreso latinoamericano Control Automatico, CLCA,
Cuba, 2004.

Eidehall, A., Schön, T. B., and Gustafsson, F. (2005). The marginalized particle filter
for automotive tracking applications. In Proceedings of the IEEE Intelligent Vehicle
Symposium, pages 369–374, Las Vegas, USA.

El Moubaraki, J., G. Bastin, and L. Levine, “Nonlinear Control of Biotechnological


Processes with Growth-Production Decoupling,” Math. Biosciences, 116, 21–44
(1993).

Englehart K, Hudgins B. A robust, real-time control scheme for multifunction


myoelectric control. IEEE Trans Biomed Eng 50: 848–854, 2003.

Englehart K, Hudgins B, Parker PA. A wavelet-based continuous classification


scheme for multifunction myoelectric control. IEEE Trans Biomed Eng 48: 302–311,
2001.

Fang B., “Kalman-Bucy Filter for Optimum Radio- Inertial Navigation” Short Paper
IEEE Transactions on Automatic control, August 1967.
258

Fearnhead, Paul. Sequential Monte Carlo methods in Filter theory, Merton College
University of Oxford. A thesis submitted in partial fulfillment of the requirements for
the degree of DPhil at the University of Oxford Trinity Term 1998.

Fearnhead, Paul. “Particle filters for mixture models with unknown number of
components,” paper preprint, 2001. Available on line
http://www.maths.lancs.ac.uk/_fearnhea/.

Fitzgerald, R.J. Divergence of the Kalman filter, (IEEE Transactions on Automatic


Control, December 1971)

Fraser, D. C. y Potter, J.E. “The optimum Linear smoother as a combination of two


optimum linear filters” IEE Transactions on Automatic Control, Dec. 1968.

Friedland, B. “Treatment of bias in recursive Filtering” IEEE Transactions on


Automatic Control, August 1969

Friedland, B. and I. Bernstein, Estimation of the state of a non-linear process in the


presence of non-Gaussian noises and disturbances,” General Precision Aerospace
Rept. 65-RC-1, 1969

Fujisaki M., Kallianpur G., and Kunita H. “Stochastic differential equations for the
nonlinear filtering problem,” Osaka J. Math., vol. 9, pp. 19–40, 1972.

Gadeyne K., and Lefebvre T., “The application of probabilistic techniques for the
state/parameter estimation of (dynamical) systems and pattern recognition problems”
Katholieke Universitet Leuven, 2004.

Gelfand A. and Smith, A. F. M. “Sampling-based approaches to calculating mariginal


densities,” J. Amer. Statist. Assoc., vol. 85, pp. 398–409, 1990.

Gelman, A., Rubin, and D. B. “Inference from iterative algorithms (with


discussions),” Statistic. Sci., vol. 7, pp. 457–511, 1992.

Gentil, I., Remillard, B. and DelMoral, P. (2005). Filtering of images for detecting
multiple targets trajectories. In Statistical Modeling and Analysis for Complex Data
Problems. Springer. To Appear.

Geweke, J. y Tanizaki, H. “On Markov chain Monte Carlo methods for nonlinear and
non-gaussian state-space models,” Commun. Stat. Simul. C, vol. 28, pp. 867–894,
1999.
259

Ghommidh, C; Vaija, J.; Bolarinwa, S. e Navarro, J. M. (1989), Oscillatory Behaviour


of Zymomonas in Continuous Cultures: A simple Stochastic Model, Biotechnology
Letters, v. 11, p. 659-664.

Gillespie Dan T.. The chemical langevin equation. J. Chem. Phys.,113:297–306, 2000.

Girsanov V., “On the transformation of a certain class of stochastic processes by


absolutely continuous substitution of measures,” Theory Prob., vol. 5, pp. 285–301,
1960.

Glynn P., and Szechtman, R., Some perspectives on the method opf control variates.
In Monte Carlo, cuasi Monte Carlo Methods. Springler Verlag 2002

Goodman, I. R., Mahler, R. P. S. and Nguyen, H. T. (1997). Mathematics of Data


Fusion. Kluwer Academic Publishers.

Gordon, N., Salmond, D., and Smith, A. “Novel Approach to Non Linear-Non
Gaussian Bayesian State Estimation” IEE Proceedings F, Abril 1993.

Gray A and Moore A. Nonparametric density estimation: Toward computational


tractability. In SIAM International Conference on Data Mining, 2003.

Guergachi, A, Patry, G “Using statistical learning theory for modeling the uncertainty
in Bussiness and engineering systems: A qualitative Introduction”, Systems, Man, and
Cybernetics, 2001 IEEE International Conference onVolume 1, 7-10 Oct. 2001
Page(s):423 - 428 vol.1 Digital Object Identifier 10.1109/ICSMC.2001.969849

Gunasekaran, P. e Raj, K. C. (1999), Ethanol fermentation technology - Zymomonas


mobilis. Current Science, v. 77, n. 156–

Gustafsson, F. Gunnarsson, F. “Particle Filters for Positioning, Navigation and


Tracking”. IEEE Transactions in signal Processing, February 2002.

Haddad W., Challaboina V., Nersesov S., “Time Reserval Symmetry, Poincare
Recurrence, Irreversibility and Entropic Arrow of time: From Mechanics to System
Thermodynamics”. Proc. 44th IEEE CDC-ECC, España, pp. 5995-6002 (2005).

Handschin, J. E. Y Mayne, D. Q. “Monte Carlo techniques to estimate conditional


expectation in multi-state non-linear filtering,” Int. J. Contr., vol. 9, no. 5, pp. 547–
559, 1969.

Harrisons P, and Stevens, C. “Bayesian forecasting (with discussion)”. J. Roy


statistics Soc Ser B, vol 38, pp 205 – 247, 1976.
260

Haykin, S., Yee, P., and Derbez, E., “Optimum Nonlinear Filtering” IEEE
Transactions on Signal processing, Vol 45, No 11, November 1977.

Heffes, H. “The effect of erroneous models on the Kalman Filter response”. IEEE
Transactions on Automatic Control, July 1966.

Higdon D. M., “Auxiliary variable methods for Markov chain Monte Carlo with
applications,” J. Amer. Statist. Assoc., vol. 93, pp. 585–595, 1998.

Ho, Y.C y Lee, R.C. “A Bayesian Approach to problems in stochastic Estimation and
Control” IEEE Transactions on Automatic Control, October 1964.

Hogan N, Mann RW. Myoelectric signal processing: optimal estimation applied to


electromyography Part I: derivation of the optimal myoprocessor. IEEE Trans Biomed
Eng 27: 382–395, 1980a.

Hogan N, Mann RW. Myoelectric signal processing: optimal estimation applied to


electromyography Part II: experimental demonstration of optimal myoprocessor
performance. IEEE Trans Biomed Eng 27: 396–410, 1980b.

Hoo, K. A. and J. C. Kantor, “Global Linearization and Control of a Mixed-Culture


Bioreactor with Competition and External Inhibition,” Math. Biosciences, 82, 43–62
(1986).

Ito K, Yoshida K, Ishikawa T, Kobayashi S (1990) Volatile compounds produced by


fungus Aspergillus oryzae in rice koji and their changes during cultivation. J Ferment
Bioeng 70:169–172

Jazwinski, A. H. “Adaptive Filtering”. Automatica July1969

Jazwinski, A.H. “Stochastic Processes and Filtering Theory”. Academic Press, 1970.

Joachimsthal, E.; Haggett, K. D.; Jang, J. e Rogers, P. L. (1998), A mutant of


Zymomonas mobilis ZM4 capable of etanol production from glucose in the presence of
high acetate concentrations, Biotechnology Letters, v. 20, n. 2, p. 137–142

Jöbses, I. M. L.; Egberts, G. T. C.; Luyben, K. C. A. M e Roels, J. A. (1986),


Fermentation Kinetics of Zymomonas mobilis at High Ethanol Concentration:
Oscillations in Continuous Cultures, Biotechnology Bioengineering v. 28, p 868-877.

Joannides Marc, Larramendy–Valverde Ir`ene, and Rossi Vivien. Monte–Carlo


Observer for a Stochastic Model of Bioreactors. 2005.
261

Johansen A., Singh, S., Doucet, A., Vo, B-N., “Convergence of the SMC
Implementation on the PHD Filter” Signal Procesing Laboratory Department of
Engineering University of Cambridge, 2005.

Jordan, M. “Introduction to Monte Carlo Methods” in Learning in Graphical Models,


Ed. Kluwer Academic Publishers, 1998.

Julier, S. J., Uhlmann, J. K., and Durrant-Whyte, H. F. “A new approach for filtering
nonlinear systems”. In Proceedings of the 1995 American Control Conference (pp.
1628–1632), 1995.

Julier, S. J., and Uhlmann, J. K. “A new extension of the Kalman filter to nonlinear
systems”. In Proceedings of AeroSense: The 11th International Symposium on
Aerospace/Defense Sensing, Simulation and Controls (pp. 182–193). Orlando, FL,
USA: SPIE. 1997.

Julier, S. J., Uhlmann, J., and Durrant-Whyte, H. F. “A new method for the nonlinear
transformation of means and covariances in filters and estimators”. IEEE Transactions
on Automatic Control, 45(3), 477–482. 2000.

Julier, S. J. and Uhlmann, J. K. “Unscented filtering and nonlinear estimation”.


Proceedings of the IEEE, 92(3):401–422. 2004.

Kunsch, H. R. (2003). Recursive Monte Carlo filters: Algorithms and theoretical


analysis. Research Report 112. ETH: Seminar F®ur Statistik. To appear in Annals of
Statistics.

Kailath T. “An Innovations Approach to least squares estimation Part I: Linear


Filtering in additive white noise” IEEE Transactions on Automatic Control, December
1968.

Kailath T. and Frost P. “An Innovations Approach to least squares estimation- Part III:
Non Linear Estimation In White Gaussian Noise” IEEE Transactions on Automatic
Control, 1971.

Kalman, R. E. “A new approach to linear filtering and prediction problems”.


Transactions of the ASME, Journal of basic engineering March 1960.

Kalman, R.E and Bucy, R.S. “New Results in Linear Filtering and Prediction Theory”
Transactions of the ASME, Journal of basic engineering, March 1961.
262

Kamisnski, P. G. Bryson, Jr A.E. and Schmidt, S.F. “Discrete square root filtering: A
survey of current techniques”. IEEE Transactions on Automatic Control, December
1971.

Karakashev D, Thomsen A, Angelidaki, I. Anaerobic biotechnological approaches for


production of liquid energy carriers from biomass. Biotechnol Lett (2007) 29:1005–
1012 DOI 10.1007/s10529-007-9360-3

Karlson R. “Particle Filters for Positioning and tracking applications” PhD thesis,
Linkoping Studies in Science and Technology. Dissertations. No. 924, Department of
Electrical Engineering Linkoping University, Linkoping, Sweden 2005.

Karlsson, R. and Gustafsson, F. “Particle filter for underwater navigation”. In


Proceedings of the Statistical Signal Processing Workshop, pages 509–512, St. Louis,
MO, USA. 2003.

Karlsson, R., Schön, T., and Gustafsson, F. (2004). Complexity analysis of the
marginalized particle filter. Technical Report LiTH-ISY-R-2611, Department of
Electrical Engineering, Linköping University.

Kallianpur, G. (1980). Stochastic Filtering Theory. Springer-Verlag.

Kazantzis, N. and C. Kravaris (1997). System-theoretic properties of sampled-data


representations of nonlinear systems obtained via taylor-lie series. International
Journal of Control 67(9), 997–1020.

Kesava, S. S. e Panda, T. (1996), Ethanol production by immobilized whole cells of


Zymomonas mobilis in a continuous flow expanded bed bioreactor and a continuous
flow stirred tank bioreactor. Journal of Industrial Microbiology, v. 17, p.11–14..

Kesava, S.S.; Panda, T. e Rakshit, S. K. (1996), Production of ethanol by immobilised


whole cells of Zymomonas mobilis in an expanded bed bioreactor. Process
Biochemistry, v. 31, p. 449–456.

Kitagawa G. and Higuchi T. “Automatic Transaction of Signal via Statistical


Modeling” 1987.

Kitagawa, G. “A self-organizing state-space model”. Journal of the American


Statistical Association, 93(443):1203–1215. 1998.

Klaas M., de Freitas N. and Doucet A. “Toward Practical N2 Monte Carlo: the
Marginal Particle Filter”, 2005.
263

Klebaner, F.C. (1998). Introduction to Stochastic Calculus with Applications. London,


UK. Imperial College Press.

Kloeden, P.E. and E. Platen (1992). Numerical Solution of Stochastic


DifferentialEquations. Springer-Verlag.

Koop R.E. and Orford R.J. “Linear Regresion Applied to system identification for
adaptive control systems” AIAA Journal, October 1963.

Kotecha, JH. and Djuric´ P. “Gaussian sum particle filtering” IEEE transactions on
signal processing, vol. 51, no. 10, october 2003

Kristensen, N.R., H. Madsen and S.B. Jørgensen (2003). Identification of


continuoustime models using discrete-time data. In: Proc. of the 13th IFAC Symp. on
System Identification. Rotterdam, The Netherlands.

Kristensen, N.R., H. Madsen and S.B. Jørgensen (2004). Parameter estimation in


stochastic grey-box models. Automatica 40, 225–237.

Kunita H. “Stochastic partial differential equations connected with nonlinear filtering”


in Nonlinear Filtering Stochastic Contr., Lecture Notes Math., S. Mitter and A. Moro,
Eds., vol. 972, pp. 163–165, 1982.

Kurtz, T. “Strong approximation theorems for density dependent Markov chains”.


Stoch Proc Appl., 6:223–240, 1978.1987

Kurtz, M. J., G.-Y. Zhu, A. Zamamiri, M. A. Henson, and M. A. Hjortso, “Control of


Oscillating Microbial Cultures Described by Population Balance Models,” Ind. Eng.
Chem. Res., 37, 4059–4070 (1998).

Kurtz, M. J., M. A. Henson, and M. A. Hjortso, “Nonlinear Control of Competitive


Mixed-Culture Bioreactors via Specific Cell Adhesion,” Can. J. Chem. Eng., 78, 237–
247 (2000).

Kushner H. J., “Dynamical equations for optimal nonlinear filtering” J. Differential


Equations, vol. 3, pp. 179–190, 1967.

Kushner H., “Non Linear Filtering: The exact Dynamical Ecuations Satisfied by the
Conditional Mode” IEEE Transactions on Automatic Control, Vol. AC-12 No. 3, June
1967.

Kushner, H, “Probability Methods for approximations in stochastic control and for


elliptic Equations” ACADEMIC PRESS. 1977. pag 61-62 122-124
264

Kushner, H.J. and P.G. Dupuis (1992). NumericalMethods for Stochastic Control
Problemsin Continuous-Time. Springer-Verlag.

Leal Ascencio R. "Artificial Neural Networks as a Biomass Virtual Sensor for a Batch
Process., "Proceedings of the IEEE International Symposium on Intelligent Control,
September, Mexico City, (2001).

Leal R., Butler P, Lane P., Payne P.,”Data fusion and artificial neural networks for
biomass estimation,” Science Measurement and Technology. IEEE Procedings V. 144,
Issue 2, pp.69-72(1997)

Lee, J. M., Biochemical Engineering. Prentice-Hall, Englewood Cliffs, NJ (1992).

Lehmann E.L. “Theory of point estimation” Statistical/Probability series. Wadsworth


& Brooks/Cole, 1991.

Li, P., Goodall, R., and Kadirkamanathan, V. (2003). Parameter estimation of railway
vehicle dynamic model using Rao-Blackwellised particle filter. In Proceedings of the
European Control Conference, Cambridge, UK.

Li, J.; McLellan, P. K. L. e Daugulis, A. J. (1995), Inhibition Effects Ethanol


Concentration History and Ethanol Concentration Change Rate on Zymomonas
mobilis, Biotechnology Letters, v. 17, n. 3, p. 321-326.

Lin, Y., Tanaka, S. Ethanol fermentation from biomass resources: current state and
prospects Appl Microbiol Biotechnol (2006) 69: 627–642 DOI 10.1007/s00253-005-
0229-x 2006

Liu J. S. “Metropolized independent sampling with comparisons to rejection sampling


and importance sampling” Statist.Comput., vol. 6, pp. 113–119, 1996.

Liu, J. and Chen “Sequential Monte Carlo methods for dynamical systems” J. Amer.
Statistic. Assoc., vol. 93, pp. 1032–1044, 1998.

Liu, J. S. Chen, R. y Logvinenko, T. “A theoretical framework for sequential


importance sampling with Resampling,” in Sequential Monte Carlo Methods in
Practice, A. Doucet, J. F. G. de Freitas, N. J. Gordon, Eds. Berlin: Springer Verlag,
2001.

Ljung, L. (1979). Asymptotic behavior of the extended Kalman filter as a parameter


estimator for linear systems. IEEE Transactions on Automatic Control, AC–24(1):36–
50.
265

Ljung, L. and Söderström, T. (1983). Theory and Practice of Recursive Identification.


The MIT Press series in Signal Processing, Optimization, and Control. The MIT Press,
Cambridge, Massachusetts.

Ljung, L. System Identification Theory for the user. Prentice hall, Englewood cliffs,
Nj, 1987.

Ljung, L. and Glad, T. (1997). Modeling of Dynamic Systems.-Prentice Hall PTR.

Lynd LR (1996) Overview and evaluation of fuel ethanol production from cellulosic
biomass: technology, economics, the environment, and policy. Annu Rev Energy
Environ 21:403–465

Maher, B., and Zeng, R., “Experimental Results and Model Reference Adaptive
Estimation and Control for a Fermentation Process”, Control Engineering Practice,
Vol 3, (1995).

Mahler, R. P. S. (2003). Multitarget Bayes filtering via first-order multitarget


moments. IEEE Transactions on Aerospace and Electronic Systems 39, 1152.
McLellan, P. J.; Daugulis, A. J. e Li, J. (1999), The Incidence of Oscillatory
Behaviour in the Continuous Fermentation of Zymomonas mobilis", Biotechnology
Progress, v.15, p. 667-680.

Maskell, S. Briers, Wrigth R. “Distribution in a Particle Filter” QuinetiQ, WRARN,


United Kindom, 2004.

Maskell, S. Gordon, N. “A tutorial on Particvle filters for Online Non Lineal/Non


Gaussian Bayesian Tracking” Qinetiq Ltd and Cambridge University Engineering
Department report, this is a condensed version of “A tutorial on Particvle filters for
Online Non Lineal/Non Gaussian Bayesian Tracking” IEEE Transactions on signal
Processing 2001.

Mantzaris, N. V., F. Srienc, and P. Daoutidis, Control of Cell Mass Distribution in


Continuous Bioreactors Using Population Balance Models, In Proceedings of
DYCOPS-6, pages 602–607, Corfu, Greece (1998).

Mantzaris, N. V., J. J. Liou, P. Daoutidis, and F. Srienc, “Numerical Solution of a


Mass Structured Cell Population Balance Model in an Environment of Changing
Substrate Concentration,” J. Biotech., 71, 157–174 (1999).

Mauch, K., S. Arnold, and M. Reuss, “Dynamic Sensitivity Analysis for Metabolic
Systems,” Chem. Eng. Sci., 52, 2589–2598 (1997).
266

Maybeck P. S. “Stochastic Models, Estimation, and Control” vol 2. New York


Academic, 1982.

Mehra, R. K. “On the identification of variances and adaptive kalman filtering” IEEE
Transactions on Automatic Control, April 1970.

Menzel, K.; Zeng, A.; Biebl, H. e Deckwer, W. (2000), Kinetic, dynamic, and
pathway studies of glycerol metabolism by lebsiella pneumoniae in anaerobic
continuous culture: I. The phenomena and characterization of oscillation and
hysteresis, Biotechnology and Bioengineering, v. 52, n. 5, p. 549 – 560.

Metropolis, N. Rosenbluth, A. W. Rosenbluth, M. N. Teller, A. H. and Teller, E.


“Equations of state calculations by fast computing machines,” J. Chem. Phys., vol. 21,
pp. 1087–1091,1953

Meng X.-L. y van Dyk D. A., “Seeking efficient data augmentation schemes via
conditional and marginal augmentation” Biometrika, vol. 86, pp. 301–320, 1999.

Miguez, J, Xu, Shanshan. “Particle Filter For Unknown Probability Distribution


Systems” IEE 2003.

Mitter, Sanjoy. Filtering and Stochastic Control: A historical perspective, MIT report
1996

Monaco, S. and D. Norman-Cyrot (1997). A unified representation for nonlinear


discrete-time and sampled dynamics. Journal of Mathematics Systems, Estimation,
and Control 7(4), 477–503.

Monaco, S. and D. Normand-Cyrot (1988). Zero dynamics of sampled nonlinear


systems. Systems and Control Letters 11, 229–234.

Monaco, S. and D. Normand-Cyrot (2005). Normal forms and approximated feedback


linearization in discrete-time. Systems anc Control Letters.

Monaco, S., D. Norman-Cyrot and S. Stornelli (1986). On the linearizing feedback in


nonlinear sampled data control schemes. In: Proc. of the 25th IEEE Conference on
Decision and Control. Athens, Greece. pp. 2056–2060.

Morales R, de Freitas, N. “Estimación y Control de Procesos Industriales con filtros


de partículas” Proceedings of the American Control Conference, 2003.
267

Murray-Smith, Johansen, and T. A. Johansen Eds. 1997, Multiple Model Approaches


to Modelling and Control, Taylor and Frances, London. 1997

Murthy K.P.N, “Monte Carlo: Basics. Theoretical Studies Section” Indira Gandhi
Centre for Atomic research, Indian Society for Radiation Physics, 2000.

Musso Christian, Oudjane Nadia, and Le Gland, Francois “Improving Regularized


Particle Filters” Sequential Monte Carlo Methods in practice, Cambridge 2001.

Neˇsi´c, D. and A.R. Teel (2001). Perspectives in Robust Control. Chap. 14: Sampled-
Data Control of Nonlinear Systems: an Overview of Recent Results. Springer.

Neˇsi´c, D. and A.R. Teel (2004). A framework for stabilization of nonlinear


sampleddata systems based on their approximate discrete-timemodels. IEEE
Transactions on Automatic Control 49(7), 1103–1122.

Neˇsi´c, D., A.R. Teel and P.V. Kokotovi´c (1999). Sufficient conditions for
stabilization of sampled-data nonlinear systems via discrete-time approximations.
Systems and Control Letters 38, 259–270.

Niederreiter, H. “Random Number Generation and Quasi-Monte Carlo Methods”


Philadelphia, PA: SIAM, 1992.

Nielsen, J. and J. Villadsen, “Modelling of Microbial Kinetics,” Chem. Eng. Sci., 47,
4225–4270 (1992).

Nishimura, T. “On the a priori information in sequential estimation problems” IEEE


Transactions on Automatic Control, July 1966.

Nordlund, P.-J. (2002). Sequential Monte Carlo Filters and Integrated Navigation.
Licentiate Thesis No 945, Department of Electrical Engineering, Linköping
University, Sweden.

Ocone D. and Pardoux E., “A lie algebra criterion for the nonexistence of finite
dimensionally computable filters,” Lecture Notes Math., vol. 1390, pp. 197–204, 1988

Oliveira I., Rapôso A.C., Souto-Maior A.M., Lopes C.E. “Oscillatory behavior of
zymomonas mobilis in continuous stirred tank bioreactor” 2nd Mercosur Congress on
Chemical Engineering, Rio de Janeiro Brasil, (2005).
268

O’Mullan, P.; Szakacs-Dobozi, M.; e Eveleigh, D.E. (1991), Identification of


saccharolytic enzymes of Zymomonas mobilis CP4. Biotechnology Letters, v. 13, n. 2,
p. 137–142.

Onder, M., et al, Neural Network Assisted Nonlinear Controller for a Bioreactor.
Bogazici Univessity Estanbul, 1998.

Øksendal, B. (2003). Stochastic Differential Equations. An Introduction with


Applications. 6th ed.. Springer.

Ozaki, T., Iino, M., “An Innovation approach to Non gausian time series analysis”. J.
Appl. Probab. 38A, 78-92, 2001.

Pan, Z. (2001). Differential geometric condition for feedback complete linearization of


stochastic nonlinear system. Automatica 37, 145–149.

Pan, Z. (2002). Canonical forms for stochastic nonlinear systems. Automatica 38,
1163–1170.

Papasiliou Anastasia, “A Uniformly Convergent Adaptive Particle Filter” Columbia


University, 2004.

Papasiliou Anastasia, “Adaptive Particle Filters with applications” PhD Thesis,


Princeton University, 2002.

Parker, C.; Peekhaus, N.; Zhang, X. e Conway, T. (1997), Kinetics of sugar transport
and phosphorylation influence glucose and fructose cometabolism by Zymomonas
mobilis. Applied and Environmental Microbiology, v. 63, n. 9, p. 3519–3525.

Pinheiro, I. O. (2001), Fermentação de Zymomonas mobilis em meio mínimo com


asparagina como fonte de nitrogênio”, Tese de Doutorado, PEQ/COPPE/UFRJ, Rio de
Janeiro, Brasil.

Peach, N. “Bearings-only tracking using a set of range-parameterized extended


Kalman filters”. In IEE Proceedings of Control Theory and Applications, volume 142,
pages 73–80. 1995.

Pitt, M. and Stephard N. “Filtering Via Simulation: Auxiliary particle Filter” Imperial
College Oxford Report, 1997.

Pitt, M and Shephard, N. “A fixed lag auxillary particle filter with deterministic
sampling rules,” unpublished paper, 1998.
269

Pons, M.-N., Bioprocess Monitoring and Control. Hanser Publishers, New York
(1992).

Poyiadjis, G., Doucet, A., Singh, S., “Particle Methods for Optimal filter derivative:
Application to parameter estimation” IEEE 2005.

Protter, P. (1990). Stochastic Integration and Differential Equations. Springer-Verlag.

Quintero, O., di Sciascio, F., and Álvarez, H., (2004). “Estructura de dos grados de
libertad y sensor virtual para controlar un bioproceso,” XIX Congreso Argentino de
Control Automático AADECA, Bs. As., Argentina.

Quintero, O., and di Sciascio, F. (2005). “Aplicación del filtro de Kalman extendido a
un proceso de fermentación alcohólica en continuo,” XI Reunión de Trabajo en
Procesamiento de la Información y Control RPIC.

Quintero, O., Amicarelli, A. di Sciascio, F., “Estimador de Estados en Fermentación


Alcohólica en Continuo de Zymomonas Mobilis Mediante Filtrado Bayesiano
Recursivo”, XII Reunión de Trabajo en Procesamiento de la Información y Control
RPIC, (2007).

Quintero, O., Amicarelli, A. di Sciascio, F. (2008a) “Recursive Bayesian Filtering for


States Estimation: An Application Case in Biotechnological Processes”, MCMSki
(3rd IMS-ISBA) meeting in Bormio, Italy Jan 9-11, 2008.

Quintero, O., Scaglia. G.,. di Sciascio, F. (2008b) “Bio process control strategy based
on numerical methods and linear algebra: second approach” in IASTED conference on
“Modelling, Identification and Control” (MIC 2008).

Quintero, O., Scaglia. G.,. di Sciascio, F. (2008c) “Numerical Methods Based Strategy
and Particle Filter State Estimation For Bio Process Control” in IEEE- ICIT 2008,
April 2008 China.

Quintero, O., Amicarelli, A. di Sciascio, F Scaglia. G. (2008d) “State estimation in


alcoholic continuous fermentation of zymomonas mobilis using recursive bayesian
filtering: a simulation approach”. Article received: Dec. 7, 2007; Peer-review
completed: Jan. 9, 2008d; Revised version received and accepted: Feb. 7, 2008;
Published: Feb. 20, Bioresources.

Quintero, O., Scaglia. G., di Sciascio, F. (2008e) “Numerical method based controllers
applied to a biotechnological process”. Submitted on 26th November 2007, Revised
18th february, to Journal of Industrial Microbiology & Biotechnology.
270

Rangan, Sundeep and Poolla, Kameshwar. “Model validation for Structured


Uncertainty Models”. Procedings of the American Control Conference, Philadelphia,
pennsylvania, june 1998

Rallo R., Ferre-Gine J., Arenas A., Giralt F.,"Neural virtual sensor for the inferential
prediction of product quality from process variables” Computers and Chemical
Engineering 26,1735/1754, (2002).

Raposso Camêlo, A., Pinto, J., Pinheiro, I., “Parameter Estimation od Continuous
fermentations using Particle Swarm”. 2nd Mercosur Congress on Chemical
Engineering, Rio de Janeiro Brasil (2005).

Ripley B., Stochastic Simulation, New York: Wiley, 1987.

Robert, C.P. “The Bayesian Choice: A Decision-Theoretic Motivation”. Springer


Texts in Statistics. Springer Verlag, 1994.

Rogers, P, Jeon, Y, Lee, K, Lawford, H. Zymomonas mobilis for Fuel Etanol and
Higher Value Products Adv Biochem Engin/Biotechnol (2007) 108: 263–288 DOI
10.1007/10_2007_060 © Springer-Verlag Berlin Heidelberg Published online: 24
May 2007

Romanenko A., Castro J., “The unscented filter as an alternative to the EKF for
nonlinear state estimation: a simulation case study”. Computers and Chemical
engineering 2003.

Rosenbluth, M.N. y Rosenbluth, A.W. “Monte Carlo calculation of the average


extension of molecular chains,” J. Chem. Phys., vol. 23, no. 2, pp 356-359, 1956.

Rivera, D., Margaritis, A. De Lasa H. , ”A Sporulation Kinetic Model for Batch


Growth of Bacillus Thuringiensis,” Canadian. Journ Chem. Engineering, V. 77, pp.
903-910, (1999).

Rossi Vivien and Vila Jean-Pierre. Filtrage de bioproc´ed´e ded´epollution. approche


par convolution particulaire. e-STA, 2(1), 2005.

Rossi Vivien and Vila Jean-Pierre Filtering discrete time nonlinear system with
unknown parameters: a non parametric approach Preprint submitted to Elsevier
Science 3rd February 2005

Rubin, Multiple Imputation for Nonresponse in Surveys, New York: Wiley, 1987.
271

Russell S. A., Robertson D. G., Lee J. H. and. Ogunnaike B. A. “Model -based quality
monitoring of batch and semi-batch processes,” Journal of Process Control, V. 10,
Issue 4, Pages 317-332, (2000)

Särkkä, Simo “Recursive bayesian inference on stochastic differential equations”


Helsinki University of Technology Laboratory of Computational Engineering
Publications Teknillisen korkeakoulun Laskennallisen tekniikan laboratorion
julkaisuja Espoo 2006. “Dissertation for the degree of Doctor of Science in
Technology to be presented with due permission of the Department of Electrical and
Communications Engineering, Helsinki University of Technology, for public
examination and debate in Auditorium S4 at Helsinki University of Technology
(Espoo, Finland) on the 24th of April, 2006, at 12 noon”

Sanger, Terence D. Bayesian Filtering of Myoelectric Signals. Division of Child


Neurology and movement Disorders, Stanford University Medical Center, Stanford,
California Submitted 3 September 2006; accepted in final form 16 December 2006

Scaglia, G. (2006) “Estrategias para seguimiento de trayectorias”, In Spanish. Tesis de


Doctorado Universidad Nacional de San Juan.

Scaglia,G., Mut .V, Quintero O, di Sciascio. “Diseño de un Controlador Basado en


metodos Algebraicos: Aplicaion a Robotica Móvil” XII Congreso lat Cont Autom,
CLCA, Brasil, 2006.

Scaglia,G., Mut .V, Rosales A., Quintero O. “Tracking Control of a Mobile Robot
using LinearInterpolation“ IMAACA,07 vol. 1, pp. 11-15, ISBN: 978-2-9520712-7-7

Scaglia,G., , Quintero O, Mut .V di Sciascio. “Numerical Methods Based Controller


Design for Mobile Robots” Robotica Journal, to appear. 2008

Scaglia,G., , Quintero O, Mut .V di Sciascio. “Numerical Methods Based Controller


Design for Mobile Robots” Ifac World Congress Seoul, 2008b

Schei, T. S. “A finite difference method for linearization in nonlinear estimation


algorithms” Automatica 33(11), 2051–2058 1997.

Schlee, F. H, Standish, C. J. and Toda, N. F. “Divergence in the Kalman filter” AIAA


Journal, June 1967.

Schon, Thomas, On computational Methods for Non Linear Estimation – Lic Thesis,
Division of Automatic Control and Communication Systems Department of Electrical
Engineering Linkoping University, SE581 83 Linkoping, Sweden, 2003.
272

Schön, T. and Gustafsson, F. (2003). Particle filters for system identification of


statespace models linear in either parameters or states. In Proceedings of the 13th
IFAC Symposium on System Identification, pages 1287–1292, Rotterdam, The
Netherlands. Invited paper.
Schön, T., Gerdin, M., Glad, T., and Gustafsson, F. (2003a). A modeling and filtering
framework for linear differential-algebraic equations. In Proceedings of the 42nd
Conference on Decision and Control, Maui, Hawaii, USA.

Schön, T., Gustafsson, F., and Hansson, A. (2003b). A note on state estimation as a
convex optimization problem. In Proceedings of the IEEE International Conference on
Acoustics, Speech, and Signal Processing, volume 6, pages 61–64, Hong Kong.

Schön, T. B. and Gustafsson, F. (2005). Integrated navigation of cameras for


augmented reality. In Proceedings of the 16th IFAC world Congress, Prague, Czech
Republic.

Schön, T. B., Eidehall, A., and Gustafsson, F. “Lane departure detection for improved
road geometry estimation”. Technical Report LiTH-ISY-R-2714, Department of
Electrical Engineering, Linköping University, Sweden. Submitted to the IEEE
Intelligent Vehicle Symposium, Tokyo, Japan. 2005.

Schön, T. B., Karlsson, R., and Gustafsson, F. (2006a). The marginalized particle
filter in practice. In Proceedings of IEEE Aerospace Conference, Big Sky, MT, USA.
Invited paper, accepted for publication.

Schön, T. B., Wills, A., and Ninness, B. (2006b). Maximum likelihood nonlinear
system estimation. In Proceedings of the 14th IFAC Symposium on System
Identification, Newcastle, Australia. Accepted for publication.

Schön, T., Gustafsson, F., and Nordlund, P.-J. (2005). Marginalized particle filters for
mixed linear/nonlinear state-space models. IEEE Transactions on Signal Processing,
53(7):2279–2289.

Simandl Miroslav, Straka Ondrej. “Nonlinear estimation by particle filters And


cramér-rao bound” 15th Triennial World Congress, Barcelona, Spain 2002.

Shorten, R., R. Murray-Smith, R. Bjørgan and H. Gollee (1999). On the interpretation


of local models in blended multiple model structures. International Journal of Control.
Int. J. Control, 72, 620.S. 1999.

Silveira1 M., Molina M.,”Indirect Estimation of Bacillus thuringiensis var. israelensis


Biomass Concentration using oxygen balance data,” Brazilian Journal of Chemical
Engineering. V. 22, pp. 495-500. (2005)
273

Sing, S., Kantas, N., Vo, B-N., Doucet, A., “Simulation Based Optimal sensor
scheduling with application to observer trajectory planning” Submitted to Automatica,
29 March 2005.

Smith A. F. M. and Gelfand, A. E. “Bayesian statistics without tears: A sampling-


resampling perspective,” Am. Stat., vol. 46, no. 4, pp. 84–88, 1992.

Sontag E. “Mathematical Control Theory”. Second Edition, Springer, New York.


(1998).

Soong, T.T. “On a Priori statistics in minimum variance Estimation Problems”


Transactions of the ASME, Journal of basic engineering, March 1965.

Sorenson, H. W. “Least Squares Estimation: From Gauss to Kalman” IEE Specrum,


July 1970.

Sorenson, H. W. Alspach, and D. L. “Recursive Bayesian estimation using Gaussian


sums” Automatica, vol. 7, pp. 465–479, 1971.

Sorenson, H. W. and Sacks, J.E. “Recursive Fading memory Filtering” Information


Sciences, January 1971.

Sorenson, H. W., “Kalman Filtering: Theory and Application” Edited By Harold W.


Sorenson IEEE press 1985, ISBN 0-87942-191-6, ISBN 0-7803-0421-7.

Sorenson, H.W. “Kalman Filtering Techniques Advances in Control Systems Theory


and applications” Academic Press 1996.

Stoica P and Jansson M. MIMO system Identification state space and subspace
approximations versus transfer function and instrumental variables. Subbitted to IEEE
trans. Sig. Proc - Royal Institute of Technology, 2000.

Strassle, C., B. Sonnleitner, and A. Fiechter, “A Predictive Model for the Spontaneous
Synchronization of Saccharomyces cerevisiae Grown in Continuous Culture. II.
Experimental Verification,” J. Biotech., 9, 191–208 (1989).

Sun M. and Glowinski R., “Pathwise approximation and simulation for the Zakai
filtering equation through operator splitting” Calcolo., vol. 30, pp. 219–239, 1993.

Svenzén, N. (2002). Real time implementation of map aided positioning using a


Bayesian approach. Master’s Thesis No LiTH-ISY-EX-3297-2002, Department of
Electrical Engineering, Linköping University, Sweden.
274

Tanizaki. H. “Nonlinear and non normal filter using importance sampling: antithetic
monte carlo integration” 1991.

Tanizaki, H. and Mariano R., “Non-Linear and Non-Normal Filter Based on Monte-
Carlo Technique” 1995a, 1995b

Tanizaki, H. and Mariano R., “Nonlinear filters based on taylor series expansions”
1994.

Tanisaki. H “Nonlinear Filters-Estimations Applications” Second Edition Springler


Verlag 1996.

Tanizaki. H. “Nonlinear and no normal filters using Monte Carlo methods”


Computational Statistics and Data Analysis, 25:417-439, 1997.

Tanner, M. A. Tools for Statistical Inference: Methods for Exploration of Posterior


Distributions and Likelihood Functions, 3rd ed., Berlin: Springer Verlag, 1996.

Tano, M., Buzato, J., Celliogoi, M.A., “Sugar Cane Juice Fermentation by
Zymomonas Mobilis CP4 Subjected to Inhibition by ethanol and High Initial
Concentratoin of Substrate”. Brasilian Arch. Biol. Tech, Vol43, April 2000.

Thrun, S. Fox “Particle filters for mobile robot localization” in Sequential Monte
Carlo Methods in Practice, A. Doucet, N. de Freitas, and N. Gordon, Eds. New York:
Springer Verlag, 2001.

Thrun, S. Fox, D, “A Probabilistic Online Mapping Algorithm for Teams of Mobile


Robots” School of computer Science, Carnegie Mellon University, 2001.

Twardoska K., Marnik, T., Paslawska, M., “Approximations of the Zakai equation in a
nonlinear filtering problem with delay” Int. J. Appl. Math. Comput. Sci, 2003 Vol 13,
No 2.

Vapnik Vladimir N., “Statistical Learning Theory” AT&T Research Laboratories, A


wiley interscience publication, 1998.

Vo, B., Singh, S. and Doucet, A. (2005). Sequential Monte Carlo methods for multi-
target _ltering with random _nite sets. IEEE Transactions on Aerospace and
Electronic Systems. To Appear.
http://www2.ee.unimelb.edu.au/staff/bv/vo/phdfilterAESrevfinal2cola.pdf.
275

Wahlberg, B. (1988). Limit results for sampled systems. International Journal of


Control 48(3), 1267–1283.

Wan, E van der Merwe, A., Rudolph A T. “Dual Estimation and the Unscented
Transformation” Oregon Graduate Institute of Science & Technology Department of
Electrical and Computer Engineering.

Wang, X., R. Chen, R., and Guo, D. “ Delayed-pilot sampling for mixture Kalman
filter with application in fading channels”. IEEE Transactions on Signal Processing,
50(2):241–254. 2002.

Wang, F., Bahri, P., Lee, P., Cameron, I., A multiple Model, State feedback strategy
for robust Control of Non linear Process. European Symposium on Computer arded
Process engineering-15, Elsevier, 2005 .

Yan Lin . Shuzo Tanaka. Ethanol fermentation from biomass resources: current state
and prospects. Appl Microbiol Biotechnol (2006) 69: 627–642 DOI 10.1007/s00253-
005-0229-x.

Yuz, J.I. (2005). Sampled-data models for linear and nonlinear systems. PhD thesis.
School of Electrical Eng. and Computer Science, The University of Newcastle.
Australia.

Yuz, J.I. and G.C. Goodwin (2005a). Generalised ¯lters and stochastic sampling zeros.
In: Joint CDC-ECC'05. Seville, Spain.

Yuz, J.I. and G.C. Goodwin (2005b). On sampleddata models for nonlinear systems.
IEEE Trans. on Automatic Control (to appear).

Yuz, J.I., G.C. Goodwin and H. Garnier (2004). Generalised hold functions for fast
sampling rates. In: Proc. of the 43rd IEEE Conference on Decision and Control.
Nassau, Bahamas.

Yuz, J and Goldwin G. Sampled data models for stochastic non linear systems. 2006

Zakai M., “On the optimal filtering of diffusion processes,”


Wahrscheinlichkeitstheorie verw Gebiete, vol. 11, pp. 230–243, 1969

Zaldivar, J.; Nielsen, J. e Olsson, L. (2001), Fuel ethanol production from


lignocellulose: a challenge for metabolic engineering and process integration, Applied
Microbiology Biotechnology, v. 56, p. 17–34.
276

Zhang J., Liu, J., “A new sequential importance sampling method and its applications
to the two dimensional hydrophobic-hydrophilic model”. Journal of chemical physics
volume 117, number 7, august 2002.

Zhang, Y., A. M. Zamamiri, M. A. Henson, and M. A. Hjortso, “Cell Population


Models for Bifurcation Analysis and Nonlinear Control of Continuous Yeast
Bioreactors,” J. Proc. Cont. (2001). In press.

Zhou K. with Doyle J. and Glover K. Robust and optimal control, Prentice Hall, NJ

Zhu, G.-Y., A. M. Zamamiri, M. A. Henson, and M. A. Hjortso, “Model Predictive


Control of Continuous Yeast Bioreactors Using Cell Population Models,” Chem. Eng.
Sci., 55, 6155–6167 (2000).
277

APÉNDICE A

PRELIMINARES MATEMÁTICOS

Sigma Álgebras

álgebra :
Sea S un conjunto y F una familia de subconjuntos de S. F es una sigma álgebra si

F
A F Ac F
A1 , A2 ,... F U i 1 Ai F

Es decir, F es cerrado bajo el complemento y la unión de conjuntos contables


infinitamente.
Un proceso xt , para el tiempo t, está adaptado a F, si es F-medible para todo t. Es
decir, que se puede establecer una medida dentro de la sigma álgebra F.
El sigma álgebra generado por el proceso xs ,0 s t se escribe como
xt xs ,0 s t .

Espacios de Probabilidad

Sean , F , P donde F es una sigma álgebra del conjunto y P es un conjunto


completo de funciones con eventos aleatorios.

Función de Probabilidad

Sea P una función de densidad de probabilidad (Radom-Nikodym) y una medida


dentro del conjunto .
Entonces la función de probabilidad se define como

dP( x)
p( x)
d
Nx
Con x X y p ( x)
278

Si es una medida continua y si x X es discreta, entonces p ( x ) es una función


de probabilidad de Masa. Si x X es continua y es una medida de Lebesgue,
p ( x ) es una función de densidad de probabilidad.

Proceso estocástico

Un proceso estocástico es una familia de funciones x(t) definidas en un espacio de


probabilidad ( , F, P). Para tiempos específicos t1….tn obtenemos una variable
aleatoria particular x(t1)…..x(tn). Es decir que es una función:

T ( t ,w ) x( t , w )

Tal que para tiempo fijo t = t0, x(t0,.) es una variable aleatoria.

Además, para cada w fijo, w = w0, obtenemos una realización (path) específica que es
función del tiempo.

Filtración

A la familia incremental de sigma álgebras X t A en que cumpla que


0 s t Xs Xt
se le llama filtración. Se dice que el proceso estocástico x t , w esta adaptado a la
filtración X t , si para todo t0 , la función w x t , w es X t medible. La filtración
natural de un proceso estocástico es la filtración más pequeña que se adapte a él.
La filtración natural X t de un proceso estocástico x t , w , que es,
Xt x s ,0 s t
puede ser pensada como la historia del proceso estocástico hasta el tiempo t. La
filtración contiene toda la información que puede saberse acerca del proceso hasta el
tiempo t.

Proceso de Markov

El proceso estocástico X t es un proceso de Markov si su futuro es independiente de


su pasado, condicionado al presente:
p x( s) X t p x( s ) x(t ) , s t .

Martingala
279

La pareja formada por el proceso y su correspondiente sigma álgebra xt , Ft es una


martingala si es una súper martingala y una submartingala.
La expresión del valor esperado de el proceso dado su sigma
álgebra E xt Fs xs , xt es una súper martingala si E xt Fs xs , y una
submartingala si E xt Fs xs .
El proceso xt , Ft es una semimartingala si tiene una

descomposición xt x0 at mt , con x0 como condición inicial, donde mt , Ft


es una martingala y at es un proceso de variación acotada.

Movimiento Browniano o Proceso de Wiener Levy

Un proceso t es llamado movimiento Browniano estándar si cumple con las


siguientes propiedades

1. 0 0
2. t1 , t2 t1 ,..., tk tk 1 son independientes para todo
t1 t2 ... tk 1 tk
3. t s N 0, t s 0 s t
4. La trayectoria simple definida por t t; w es continua para todo w

T
Un vector n dimensional de procesos t 1 t ... n t , donde casa proceso
escalar t es un movimiento Browniano estándar e independiente se llama un
1

movimiento Browniano n dimensional.


Un movimiento Browniano escalar con coeficiente de difusión q(t ) , esta definido
como el proceso
t q(t ) s t
donde s t es un movimiento Browniano estándar.
T
Un vector n dimensional de procesos t 1 t ... n t , donde i t son
movimientos Brownianos independientes con coeficientes de difusión qi t es
280

llamado movimiento Browniano n dimensional con matriz de difusión


Qc t diag q1 t ,..., qn t

Figura A.1. Densidad de Probabilidad de un movimiento Browniano

Ruido blanco:

Se define como ruido blanco al proceso estocástico ( t ) que verifica las siguientes
propiedades
( t ) es gaussiano para todo t, Tiene media nula, E{ ( t )} 0

Función de covarianza:

T
r( t , s ) E{ ( t ) ( s )} (t s ) t ,s : s t
T
r( ) E{ ( t ) ( t )} ( ), t s

Recordando que ( ) es la función delta de dirac y que si la función de covarianza


sólo depende de t s es un proceso estacionario.
281

t
W(t ) ( )d donde W(t) es un proceso de Wiener.
0

Procesos estacionarios:

Un proceso estocástico se denomina estacionario en sentido estricto si todas sus


propiedades estadísticas son invariantes respecto a un desplazamiento del origen del
tiempo. Es decir que su función de distribución se mantiene constante.
Ahora, si su media es constante y su auto correlación depende solamente de la
diferencia t1 t 2 se dice que es estacionario en sentido amplio, lo que constituye
un concepto menos estricto que el anterior.
La estacionariedad en sentido amplio, además de ser de más fácil verificación, se
cumple para la mayor parte de los procesos. Por otro lado, cuando la longitud de las
señales con las que se trabaja sea de n segundos, sólo se necesita estacionariedad de la
auto correlación durante ese intervalo, es decir que será necesario es que la
variabilidad no sea tan rápida como para invalidar el procesamiento realizado en ese
intervalo.

Ergodicidad:

Un proceso estocástico x(t) se denomina ergódico si todas sus propiedades estadísticas


pueden determinarse a partir de una sola muestra. Un proceso ergódico debe ser
necesariamente estacionario en sentido estricto. Puede darse también una
interpretación más limitada cuando sólo determinadas propiedades de x(t) pueden
inferirse de una sola muestra. En este caso la estacionariedad sólo es necesaria con
respecto a esas propiedades.

Integral de Itô

La integral estocástica de la función o el proceso estocástico f respecto al movimiento


Browniano t , esta definida por
T
Integral f f t, w d
s

También debemos definir la generalización multidimensional de dicha integral. La


integral estocástica simétrica, será llamada integral de Stratonovich.

Sea , F, P un espacio de probabilidad, t un movimiento Browniano con


filtración natural Ft F y f t , w : 0, un proceso estocástico con las
siguientes propiedades
282

1. t , w f t , w esB 0, Fmedible
2. Existe una filtración Ft , de modo que t sea una martingala con respecto a Ft y
f t , w este Ft adaptado.
T
2
3. E f t , w dt
s

entonces la integral de Itô de f t , w respecto al movimiento Browniano t , puede


definirse como
T T
f t, w d t, w lim n t, w d t, w
n
s s

donde n es una secuencia de procesos simples de modo que se cumpla que el


T
lim E f t, w n t , w dt 0
n
s

Nótese que la integral de Itô es siempre una martingala.

Ecuacion diferencial estocástica

Una ecuacion diferencial estocástica es una ecuacion de la forma

dx t f x, t dt g x, t d t

n n n d
donde f : 0, es la función de base o drift, g : 0, es la
matriz de dispersión y t es el movimiento Browniano con matriz de difusión
Qc t . La matriz definida por g x, t Qc t g T x, t es la matriz de difusión de la
ecuacion diferencial estocástica.
La ecuacion diferencial estocástica puede ser expresada de la siguiente manera:

t t
x t x s f x, t dt g x, t d t
s s

en la cual el ultimo término es una integral estocástica de Itô. El proceso estocástico


solución de la ecuacion diferencial es llamado proceso de Itô.
283

Integral de Stratonovich

Las ecuaciones diferenciales estocásticas de Stratonovich (Stratonovich, 1968;


Oksendal, 2003) son similares a las ecuaciones diferenciales de Itô, pero en vez de
usar integrales de Itô, se incluyen integrales estocásticas en el sentido de Stratonovich.
Una ecuacion diferencial estocástica de Stratonovich puede convertirse en su
equivalente en el sentido de Itô, usando formulas simples de transformación
(Stratonovich, 1968; Oksendal, 2003). Si el término de dispersión es independiente del
estado, es decir, g ( x, t ) g (t ) , entonces la interpretación de Itô y Stratonovich de la
ecuacion diferencial estocástica son las misma.
Para distinguir entre las ecuaciones diferenciales de Itô y de Stratonovich, las
integrales correspondientes al término de difusión se marcan de manera diferente, es
decir, la integral de Stratonovich se denota usando un círculo pequeño antes del
término del diferencial del movimiento Browniano, es decir,

dx t f x, t dt g x, t d t

la interpretación de las ecuaciones diferenciales estocásticas en términos del ruido


blanco, permiten que su significado en el sentido de Stratonovich se haga natural. Esto
se debe a que, las aproximaciones en tiempo discreto del ruido blanco en las
ecuaciones diferenciales, convergen a las ecuaciones diferenciales estocásticas en el
sentido de Stratonovich, no en el sentido de Itô. Por esta razón, los esquemas de
integración numérica de órdenes superiores, aproximan también a las ecuaciones de
Stratonovich correspondientes, al ser aplicados a las ecuaciones diferenciales
estocásticas.

Una solución a una ecuacion diferencial estocástica es llamada fuerte si para un


movimiento Browniano dado t , con una filtración determinada Ft , es posible
construir una solución x t que se adapte a esa misma filtración Ft . La unicidad de la
solución fuerte significa que las realizaciones del proceso estocástico x t , son única
para el movimiento Browniano dado y por esta razón, la unicidad fuertes es llamada,
unicidad de una “realización cierta”.
Una solución es débil si es posible construir algún movimiento Browniano t y un
proceso estocástico x t de modo que el par nuevo sea una solución de la Ecuacion
diferencial estocástica. La unicidad en el sentido débil quiere decir que la ley de
probabilidad de la solución es única, es decir, que no debe haber dos soluciones con
distribuciones de dimensión finita diferentes.
284

Las condiciones necesarias para la función de base f y la matriz de dispersión g, que


hacen que se puedan garantizar la existencia de las soluciones fuerte y débil, pueden
encontrarse en el libro de Oskendal, 2003.
La herramienta mas importante para calcular las soluciones fuertes de la Ecuacion
diferencial estocástica es la fórmula de Itô, que puede ser interpretada como la
contraparte de la regla de la cadena del calculo ordinario.

Formula de Itô

Asuma que el proceso estocástico x t esta generado por la Ecuacion diferencial


estocástica definida

dx t f x, t dt g x, t d t

Sea g una Ecuacion doblemente diferenciable. Entonces las componentes del proceso
estocástico
y(t ) g x(t ), t , satisfacen la ecuaciones diferenciale estocástica

2
gk gk 1 gk
dyk dt dxi dxi dx j
t i xi 2 ij xi x j
donde los términos dxi dx j se calculan de acuerdo a las reglas
dtd 0; d dt 0; d d T Qc (t )dt
en caso que la ecuacion fuera en el sentido de Stratonovich, el diferencial seria
gk gk
dyk dt dxi
t i xi
que es igual al resultado del calculo ordinario.

En la inferencia Bayesiana se asume que toda la información acerca de las cantidades


desconocidas esta contenida dentro de las distribuciones de probabilidad de de dichas
cantidades desconocidas. Por esta razón, cuando se hace inferencia Bayesiana en
ecuaciones diferenciales estocásticas, es mas frecuentemente que sea suficiente con las
soluciones débiles, ya que solo se esta interesado en las leyes de probabilidad, y no en
las realizaciones reales del proceso.

Distribución empírica

La distribución P(x), puede ser reemplazada por un a distribución empírica de la


forma
285

Np
1
Pˆ ( x) ( x xi )
Np i 1

Con la densidad de Radom-Nikodym y Np el número de partículas (se definirá mas


adelante). Si X es el espacio de estados, y

1 si x xi
x X es discreta, la función ( x xi ) ,
0 si x xi

Si x X es continua, ( x xi ) es una función delta de dirac (con


x xi 0, x xi ) y

dPˆ ( x) pˆ ( x)dx 1
X X

Teorema de Girsanov

n
Asuma que t :0 t T es un proceso F medible adaptado a la filtración
n
natural Ft F de un movimiento Browniano n dimensional t :0 t T
con respecto a la medida P.
Si
t
2
E exp t dt
0

entonces
t t
T 1 2
Z t exp td t t dt
0
20
satisface la ecuacion
t
T
Z t 1 Z t td t
0

y esta es una martingala.


Bajo la medida P dw Z t , w P dw , el proceso
t
t t t dt
0
286

es un movimiento Browniano unidimensional.


La variable aleatoria Z t , w es la relación de las probabilidades de P y P
dP
w Z t, w
dP Ft

Estadísticas suficientes Fisher, problemas sin ruido de proceso

En este tipo de estimación, desde el punto de vista de Fisher, también llamado como
paramétrico, los parámetros del modelo o los estados, no son considerados como
variables aleatorias, pero como se menciono anteriormente se consideran fijas pero no
conocidas y el valor del parámetro afecta explícitamente las propiedades estadísticas
de las observaciones de manera conocida. La conexión entre las medidas y los
parámetros está definida por la función de densidad de el vector de observación y,
parametrizado por el vector de parámetros x, de la forma p(y/ x), la cual es función de
los parámetros después de haber hecho las medidas. Esta función de vecindad se
escribe de la siguiente forma combinando las vecindades para diferentes instantes de
tiempo, asumiendo independencia de eventos:

l ( x y) p( y x)

Nótese que para enfatizar, dicha vecindad es función del primer argumento y luego, se
consideran las medidas u observaciones y. Luego de considerar dichas medidas, el
vector de parámetros x corresponde a la mejor densidad elegida a partir de las medidas
observadas.

Fisher plantea que una buena estimación del vector de parámetros o del vector de
estados, esta dado por el argumento que maximiza la función de vecindad; la teoría se
basa en que asintóticamente, la estimación de máxima verosimilitud converge casi
seguramente al valor verdadero, bajo las condiciones generales:

x ML arg max l ( x y )
x
Lo que da pie a la teoría de estimación de máxima verosimilitud o de vecindad. Para
mayor detalle ver (E.L. Lehmann. 1991).

Puede verse que el posteriori debe ser proporcional a la vecindad y en eso, las
aproximaciones Bayesiana y Fisheriana coinciden.

Algunos argumentan que la necesidad de conocimiento previo para definir p(x), hace
que el punto de vista Bayesiano sea menos atractivo, lo que favorecería la
aproximación paramétrica donde no es necesario tanto conocimiento previo. Sin
287

embargo, si este conocimiento previo existe, es difícil de describir, por lo menos como
función de densidad de probabilidad; un razonamiento similar afirma que dado que la
elección de la función previa es algo subjetiva, puede afectar la inferencia en forma
destructiva. Estos argumentos se encuentran a favor de la estadística paramétrica,
frente a la Bayesiana, mas allá de esto, el previo y la vecindad define el problema de
inferencia como se presentó anteriormente y definir una función de vecindad correcta,
refleja el mismo problema que definir una buena función de densidad previa.

En situaciones practicas, no se puede garantizar que las observaciones reales del


proceso en las cuales se vaya a basar la estimación, sean exactamente el reflejo del
modelo probabilístico definido por la densidad conjunta p(x/y). Por ello, no hay forma
de asegurar que las medidas tomadas se originen de una función de densidad
parametrizada p(y/x) dados algunos x en el conjunto de parámetros admisibles.
La necesidad de definir un conocimiento previo no es una demanda, pero si es una
opción; eligiendo una función previa que no represente bien la información, atenúa su
efecto en el resultado de la estimación, mientras que una función previa con un
soporte bien definido tendrá un efecto claramente visible en el resultado.

Finalmente, la aproximación Bayesiana puede verse como una generalización de la


aproximación Fisheriana con una opción de posicionar el resultado eligiendo un buen
soporte y solapamiento de la densidad previa. Algunas sugerencias para la elección de
la distribución previa las dan en [J.O. Berger., 1985.], [G. Box and G. Tiao, 1992.] y
[C.P. Robert, 1994.], [Bergman, 1999], [Karlson, 2005]

Cuadratura de Gauss-Hermite Problema de LQG

Al tiempo que se desarrollaba la teoría de filtrado usando ecuaciones diferenciales


estocásticas, se plantearon desarrollos para la teoría de control con funciones de costo
cuadráticas. Como resultado de ello, y en pro de un desarrollo de la teoría de control
óptimo con funcional de costo cuadrático, para sistemas dinámicos lineales con ruido
blanco aditivo, se desarrolló el problema de costo cuadrático para sistemas lineales
estocásticos.

Dado el sistema dinámico

dxt Fxt dt But dt G dvt


dyt Hxt dt dwt

Debe minimizarse la función de costo.

T
J (u ) E x 't Qxt u 't Rut dt x 't Mxt , Q 0, R 0, simetricas
0
288

Cuando las perturbaciones estocásticas están presentes hay una diferencia fundamental
entre el lazo de control abierto (donde el control no es función de las observaciones) y
el lazo de realimentación (donde la acción de control es función de las observaciones).
La respuesta para resolver este problema estocástico totalmente observable

vt 0, t 0, T H I

Considerando a

dxs Fxs dt Gdvs , s t,T


xt x( fijo)

En [Mitter, 1996] puede verse que la acción de control óptima esta dada por

u o (t ) R 1 B ' P (t ) xt

con P la solución de la ecuación de Riccati, que minimiza la función de costo

T
J (uo ) tr G ' P( s)G ds m0' P(0)m0 tr 0 P(0)
0

E ( x0 ) m0
cov( x0 ) 0

Siendo la misma que en el caso determinístico, pero no la función de costo.

Si el problema es parcialmente observable, se introduce una idea de estado de


información, incluyendo una distribución condicional

Pu ( xt yt ,0 s t ) ,

la cual es condicionalmente Gaussiana y dada por el filtro de Kalman

dxˆt Fxˆt dt But dt K t dvt


K t P t H'

Con v siendo un movimiento Browniano adaptado a Fyt, el sigma álgebra generado por
289

ys 0, 0 s t .

Luego, la solución se halla minimizando

T T
J ( n) E xˆ t' Qt xˆt u 't Rut dt xˆ t' Mxˆt tr P (t )Q dt tr P (T )M
0 0

Con
u o (t ) R 1 B ' (t ) xˆt

Con la matriz solución de la ecuación de Riccati y usando el teorema de separación de


un sistema estocástico parcialmente observable en una solución determinística y un
problema de filtrado de Kalman.

Distribuciones de probabilidad estándar

También podría gustarte