Base de Datos de Rostros

Bases de Datos de Rostros: Algoritmos y Programas de
Software
Ingeniera Industrial Tecnologas de Base de Datos
RESUMEN
En este trabajo de investigacin se presenta informacin sobre el diseo de bases de
datos de caractersticas biomtricas. Una de las tecnologas emergentes que muestra
grandes posibilidades de desarrollo en los prximos aos, es la Biometra, la cual tiene
como propsito la identificacin de personas por medio de sus diversas caractersticas
fsicas (voz, huellas digitales, caractersticas faciales, etc.). A partir de los ataques
terroristas a las dos torres del World Trade Center en New York, el 11 de septiembre de
2001, los sistemas biomtricos cobraron un gran auge.
Sobre todo, los sistemas de reconocimiento de rostros. Dichos sistemas tendrn el objetivo
de detectar posibles sospechosos, a partir de diversas bases de datos con fotografas de
personas consideradas terroristas o delincuentes. Tambin, tiene otros mltiples usos de
identificacin en la vida cotidiana: acceso a cajeros automticos, a estacionamientos,
acceso de personal a oficinas, reconocimiento de personas desaparecidas y fallecidas que
no presenten identificacin, acceso a computadoras (en lugar de utilizar password), etc.
En la actualidad, los dos paquetes de software comercial ms utilizados en el
reconocimiento de rostros, utilizan la tcnica de Anlisis por Componentes Principales o
alguna derivacin de ella. Asimismo, la gran mayora de los paquetes computacionales
realizados en proyectos de investigacin para reconocimiento e identificacin de rostros,
que utilizan otros mtodos estadsticos (regresin, redes neuronales, anlisis cluster,
etc.), comparten algo en comn con el anlisis de componentes principales: todos ellos
utilizan clculos y mtricas que se llevan a cabo en un espacio denominado Euclidiano o
L2.
El software basado en tcnicas que utilizan la mtrica Euclidiana, no ha presentado
resultados completamente satisfactorios en el proceso de reconocimiento de rostros. Se
considera que dichas limitaciones se presentan por dos motivos principales: el primero,
debido al propio algoritmo, en segundo lugar, al tipo de caractersticas estadsticas que
presentan los datos de entrada al sistema (los rostros). Para poder utilizar adecuadamente
mtodos estadsticos en espacios L2, los datos de entrada deben cumplir los supuestos de
linealidad, homoscedasticidad y sobre todo, el de normalidad multivariada.
Actualmente, tenemos bases de datos donde se construyen arreglos de servidores de
almacenamiento disponible en red basado en la plataforma de software libre denominada
Gluster que proporciona un alto grado de escalabilidad y disponibilidad.
En la actualidad ya se realiza el diseo de la base de datos de caractersticas biomtricas
para reconocimiento facial y de la forma de caminar y del manejador para la base de
datos que permite incrementar su tamao en cuanto a nmero de personas y agregar
otras caractersticas biomtricas de manera natural para los usuarios.

Software
CAPITULO I
INTRODUCCIN
En la vida cotidiana rara vez nos maravillamos de nuestra capacidad para reconocer un
rostro. Es sorprendente que podamos memorizar un nmero tan considerable de rostros
en el transcurso de nuestra vida. En general lo hacemos de golpe, de manera holstica, sin
necesidad de una descripcin verbal ni de un anlisis consciente de las diversas
caractersticas faciales. Podemos dejar de ver a una persona por algunos aos y cuando la
encontramos nuevamente, generalmente la reconocemos, a pesar de que haya cambiado
de peinado o tenga barba. Sin embargo, el lograr que una computadora pueda reconocer
un rostro, es un problema muy complejo.
El reconocimiento de rostros por medios computacionales, forma parte del rea
denominada Biometra. La palabra biometra, se deriva del griego (bio y metria): Bio (vida)
y metra (medida).
El propsito de la Biometra, consiste en la elaboracin de mtodos automatizados para la
identificacin o verificacin de personas mediante el uso de caractersticas fsicas o de
comportamiento. Esta tecnologa se basa en la premisa de que cada persona es nica y
posee rasgos distintivos que pueden ser utilizados para identificarla. Algunos ejemplos de
caractersticas fsicas son la cara, las huellas digitales, el iris de los ojos y en los ltimos
aos se ha considerado el ADN. Por su parte, algunos ejemplos de caractersticas de
comportamiento son la voz, la manera de firmar, la forma de caminar.
La informacin es el elemento vital en el procesamiento de datos. La necesidad de
mantener la informacin disponible en todo momento, ha hecho a los sistemas de
almacenamiento un componente central en los sistemas de Tecnologas de Informacin.
La tendencia general, es la de implementar sistemas cada vez ms robustos con
rendimientos y disponibilidad cada vez mejores y, lo ms importante, con costos cada vez
menores. Necesidades como estas, han llevado al mundo tecnolgico de hoy a proponer el
diseo de una base de datos que ser utilizada para el anlisis y reconocimiento de
personas basado en sus caractersticas biomtricas como son el reconocimiento facial,
huellas dactilares y forma de caminar.
Actualmente, una de las tecnologas que representan una de las pocas alternativas
disponibles para poder mostrar grficamente un perfil multivariante es Caras de Chernoff.
Esta tecnologa cuenta con un grfico asigna a las variables de una base de datos (hasta
un mximo de dieciocho) rasgos fsicos de la cara y dibuja una cara por cada individuo de
la tabla.

Software
As por ejemplo, en psicologa se pueden detectar individuos con rasgos depresivos. Los
rasgos faciales son fcilmente interpretables por el ojo humano, pero cuando la base de
datos tiene muchos individuos, la labor de diferenciacin es tediosa para el investigador y
se complica cuando el nmero de variables es tambin grande.
En esta tecnologa que mencionamos se presenta un grfico basado en las Caras de
Chernoff que utiliza una paleta de colores para resaltar sobre el grfico original aquellos
rasgos que representan un valor atpico en una o vara variables de uno o varios
individuos de una base de datos. Para detectar estos rasgos atpicos u outliers se utiliza en
primer lugar un diagrama de caja o Box Plot. Este grfico est basado en cuartiles y
permite visualizar de una forma sencilla los individuos de una nica variable.
Posteriormente se elabora un cdigo que permite dibujar e interpretar sobre las caras de
Chernoff dichos outliers diferencindolos por colores.
Se han creado bases de datos distribuidas, implementadas utilizando servidores de
almacenamiento de datos conectados a la red de computadoras (Network-Attached Server
NAS). Se han creado una estructura u organizacin de la informacin almacenada y un
sistema de administracin de los datos. Para esto se hace uso de tecnologas como
Gluster, XML y Java sobre la plataforma Linux.
Actualmente, muchos grupos de investigacin, se encuentra desarrollando proyectos en el
rea de Biometra, especialmente en el reconocimiento de personas por su forma de
caminar y reconocimiento facial.
1.1.- ANTECEDENTES DE LA BIOMETRA

Los antecedentes del uso de medidas fsicas del ser humano para propsitos de
identificacin, se remonta al siglo XIV, en donde los chinos, ya utilizaban ciertas
impresiones de los dedos para identificacin. En el ao 1877, Alphonse Bertillion
(antroplogo y polica de Pars) est considerado como la primera persona que desarroll
y utiliz de manera sistemtica, un mtodo para clasificas e identificar criminales a partir
de diversas medidas del cuerpo y la cabeza.
En 1884, con el sistema de Bertillion se tuvo la
posibilidad de identificar a 241 criminales. Los
cuerpos de polica, tanto en Inglaterra, Francia y los
Estados Unidos, adoptaron en sistema. Sin
embargo, aos despus se comprob que
presentaba fallas importantes en el proceso de
identificacin.
Por su parte, Sir William Herschel realizaba desde
1800, investigaciones sobre el uso de huellas
dactilares para tratar de identificar personas. Logr
obtener aproximadamente 8000 conjuntos de
huellas. Sin embargo fue Sir Francis Galton,
antroplogo britnico y primo de Charles Darwin,
quien logro obtener el primer sistema de
clasificacin de huellas dactilares con el nombre de Finger Prints (Galton, 1892). Utilizando

Software
la investigacin de Galton, Edward Richard Henry desarroll entre 1896 y 1897 el que est
considerado como el primer sistema de la polica para identificacin por medio de huellas
dactilares. Dicho sistema, fue utilizado por Scotland Yard en 1901 y utilizado
posteriormente, por diversos cuerpos de polica en el mundo.
Por lo que respecta al desarrollo de sistemas aplicados al reconocimiento de rostros, las
primeras aplicaciones se remontan a la dcada de los aos sesentas con una compaa
denominada Panoramic Reserch, Inc. en Palo Alto, California y financiada por el
Departamento de Defensa de los Estados Unidos y otras agencias de Inteligencia. Uno de
los fundadores de dicha empresa, fue Woodrow Wilson Bledsoe (pionero en el campo del
razonamiento automatizado). Bledsoe desarroll un sistema semiautomtico para extraer
caractersticas de la fotografa de un rostro, por medio de sealar en una tableta
digitalizadora elementos faciales del rostro (diversos puntos de los ojos, boca, cabeza,
etc.). A partir de dichos puntos, se obtenan coordenadas y un registro de las coordenadas
de su correspondiente fotografa. La computadora calculaba las distancias entre los
registros de la base de datos y los puntos de la fotografa a identificar. En 1996, el sistema
de Bledsoe continu en desarrollo en el Stanford Reserch Institute (SRI).
El siguiente trabajo pionero en el rea, se debe a Sakai y Fujibayashi (1969), quienes
presentan un programa computacional (que no requiere intervencin de algn operador
humano) para confirmar la existencia o ausencia de un rostro en una imagen.
Por su parte, Kelly (1970) elabora una disertacin doctoral sobre reconocimiento de rostros
en Stanford. Su tcnica permite que una computadora extraiga de manera automtica el
contorno de la cabeza y el cuerpo de una determinada persona a travs de una fotografa;
y pueda entonces localizar los ojos, nariz y boca. Sin embargo, el procedimiento requiere
de tres imgenes de cada individuo: una imagen del cuerpo, una imagen del fondo de la
fotografa (sin el cuerpo) y un acercamiento de la cabeza.
El siguiente desarrollo, se realiza en la disertacin doctoral de Takeo Kanade (1973) en la
Universidad de Kyoto, Japn. Quien reporta los mismos resultados que obtuvo Kelly, pero
con ventaja de utilizar nicamente una sola fotografa del rostro. Asimismo, propone un
nuevo esquema ms flexible para el anlisis de la imagen, logrando reconocer
adecuadamente, quince de veinte personas.
Los anteriores, son trabajos pioneros en el rea de reconocimiento de rostros, como se
puede apreciar, el tiempo transcurrido entre dichos desarrollos (aos 60 y 70) y la
actualidad, es de apenas 45 aos como mximo. Si lo comparamos contra el trabajo de
huellas dactilares en 1892 (a partir del sistema de Galton), a la fecha se tienen 113 aos
de desarrollo, por lo cual, los sistemas computacionales aplicados a dicha rea presentan
xitos notables y sumamente confiables en la poca actual.
De manera general, la mayora de los sistemas biomtricos funcionan de forma muy
similar y se puede resumir en dos pasos. El primero, consiste en que la persona debe
registrarse en el sistema. Durante el proceso de registro, el sistema captura el rasgo
caracterstico de la persona, como por ejemplo la huella digital, y lo procesa para crear una
representacin electrnica denominada modelo de referencia o modelo de
entrenamiento. El modelo de entrenamiento debe ser guardado en una base de datos,

Software
una tarjeta inteligente, o en algn otro lugar del cual ser extrado en cualquier ocasin
futura para dar origen al segundo paso.
El segundo paso depende si la funcin del sistema biomtrico consiste en verificar la
identidad de la persona o reconocer a la persona. En el caso de verificacin, la persona le
informa al sistema cul es su identidad ya sea presentando una tarjeta de identificacin,
dando una clave o proporcionando su huella digital o imagen del rostro.
El sistema captura el rasgo caracterstico de la persona y lo procesa para crear una
representacin tambin electrnica llamada modelo en vivo. Por ltimo, el sistema
compara el modelo en vivo con el modelo de referencia de la persona. Si ambos modelos
son idnticos o la diferencia es menor que un determinado umbral se considera una
verificacin adecuada. A este proceso se le conoce tambin como comparacin uno-a-uno
(one-to-one).
Cuando la funcin del sistema es de reconocimiento, la persona no le informa al sistema
cul es su identidad. El sistema tan solo captura el rasgo caracterstico de la persona y lo
procesa para crear el modelo vivo. Luego el sistema procede a comparar los modelos
respectivos para determinar la identidad de la persona en la base de datos o en diversas
bases de datos. Es un proceso denominado uno-a-muchos (one-to-many).
Los sistemas biomtricos se han considerado elementos clave para cuestiones de
seguridad, desde hace varias dcadas. En enero del ao 2000, la revista Technology
Review publicada por el MIT, propuso al rea de la biometra como una de las diez
tecnologas emergentes que cambiarn al mundo. Y de acuerdo a la empresa
Internacional Biometric Group (una de las empresas lderes en el desarrollo de sistemas
biomtricos), se consider que las ventas de sistemas biomtricos creceran de $399
millones de dlares en el aos 2000 a $1.9 billones de dlares para el ao 2005.
A partir de los ataques
York,
11 de septiembre de
los
terroristas a las dos Torres del World Trade Center en New
el
2001,
sistemas biomtricos cobraron un gran auge. Sobre todo, los sistemas de

reconocimiento de rostros. La propuesta de las instituciones de seguridad de los Estados
Unidos, consista en proporcionar a los aeropuertos y lugares de concentracin masiva
(estadios, auditorios, centros comerciales, etc.), sistemas de reconocimiento de rostros.
Dichos sistemas tendran el objetivo de detectar posibles sospechosos (delincuentes y

Software
sobre todo terroristas), a partir de diversas bases de datos con fotografas de personas
consideradas terroristas o ligados de alguna forma a ellos.
Existen diversos procedimientos para elaborar sistemas computacionales de
reconocimiento de rostros, los cuales se detallan en el siguiente captulo. Sin embargo, los
dos algoritmos que ms eficiencia han mostrado y con los cuales se desarrollaron los dos
sistemas comerciales aplicados al reconocimiento de rostros y que se encuentran en uso
por diversas agencias de seguridad tanto en Estados Unidos como en otros pases son:
ALGORITMO EIGENFACES, utilizado en el sistema FaceNet/FaceFinder de la

compaa Viisaje.
ALGORITMO DE ANLISIS DE CARACTERSTICAS LOCALES (LFA) utilizado
en el sistema FaceIt de la compaa Visionics.
Ambos algoritmos se basan en la tcnica denominada Componentes Principales,

desarrollada hace dcadas y utilizada originalmente en las reas de Psicologa, Ciencias
Sociales y Educacin.
El primer sistema comercial exitoso, fue FaceNet, el cual se desarroll a partir de la
tcnica de anlisis de componentes principales. Originalmente fueron Sirovich y Kirby
(1987), quienes plantearon la posibilidad de caracterizar un rostro humano por medio de
componentes principales y denominaron al modelo con el nombre de eigenpictures.
Posteriormente, Turk y Pentland (1991) investigadores del MIT, modificaron e hicieron
operativa la propuesta de los eigenpictures para desarrollar el algoritmo denominado
Eigenfaces. Dicho algoritmo fue patentado por el MIT y posteriormente lo adquiri la
empresa Viisaje para desarrollar comercialmente el sistema FaceNet/FaceFinder.
Por lo que se refiere al algoritmo LFA, fue desarrollado por Joseph Atick, Paul Griffin y
Norman Redlich (1996), basndose tambin en la tcnica de componentes principales. El
algoritmo LFA, intenta reducir la informacin de la imagen digital de un rostro, y obtener
nicamente de 12 a 40 elementos que caracterizan al rostro. Posteriormente, el Dr. Atick
fund la empresa Visionics y comercializ su sistema de reconocimiento de rostros con el
nombre de FaceIt.
Como se ha mencionado, la tecnologa en reconocimiento de rostros, se espera que tenga
grandes incrementos en ventas en las prximas dcadas. De los 399 millones de dlares
por ventas de sistemas biomtricos en el ao 2000 (como se mencion en prrafos
anteriores), $34.4 millones en ventas correspondi a sistemas de reconocimiento de
rostros. Sin embargo, lo anterior se ha incrementado sustancialmente en los ltimos aos.
Para el ao 2007, se pronostican ventas por $429.1 millones de dlares. Por tanto, los
sistemas de reconocimiento de rostros es un nicho de mercado que no se debe perder de
vista y es importante continuar con investigaciones que contribuyan a su desarrollo.
1.2.- BIOINFORMTICA
La Bioinformtica es el campo de la ciencia en donde la biologa, la informtica y la
tecnologa se fusionan en una sola disciplina. ltima meta: descubrimiento de nuevas
penetraciones biolgicas as como crear una perspectiva global que permita analizar los
principios de unificacin en Biologa.

Software
Dentro de bioinformtica, existen tres subdisciplinas:
El desarrollo de nuevos algoritmos y estadsticas para establecer relaciones entre

miembros de grandes grupos de datos.
El anlisis y al interpretacin de varios tipos de datos incluyendo secuencias de
nucletidos y aminocidos, dominios proteicos y estructuras de protenas.
El desarrollo y la implementacin de herramientas que permitan acceso y manejo
eficientes de diferentes tipos de informacin.
Los avances de la biologa molecular permiten la generacin de una gran cantidad de

informacin cuyo anlisis requiere el uso de herramientas de clculo altamente
especializadas. Desarrollar estas herramientas tiene por nombre bioinformtica y es
considerada una de las grandes revoluciones en la biologa y la computacin.
La bioinformtica, ha tenido expansin notoria en sus aplicaciones los ltimos cinco 5
aos. Esta disciplina est siendo aplicada en problemas que implican evaluar y entender la
dispersin y la variacin de marcadores genticos, modelaje molecular, genmica,
protemica, y minera de datos biolgicos. Se pueden citar ejemplo de aplicaciones en
medicina forense, antropologa, manejo y control de plagas, conservacin, desarrollo de
vacunas y drogas, mejoramiento gentico de animales y plantas, entre otros.
La bioinformtica es la aplicacin de tcnicas y tecnologas informticas a la biologa. En
1977 se realiza la primera secuenciacin de ADN (cido desoxirribonucleico). Fue la del
Pho-X174, un bacterigrafo con 5386 nucletidos que codifican 11 protenas. Actualmente
ya se ha secuenciado el ADN de cientos de seres vivos, son cientos de cadenas de miles
de datos, la manipulacin de esta informacin
sin ayuda computacional sera una ardua tarea
en muchos casos frustrante, lo que un
ordenador potente puede procesar en poco
tiempo, del orden de segundos o minutos, un
equipo de trabajo podra necesitar del orden de
semanas para desarrollar ese mismo trabajo.
Por lo que la bioinformtica se destapa como
un campo fundamental en el mbito de la
biologa.
El trmino bioinformtica lo acua Paulin Hogeweg en 1970 para referirse a esta
relevancia que comienza a tomar la informtica en el mbito de la biologa siendo una
parte fundamental en el tratamiento, almacenamiento y transmisin de datos. La
importancia de la informtica en la biologa ha ido en aumento desde los aos 70, por dos
razones principales. La primera es que al da de hoy cada vez se analizan mayor nmero
de secuencias, y la segunda y ms importante es que no solo se analizan esas
secuencias, sino que se almacenan las secuencias y los resultados, compartindolos en la
red lo que agiliza las investigaciones, ya que evita tener que realizar el mismo trabajo
repetidas veces suponiendo un ahorro en tiempo y dinero considerablemente alto.
1.3.- SOFTWARES ACTUALES Y SUS LIMITACIONES

Software
Para el reconocimiento de rostros se han utilizado diversos mtodos, entre stos:
elementos geomtricos del rostro, anlisis estadstico, redes neuronales, componentes
principales, etc. La tcnica ms utilizada en los ltimos aos, ha sido el de componentes
principales.
Uno de los paquetes de software aplicado al reconocimiento de rostros y que ha
presentado resultados exitosos, utiliza el algoritmo denominado Eigenfaces (Sirovich y
Kirby, 1987; Turk y Pentland, 1991), basado en la tcnica de anlisis de componentes
principales. Sin embargo, aunque dicho software se considera uno de los mejores,
presenta ciertos porcentajes de error. Otros sistemas de reconocimiento de rostros, que
utilizan otras tcnicas derivadas del anlisis de componentes principales (LFA, propuesto
por Penev y Atick, 1996), tambin han presentado resultados inciertos.
La gran mayora de los sistemas computacionales para reconocer rostros, comparten algo
en comn, sus respectivos algoritmos matemticos trabajan en un espacio en L 1 o L2. Lo
anterior, presupone que las caractersticas de los datos deben cumplir con ciertos
supuestos estadsticos y matemticos al aplicar diversas tcnicas de anlisis multivariado
que se utilizan.
El software basado en la tcnica de anlisis de componentes principales y algunos otros
desarrollos basados en tcnicas similares, presentan diversas limitaciones y por tanto,
deficiencias en los resultado. Tales limitaciones se considera que se presentan por dos
motivos principales: el primero, debido al propio algoritmo; en segundo lugar, al tipo de
caractersticas estadsticas que presentan los valores que se obtienen de los pixeles de
una imagen digital de un rostro. Se considera que los datos numricos de los rostros
utilizados en el sistema de Eigenfaces, viola el supuesto de normalidad multivariada,
elemento importante para utilizar las tcnicas de anlisis de componentes principales.
1.4.- OBJETIVOS DE LA INVESTIGACIN

1.2.1.- OBJETIVO GENERAL
Estudiar y presentar una Investigacin sobre sistemas computacionales para el
reconocimiento de rostros, presentando los algoritmos genticos de reconocimiento
de patrones que existen la actualidad, as como los programas de software ms
utilizados; informando tambin acerca de las ventajas y limitaciones de estos.
1.2.1.- OBJETIVOS PARTICULARES
Identificar los elementos terico-matemticos que se usan en el

reconocimiento de rostros.
Presentar los Algoritmos ms utilizados en la actualidad para el
reconocimiento de patrones en los rostros.
Estudiar sobre las aplicaciones tecnolgicas actuales del reconocimiento
facial.
Presentar las innovaciones actuales de software (base de datos) sobre
reconocimiento de rostro.

Software
CAPITULO II
RECONOCIMIENTO DE ROSTROS
HUMANOS POR MTODOS
COMPUTACIONALES
El propsito de este captulo, consiste en presentar una revisin de la literatura acerca de
los trabajos de investigacin sobre reconocimiento automatizado de rostros por medio de
computadoras. Se seleccionaron las investigaciones que se consideraron ms relevantes y
que presentan una panormica de los mtodos ms famosos que se han utilizado en el
reconocimiento de rostros.
Es importante sealar, que se tienen dos grandes reas o enfoques acerca del estudio del
reconocimiento de rostros:
El psicolgico y de neurociencias,
El reconocimiento por medio de computadoras.
Algunas de las caractersticas que subyacen al reconocimiento de rostros desde el punto

de vista biolgico y psicolgico, se han utilizado para proponer diversos mtodos
algortmicos que se utilizan en el reconocimiento automatizado.
Sin embargo, el enfoque computacional, es el que ms interesa en el presente trabajo. Por
tanto, a lo largo del presente captulo, se mencionan algunas cuestiones sobre el enfoque
psicolgico y de neurociencias; realizando un nfasis en los mtodos computacionales.
2.1. ENFOQUE PSICOLGICO Y DE NEUROCIENCIAS

RECONOCIMIENTO DE ROSTROS EN EL SER HUMANO
EN
EL
9

Software
Esta primera rea, escapa del mbito del presente trabajo, pero es necesario remarcar,
que diversos resultados de sus investigaciones han sido y son, la base para el
planteamiento de diversos algoritmos computacionales que se utilizan en el procesamiento
de rostros en computadora. Cabe mencionar que los enfoques psicolgicos y de
neurociencias han estudiado principalmente los siguientes aspectos:
Unicidad de caras.
Investigacin acerca de que si el reconocimiento es holstico o por anlisis de
caractersticas locales.
Anlisis y uso de expresiones faciales para reconocimiento e investigacin acerca
de :
Como los nios perciben las caras.
Organizacin de la memoria para el reconocimiento de rostros.
Desordenes en la habilidad para reconocer en forma precisa rostros.
Investigacin acerca de la existencia de una gran neurona madre para el
Reconocimiento de rostros.
Papel del hemisferio derecho del cerebro en la percepcin de rostros.
2.2. ENFOQUE COMPUTACIONAL

Bastantes de las teoras e hiptesis acerca de los anteriores temas se han investigado,
mediante el uso de pequeos conjuntos de imgenes. Sin embargo, los diversos
resultados obtenidos han servido como base para el diseo de algoritmos y sistemas para
el reconocimiento de rostros a travs de computadoras.
Actualmente (en los ltimos cinco aos aproximadamente), se han incrementado los
sistemas para reconocimiento de caras, pero con pocas excepciones, la mayora de los
enfoques se han probado con conjuntos de datos relativamente pequeos (menores a 100
imgenes), nicamente se tienen algunas investigaciones que se han procesado con
bases de datos de 3,000 rostros humanos.
La excepcin, son los sistemas FaceIt y FaceNet utilizados en aeropuertos, se cre que
accede a diversas bases de datos con un gran nmero de fotografas (se desconoce el
tamao de la base).
A continuacin se describen los principales mtodos y tcnicas que se han utilizado para
realizar procesamientos computacionales tendientes a la identificacin de rostros.
2.2.1. SEGMENTACIN DE ROSTROS

a) Mtodo para extraer el rea de la cabeza a partir de una imagen
Craw y otros (1987), describen un mtodo para extraer el rea de la cabeza a
partir de una imagen. Utilizan una escala de imagen jerrquica y una plantilla de
escala. Utilizan resoluciones de 8x8, 16x16, 32x32, 64x64, 128x128 pixeles y
consideran restricciones para la localizacin de la cabeza.
10

Software
Al nivel ms bajo de resolucin, una
plantilla se construye del contorno de
la cabeza; la direccin del borde se
calcula a partir del nivel de grises de
la imagen utilizando una mscara de
Sobel.
Una lnea continua se utiliza para
conectar el contorno de la cabeza. La plantilla se utiliza para compensar
posibles errores que se dan al confundir bordes de la cabeza con otros bordes
de la imagen. Los resultados que se obtienen con este nivel bajo de resolucin,
se utiliza como gua en el siguiente nivel de resolucin.
Una vez que se tiene el contorno de la cabeza, una bsqueda de caractersticas
de bajo nivel tales como ojos, cejas y labios, se lleva a cabo. Los resultados que
se obtienen, en general, son satisfactorios para detectar el perfil de la cabeza, la
bsqueda de los ojos no es tan exitosa. Asimismo, se reporta que se obtuvieron
resultados satisfactorios utilizando los mtodos de Canny (1986) o el de Burr
(1981), para encontrar bordes.
b) Sistema para reconocer y medir caractersticas faciales
Craw, Tock y Bennet (1992), describen un sistema para reconocer y medir
caractersticas faciales, trabajo motivado por un proyecto de indexado
automatizado de fotos policiacas.
Ellos tratan de localizar 40 puntos caractersticos a partir de una imagen de
niveles de gris; dichos puntos se seleccionaron con base a la propuesta de
Shepherd (1986), el cual tambin fue utilizado como un criterio de juicio. El
sistema utiliza una bsqueda jerrquica de grueso a fino. La plantilla se basa en
el principio de transformacin poligonal aleatoria propuesta por Grenander y
otros (1991).
La localizacin aproximada, escala y orientacin de la cabeza se obtiene por
una deformacin iterativa de la plantilla total por medio de escalamiento
aleatorio, traslacin y rotacin.
La optimizacin se logra por medio de recocido simulado (simulated annealing)
(Davis, 1987). Una vez que se logra una idea general de la localizacin de la
cabeza, se realiza un refinamiento por transformaciones individuales de
vectores del polgono (Crac, Tock, Bennett, 1992).
c) Modelo para localizar la cara en una imagen desordenada
Govindaraju y otros (1990) consideran un modelo para localizar la cara en una
imagen desordenada, su tcnica utiliza una plantilla deformable que es
ligeramente diferente a la propuesta por Yuille y otros (1989). Trabajan sobre los
bordes de la imagen, basando en esto su plantilla sobre el contorno de la
cabeza. La plantilla se compone de tres segmentos que se obtienen a partir de
las discontinuidades de curvatura del contorno de la cabeza. Estos tres
11

Software
segmentos forman la lnea del lado derecho, la lnea del lado izquierdo y la lnea
del cabello.
Cada una de estas curvas se le asigna una cuadri-tupla que consiste de la
longitud de la curva, la cuerda en forma vectorial, el rea encerrada entre la
curva y la cuerda y el centroide de dicha rea. El centro de dichos tres
segmentos da la localizacin del centro de la cara y posteriormente, las
plantillas permiten trasladar, escalar y rotar de acuerdo a ciertos modelos.
2.2.2. EXTRACCIN DE CARACTERSTICAS

Los primeros trabajos en reconocimiento de caras fueron realizados por Sakai y otros
en el ao de 1969. Utilizaron una imagen digitalizada con 8 niveles de gris. El trabajo
se realiz sobre un conjunto de datos consistente de imgenes frontales de caras, y
se utiliz una cuadrcula de 3x3 para determinar los pixeles que presentan el mayor
valor de gradiente, de tal forma que la cantidad de informacin se reduce a elementos
esenciales. Estos pixeles se conectan a pixeles vecinos que exhiban caractersticas
similares para formar lneas y segmentos de contorno. Un enfoque de grueso a fino
se utiliza para determinar caractersticas individuales de la cara.
El reconocimiento no diferencia entre caras diferentes, determina nicamente la
existencia de una cara en la imagen. Los autores anotan que el procedimiento
empleado presenta una dependencia de la direccin de la iluminacin, cambios en
sta, causan problemas en el enfoque.
2.2.3. RECONOCIMIENTO DE ROSTROS

Kaya y Kobayashi (1972) presentan un estudio bsico en la clasificacin de caras
utilizando vistas frontales, con boca cerrada, sin barba, sin anteojos. Se utilizan
distancias euclideanas entre puntos similares sobre la cara como parmetros, para la
caracterizacin respectiva. Dichos parmetros son resistentes a cambios en luz y
grado de desarrollo en pequeos cambios de la expresin facial. Kaya y otros estiman
que el nmero de parmetros debe ser mayor que bits, en donde N es igual al nmero
de caras a clasificar. Los parmetros se normalizan dividindolos entre la longitud de
la nariz, para contabilizar cualquier diferencia debida al tamao de la fotografa y la
distancia del sujeto a la cmara. N2log
Se utilizaron fotos de 62 japoneses adultos entre los 20 y los 30 aos de edad y bajo
las mismas condiciones de luz. Los parmetros caractersticos fueron medidos a
mano, y se calcul la media y la desviacin estndar. La correlacin de los parmetros
indica que la actual dimensin del vector de parmetros puede ser ms pequea de 9.
Una de las mtricas utilizadas con gran efectividad de clasificacin es el nmero
promedio de parmetros utilizados para identificar la cara.
Uno de los mtodos de caracterizacin de la cara es el uso de parmetros
geomtricos (distancias y ngulos entre puntos, tales como las corneas del ojo,
extremidades de la boca, mentn, etc.).
12

Software
En trabajos posteriores, Kirby y Sirovich (1990) incluyen la simetra de las caras en la
representacin de eigenfotos de las caras, utilizando un ensamble extendido de
imgenes, consistentes de las caras originales y sus imgenes espejo.
Entre los mtodos que ms relevancia tuvieron a principios de la dcada de los

noventas y que sirvieron para desarrollos posteriores, es el propuesto por Brunelli y
Poggio (1993). Dichos investigadores han realizado mtodos para el reconocimiento
de rostros a partir de la obtencin de caractersticas geomtricas. A partir de 35
caractersticas se realiza el reconocimiento mediante un clasificador bayesiano.
Otro mtodo muy utilizado hasta la fecha, consiste en la utilizacin de plantillas
(mscaras), en el cual se configuran diversas plantillas que abarcan ciertas regiones
del rostro: ojos, nariz, boca, etc., como se puede observar en la figura 3.b. La imagen
a reconocer se compara a travs de las plantillas con las imgenes de la base de
datos, y se obtiene un vector con las puntuaciones de apareamiento mediante
procesos de correlacin (Brunelli y Poggio, 1994).
Un mtodo tambin ampliamente utilizado en la actualidad, consiste en la utilizacin
del denominado Anlisis de Componentes Principales. El cual, es una tcnica
estadstica que se utiliza para la reduccin de la dimensionalidad de los datos,
preservando la informacin relevante. Hancock, Bruce y Burton (1996, 1998),
proponen la utilizacin de componentes principales a partir de 38 puntos geomtricos
del rostro.
13

Software
Turk y Pentland (1991) utilizan eigenfotos (conocidas como eigenfaces) para la

deteccin de caras y su respectiva identificacin (figura 6). Dadas las eigenfaces, toda
cara en la base de datos se puede representar como un vector de pesos, los pesos se
obtienen por la proyeccin de la imagen en los componentes de la eigenface por
medio de un simple producto punto.
Cuando una nueva imagen prueba cuya identificacin se requiere es dada, la nueva
imagen tambin se representa por su vector de pesos. La identificacin de la imagen
prueba se realiza al localizar la imagen en la base de datos cuyos pesos son los ms
cercanos (en distancia euclideana), a los pesos de la imagen prueba.
Al utilizar la observacin de que la proyeccin de la imagen de una cara y la imagen
que no sea una cara, son muy diferentes, se tiene un mtodo para detectar la
presencia de caras en una determinada imagen. Los autores utilizan una base de
datos de 3000 caras, correspondientes a 16 sujetos, digitalizando todas las
combinaciones de tres orientaciones de la cabeza, tres tamaos de la cabeza y tres
condiciones de luz. Se reporta que el enfoque es robusto para cambios en la
condicin de la luz, pero se degrada rpidamente ante cambios de la escala.
14

Software
Akamatsu
y
otros
(1991), utilizan el mtodo KL para la extraccin de caractersticas a partir de imgenes
de caras, ste mtodo, se combina con otras dos operaciones para mejorar la
ejecucin de la tcnica de extraccin en la clasificacin de caras con vista frontal. La
aplicacin de la expansin KL directamente sobre una imagen facial sin
estandarizacin, no logra robustez ante variaciones en la adquisicin de la imagen. El
mtodo reportado por Akamatsu, utiliza estandarizacin de la posicin y tamao de la
cara. Los puntos centrales son las regiones correspondientes a los ojos y boca.
Cada imagen objetivo se traslada, escala y rota a travs de transformaciones afines,
tal que, los puntos de referencia de los ojos y boca estn en un arreglo espacial
especfico con una distancia constante. La expansin KL aplicada a la estandarizacin
de imgenes de caras se conoce como la transformada Karhunen-Loeve de patrn de
intensidad en imagen objetivo de transformada afn (KL-IPAT). Golomb y Sejnowski
(1991), utilizan cascadas de dos redes neuronales para clasificacin de gnero. El
primer estado es una red neuronal para comprimir imgenes, cuyos nodos ocultos
sirven como entradas a la segunda red, la cual ejecuta la clasificacin del gnero.
Ambas redes se encuentran totalmente conectadas y redes de tres capas, se
entrenan por un algoritmo estndar back-propagation. Las imgenes utilizadas para
la prueba y entrenamiento fueron adquiridas de tal forma que se evita el pelo facial,
joyera, maquillaje, fueron preprocesadas de tal forma que los ojos estn a nivel, as
como la boca.
2.2.4. RECONOCIMIENTO DE ROSTROS A PARTIR DE PERFILES

La investigacin en esta rea es generalmente aplicada a requerimientos de
identificacin policiaca. Las imgenes de perfil proporcionan informacin estructural
15

Software
detallada acerca de la cara, la cual no se puede obtener en imgenes frontales.
Especficamente, el tamao y orientacin de la nariz, as como la obtencin de puntos
locales de inters. El reconocimiento involucra la determinacin de interrelaciones
entre dichos puntos.
Kaufman y Breeding (1976) desarrollaron un sistema de reconocimiento a partir de
siluetas de perfil. La imagen adquirida por una cmara de TV blanco y negro, se
genera una imagen binaria, con el negro correspondiente a la regin de la cara. Un
paso de pre procesamiento extrae la porcin frontal de la silueta que limita la imagen
de la cara. Un conjunto de auto correlaciones normalizadas expresada en
coordenadas polares, se utiliza como un vector de caractersticas, una regla del tipo
K-vecinos prximos con distancia pesada se utiliza para la clasificacin. Se
realizaron experimentos con 120 perfiles correspondientes a 10 personas, la mitad fue
utilizada para entrenamiento.
Wu y Huang (1990) reportan tambin un sistema para reconocimiento de perfiles
utilizando enfoques similares al de Harmon (1977). Primero, a partir de los perfiles se
utilizan B-splines para extraer seis puntos de inters (pico de la nariz, fondo de la
nariz, punto de la boca, mentn y punto del ojo). Un vector de caractersticas con
dimensin de 24, se construye a partir del clculo de distancias entre dos puntos
vecinos, longitud, ngulo entre segmentos de curvatura juntando dos puntos
adyacentes, etc.
El reconocimiento se realiza al comparar el vector de caractersticas que se extrajo
contra la imagen de prueba con vectores almacenados utilizando un mtodo de
bsqueda secuencial y una norma absoluta. Las caractersticas almacenadas se
obtienen a partir de tres instancias de los perfiles de personas, en todas, se utilizaron
18 personas para la fase de entrenamiento.
2.2.5. METODOS EVOLUTIVOS

Liu y Wechsler (1998), proponen una combinacin de Anlisis de componentes
principales con un enfoque evolutivo. Se utiliza un Algoritmo Gentico con el propsito
de buscar los mejores ejes de rotacin definidos por el Anlisis de componentes
principales, con el propsito de encontrar los ejes que mejor realicen la separacin de
clases. Reportan experimentos que se realizaron con 1107 imgenes de rostros de la
base de datos FERET, correspondientes a 369 sujetos, utilizando en promedio, tres
imgenes por sujeto.
Otras aplicaciones utilizando algoritmos genticos, se han realizado combinndolos
con algunas de la tcnicas mencionadas en las secciones anteriores. Entre las
investigaciones reportadas, se encuentran, las de Bhanu (1995) para segmentacin
de imgenes. Huang (1998) realiza el reconocimiento utilizando componentes
principales y algoritmos genticos. Pinto y Sossa (1998) proponen un mtodo que
utiliza las primeras cuatro invariantes de Hu y a partir de stas realizar la identificacin
con la ayuda de un algoritmo gentico.
16

Software
CAPITULO III
ALGORITMOS ACTUALES DE
RECONOCIMIENTO FACIAL
Hay dos familias de tcnicas de reconocimiento facial: tcnicas basadas en la apariencia y
tcnicas basadas en modelos [8]. En cada una de estas familias, se encuentran varios
mtodos para caracterizar la imagen, aunque en este estudio solo se tratarn algunos de
los mtodos basados en la apariencia.
Los sistemas basados en la apariencia se utilizan directamente sobre las imgenes sin
hacer uso de modelos 3D. Estos tipos de sistemas representan un objeto en funcin de
diferentes vistas del mismo. En estos sistemas cada imagen se representa como un punto
en un subespacio vectorial, de forma que la comparacin entre la imagen de test y las
imgenes de referencia se realiza en el subespacio vectorial caras.
El objetivo de estos algoritmos es clasificar las diferentes caras en el nuevo subespacio,
pero para ello ser necesario entrenar previamente el sistema con imgenes de diferentes
caras con diferentes vistas. Estas tcnicas sern explicadas con ms detalles
posteriormente donde se expondrn los mtodos de clasificacin basados en la apariencia
que se han utilizado. Por otro lado estn los sistemas basados en modelos, los cuales
intentan construir un modelo lo ms descriptivo posible de la cara humana capaz de
detectar con precisin las variaciones faciales.
17

Software
Estos sistemas tratan de obtener caractersticas biomtricas de las imgenes para realizar
el reconocimiento (distancia entre ojos, grosor de la nariz). Habitualmente estas tcnicas
requieren de imgenes de gran resolucin. Cuando se utilizan estos sistemas, el algoritmo
sabe con antelacin el objeto que ha de representar y lo que intenta hacer es que
corresponda la cara real con el modelo. El proceso que se suele seguir cuando se usan
estas tcnicas est formado por tres pasos:
Construccin del modelo.
Ajustar el modelo a la imagen de test.
Utilizar los parmetros del modelo ajustado para calcular la similitud entre la
imagen de test y las imgenes de referencia para realizar el reconocimiento.
Algunas de las ventajas e inconvenientes de los sistemas basados en la apariencia frente

a los basados en modelos son las siguientes:
Ventajas:
o Ms rpidos.
o Requieren de un menor tamao de las imgenes.
o Menor complejidad.
o No requieren de un conocimiento previo de las imgenes.
Inconvenientes:
o Ms afectados por cambios en la orientacin o expresin de la cara.
o Ms dificultades frente a cambios en la iluminacin.
A continuacin se har una pequea descripcin de la literatura que existe sobre algunos
de los mtodos ms relevantes de reconocimiento facial y una pequea explicacin de
cmo se va a realizar el reconocimiento de las imgenes.
18

Software
3.1 RECONOCIMIENTO DE IMGENES FIJAS

En este estudio se har uso de mtodos basados en la apariencia, los cuales para el
reconocimiento de imgenes requiere de los bloques que podemos encontrar en la
siguiente figura:
Para realizar los diferentes experimentos que se realizan en este estudio el sistema hace
uso de los siguientes conjuntos de imgenes:
Imgenes de referencia: son las que estn almacenadas y son conocidas por el
sistema y son utilizadas para saber si una imagen de entrada pertenece o no a
algn sujeto registrado en el sistema.
Imgenes de test: son las que recibiremos en el sistema y se tienen que

reconocer.
Imgenes de entrenamiento: son utilizadas en los mtodos PCA y LPP para

conseguir las matrices de proyeccin.
Los pasos que se llevan a cabo para este reconocimiento, sin tener en cuenta el
preprocesado previo de las imgenes, son los que se detallan a continuacin:
1) El sistema necesita de un set de imgenes de referencia las cuales son
procesadas y proyectadas (y = Wx) en el nuevo subespacio para despus ser
utilizadas para conocer si una imagen pertenece o no a un individuo registrado en
el sistema.
2)
3) Cuando las imgenes de referencia estn correctamente proyectadas, se realiza el

mismo procedimiento con las imgenes de test. Estas pueden pertenecer a
19

Software
personas que estaban incluidas entre las imgenes de referencia pero mostrando
diferentes expresiones faciales o diferentes condiciones del entorno.
4)
Finalmente se dir que ha habido reconocimiento si se cumple alguna condicin, en

general se considera que hay un reconocimiento positivo si se cumple una
condicin:
En concreto para el caso de este estudio, una imagen de test pertenece a otra del
conjunto de imgenes de referencia si es la que cumple distancia mnima de
manera que siempre se tiene que asignar un sujeto a una imagen de entrada.
3.2 DESCRIPCIN DE LOS PRINCIPALES ALGORITMOS

Como en este estudio se va a hacer uso de tcnicas basadas en la apariencia, a
continuacin se describen brevemente los principales mtodos que se pueden encontrar.
3.2.1.- PCA (Principal Component Analysis)

PCA es un mtodo que transforma un nmero de variables posiblemente
correlacionadas en un pequeo nmero de variables incorrelacionadas llamadas
componentes principales, es decir, es un algoritmo de reduccin dimensional que
permite encontrar los vectores que mejor representan la distribucin de un grupo de
imgenes.
PCA est basado en la Transformada de Karhunen-Loeve (KLT), que consiste en la
representacin de un proceso estocstico no peridico a travs de una base de
vectores obtenidos completamente del proceso en s mismo, es decir, PCA permite
representar una imagen de una cara usando una base que se ha conseguido a partir
de muchas observaciones de diferentes caras.
El objetivo de este mtodo consiste en representar una imagen en trminos de un
sistema de coordenadas ptimo reduciendo el nmero final de componentes que
tendr la imagen. Un ejemplo de PCA lo podemos ver en la figura 14.
20

Software
Esta base de transformacin depende de las observaciones y se forma a partir de los

d autovalores ms significativos de la matriz de covarianza, los cuales representan las
componentes principales que son ms comunes en imgenes de diferentes caras.
La reduccin dimensional realizada por PCA es equivalente al nmero de
autovectores que se utilicen. Por lo tanto la imagen proyectada por PCA tendr una
dimensin de valor d, como se puede ver en la figura 15.
Estos autovectores representan las componentes principales que son ms comunes

en imgenes de diferentes caras, otra forma de verlo, es que son los ejes del
subespacio donde proyectaremos las imgenes de caras humanas los cuales se
corresponden con las direcciones de mxima varianza de los datos.
La matriz de transformacin, est formada por los autovectores correspondientes a los
d autovalores ms significativos. En la figura 16 se muestran los primeros 7
autovectores que derivan del uso de la base de datos ORL. La imagen media
correspondiente a estos 7 autovectores la podemos ver en la figura 17 y en la figura
18 podemos ver las imgenes correspondientes a los 7 autovalores ms bajos. Estos
ltimos se corresponden con autovalores muy pequeos y son considerados como
ruido de manera que no se tienen en cuenta para el reconocimiento.
21

Software
Otra de
las
cualidades de PCA, es que realiza una discriminacin entre clases, es decir, todas las
caras correspondientes a un mismo individuo estn cerca entre s, mientras que las
imgenes correspondientes a individuos diferentes estn ms alejadas. Esta
propiedad es ms destacable en las primeras componentes de las imgenes
proyectadas. En la figura 19 se muestra un ejemplo de la proyeccin de tres imgenes
de personas diferentes mostrando diferentes componentes.
22

Software
3.2.2.- LDA (Linear Discriminant Analysis)
LDA tiene como objetivo convertir un problema de alta dimensionalidad en uno de
baja. Para ello LDA proyecta los datos (imgenes) en un espacio vectorial de baja
dimensionalidad de manera que la ratio entre la distancia entre clases y la distancia
dentro de la clase se maximiza. De este modo se garantiza una mxima
discriminacin entre las clases.
A diferencia de PCA, que es un mtodo de reduccin dimensional sin supervisin,
LDA si que es supervisado y utiliza informacin de los datos. Para ello lo que se hace
es maximizar la siguiente expresin:
Donde SB es la matriz de dispersin entre clases mientras que SW es la matriz de

dispersin intra clase y se definen como:
y NC es el nmero de casos dentro de la clase c.

Una vez est resuelto este problema, se obtiene la matriz de proyeccin que permite
pasar de un problema de alta dimensionalidad a uno de baja. Cada una de las
columnas que forman esta matriz sern las bases del nuevo subespacio, las cuales se
conocen como FisherFaces (figura 20). Estas bases son aquellas que garantizan una
mxima discriminacin entre clases por encima de ser las que mejor describen los
datos, a diferencia de PCA [17] (figura 21).
Una de las limitaciones que tiene LDA, es que se requiere de matrices de dispersin
no-singulares. Esto en aplicaciones de reconocimiento facial es complicado debido a
que en muchas ocasiones la alta dimensionalidad de las imgenes es mucho mayor
que el nmero de imgenes lo que desemboca en un problema de matrices
singulares, algo que como se ver ms adelante tambin puede suceder en LPP,
conocido como undersampled o singularity problem. Para evitar este efecto, se utilizan
diferentes aproximaciones como pseudo-inverse LDA, que utiliza la pseudo-inversa de
la matriz de covarianza en lugar de su inversa, y PCA + LDA, que realiza un reduccin
previa de los datos utilizando PCA.
23

Software
3.2.3.-
LPP
(Locality Preserving Projections)

LPP es un algoritmo lineal que del mismo modo que PCA realiza una reduccin
dimensional de los datos. Al tratarse de un algoritmo lineal es rpido y til para
aplicaciones prcticas.
Una de las propiedades que lo diferencian de PCA es que en lugar de conservar la
estructura global de los datos, conserva la estructura local (figura 22). De este modo
los vecinos para un dato en concreto sern los mismos en el espacio original, de alta
dimensionalidad, y en el nuevo subespacio de baja dimensionalidad. Al conservarse la
estructura local de los datos, las imgenes pertenecientes a un mismo individuo
estarn cercanas entre si y alejadas de las de otros individuos, es decir, hay una
discriminacin entre clases (figura 23).
Para conservar la estructura local de los datos se hace uso de un grafo de
adyacencias que incluye informacin de la estructura de los datos. Este grafo, como
se ver con ms detalle en el apartado 3.4.1, consiste en la creacin de una matriz de
tamao NxN, donde N es el nmero de imgenes, que tiene asignados unos pesos
dependiendo de si los elementos i y j son vecinos o no.
En el momento de crear este grafo cabe la opcin de crearlo de manera automtica
(caso no supervisado), utilizando mtodos de bsqueda de vecinos como K nearest
neighbors o -neighborhoods, o hacerlo de manera manual (caso supervisado)
asignando manualmente quienes son o no vecinos. Todas estas configuraciones sern
vistas con ms detalle en el apartado 3.4.
24

Software
Este mtodo presenta algunos inconvenientes. Uno de ellos, aunque para el caso de
este estudio no afecta, es la dificultad de recuperar los datos originales a partir de los
datos proyectados al nuevo subespacio, esto se debe al hecho de hacer uso de bases
no ortogonales.
Otro inconveniente que se puede dar es el de las matrices singulares, que veremos
con ms detalle en el apartado 3.4.1, el cual se produce cuando la dimensionalidad de
los datos es mucho ms elevada que el nmero de muestras (n >> N). Para
solucionar este problema se hace uso de tcnicas de reduccin dimensional de los
datos antes de utilizarlos de manera que n = N o n > N.
Por otro lado, este mtodo es interesante por diferentes perspectivas:
Los mapas estn diseados para minimizar algn criterio objetivo procedente
de las tcnicas lineales clsicas.
Como LPP preserva la estructura local de los datos, el sistema tendr los
mismos vecinos en el espacio de baja dimensionalidad que en el de alta.
LPP es un mtodo lineal, lo que hace que sea rpido y conveniente para
aplicaciones prcticas.
LPP est definida para todos los casos, a diferencia de las tcnicas de
reduccin no lineales que solo estn definidos para el conjunto de datos de
entrenamiento, de manera que al tener un nuevo dato LPP es capaz de
representarlo en el nuevo subespacio sin tener que recalcularse las matrices
de proyeccin.
25

Software
3.2.4.- DCT (Discrete Cosine Transform)

La DCT es una transformacin que representa una secuencia finita de datos como la
suma de una serie de funciones cosenoidales oscilando a diferentes frecuencias. Esta
tcnica es muy utilizada en aplicaciones de procesado de seal, desde compresin de
audio e imgenes hasta mtodos espectrales para la solucin numrica de
ecuaciones diferenciales. Una de estas aplicaciones es el reconocimiento facial.
En este trabajo, la DCT ser utilizada para obtener caractersticas de la imagen y
luego usarlas para poderlas clasificar, como se hace con PCA. A diferencia de PCA,
este mtodo no necesita ser entrenado con imgenes del mismo tipo a las que se van
a usar sino que simplemente se transforman directamente las imgenes, es decir, la
base de la transformacin es independiente de las imgenes. Otra de sus ventajas es
su bajo coste computacional en relacin con PCA.
Se definen 8 variantes de DCT, de las cuales las ms relevantes son: DCT-I, DCT-II,
DCT-III y DCT-IV. En lo que se refiere al reconocimiento facial, la transformacin ms
utilizada es DCT-II, que se define como:
Si la interpretacin de esta frmula es que la entrada al sistema es una imagen u y la

DCT es la matriz de transformacin para obtener W, se tiene una expresin como la
expuesta en el captulo 2.1 donde W = c(k, ) = c(k1,n). c(k2,m) y k y son las filas y
columnas:
26

Software
De esta manera se puede tratar este algoritmo del mismo modo que PCA o LPP, es
decir, como un sistema que tiene una matriz de proyeccin (en este caso nica para
cada imagen) gracias a la cual se puede proyectar las imgenes a un subespacio de
baja dimensionalidad de igual modo que se hace en PCA (figura 15).
3.2.5.- DCT por Bloques

Este mtodo realiza una mezcla de las tcnicas basadas en la apariencia y las
basadas en modelos, en concreto, hace uso de la misma metodologa que el mtodo
DCT pero aplicado de forma distinta.
Lo que se hace es aplicar DCT-II sobre bloques de 8x8 pxeles de la imagen. Una vez
calculada la DCT sobre cada uno de estos bloques de 8x8 pxeles, se selecciona un
determinado nmero de coeficientes por bloque con el fin de crear la nueva
representacin de la imagen (figura 24).
Este sistema hace uso parcial de los sistemas basados en modelos porque requiere
de la localizacin de alguna caracterstica facial. En este caso para el buen
funcionamiento del sistema se necesita que las imgenes estn recortadas y
totalmente alineadas. Por esta razn previamente a aplicar el algoritmo, se debe
detectar la posicin de los ojos y alinear la imagen segn un criterio (figura 25). En
caso de que no se realice esta alineacin previa de las imgenes, el sistema no
27

Software
funcionar correctamente. En la figura 26 se puede ver el efecto causado al no
realizar una correcta alineacin de las caras.
28

Software
CAPITULO IV
BASE DE DATOS DE ROSTROS
4.1 BASE DE DATOS OLIVETTI (ORL DATABASE)
Se trata de una base de datos formada por 40 individuos, a razn de 10 imgenes por
individuo tomada entre 1992 y 1994 [27]. En esta base de datos se pueden encontrar tanto
imgenes de hombres como de mujeres.
Como es posible observar en la figura, en esta base de datos se pueden encontrar
imgenes con diferentes posiciones y expresiones faciales (ojos abiertos/cerrados,
sonriendo o no,), lo cual ser una dificultad aadida para el sistema. Del mismo modo se
puede observar como en algunos sujetos, se tendrn imgenes con distintos detalles
faciales (gafas o no, bigote o no,).
Por ltimo decir que todas estas fotos han estado tomadas bajo unas condiciones de
iluminacin y de fondo de imagen controladas. El tamao de todas estas imgenes es de
92x112 pxeles, con 256 niveles en la escala de grises para cada pxel.
4.2 BASE DE DATOS XM2VTS

Est formada por imgenes pertenecientes a 295 sujetos, con 4 imgenes por individuo
tomadas durante 4 meses. Son imgenes de un tamao de 286x350 pxeles y en color
(4:2:2). Previamente a su uso, han sido convertidas a escala de grises (256 niveles) y se
han recortado de manera que la imagen solo contenga la cara de los individuos.
29

Software
Como se observa en la figura 32, se trata de imgenes tomadas en un entorno controlado,
bajo condiciones estables de iluminacin y con una variacin en la posicin facial y de
expresin muy leves.
4.3 BASE DE DATOS BANCA

Se trata de una base de datos muy amplia. Dentro de la base de datos BANCA, se pueden
encontrar diferentes grupos de imagen. Por un lado hay una primera diferenciacin en
cuanto al origen de los individuos de las imgenes (Espaa, Inglaterra,) y por otro se
clasifican las imgenes entre las tomadas en entornos controlados, y las tomadas en
entornos no controlados. Durante el resto de experimentos en que se utilice esta base de
datos, se har uso de las imgenes correspondientes a individuos de Inglaterra.
Las imgenes tomadas en entorno controlado, que en adelante se describirn como
imgenes de la base BANCA Controlled (figura 33), presentan unas condiciones de
iluminacin constantes a la vez que los cambios de posicin y expresin facial son
pequeos.
Las imgenes pertenecientes al conjunto no controlado, en adelante BANCA Degraded
(figura 34), presentan unas condiciones de iluminacin variable. En cuanto a la posicin de
las caras se refiere, estas siguen siendo bastante frontales y con pequeos cambios en la
expresin.
Como es posible observar en la figura 33 y 34, todas las imgenes han sido previamente
convertidas a escala de grises y recortadas de modo que las imgenes solo contengan la
cara.
30

Software
4.4 BASE DE DATOS YALE

Est formada por 150 imgenes pertenecientes a 15 sujetos con 10 imgenes por
individuo que han sido tomadas bajo diferentes condiciones. Estas imgenes tienen un
tamao de 320x243 pxeles y no incluyen solamente el rostro sino que se ve de fondo una
pared granulada la cual es muy visible o no dependiendo de cmo incida la luz sobre la
escena, por lo tanto es adecuado realizar un recorte de estas imgenes de manera que
solo tengamos la cara para el reconocimiento.
Estas imgenes son muy cambiantes y presentan situaciones de todo tipo como pueden
ser cambios en la expresin facial, presencia o no de vello facial, gafas y cambios en la
iluminacin no uniformes (figura 35).
31

Software
CAPITULO V
TECNOLOGA DE BASE DE DATOS Y
RECONOCIMIENTO DE ROSTROS CON
SISTEMAS BIOMTRICOS
5.1.- SISTEMAS BIOMTRICOS
Los sistemas biomtricos, los cuales emplean diversas caractersticas fsicas o de
comportamiento aprendido de las personas para su identificacin, han sido un tpico de
activa investigacin durante los ltimos aos, tiempo en el cual se han desarrollado
diversos sistemas tanto para la identificacin de personas como para la verificacin de su
identidad (Jain y col, 2008; Ngugi y col., 2011). Entre los sistemas biomtricos reportados
hasta la fecha existen esquemas basados en caractersticas de la voz, del rostro, las
huellas dactilares, en la firma autgrafa, la cadencia de tecleo, la forma de caminar, etc.
(Gibbs, 2010).
Entre ellos los sistemas basados en el reconocimiento de rostros son de los ms utilizados
debido a su naturaleza no-intrusiva, ya que en stos la adquisicin de los datos se lleva a
cabo simplemente tomando una fotografa.
Adicionalmente, ste es el mecanismo ms frecuentemente usado por las personas para
reconocerse entre s (Zhonghua y col. 2013; Vezzeti y Marcolin, 2012; Fookes y col. 2012).
Durante los ltimos aos diversos esquemas de reconocimiento de rostros se han
incorporado en diversos equipos comerciales, proporcionando porcentajes de
reconocimiento superiores al 95% cuando operan en condiciones controladas. Sin
embargo su funcionamiento se degrada considerablemente cuando operan en ambientes
32

Software
con iluminacin no controlada, orientacin variable del rostro con respecto a la cmara; as
como cuando la imagen del rostro capturada contiene oclusiones significativas (Corcoran,
2011).
Otra de las limitaciones de los sistemas de reconocimiento de rostro actuales, la cual ha
recibido menos atencin que las anteriormente mencionadas, es el hecho de que el rostro
es un objeto tridimensional y la gran mayora de los sistemas desarrollados hasta la fecha,
estn basados en imgenes bidimensionales (Jin y Zhuojun, 2009; Faruqe y Hasan, 2000;
Aguilar y col., 2009; Olivares y col. 2007).
Esto permitira engaar al sistema colocando frente a la cmara una fotografa de alta
resolucin de la persona cuya identidad se desea suplantar. Para evitar este problema, en
este artculo se propone un sistema de reconocimiento de rostros empleando imgenes
estreo, con el fin de discriminar entre imgenes tridimensionales e imgenes
bidimensionales, previniendo as el empleo de imgenes capturadas de una fotografa de
la persona cuya identidad se pretende suplantar.
As, s el sistema determina que la imagen capturada corresponde a una fotografa, el
reconocimiento se detiene; mientras que en caso contrario se procedera a la extraccin de
caractersticas para el posterior reconocimiento de la imagen de entrada.
Una vez que el sistema determina que la imagen de entrada es autntica, se procede a la
caracterizacin de cada una de las imgenes estreo, para lo cual se analizaron tres
esquemas altamente eficientes: el anlisis de componentes principales (PCA), (Turk, y
Pentland, 1991; Kshirsagar y col. 2011), los filtros de
Gabor (GF), (Aguilar y col., 2009; Jing y col. 2011); y la transformada ondoleta discreta
(DWT por sus siglas en ingls), (Olivares y col. 2007; Santamara y col. 2012; Rubio y col.
2012).
Seguidamente, debido a que se obtiene un vector caracterstico por cada imagen estreo,
con el fin de sacar el mayor provecho de los mismos, se realiza una fusin, ya sea del
resultado obtenido de manera independiente de stos o una fusin de los vectores
caractersticos, para tomar la decisin final relativa a la identificacin de persona bajo
anlisis, o la verificacin de la identidad de la misma. Una vez procesados los vectores
caractersticos, stos se insertan a un esquema de clasificacin para la toma de la decisin
final.
5.1.1.- PROCESAMIENTO DE LA INFORMACIN

Aunque estos dispositivos se basan en tecnologas muy diversas, si se consideran de
forma genrica se puede considerar un sistema biomtrico genrico de identificacin,
dividido en cinco subsistemas: recoleccin de datos, transmisin, procesado de seal,
decisin y almacenamiento de datos.
La siguiente figura muestra de manera esquemtica estos cinco subsistemas y como
se relacionan entre s:
33

Software
5.1.2.- BIOMETRA ESTTICA

5.1.2.1.- Huella Dactilar:
Las huellas digitales son caractersticas exclusivas de los primates. En la
especie humana se forman a partir de la sexta semana de vida intrauterina y
no varan en sus caractersticas a lo largo de toda la vida del individuo. Son las
formas caprichosas que adopta la piel que cubre las yemas de los dedos.
Estn constituidas por rugosidades que forman salientes y depresiones. Las
salientes se denominan crestas papilares y las depresiones surcos
interpapilares. En las crestas se encuentran las glndulas sudorparas. El
sudor que stas producen contiene aceite, que se retiene en los surcos de la
huella, de tal manera que cuando el dedo hace contacto con una superficie,
queda un residuo de sta, lo cual produce un facsmil o negativo de la huella.
a) Identificacin de Patrones: A simple vista, el patrn que siguen las

lneas y surcos de una huella se puede clasificar segn tres rasgos
mayores: arco, lazo y espiral. Cada dedo presenta al menos una de
estas caractersticas. Por otro lado, en determinados puntos las lneas
de la huella dactilar se cortan bruscamente o se bifurcan. Estos puntos
reciben el nombre de minucias, y juntos suman casi el 80% de los
elementos singulares de una huella.
34

Software
Todo esto da lugar a un patrn complejo nico para cada individuo,

distinto incluso en gemelos idnticos. En concreto, se estima que la
probabilidad de que dos personas tengan las mismas huellas
dactilares es aproximadamente de 1 en 64.000 millones.
Cuando se digitaliza una huella, los detalles relativos a las lneas
(curvatura, separacin,...), as como la posicin absoluta y relativa de
las minucias extradas, son procesados mediante algoritmos que
permiten obtener un ndice numrico correspondiente a dicha huella.
En el momento en que un usuario solicita ser identificado, coloca su
dedo sobre un lector (ptico, de campo elctrico, por presin,...) y su
huella dactilar es escaneada y analizada con el fin de extraer los
elementos caractersticos y buscar su homloga en la base de datos.
El resultado es un diagnstico certero en ms del 99% de los casos.
Las tcnicas utilizadas para la comparacin de la huella dactilar se
pueden clasificar en dos categoras:
La tcnica de puntos Minutia primero encuentran estas minucias y
posteriormente procede a su colocacin relativa en el dedo.
Es difcil extraer los puntos de las minucias exactamente cuando la
huella dactilar es de baja calidad. Tambin este mtodo no considera
el patrn global de crestas y de surcos.
El mtodo correlacin puede superar algunas de las dificultades de la
Comparacin por puntos Minutia; sin embargo, tiene algunos
inconvenientes propios. Las tcnicas de correlacin requieren una
localizacin precisa de un punto de registro y se ve afectada por el
desplazamiento y rotacin de la imagen.
b) Realce de la Huella: Un paso crtico en la clasificacin automtica de
la huella dactilar est en extraer mediante un algoritmo las minucias de
las imgenes de la huella dactilar de la entrada. El funcionamiento de
un algoritmo de extraccin de las minucias confa totalmente en la
calidad de las imgenes de la huella dactilar de la entrada. Para
asegurarse de que el funcionamiento de un sistema automtico de
identificacin/verificacin de huella dactilar sea robusto con cierta
independencia de la calidad de las imgenes de la huella dactilar, es
esencial incorporar un algoritmo del realce de la huella dactilar en el
mdulo de la extraccin de las minucias. De este modo se puede
35

Software
mejorar de forma adaptativa la claridad de las estructuras de la cresta
y del surco de las imgenes de las huella dactilares de entrada.
5.1.2.2.- Reconocimiento Facial Escaner de Rostro:

Un sistema de reconocimiento facial es una aplicacin dirigida por ordenador
para identificar automticamente a una persona en una imagen digital
mediante la comparacin de determinadas caractersticas faciales en la
imagen y en la base de datos facial.
El reconocimiento facial automatizado es relativamente un concepto nuevo.
Desarrollado en los aos 60, el primer sistema semiautomtico para
reconocimiento facial requera del administrador para localizar rasgos (como
ojos, orejas, nariz y boca) en las fotografas antes de que este calculara
distancias a puntos de referencia en comn, los cuales eran comparados
luego con datos de referencia.
El mtodo ms comn utiliza una cmara para capturar una imagen de nuestra
cara, que es analizada en funcin de ciertos 'puntos clave', como la distancia
entre los ojos o la anchura de la nariz.
a) Funcionamiento:
El primer paso en el reconocimiento facial es la adquisicin de una
imagen real o una imagen bidimensional del objetivo. El sistema
determina la alineacin de la cara basndose en la posicin de la
nariz, la boca, etc. En una imagen en 2D no debe estar ms
desplazada de 35 grados. Despus de la alineacin, orientacin y
ajuste de tamao, el sistema genera una plantilla facial nica (una
36

Software
serie de nmeros) de modo que pueda ser comparada con las de la
base de datos.
Un factor importante en los sistemas de reconocimiento facial es su
capacidad para distinguir entre el fondo y la
cara. El sistema hace uso de los picos,
valles y contornos dentro de un rostro (los
denominados puntos duros del rostro) y
trata a estos como nodos que puedan
medirse y compararse contra los que se
almacenan en la base de datos del sistema.
Hay aproximadamente 80 nodos en un
rostro de los que el sistema hace uso (entre
ellos se incluye el largo de la lnea de la
mandbula, la profundidad de los ojos, la
distancia entre los ojos, la forma del
pmulo, la anchura de la nariz...).
Los nuevos sistemas de reconocimiento facial hacen uso de imgenes
tridimensionales, y por lo tanto son ms precisos que sus
predecesores. Al igual que en los sistemas de reconocimiento facial en
dos dimensiones, estos sistemas hacen uso de distintas caractersticas
de un rostro humano y las utilizan como nodos para crear un mapa del
rostro humano en tres dimensiones de la cara de una persona.
Empleando algoritmos matemticos similares a los utilizados en
bsquedas de Internet, la computadora mide las distancias entre
determinados puntos de la muestra en la superficie del rostro. Estos
sistemas en 3D tienen la capacidad de reconocer una cara incluso
cuando se encuentra girada 90 grados. Por otra parte, no se ven
afectados por las diferencias en la iluminacin y las expresiones
faciales del sujeto.
b) Otros sistemas de Reconocimiento Facial:
Ciertos softwares interpretan cada imagen facial como un conjunto
bidimensional de patrones brillantes y oscuros, con diferentes
intensidades de luz en el rostro. Estos patrones, llamados eigenfaces,
se convierten en un algoritmo que representa el conjunto de la
fisionoma de cada individuo.
Cuando un rostro es escaneado para su identificacin, el sistema lo
compara con todas las eigenfaces guardadas en la base de datos.
Este tipo de sistemas est sujeto a limitaciones, como las condiciones
ambientales en el momento de capturar la imagen. As, aunque
normalmente interpreta correctamente los cambios de luz en interiores,
su funcionamiento al aire libre, con luz natural, es todava una
asignatura pendiente. Tambin la posicin de la cabeza y la expresin
del rostro pueden influir en el "veredicto".
5.2.- VISIN ESTREO

37

Software
Visin Estreo es un sistema biomtrico que usa imgenes estreo que permite
incrementar la seguridad de los sistemas de reconocimiento de rostros convencionales, al
poder discriminar entre imgenes de rostro reales en 3D y falsificadas en 2D, empleando
la informacin proporcionada por las imgenes estreo. Una vez que el sistema determina
que la imagen de entrada es un rostro real en 3D, cada imagen estreo es caracterizada e
independientemente procesada usando un mtodo de extraccin de caractersticas (EC)
convencional.
Seguidamente se emplea un mtodo de fusin (MF) para combinar la informacin obtenida
de ambas imgenes. Con el fin de determinar la combinacin EC-MF ms adecuada, se
analizaron tres mtodos de extraccin de caractersticas y tres mtodos de fusin. Los
resultados experimentales obtenidos muestran que realizando la fusin de los datos
extrados mediante la transformacin ondoleta discreta, antes de pasar a la etapa de
clasificacin, se obtienen los mejores resultados.
5.2.1.- SISTEMA DE VISIN ESTREO

El sistema de reconocimiento de rostros propuesto, mostrado en la figura 1, est
constituido por dos etapas principales: la etapa de entrenamiento y la etapa de
identificacin o verificacin de identidad del individuo.
Aqu en la etapa de entrenamiento el sistema genera los modelos de las personas
bajo anlisis y los almacena en la base de datos, mientras que la etapa de
identificacin determina la identidad de la persona bajo anlisis o verifica su identidad,
empleando los modelos almacenados en la base de datos. Las siguientes sub
secciones proporcionan un descripcin de cada una de las etapas del sistema
propuesto.
a) Etapa de pre-procesamiento
En esta etapa inicial se elimina el ruido aditivo que puede llegar a contaminar
la imagen capturada, se segmenta la imagen y eventualmente, dependiendo
del tamao de la imagen capturada, se realiza una reduccin de la dimensin
de la imagen de entrada mediante una operacin de filtrado pasa bajas,
similar al realizado en la DWT, para facilitar el anlisis de la misma. En caso
de ser necesario, en esta etapa se podra tambin llevar a cabo la
restauracin de la imagen de entrada empleando esquemas de igualacin
del histograma para mejorar su calidad cuando sta ha sido alterada debido
a cambios en la iluminacin (Olivares-Mercado y col., 2007).
38

Software
b) Etapa de pre-reconocimiento de rostros reales.

La etapa de pre-reconocimiento, mostrada en la figura 2, intenta evitar la
suplantacin de identidad mediante el uso de las dos imgenes estreo
presentes a la entrada del sistema. A fin de determinar si las imgenes
estreo que se presentan a la entrada del sistema corresponden a un rostro
real, tridimensional o una imagen en 2 dimensiones obtenida a partir de una
fotografa, de alta resolucin, perteneciente a una de las personas
registradas en el sistema, se calcula la disparidad existente entre la imagen
derecha e izquierda del rostro de entrada obtenidas usando una cmara
estero.
La idea principal detrs de este procedimiento es que la diferencia existente
entre la imagen izquierda y derecha de un rostro real, figura 3, al ser un
volumen, es mayor que la diferencia obtenida cuando las imgenes de
entrada corresponden de un objeto plano tal como se muestra en la figura 4.
39

Software
Para llevar a cabo la evaluacin del sistema y tomando en cuenta que no existe, hasta
donde los autores conocen, una base de datos estandarizada para reconocimiento de
rostro usando visin estreo, se construy una usando una cmara Fujifilm FinePix real
3D dual de 10 Mega pixeles. La base construida consiste de 60 personas diferentes con
15 imgenes estreo por cada persona, de las cuales 10 imgenes de cada persona se
usaron para el entrenamiento del sistema y 5 para la realizacin de pruebas de
identificacin y verificacin. As, el nmero total de imgenes contenidas en esta base de
datos es de 1800 imgenes, capturadas en un ambiente con iluminacin y fondo
controlado. La figura 10 muestra algunas de las imgenes que conforman esta base de
datos.
Este trabajo propone un sistema de reconocimiento de rostros, usando visin estreo, el

cual permite evitar la suplantacin de identidad. Este proceso se lleva a cabo en la etapa
de pre-reconocimiento, estimando el promedio de la diferencia absoluta de la luminosidad
o Intensidad, presente entre los pixeles las dos imgenes estreo. Una vez capturadas las
dos imgenes estreo el sistema inicialmente se verifica si la imagen del rostro bajo
anlisis corresponde a un rostro real o a una fotografa, antes de proceder a llevar a cabo
el reconocimiento o verificacin de la identidad de la persona bajo anlisis. Una vez que el
sistema ha verificado que la imagen corresponde a un rostro real, se procede a la
caracterizacin de las dos imgenes estreo mediante el uso, ya sea de las funciones de
40

Software
Gabor, PCA o de la DWT. Seguidamente, una vez obtenido el vector caracterstico de las
imgenes estreo, se emplea uno de los distintos niveles de fusin con el fin combinar de
forma adecuada los vectores caractersticos obtenidos a partir de ambas imgenes.
Los resultados experimentales, usando la mquina de soporte vectorial (SVM) como
clasificador, muestran que los tres niveles de fusin analizados, en general, presentan
resultados altamente satisfactorios con los cuatro mtodos de extraccin de caractersticas
usados. Sin embargo, el mtodo de fusin a nivel caractersticas cuando se emplean los
filtros de Gabor para llevar a cabo la extraccin de caractersticas, mostr ser ligeramente
superior a los dems, cuando el sistema es usado como identificador. Mientras que cuando
el sistema opera como verificador los resultados obtenidos usando el PCA son ligeramente
superiores a los dems.
CAPITULO VI
BASE DE DATOS DISTRIBUIDA DE
ROSTROS Y FORMA DE CAMINAR EN 3D
Actualmente muchos grupos de investigacin se encuentran desarrollando proyectos en el
rea de Biometra, especialmente en el reconocimiento de personas por su forma de
caminar y reconocimiento facial.
Para llevar a cabo investigaciones es necesario tomar una serie de vdeos de las personas
caminando en ngulos de 45, 60 y 90 grados con respecto a las cmaras. Si tomamos en
cuenta que para el reconocimiento se tiene un Sistema de Visin en Estreo que captura a
la persona, se tienen 2 vdeos para cada ngulo.
Tambin agreguemos a esto que se captura a la persona caminando en trayectorias tanto
de derecha a izquierda como de izquierda a derecha, haciendo todava ms grande el
cmulo de datos adquiridos. En resumen, se tendran: 1) dos cmaras, 2) dos trayectorias
(de izquierda a derecha y derecha a izquierda) y, 3) tres ngulos (45, 60 y 90 grado),
teniendo as para una sola persona un total de 12 vdeos para el anlisis de su forma de
caminar. Aparte del video de otra cmara que captura informacin de frente a la persona
para el reconocimiento facial. Uno de los problemas al adquirir los vdeos, es el tamao en
bytes que estos pueden alcanzar.
Aunque este no es el nico problema, ya que existen tambin otro tipo de elementos
producto del procesamiento llevado a cabo sobre los datos, los cuales pueden ser, los
cuadros de imagen extrados de los vdeos (en promedio 150 por vdeo), imgenes
resultado de operaciones realizadas sobre estos ltimos, como por ejemplo: deteccin de
bordes, segmentacin y otros.
En conjunto toda esta cantidad de informacin llega a alcanzar un tamao de hasta 10
Gigabytes por persona, lo que hace muy difcil la tarea de administracin y
almacenamiento de los archivos, especialmente si se lleva a cabo de manera local, es
41

Software
decir, en una sola computadora, lo que puede traer como consecuencia la prdida de
informacin si la misma llega a fallar.
Debido a esta problemtica, se plantea la implementacin de un sistema que asegure el
almacenamiento permanente (en la medida de lo posible) y administracin de toda esta
gran cantidad de informacin, en donde los datos no estn centralizados, es decir, que no
se almacenen en una sola computadora, sino que estn distribuidos en un arreglo de
servidores de almacenamiento de datos conectados a la red y se puedan acceder de
manera remota por los usuarios, asegurando as, la permanencia de los datos y el acceso
a los mismos. Adems, se agrega la posibilidad de guardar informacin que describa a los
datos almacenados, esto con la finalidad de tener un sistema de almacenamiento que no
solo contenga archivos, si no que conozca caractersticas de los datos almacenados en
la misma y apoye al usuario final en la recuperacin de archivos de inters para anlisis
posterior.
Existen algunas bases de datos que proporcionan informacin para el anlisis de la forma
de caminar, algunas como:
Georgia Tech Database,

University of Southampton Database,
University of Maryland Database,
CASIA Gait Database
NIST-University of South Florida
Todas con diferentes caractersticas para la investigacin de diferentes aspectos y

variables que afectan la forma de caminar de las personas.
Tambin existen bases de datos que combinan diferentes caractersticas biomtricas como
los son:
BIOMET (Rostro, voz, huellas dactilares, huellas palmares y firmas autgrafas)

BioSec (Huellas dactilares, rostro y voz)
MCYT (Huellas dactilares y firma autgrafa)
IDIAP-IMIM (Rostro y voz)
Nuestra base de datos incluir la combinacin de caractersticas de rostro y forma de

caminar en 3D, esta combinacin especfica de caractersticas la hace diferente a las
mencionadas.
6.1.- CONSTRUCCIN DEL SISTEMA DE ALMACENAMIENTO DE

DATOS
Debido a la problemtica generada al manejar grandes cantidades de informacin, se
construy un sistema de almacenamiento basado en un arreglo de servidores tipo NAS.
Aunque existen soluciones NAS desarrolladas por diversos fabricantes, muchas de ellas
son costosas y permiten su implementacin en un solo servidor, si se requieren ms
servidores, es necesario desembolsar una cantidad an mayor para cada elemento
aadido.
42

Software
Algo importante al momento de seleccionar la manera de implementar el sistema, fue la
necesidad de utilizar software libre, basado en Linux y que resolviera las necesidades
particulares de nuestra problemtica. Algunos de los puntos considerados fueron:
Escalabilidad: El sistema debe poder escalar tanto en capacidad como en

rendimiento y permitir accesos concurrentes a la informacin almacenada, adems
expandir la capacidad de almacenamiento no debe degradar el rendimiento del
sistema.
Alta disponibilidad: La informacin debe estar disponible en todo momento,

incluso si uno o ms de los componentes llega a fallar, esto implica que el sistema
debe ser capaz de replicar la informacin y almacenarla en diferentes locaciones.
Durabilidad: Los datos deben permanecer en todo momento, no debe haber

prdida de informacin incluso si hay fallas tanto en software como en hardware,
permitir respaldos de la informacin y recuperarla en momentos crticos.
Interfaces genricas: El sistema debe proveer interfaces genricas a los clientes.
Preferentemente debe soportar en la medida de lo posible la interfaz de sistemas
de archivos POSIX; de esta manera, una gran cantidad de aplicaciones pueden ser
soportadas.
Protocolos: El sistema debe soportar comunicacin mediante estndares libres.

Esto permite accesos al sistema desde cualquier Sistema Operativo que soporte
este tipo de protocolos.
Bajo costo: Debe ser posible construir, configurar y mantener el sistema sin que
esto implique grandes gastos. En lo posible no ser necesario pagar licencias de
software.
Tomando en cuenta los distintos puntos, se seleccion Gluster de entre varias de las
plataformas evaluadas, algunas de ellas como: OpenFiler y FreeNAS.
La seleccin de Gluster se debi en gran medida a su escalabilidad al momento de
agregar servidores, su sencillez al momento de administrar el sistema y habilidad al crear
volmenes de almacenamiento combinando discos localizados, tanto en el mismo servidor,
como en servidores aadidos, teniendo as, una piscina de almacenamiento vista por
cada uno de los nodos de la red. Actualmente solo se cuenta con 2 nodos configurados de
manera que un nodo es el espejo del otro y se asegura as que la informacin est
disponible incluso si falla uno de ellos, aunque el sistema puede escalar de acuerdo a las
necesidades de la aplicacin y a la demanda de almacenamiento. La figura 1 muestra la
configuracin utilizada en nuestro sistema.
43

Software
Gluster es una
plataforma
que
permite
implementar servidores NAS con capacidad y rendimiento que puede escalar de unos
cuantos Tera bytes a mltiples Peta bytes, utilizando solamente productos de bajo costo y
lo ms importante, en una solucin de fcil administracin y configuracin.
La plataforma de almacenamiento de Gluster (Gluster Storage Platform) integra el sistema
de archivos GlusterFS con un sistema operativo y una interfaz de usuario con acceso va
web para administracin del sistema. Nos permite implementar un clster de servidores
NAS de manera muy sencilla.
Un clster implementado mediante Gluster es una coleccin de servidores individuales con
sus recursos de almacenamiento exportados como un protocolo a nivel de archivo que
cumplen con POSIX. Todos los servidores corren sobre la plataforma de almacenamiento
de Gluster, cada servidor en el clster est activo y la informacin se puede acceder desde
cualquier servidor utilizando cualquiera de los protocolos de comunicacin soportados.
6.2.- DISEO DE LA BASE DE DATOS

Para el diseo de la base de datos fue necesario definir una estructura de directorios
dentro del clster de servidores que albergara a cada persona.
Esta estructura deba contener directorios para cada una de las trayectorias, para cada
cmara y para los diferentes ngulos de captura. As se cre la estructura de directorios de
la siguiente forma.
Las figura 4 muestra algunos ejemplos del tipo de videos e imgenes que se almacenan
en nuestra base de datos.
44

Software
6.3.- ADMINISTRADOR DE LA BASE

DE DATOS
Definida la estructura de la base de datos, se crearon algunas clases, utilizando el
lenguaje de programacin Java, stas son las encargadas de administrar la base de datos
generada. Para este propsito se utilizaron algunas libreras para el manejo de archivos
XML como DOM (Document Object Model) y SAX (Simple API for XML). Estas libreras
permiten acceso a los archivos XML como si fuera un rbol de nodos que representa la
estructura del documento.
Adems se disearon algunas clases para el manejo de los directorios dentro de la base
de datos. El propsito de manejar clases para la administracin de la base de datos es el
de proveer de un mecanismo que permita construir aplicaciones ms robustas sobre
jerarquas de clases utilizando las ya existentes. Algunas de las clases desarrolladas son:
XMLFile: Esta Clase permite manipular los archivos XML, as como la informacin
contenida en ellos. Realiza operaciones como crear, anexar, borrar, leer y
45

Software
actualizar. Adems se encarga de almacenar el archivo XML en el directorio

correspondiente dentro de la base de datos.
CreateDirectory: Clase encargada de crear directorios dentro de la base de datos.
DirectoryReader: Encargada de leer el contenido de los directorios dentro de la
base de datos.
CreatePersona: Crea la estructura de directorios, los archivos XML.
PersonaIndex_Elements: Mantiene el registro del nmero de personas existentes
en la base de datos, as como los campos que contienen la informacin de los
videos.
Actualmente se desarrolla un Gestor de Base de Datos que utiliza estas clases el cual
permitir al usuario realizar operaciones sobre los datos, tales como: insertar, eliminar,
modificar y otras, adems de poder visualizar la informacin ya contenida, exceptuando
detalles como la localizacin fsica de los archivos. Todo esto mediante el uso exclusivo de
la informacin contenida en los archivos XML y las clases desarrolladas para su manejo.
Una de las alternativas al manejar objetos de gran tamao, como son los videos e
imgenes, es la de utilizar BLOBs. En nuestro diseo solo se plantea el manejo de los
datos a nivel de archivo, almacenando la direccin fsica de los mismos en los archivos
XML y permitiendo solamente al Gestor de Base de Datos conocer este tipo de
informacin. La decisin del manejo de los datos de esta forma se debe en gran medida
tambin a la utilizacin de Gluster como plataforma de almacenamiento, a sus
caractersticas como un sistema de archivos y al manejo que este hace de los mismos.
La distribucin de los datos en un arreglos de servidores como el que se ha construido
permite mantenerlos siempre disponibles, incluso si hay fallas en alguno de los elementos
que componen el sistema, esto no es posible si la informacin se guarda en una sola
computadora. Se demuestra que a travs de un correcto diseo e integracin de software
libre y hardware convencional, se puede construir una arquitectura distribuida tipo clster
dedicada a solamente al almacenamiento de datos.
CAPITULO VII
APLICACIONES ACTUALES DE
RECONOCIMIENTO FACIAL Y BASE DE
DATOS
La tecnologa para el reconocimiento facial se ha vuelto omnipresente. Desde nuestras
fotos en Facebook hasta las cmaras de seguridad de los aeropuertos, son la
46

Software
caracterstica consentida de los sistemas de seguridad en todo el mundo, sumergindonos
cada vez ms profundo en las entraas de una distopa orwelliana.
El reconocimiento facial funciona a travs de algoritmos que identifican caractersticas
faciales a partir de una imagen o video del rostro de una persona. Un determinado
algoritmo puede analizar la ubicacin relativa, la forma y el tamao de determinados
rasgos, como ojos, nariz, boca, mentn y pmulos, y luego compararlos con una bsqueda
de otras imgenes para encontrar caractersticas similares. Cualquiera que haya recibido
sugerencias de Facebook o Google para etiquetar su propio rostro o el de sus amigos en
una fotografa puede haber sentido un leve escalofro recorrer su columna vertebral. Las
mquinas saben quines somos.
7.1.- SISTEMAS DE SEGURIDAD EN JAPN

La empresa japonesa de seguridad Hitachi Kokusai Electric ha presentado un nuevo
sistema de cmaras de video para vigilancia que a partir de una fotografa o video de
una cara puede obtener resultados inmediatos entre una base de datos de 36
millones de rostros almacenados previamente.
El sistema puede almacenar rostros que ocupen al menos 40 pxeles para cada lado,
incluso puede reconocer rasgos faciales cuando estn torcidos hasta 30 grados en alguna
direccin. El sistema toma la informacin del rostro y realiza una bsqueda que en un
segundo se traduce en resultados exactos que aparecen en miniaturas as sean de fotos
anteriores o fragmentos de videos, permitiendo rpidamente reproducir el momento en que
fue tomado. De acuerdo a lo declarado por Hitachi el sistema tiene una etapa de
reconocimiento y otro de agrupacin de rostros por similitudes, esto ayudara a la
velocidad y eficacia del sistema.
En la prctica, usado como seguridad este sistema permitir rpidamente encontrar
actividad previa de una persona dentro de un circuito protegido por cmaras de video. Por
ejemplo, en un comercio al pblico gracias a la velocidad de procesamiento cada rostro
que entra por la puerta podr ser relacionado con el historial de una persona en la tienda,
permitiendo fcilmente reconocer antecedentes delictivos si estos han sido capturados en
alguna oportunidad.
Creemos que el producto sirve para clientes que tengan un sistema de vigilancia de gran
escala, como empresas de transporte, elctricas, organismos de seguridad o grandes
tiendas.
Tambin podra utilizarse para generar valor en la atencin como podra ser una tienda que
reconozca a un cliente cuando ingresa y le preparara parte de la experiencia de compra de
la manera que ms le gusta. Esperan que esta tecnologa est lista para comercializar el
prximo ao.
7.1.1.- RECONOCIMIENTO DE ROSTROS POR CAMRAS

Las cmaras no solo sirven para tomar fotos y hacer videos: la tecnologa con
respecto a los rostros ha evolucionado hasta el punto en el que se puede detectar a
un mentiroso. Hitachi Kokusai Electric tiene ahora una nueva cmara
47

Software
de vigilancia que ayudar a combatir de manera rpida el crimen
pues puede identificar un rostro entre 36 millones en solo un
segundo.
La bsqueda e identificacin de
un rostro se hace contra una
base de datos que la compaa
japonesa tiene. La bsqueda ya
no tomar un largo tiempo sino
que a partir de un algoritmo se
logra el rpido reconocimiento.
Esta cmara est pensada para
organizaciones que necesiten
vigilancia
e
identificacin
inmediata,
puede
ser
de
peatones, conductores o clientes.
El software que cre Hitachi permite el reconocimiento con un
fotograma hasta de 4040 pxeles y con el rostro a 30 grados. La
base de datos puede ser alimentada de manera constante con cualquier tipo de foto o
video tomado con diferentes dispositivos mviles, como Smartphones.
La velocidad de la deteccin de rostro, como lo explic el ingeniero elctrico Seiich
Hirai de Hitachi a DigiInfo TV, se consigue mediante el reconocimiento de la imagen
cuando la cmara se encuentra registrando, lo que significa que ambas cosas
suceden al tiempo, y tambin mediante la agrupacin de caras similares, lo que
facilita la identificacin.
Tambin incluye una revisin de las visitas anteriores para la deteccin del rostro, que
llevar a mostrar todos los clips en los que se identifique un sospechoso. Con esto
se puede no solo identificar a un criminal, sino tambin ver todas
sus acciones antes en el lugar o durante un hecho especfico.
Creemos que este sistema es adecuado para clientes que tienen un sistema de
vigilancia a escala relativamente grande, como los ferrocarriles, las compaas
elctricas, la polica, y las tiendas grandes, agreg Hirai en la entrevista.
Este tipo de tecnologa puede ser muy til no solo como una forma
de combatir el crimen, sino tambin para la bsqueda de nios
perdidos en centros comerciales, parques de diversiones o eventos
de gran magnitud.
7.2.- RECONOCIMIENTO FACIAL DEL FBI

El FBI se encuentra construyendo una base de datos de rostros masiva que funcionar
con programas de reconocimiento facial. Segn documentos obtenidos por la organizacin
Electronic Frontier Foundation (EFF), la base de datos de Identificacin de Prxima
48

Software
Generacin (NGI, por sus siglas en ingls) incluir 52 millones de fotografas para 2015, un
aumento significativo a los 16 millones de imgenes incluidas a mediados de 2013.
Ms importante que la cantidad de rostros, los documentos sugieren que 4.3 millones de
imgenes se obtuvieron por mtodos distintos a la investigacin criminal. Se desconoce
exactamente el origen de estas fotografas, pero ciertos tipos de empleos requieren de
fotografa y registro de huellas digitales, las cuales son enviadas por algunas empresas al
FBI para ser incluidas en su base de datos de civiles.
Cabe destacar que la base de datos de la NGI combinar los registros de criminales y
civiles en el mismo lugar. Esto difiere de la actual base de datos del FBI, donde los 2 tipos
de informacin se mantienen separados. La EFF menciona que incluso las personas que
nunca han sido arrestadas aparecern en las bsquedas que el FBI lleve a cabo.
El gobierno del presidente Barack Obama evala los beneficios y retos de la
implementacin del reconocimiento facial en distintos tipos de servicios. A pesar de todas
las bondades que esta tecnologa puede aportar, la ms grande preocupacin tiene que
ver con la proteccin de la privacidad, un tema bastante discutido ltimamente. As que
an est por confirmarse el uso e implementacin del reconocimiento facial y la base de
datos de la NGI.
7.2.1.- ROSTROS EN LA DATABASE DEL FBI

La Siguiente Generacin de Identificacin (Next Generation Identification, NGI), la
base de datos biomtrica del FBI se est expandiendo y ahora incluye el
reconocimiento de fotografas faciales.
La fundacin Electronic Frontier (EFF) ha reportado est iniciativa por aos y
recientemente gan una demanda contra el FBI sobre el Acta Freedom of
Information, en donde solicitaron ver los documentos relacionados con su base de
datos de fotografas faciales. Y el nmero que la EFF obtuvo les sorprendi.
De acuerdo al documento, el reconocimiento
facial de la NGI contendr 52 millones de
imagines faciales para el 2015. Para el 2012
ya posea 13.6 millones de fotografas de 7 u
8 millones de personas. Y para el 2013 la
base de datos creci a 16 millones.
El documento mostr que al menos la mitad de los estados estn participando en el
programa piloto de reconocimiento facial, o expresaron su inters en participar. Y no
importa que tan grande crezca esta base, ser capaz de procesar 55 mil nuevas fotos
por da y soportar millones de bsquedas.
Pero lo ms delicado, es que esta base no solo contiene fotografas de criminales. De
acuerdo con el documento, el FBI estima que para el 2015 la base de datos tendr 4.3
millones de imgenes de civiles, al respecto la EFF escribi:
Actualmente, si aplicas para cualquier tipo de trabajo se requieren tus huellas y tus
antecedentes y estas son enviadas al FBI para integrarlas a su base de datos. Sin
49

Software
embargo, el FBI nunca antes haba recolectado fotografas junto a las huellas. Esto ha
cambiado con el NGI. Ahora un civil que busque un trabajo requerir entregar sus
huellas y una fotografa. Si es el caso, el FBI tendr tus huellas, tu fotografa y tu
biografa.
De acuerdo con la EFF, el lugar donde el FBI deposita las fotografas de criminales y
civiles es denominado "Repositorio Individual de Asuntos Especiales". Adems,
descubrieron que la obtencin de stas proviene de diferentes fuentes; 750 mil
imgenes se encontraban dentro de la seccin Special Population Cognizant y 215
mil dentro de New Repositories. Combinadas ambas sumarn cerca de 1 millones
de imgenes para el 2015; sin embargo, la EFF no pueden revelar de dnde estn
proviniendo ests fotografas.
La escasa barrera que existe entre las imgenes de criminales y no criminales, es una
de las muchas preocupaciones que la EFF tiene acerca de los proyectos del FBI.
La NGI permitir a la ley buscar los rostros de los no criminales y los criminales al
mismo tiempo, lo que significar que un usuario pueda convertirse en sospechoso en
un caso criminal solo por el hecho de haber aplicado a un trabajo.
50

Base de Datos de Rostros

Cargado por

Copyright:

Formatos disponibles

Base de Datos de Rostros

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Base de Datos de Rostros

Cargado por

Copyright:

Formatos disponibles

Bases de Datos de Rostros: Algoritmos y Programas de

Bases de Datos de Rostros: Algoritmos y Programas de

Bases de Datos de Rostros: Algoritmos y Programas de

1.1.- ANTECEDENTES DE LA BIOMETRA

Bases de Datos de Rostros: Algoritmos y Programas de

Bases de Datos de Rostros: Algoritmos y Programas de

terroristas a las dos Torres del World Trade Center en New

sistemas biomtricos cobraron un gran auge. Sobre todo, los sistemas de

Bases de Datos de Rostros: Algoritmos y Programas de

ALGORITMO EIGENFACES, utilizado en el sistema FaceNet/FaceFinder de la

Ambos algoritmos se basan en la tcnica denominada Componentes Principales,

Bases de Datos de Rostros: Algoritmos y Programas de

El desarrollo de nuevos algoritmos y estadsticas para establecer relaciones entre

Los avances de la biologa molecular permiten la generacin de una gran cantidad de

1.3.- SOFTWARES ACTUALES Y SUS LIMITACIONES

Bases de Datos de Rostros: Algoritmos y Programas de

1.4.- OBJETIVOS DE LA INVESTIGACIN

1.2.1.- OBJETIVOS PARTICULARES

Identificar los elementos terico-matemticos que se usan en el

Bases de Datos de Rostros: Algoritmos y Programas de

Algunas de las caractersticas que subyacen al reconocimiento de rostros desde el punto

2.1. ENFOQUE PSICOLGICO Y DE NEUROCIENCIAS

Bases de Datos de Rostros: Algoritmos y Programas de

2.2. ENFOQUE COMPUTACIONAL

2.2.1. SEGMENTACIN DE ROSTROS

Bases de Datos de Rostros: Algoritmos y Programas de

Bases de Datos de Rostros: Algoritmos y Programas de

2.2.2. EXTRACCIN DE CARACTERSTICAS

2.2.3. RECONOCIMIENTO DE ROSTROS

Bases de Datos de Rostros: Algoritmos y Programas de

Entre los mtodos que ms relevancia tuvieron a principios de la dcada de los

Bases de Datos de Rostros: Algoritmos y Programas de

Turk y Pentland (1991) utilizan eigenfotos (conocidas como eigenfaces) para la

Bases de Datos de Rostros: Algoritmos y Programas de

2.2.4. RECONOCIMIENTO DE ROSTROS A PARTIR DE PERFILES

Bases de Datos de Rostros: Algoritmos y Programas de

2.2.5. METODOS EVOLUTIVOS

Bases de Datos de Rostros: Algoritmos y Programas de

Bases de Datos de Rostros: Algoritmos y Programas de

Algunas de las ventajas e inconvenientes de los sistemas basados en la apariencia frente

Bases de Datos de Rostros: Algoritmos y Programas de

3.1 RECONOCIMIENTO DE IMGENES FIJAS

Imgenes de test: son las que recibiremos en el sistema y se tienen que

Imgenes de entrenamiento: son utilizadas en los mtodos PCA y LPP para

3) Cuando las imgenes de referencia estn correctamente proyectadas, se realiza el

Bases de Datos de Rostros: Algoritmos y Programas de

Finalmente se dir que ha habido reconocimiento si se cumple alguna condicin, en

3.2 DESCRIPCIN DE LOS PRINCIPALES ALGORITMOS

3.2.1.- PCA (Principal Component Analysis)

Bases de Datos de Rostros: Algoritmos y Programas de

Esta base de transformacin depende de las observaciones y se forma a partir de los

Estos autovectores representan las componentes principales que son ms comunes

Bases de Datos de Rostros: Algoritmos y Programas de

Bases de Datos de Rostros: Algoritmos y Programas de

Donde SB es la matriz de dispersin entre clases mientras que SW es la matriz de

y NC es el nmero de casos dentro de la clase c.

Bases de Datos de Rostros: Algoritmos y Programas de

(Locality Preserving Projections)

Bases de Datos de Rostros: Algoritmos y Programas de

Bases de Datos de Rostros: Algoritmos y Programas de