Reconocimiento Facial en El Ambito Forense PDF
Reconocimiento Facial en El Ambito Forense PDF
Reconocimiento Facial en El Ambito Forense PDF
RECONOCIMIENTO FACIAL
EN EL ÁMBITO FORENSE
Ingeniería de Telecomunicación
Maya Binetskaya
Septiembre 2013
RECONOCIMIENTO FACIAL
EN EL ÁMBITO FORENSE
I
Resumen
RESUMEN
En el presente proyecto fin de carrera se estudia, desarrolla y evalúa un sistema biométrico de reco-
nocimiento facial forense en entornos controlados, basado en el análisis morfológico del rostro humano
utilizado por laboratorios forenses como la Dirección General de la Guardia Civil y Netherlands Fo-
rensic Institute. Para la evaluación del sistema se han utilizado dos bases de datos del estado del arte
proporcionadas por el grupo de reconocimiento biométrico ATVS, emulando entornos de aplicación
controlados y no controlados.
Como punto de partida se ha estudiado el estado del arte en sistemas biométricos faciales foren-
ses y su evolución a lo largo de la historia. A continuación se ha diseñado y analizado la extracción
de características faciales en base al análisis morfológico y a los protocolos de los laboratorios foren-
ses. En general, el proceso de desarrollo se puede dividir en tres fases de trabajo, primero se empieza
con el pre-procesado necesario de las imágenes, con el objetivo de eliminar todas las fuentes de ruido,
posteriormente se realiza la caracterización morfológica de todos los rasgos faciales, y finalmente se
proponen dos grandes conjuntos de características continuas y discretas utilizadas para el reconocimien-
to de sujetos. Adicionalmente, se ha realizado una adaptación del extractor de características para su
funcionamiento en entornos no controlados y finalmente se evalúa su rendimiento.
La parte experimental se ha dividido en dos grandes fases, en la primera se analizan las características
propuestas y en la segunda se evalúa su desempeño en las dos bases de datos utilizadas.
Durante la primera fase se ha llevado a cabo un análisis estadístico de las dos poblaciones analizadas
(ambas bases de datos) y a continuación, se ha estudiado y discutido la correlación entre todas las
características propuestas en el proyecto.
En en la segunda fase se han realizado varias pruebas bajo diferentes condiciones con el objetivo
de determinar la capacidad y eficiencia del sistema en las tareas de reconocimiento. En particular se ha
estudiado el tamaño óptimo del conjunto de entrenamiento, el desempeño de varias medidas de similitud
sobre los dos conjuntos de características propuestos, y se ha evaluado los subconjuntos de características
más discriminantes. Finalmente, se ha demostrado que la fusión de ambas características, continuas y
discretas, permite alcanzar unas tasas de rendimiento adecuadas para el reconocimiento biométrico.
Por último, se presentan las conclusiones, extraídas a lo largo del proyecto y se proponen líneas de
trabajo futuro.
PALABRAS CLAVE
III
Reconocimiento Facial en el Ámbito Forense
ABSTRACT
In this final project, an automatic biometric forensic system of facial recognition in controlled en-
vironments, is studied and implemented. Forensic protocols used during this project are based on the
real forensic protocols used by Dirección General de la Guardia Civil Española or Netherlands Foren-
sic Institute. Two databases, emulating controlled and uncontrolled environments and provided by the
biometric group ATVS, are used in order to evaluate the performance of the system.
A study of the evolution of forensic systems and existing protocols is taken as a starting point.
In general, the design of this project can be divided into two main stages. First of all, we start with
the necessary preprocessing of the images, focused on eliminating all noise sources and then perform
the morphological characterization of all features obtained during segmentation. The adaptation of the
system for uncontrolled environments has additionally been performed.
The experimental part is divided into two principal phases, the first analizes all the proposed features
and the second evaluates their performance for the two databases used.
During the first phase, the statistical analysis has been carried out for the two population groups
analyzed (both databases) followed by the study of the correlation existing between all the features
proposed in the project.
In the second phase, several tests have been conducted under different conditions in order to deter-
mine the capacity and efficiency of the system. In particular, we have studied the optimal size of the
training set, the performance of various measures of similarity for the two sets of characteristics provi-
ded, and evaluated the most discriminating feature subsets. Finally it has been shown that the fusion of
both continuous and discrete features allow to achieve adequate results during the biometric recognition
Once the system is tested, the conclusions drawn throughout the project are presented together with
the future work proposals.
KEY WORDS
IV
Agradecimientos
No me puedo creer que finalmente esté escribiendo el último capítulo de la memoria de mi proyecto
fin de carrera. Durante los años pasados en la universidad no me imaginaba que este momento iba a
llegar tan rápido sin darme cuenta.
Después de todo el esfuerzo dedicado al proyecto, en primer lugar me gustaría agradecer a mi tutor
Pedro Tomé por su apoyo y dedicación a mi proyecto. Siempre ha encontrado tiempo para resolver las
dudas y ayudarme con los problemas que iban surgiendo durante el proyecto a lo largo de este curso.
Incluso estando tú a miles de kilómetros he conseguido darte la brasa =).
También agradecer en general al grupo ATVS por darme la oportunidad de trabajar con ellos y
hacer un proyecto realmente emocionante. Además los lunes con los cafés hacían que mi estancia en el
laboratorio fuese más interesante a nivel académico y dulce a nivel culinario. Quería agradecer a Fer,
por su ayuda en los casos cuando yo entraba en crisis de Linux y a Luis que no sólo me ha ayudado en
el departamento, sino que ha sido mi compañero de prácticas durante varios años. Siempre me acordaré
de nuestros fines de semana dedicados a las prácticas.
A mis niñas de Valencia, que aunque estemos cada una en una parte del país, siempre tenemos
tiempo para vernos.
En general hay tanta gente maravillosa que he conocido en la universidad que es imposible men-
cionarlos a todos. Pero en especial, quería darles las gracias a mis compañeros de clase Marta, Eva y
Álvaro por estar siempre allí cuando más los necesitaba. A Eslava, Sergio y Mike-Mustafa por hacer
que la universidad no sólo sea un sitio donde adquirimos conocimientos. Y por supuesto a Leyre, que
aunque no tenga nada que ver con la carrera ha ido a algunas clases casi más que yo =). Sobre todo
quiero dar las gracias a ti, P. Por tener la habilidad de sacarme una sonrisa cuando parece que todo va
mal y convencerme de que todo es posible.
Maya Binetskaya
Septiembre 2013
V
A mis padres.
Índice general
Índice de figuras XI
Índice de tablas XV
1. Introducción 1
1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Objetivos y enfoque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. Metodología y plan de trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4. Estructura de la memoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5. Contribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
VII
Reconocimiento Facial en el Ámbito Forense
5. Experimentos y Resultados 57
5.1. Medidas de Semejanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.1.1. Características Continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.1.2. Características Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.1.3. Características Conjuntas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.2. Correlación entre las características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3. Análisis estadístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.4. Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.4.1. Experimento 1: Características individuales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.4.2. Experimento 2: Características conjuntas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.4.3. Experimento 3: Estudio de las muestras de entrenamiento . . . . . . . . . . . . . . . . . . . . 72
Bibliografia 83
Anexos 87
A. Presupuesto 89
B. Pliego de condiciones 91
ÍNDICE GENERAL IX
Índice de figuras
XI
Reconocimiento Facial en el Ámbito Forense
5.1. Correlación de Pearson de las características continuas para la base de datos ATVS . . . 60
5.2. Correlación de Pearson de las características discretas para la base de datos ATVS . . . . 62
5.3. Correlación de Pearson de las características continuas para la base de datos MORPH . 63
5.4. Correlación de Pearson de las características discretas para la base de datos MORPH . . 64
5.5. Análisis estadístico de las cejas para la base de datos ATVS . . . . . . . . . . . . . . . . . . . . . . . 65
5.6. Análisis estadístico de las cejas para la base de datos MORPH . . . . . . . . . . . . . . . . . . . . . 65
5.7. Análisis estadístico de la boca para la base de datos ATVS . . . . . . . . . . . . . . . . . . . . . . . . 66
5.8. Análisis estadístico de la boca para la base de datos MORPH . . . . . . . . . . . . . . . . . . . . . . 66
5.9. Análisis estadístico de la nariz para la base de datos ATVS . . . . . . . . . . . . . . . . . . . . . . . . 67
5.10. Análisis estadístico de la nariz para la base de datos MORPH . . . . . . . . . . . . . . . . . . . . . . 67
5.11. Análisis estadístico de la mentón para la base de datos ATVS . . . . . . . . . . . . . . . . . . . . . . 68
5.12. Análisis estadístico de la mentón para la base de datos MORPH . . . . . . . . . . . . . . . . . . . . 68
5.13. Análisis estadístico de la frente y ojos para la base de datos ATVS . . . . . . . . . . . . . . . . . . 69
5.14. Análisis estadístico de la frente y ojos para la base de datos MORPH . . . . . . . . . . . . . . . 69
XV
Glosario de acrónimos
NIF: Near-Infrared
XVII
1
Introducción
1.1 MOTIVACIÓN
La palabra biometría, procedente del griego “bios” vida y “metron” medida, abarca el estudio
de métodos automáticos para el reconocimiento único de humanos basado rasgos físicos o rasgos de
comportamiento (forma de andar, de escribir, etc.).
Las técnicas biométricas más extendidas incluyen los estudios de cara, huellas dactilares, iris, voz,
firma y geometría de la mano. Muchas otras modalidades se encuentran en distintas etapas de desarrollo
y evolución.
Centrándose en el reconocimiento facial, se pueden mencionar tres grandes grupos de aplicaciones.
El grupo más conocido por la gente es el comercial, es decir, aplicaciones para los controles de acceso,
seguridad electrónica, cajeros automáticos, teléfonos móviles, tabletas, etc.
El segundo gran grupo al que se hace referencia es el gubernamental, cuyas aplicaciones son las
vinculadas a documentos identificativos (DNI, pasaporte, permiso de conducir), Seguridad Social, con-
trol de fronteras, control de aeropuertos, etc.
En el tercer grupo, el forense, tienen lugar investigaciones criminales, identificación de cadáveres,
investigaciones sobre actos terroristas, identificación de personas desaparecidas, etc. En las últimas dé-
cadas las huellas y las muestras de ADN han desempeñado un papel muy importante en las historias
de crímenes, pero se está trabajando para que otros rasgos biométricos puedan servir de apoyo a los
investigadores. Entre ellos la cara, que es un rasgo biométrico con gran capacidad discriminativa que en
muchos casos permite una identificación única durante las investigaciones forenses. Como ejemplo se
puede mencionar la investigación de la explosión durante la Maratón en Boston en abril de 2013. Du-
rante esta investigación se utilizaron los videos se vigilancia grabados durante la Maratón y los expertos
forenses identificaron los posibles sospechosos que posteriormente fueron comparados con las bases de
datos gubernamentales de los Estados Unidos [1].
Este proyecto se centra en el estudio y desarrollo de un sistema de reconocimiento facial basado
en el análisis morfológico desarrollado por los expertos forenses en base al Retrato Hablado. Dicho
documento describe en detalle los protocolos que los laboratorios forenses como Guardia Civil Española
1
Reconocimiento Facial en el Ámbito Forense
o Netherlands Forensic Institute siguen para realizar la comparación de dos caras humanas.
El objetivo principal de este proyecto es el desarrollo de un sistema completo que pueda servir para
el análisis de las imágenes en las investigaciones forenses. Se parte de una base de datos de un entorno
controlado compuesta de imágenes frontales de sujetos, junto con la ayuda de los puntos característicos
faciales, es decir, aquellos puntos más relevantes en un rostro humano.
Para el diseño e implementación nos hemos basado en el esquema general de un sistema automático
de reconocimiento facial, siguiendo cada una de sus etapas.
En primera instancia se ha procedido con el pre-procesado de las imágenes, extrayendo cada una de
las regiones faciales con el objetivo de poder realizar la extracción de los caracteres morfológicos. Como
se ha mencionado anteriormente, la descripción morfológica se basa los protocolos de los laboratorios
forenses, como es Guardia Civil Española o NFI, para acercarnos lo más posible a las situaciones de
la vida real. Una vez terminado el desarrollo se procede a la etapa de experimentación para ver el
rendimiento del sistema elaborado a la hora de identificar sujetos. La fase experimental consta tanto
de las pruebas de rendimiento como del estudio previo de las características morfológicas obtenidas.
Finalmente, se estudia cuáles son las características más óptimas de la cara del conjunto propuesto y se
evalúan las más discriminantes para el reconocimiento facial.
El sistema creado se centra en los entornos controlados, pero se realiza una parte añadida del proyec-
to que consta de unos ajustes para adaptarlo a un entorno no controlado. Una vez efectuados los ajustes
necesarios se repiten todos los experimentos con una base de datos de imágenes tomadas en entornos no
controlados y se obtienen los resultados finales.
Para la correcta realización de este Proyecto Fin de Carrera se sigue un plan que incluye los siguien-
tes pasos:
2 CAPÍTULO 1. INTRODUCCIÓN
Reconocimiento Facial en el Ámbito Forense
1. Introducción
El primer capítulo de la memoria incluye la principal motivación del proyecto, su enfoque y los
objetivos perseguidos. Para enfocar al lector se expone la metodología seguida y la estructuración
de la memoria elaborada.
5. Experimentos y resultados
Una vez descrito el sistema se inicia el capítulo de experimentación en el que se detallan los expe-
rimentos realizados para evaluar el sistema de reconocimiento facial y sus resultados. Previamente
se realiza un estudio de los datos obtenidos, que incluye un estudio de correlación entre las carac-
terísticas morfológicas obtenidas y su análisis estadístico. Dicho estudio se hace con el objetivo de
analizar con mayor profundidad los resultados obtenidos y poder sacar las conclusiones finales.
CAPÍTULO 1. INTRODUCCIÓN 3
Reconocimiento Facial en el Ámbito Forense
1.5 CONTRIBUCIONES
Las contribuciones del presente Proyecto Fin de Carrera incluyen los siguientes puntos:
Amplio estudio de las características más discriminantes de antropometría facial para los dos
entornos analizados (controlado/no controlado).
4 CAPÍTULO 1. INTRODUCCIÓN
2
Estado del arte
2.1 INTRODUCCIÓN
Los humanos a menudo utilizan los rostros para reconocer individuos, dada su capacidad discrimi-
nativa, y los avances en las capacidades de computación en las últimas décadas, ahora permiten reco-
nocimientos similares en forma automática. Los algoritmos de reconocimiento facial anteriores usaban
modelos geométricos simples, pero el proceso de reconocimiento actualmente ha madurado en una cien-
cia de sofisticados algoritmos matemáticos. Importantes avances e iniciativas en los pasados diez o vein-
te años han propulsado a la tecnología de reconocimiento facial al centro de la atención. Sin embargo,
se pueden destacar algunas de las dificultades existentes en este campo como pose, expresión facial o
iluminación.
Los sistemas de reconocimiento facial tienen dos modos de funcionamiento posibles: verificación o
identificación [2]. En el modo de verificación (1:1) dos imágenes de caras son analizadas en base a la
semejanza entre los rasgos. La decisión se toma a partir de las coincidencias encontradas. Sin embargo,
en el modo de identificación (1:N) se compara la imagen de una sola cara contra un conjunto de N caras.
Cualquiera de los dos modos de funcionamiento del reconocimiento facial automático funciona sin la
interacción humana.
5
Reconocimiento Facial en el Ámbito Forense
El reconocimiento facial forma una parte importante de la investigación forense. El primer intento
de identificar a un sujeto comparando su rostro con un pequeño conjunto de imágenes data del año 1871
usado en el tribunal británico [4]. Y el primer método sistemático de reconocimiento fue desarrollado
por el criminólogo francés Alphonse Bertillon en el año 1882, cuando él empezó a tomar medidas y crear
una base de datos de los rasgos faciales [5]. El método que usaba Bertillon consistía en identificación,
toma de medidas y clasificación de todos los rasgos posibles .
(a) Cabeza
(b) Ojos
Figura 2.1: Ejemplos de las medidas tomadas por Alphonse Bertillon
El primer artículo científico sobre el reconocimiento facial automático apareció en 1966 publicado
por Bledsoe et al. [6]. En el proyecto desarrollado se trabajaba con unas imágenes de la cara en las cuales,
se calculaba una lista de veinte distancias entre los puntos característicos del rostro. Entre los puntos
característicos se pueden mencionar las pupilas, las esquinas de la boca, ojos, cejas, etc. Basándose en
las diferencias y similitudes entre estas 20 distancias se conseguía identificar dos caras iguales. Poco a
poco la lista de los puntos característicos fue aumentando para mejorar el resultado de la identificación
forense y se calculó que era necesario obtener 6 características diferentes para una base de datos de 255
imágenes y 14 para una base de datos de 4.000.000 imágenes [7].
El primer sistema completamente automático fue desarrollado por Kanade [8] usando una lista de
las características faciales sacadas de las imágenes en escala de grises. Para dichas fotos se calculaban
los histogramas locales para conseguir la identificación de la persona. El sistema de Kanade utilizando
20 imágenes daba una precisión de 75 % por lo que se necesitaba un sistema más preciso.
Por primera vez el análisis de componentes principales (Principal Component Analysis, PCA) [9]
fue utilizado para las imágenes de rostros por Sirovich en el año 1987 para conseguir la compresión de
las fotos y posteriormente por Turk y Pentland para la identificación utilizando el conjunto de Eingen-
faces [10]. Dicha técnica permite trabajar con un conjunto extenso de datos permitiendo la reducción de
la dimensionalidad de dicho conjunto. El método PCA se basa en la construcción de una transforma-
ción lineal que escoge un nuevo sistema de coordenadas para el conjunto original de datos en el cual la
varianza de mayor tamaño del conjunto de datos es representada en el primer eje (primer componente
principal), la segunda varianza más grande es el segundo eje, y así sucesivamente. Intuitivamente la téc-
nica sirve para hallar las causas de la variabilidad de un conjunto de datos y ordenarlas por importancia
quedándose siempre con los que más importancia tengan [11].
Otro de los métodos más extendidos en el área del reconocimiento facial es el análisis discriminante
lineal (Linear Discriminant Analysis, LDA)[12] que se basa en el análisis lineal de Fisher. Dicho método
intenta buscar una combinación lineal de características significativas de un conjunto dado. La combi-
nación resultante podría servir de clasificador o reductor de dimensionalidad del conjunto a analizar. A
diferencia de PCA, en LDA la importancia se da a las diferencias de clases en vez de a las similitudes,
por lo que se logran mejores resultados usando este método [13].
Correspondencia entre agrupaciones de grafos elásticos (Elastic Bunch Graph Matching, EBGM)
[14] es otro de los métodos que se utiliza. La técnica se basa en la búsqueda de algunos de los puntos más
característicos de la cara que permitan la creación de un grafo representativo. La creación de los grafos se
puede dividir en dos etapas principales: la estructura geométrica, es decir el conjunto de nodos y aristas
y las etiquetas cualitativas como los jets y distancias. El primer paso consiste en la normalización de las
imágenes y se realizan algunas transformaciones geométricas con el objetivo de ubicar las coordenadas
de los ojos en unas posiciones determinadas.
Y en la segunda etapa se consiguen los valores de los jets y las distancias utilizando el método de
Wavelets de Gabor, dado que son funciones aproximadamente paso-banda que pueden diseñarse como
un banco de filtros con diferentes dilataciones y rotaciones. La principal ventaja es que se obtienen los
resultados tanto en el dominio espacial como frecuencial, ya que los jets de un grafo representan un
conjunto de coeficientes de la convolución de los núcleos con diferentes rotaciones y frecuencias de un
pixel de una imágen.
Hoy en día en un sistema de reconocimiento forense en necesario utilizar tanto el análisis automático
como la ayuda de un examinador forense para tomar la decisión final. En muchos de los sistemas se
introduce el pre-procesado de las imágenes de entrada, que afecta a la iluminación, la expresión de la
cara, la edad del sospechoso, y con ello se consigue una mejora considerable de la calidad de la imagen.
El sistema de reconocimiento facial forense pertenece al grupo de los sistemas off-line, dado que
el proceso de reconocimiento lleva un cierto tiempo, además introduciendo la interacción humana se
consiguen mejores resultados. Sin embargo, la mayoría de los sistemas automáticos convencionales,
como por ejemplo los de acceso restringido, necesitan obtener la decisión final de una manera casi
inmediata, por lo que son completamente automáticos. En resumen, se pueden nombrar las siguientes
características que diferencian el reconocimiento facial forense del reconocimiento habitual:
1. La calidad de las imágenes suele ser baja ya que muchas se consiguen de las cámaras de vigilancia.
2. Pose e iluminación.
Para combatir los problemas que presenta el envejecimiento se utilizan dos modelos propuestos
por Li et al.[15]: generativo y discriminatorio. El modelo generativo utiliza el modelo paramétrico de
envejecimiento en un dominio de 3 dimensiones para generar las imágenes y reducir la diferencia de la
edad entre la imágen del sospechoso y de los sujetos de la base de datos. Además se aplican las técnicas
para la corrección de la postura del sujeto para obtener el máximo parecido posible. Hoy en día no
hay bases de datos que siguen el envejecimiento del sujeto de 3D por lo que se han utilizado las bases
existentes de 2 dimensiones para crear los modelos.
El modelo discriminatorio utiliza los rasgos salientes de la cara para ver los cambios de la cara
pasados distintos intervalos de tiempo. Para conseguir mejores resultados los modelos existentes se
combinan en una investigación forense.
Dado que las cicatrices, las marcas faciales o pecas son un rasgo único y diferente en cada persona, la
identificación del sospechoso con dichas características podría ser más fácil. La tecnología va mejorando
año tras año permitiendo conseguir mejor resolución de las imágenes facilitando tanto el proceso de
reconocimiento automático como manual. Se pueden ver algunos ejemplos en la Figura 2.4:
Las descripciones de las víctimas o los testigos de un caso son claves para la resolución, por lo que
si el sospechoso tiene marcas faciales o cicatrices es lo primero que le diferencia de los demás. Spaun
[16], [17] ha creado una lista de pasos que se siguen en las investigaciones forenses para el análisis
facial, donde uno de los pasos más importantes es la identificación de las características particulares del
sospechoso. Las características particulares incluyen el número y la localización de las pecas, cicatrices,
tatuajes, dientes astillados o rotos y arrugas. Automatizar el proceso de detección y comparación de
dichas particularidades ayuda a reducir el tiempo invertido además de eliminar la subjetividad del inves-
tigador. La búsqueda de las marcas faciales no pretende identificar a un único sospechoso, sino separar
un grupo de posibles candidatos para reducir la base de datos para el análisis posterior. Además, para el
caso de los hermanos gemelos las particularidades personales pueden ser cruciales [18].
Para combatir las dificultades causadas por la pose del sujeto, hoy en día se utilizan varias técnicas
que dependen de los propósitos de los sistemas de reconocimiento facial. Uno de los métodos consiste
en la utilización de un modelo 2D que se separa la imagen en distintos componentes dependiendo de su
textura y forma [24].
Últimamente, se están utilizando los modelos 3D adquiridos de distintas formas, como por ejemplo,
cámaras estereoscópicas o escáneres de luz estructurada. Sin embargo, todavía existen muchos fallos que
presentan estos modelos 3D, debido a la imperfección de la tecnología existente, además de la dificultad
de obtener modelos 3D en algunos casos. En general, las investigaciones de este área presentan muchos
avances en el tema de pose e iluminación, pero se requieren más estudios profundos acerca de dichas
dificultades.
engañosos debido a una mala descripción o la subjetividad del mismo artista, por lo que el problema
principal es la incapacidad de la víctima o testigo de acordarse de la apariencia del sospechoso. Además,
se necesita mucho tiempo para dibujar un retrato por lo que sólo se utilizan en los crímenes más atroces.
Algunos ejemplos pueden ser vistos en la Figura 2.6.
Los sistemas comerciales de reconocimiento no están diseñados para comparar las imágenes con los
retratos, por lo que Klare et al.[25] desarrollaron un sistema de comparación entre las imágenes y los
retratos. El método permite comparar un retrato con una base de datos comparando los patrones binarios
y los rasgos SIFT [21]. Dicho método da mejores resultados que los sistemas comerciales existentes.
La estructura física del rostro humano es muy variable debido a la libertad en las articulaciones de
la cabeza, los cambios de la expresión de la cara y sus partes producidas por la actividad muscular. Sin
embargo, la variación de la forma de la cara está limitada por dos tipos de restricciones: genéticas y
biológicas, y se caracteriza por un alto grado de simetrías y proporciones de los rasgos faciales.
La antropometría es una ciencia biológica que se ocupa de las medidas del cuerpo humano y sus
proporciones [26]. Los datos antropométricos dan la información suficiente sobre la distribución de
las medidas y proporciones de las poblaciones humanas. Por ejemplo, el estudio y conocimiento de la
estructura física del rostro humano y su variabilidad puede ayudar al diseño de sistemas automáticos de
reconocimiento facial [27]. En medicina, la comparación cuantitativa de los datos antropométricos de las
mediciones de los pacientes antes y después de la cirugía ayuda a la planificación y la evaluación de la
cirugía plástica y reconstructiva [26]. En antropología forense, ayuda a la determinación de la apariencia
de los individuos a partir de sus restos [26], [28] y en la búsqueda de niños desaparecidos.
La evaluación antropométrica se inicia con la identificación de puntos característicos de la cara o
landmarks, que se definen en términos de características visibles o palpables (piel o hueso). Luego se
toma una serie de mediciones entre dichos puntos de referencia con procedimientos cuidadosamente
especificados e instrumentos de medición. Un buen resultado se consigue cuando las medidas se toman
repetidas veces durante varios días.
1. La distancia más corta entre dos puntos. Un ejemplo es en-ex, la distancia entre los puntos en las
esquinas del ojo.
2. La distancia axial entre dos puntos es la distancia a lo largo de uno de los ejes medida en el
sistema de coordenadas canónicas, con la cabeza en posición FH, es decir el sujeto tiene que mirar
de frente. Un ejemplo es v-tr, la distancia vertical (diferencia de altura) entre la parte superior de
la cabeza y la línea del cabello.
3. La distancia tangencial entre dos puntos es la distancia medida a lo largo de una trayectoria
prescrita en la superficie de la cara. Un ejemplo es ch-t, la distancia de la superficie desde la
esquina de la boca al tragus.
4. El ángulo de inclinación entre dos puntos con respecto a uno de los ejes canónicos. Un ejemplo
es la inclinación de uno de los ejes de la oreja con respecto al eje vertical.
5. El ángulo entre dos ejes, por ejemplo el ángulo mentocervical (el ángulo de la barbilla).
Analizando estas 5 medidas aplicadas sobre los 47 puntos propuestos por Farkas [26], un total de
132 medidas de la cara y cabeza son evaluadas. Algunas de las medidas están emparejadas simétrica-
mente, es decir, cuando hay una medida correspondiente en el lado izquierdo y derecho de la cara. La
recopilación sistemática de dichas medidas antropométricas hace posible una gran variedad de investi-
gaciones estadísticas de grupos de población. Además de la información sobre las medidas, Farkas et al.
realizaron un análisis estadístico de las proporciones faciales estudiando las dependencias que pueden
tener las características obtenidas. Una de las contribuciones fue la demostración de que las proporciones
dan información útil sobre las correlaciones entre las características, que a su vez pueden servir como
indicadores de la pertenencia a un grupo de población concreto [29].
Los sistemas biométricos normalmente poseen tres componentes básicos. El primero se encarga
de la adquisición de algún indicador biométrico de una persona, por ejemplo de la imagen de la cara.
El segundo se encarga de la compresión, procesamiento, almacenamiento y comparación de los datos
adquiridos y el último componente establece una interfaz con aplicaciones en el mismo sistema. La
arquitectura típica se representa en la Figura 3.1 y puede dividirse en dos módulos:
Módulo de inscripción
Módulo de reconocimiento
Modo de verificación
Modo de identificación
15
Reconocimiento Facial en el Ámbito Forense
Lector Extractor de
Biométrico caracterís!cas
Módulo de inscripción
Base de
datos
Lector Extractor de
Biométrico caracterís!cas
Comparador de patrones
Resultado
caracterís!cas
Módulo de reconocimiento
con el creado a partir de la realización actual. Dicho proceso se denomina “reconocimiento positivo” y
requiere una comparación “uno-a-uno”. La decisión de aceptar o rechazar al usuario dependerá de si el
valor de parecido o probabilidad obtenida supera o no un determinado umbral de decisión. Se tratará de
un “usuario genuino” si la puntuación ha superado el umbral establecido y de un “usuario impostor” en
el caso contrario. El esquema del sistema de modo de verificación se puede observar en la Figura 3.2:
Cuando se trabaja con este modo de operación, para evaluar el sistema se utiliza la tasa de falsa
aceptación (FAR, False Acceptance Rate) y la tasa de falso rechazo (FRR, False Rejection Rate). FAR
ocurre cuando el sistema detecta a un usuario genuino siendo en realidad un usuario impostor. Es de-
cir, dos modelos pertenecientes a distintos usuarios generan una puntuación por encima del umbral de
decisión.
A su vez, FRR ocurre cuando el sistema detecta a un usuario impostor siendo en realidad un usuario
genuino. Dicha situación se produce cuando dos modelos pertenecientes a un mismo usuario generan
una puntuación por debajo del umbral de decisión.
Según se sitúe el umbral, los valores de FAR y FRR varían en sentido opuesto. Si el umbral es bajo,
el sistema será muy permisivo, es decir dará como válidos modelos impostores. En el caso contrario,
cuando el umbral es alto, el sistema será muy restrictivo produciendo el efecto opuesto. Cuando se trata
de los sistemas forenses se trabaja en bajo falso rechazo (FR, False Rejection) con el objetivo de no
perder individuos buscados, a costa de una alta falsa aceptación (FA, False Aceptación).
Uno de los puntos importantes en los sistemas que analizan los valores de FAR y FRR es el valor de
la Tasa de Igual Error (EER, Equal Error Rate). EER es el punto donde las curvas de falsa aceptación
(FA) y falso rechazo (FR) se cruzan, siendo FAR y FRR iguales. Por ello, dicho valor suele usarse para
caracterizar con un único número el rendimiento de un sistema biométrico.
Para determinar el rendimiento del sistema implementado en este proyecto se utilizarán las curvas
de Característica Operativa del Receptor (ROC, Receiver Operating Characteristic), que representan
la relación de FRR frente a FAR. En el caso del presente proyecto se utiliza el valor de la tasa de
verificación (VR, Verification Rate), que representa el valor de 1-FRR.
El mejor método posible de predicción se situaría en el punto con la coordenada (0,1) del espacio
ROC, representando un 100 % de FRR (ningún falso negativo) y un 100 % también de FAR (ningún falso
positivo). A este punto también se le llama una clasificación perfecta. Por el contrario, una clasificación
totalmente aleatoria daría un punto a lo largo de la línea diagonal, que se llama también línea de no-
discriminación, desde el extremo inferior izquierdo hasta la esquina superior derecha, tal y como se
puede ver el la Figura 3.3.
ROC
1
0.9
Face Verification Rate
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
False Acceptance Rate
Figura 3.3: Ejemplo de las curvas ROC
1. El sistema se decide por el identificador de un patrón erróneo de la base de datos. Por tanto, el
usuario no aparece como primer candidato de la lista.
2. El usuario que demanda ser identificado, a pesar de aparecer como primer candidato en la lista, no
obtiene el grado de semejanza suficiente como para ser reconocido como tal, y en consecuencia,
el sistema considera que no pertenece a la base de datos.
El modo de identificación requiere un coste computacional bastante más elevado que el modo de
verificación. Por lo que en muchos casos su uso se limita a aplicaciones en las que el usuario no quiere
ser reconocido, llamado “reconocimiento negativo”.
Para el presente proyecto se han utilizado 2 bases de datos del estado del arte como son ATVS [30]
y MORPH [31]. En esta sección se explican en detalle cada una de ellas en cuanto a la cantidad de
sujetos, número de sesiones, tomas y objetivos de su creación, La Tabla 3.1 muestra un resumen da las
principales características de cada una de las dos bases de datos utilizadas.
imágenes han sido tomadas en un periodo de tiempo de 1 año (entre 2012 y 2013), con 2 sesiones
por cada usuario (entre las cuales pasaron, de media, 3 meses entre la primera sesión y la segunda)
y 4 secuencias por sesión. Además, los usuarios fueron colocados dentro de una habitación con una
iluminación estándar y un flash adecuado (condiciones estándar de las imágenes de pasaportes u otros
documentos de identificación personal como por ejemplo, el DNI), en tres puntos distintos, a distintas
distancias (1 metro, 2 metros y 3 metros).
La finalidad de sacar fotografías a tres distancias distintas, es la de ver el potencial de los algoritmos
de reconocimiento facial para distintas calidades de imágenes. El cambio de calidad de las imágenes se
puede observar en la Figura 3.5.
Las figuras 3.6 a 3.11, muestran un ejemplo de las imágenes frontales de las sesiones disponibles
normalizadas al mismo tamaño para un sujeto ejemplo de dicha base de datos.
Como se representa en la Tabla 3.1, las fotos tienen 21 puntos marcados, ubicados en los principales
rasgos faciales, incluyendo:
Todos los puntos fueron elegidos siguiendo los protocolos forenses de DGGC [32], NFI [33] y ENFSI
[34], tal y como se muestra en la Figura 3.12 y marcados por la misma persona, imitando el marcado
manual de un examinador forense [30].
3.2.2 MORPH
La base de datos MORPH [31], versión no comercial, se recogió en un periodo de tiempo de 5 años
(desde el año 2003 al 2007), con 55134 imágenes. Está formada por más de 13000 individuos divididos
en 4 subconjuntos: europeos, africanos, asiáticos e hispanos, con un rango de edad entre los 16 y los 77
años, con una edad media de 33 años.
El número de imágenes por individuo es variable, siendo el número medio de imágenes de 4. Esta
base de datos, se trata de una colección adquirida en condiciones no controladas, es decir, fue recogida
en condiciones del mundo real (entorno no controlado). Algunas de las imágenes de dicha base de datos
se muestran en la Figura 3.13.
Para la realización del presente proyecto se ha utilizado un subconjunto, dentro del conjunto de
sujetos europeos, que contiene 130 sujetos con 6 sesiones repartidas a lo largo de un año. Cada imagen
fue marcada por un examinador humano imitando los protocolos de los laboratorios forenses como en
la base de datos anterior. Para este proyecto no se realizó ningún marcado adicional, simplemente se
utilizaron los puntos característicos junto con las imágenes faciales.
Cabe mencionar, que para el desarrollo del proyecto, sólo se ha utilizado un conjunto de 130 sujetos
pertenecientes a la raza de Europeos de todas las imágenes disponibles. La razón principal de esta selec-
ción de un grupo reducido dentro de una extensa base de datos se debe a que sólo este subconjunto de
130 usuarios con 6 sesiones fue utilizado previamente para otros estudios y marcado con sus respectivos
puntos característicos manualmente.
En la Morfología Facial Forense se aplican las técnicas basadas en la descripción corporal con énfasis
en los rasgos faciales, sostenidas en el estudio anatómico, miológico y osteológico con la aplicación de
conocimientos puntuales en antropología, física, psicología y técnicas de entrevista judicial para lograr
la obtención de información necesaria. Uno de los métodos más utilizados es el Retrato Hablado que
hoy en día se utiliza para el adiestramiento del personal policial. El Retrato Hablado consiste en una
descripción verbal de rasgos faciales específicos convertidos a dibujo, basado en los datos aportados por
una persona que observó el rostro del individuo vinculado a una investigación, para individualizarlo.
Según las normas del Retrato Hablado existen tres tipos de características físicas de la persona:
Donde las características morfológicas describen la forma, magnitud y dirección de los rasgos del
rostro, las cromáticas se fijan en las distintas coloraciones que algunas partes de la cabeza tienen y las
complementarias hacen referencia a otros conceptos que no se abarcan por las características anteriores.
El sistema desarrollado en este proyecto se basa en la utilización del cotejo morfológico para el
análisis de los rasgos faciales. Dicho cotejo se realiza con el fin de efectuar la comparación de los rasgos
faciales de una persona con respecto a otra. Los caracteres morfológicos que se han utilizado en este
proyecto son los siguientes:
Para evaluar las dimensiones de dichas características el rostro se divide verticalmente en dos, por
el eje central de simetría y horizontalmente en tres partes, por dos rectas horizontales que pasan por el
comienzo de la nariz y por la base de la misma [32].
25
Reconocimiento Facial en el Ámbito Forense
Las dimensiones de los distintos caracteres se expresan normalmente por medio de la clasificación
tripartita, comparándola para ello con el conjunto facial o con la parte en la que están situados. Algunas
características se expresan en centímetros.
En la práctica habitual de los laboratorios forenses como son DGGC [32] y NFI [33], se utilizan
protocolos basados en la comparación morfológica bastante extensa de todos los rasgos, la mayoría de
los rasgos se representan en la Tabla 4.1.
Rasgos Características
Forma
Rostro Proporciones
Línea de pelo
Forma
Arrugas horizontales
Frente
Cejas
Marcas
Distancia
Posición
Color
Ojos
Forma
Bolsas
Arrugas
Longitud
Anchura
Prominencia
Nariz Simetría
Forma de la raíz
Forma de las fosas nasales
Tabique
Tamaño
Posición
Orejas Forma del hélice
Tubérculo de Darwin
Forma del lóbulo
Tamaño
Forma
Boca
Labio superior
labio inferior
Forma
Distancia entre la boca y la barbilla
Mentón
Hoyuelos
Papada
Marcas
Rasgos Cicatrices
especiales Simetría
Arrugas
1. Semejante → La calidad de la imagen no es muy alta, por lo que las diferencias pueden ser
invisibles.
Por cada rasgo se realiza el proceso de comparación para concluir si las dos imágenes representaban
a la misma persona o no. La limitación principal de este método es que el análisis de las imágenes puede
ser bastante subjetivo [33].
Este proyecto se centra en la descripción morfológica de los rasgos faciales de individuos basada
en los protocolos de los laboratorios forenses para finalmente generar lo que se conoce como Retrato
Hablado que consiste en una descripción verbal de rasgos convertidos a dibujo. El objetivo principal
se centra en intentar automatizar la tarea de un experto forense, mediante el uso de técnicas de trata-
miento de imágenes y reconocimiento de patrones, por lo que el sistema desarrollado tiene que tener
la capacidad de pre-procesar las imágenes con el fin de segmentar los rasgos faciales para su posterior
descripción detallada. Además, después de dicha segmentación, cada rasgo será tratado y analizado por
separado utilizando distintas técnicas de tratamiento de imágenes con el objetivo de conseguir los deta-
lles de dicho rasgo con la mayor precisión posible. No se extraen sólo los puntos más significativos, sino
que se intenta procesar el rasgo en su totalidad.
Una vez conseguidas las imágenes de cada rasgo, se procede a la caracterización morfológica ne-
cesaria. La última etapa del sistema se ocupa de la identificación de los sujetos incluidos en las dos
bases de datos, dando como resultado final el valor de EER del sistema. El sistema consta de 3 grandes
bloques: i) pre-procesado de imágenes, ii) extracción de características e iii) identificación/verificación,
representados en la Figura 4.1. Cada uno de dichos bloques serán descritos en detalle en las siguientes
secciones.
En la actualidad, el marcado de los puntos característicos puede ser de manera manual, una persona
realiza dicho marcado, o de manera automática, es decir, es un programa quien marca dichos puntos. En
el mundo forense, el marcado utilizado es el manual, ya que tiene mayor precisión en estos momentos,
por lo que en este proyecto se han utilizado las fotos marcadas manualmente.
Antes de empezar con la normalización tenemos que disponer de las coordenadas de las pupilas,
suponiendo que el sujeto siempre estará mirando de frente. Por lo tanto, se utilizan los puntos de los
extremos de cada ojo para calcular el punto medio de la siguiente manera:
Extremointeriorx + Extremoexteriorx
Pupiladerechax = (4.1)
2
Extremointeriory + Extremoexteriory
Pupiladerechay = (4.2)
2
Extremointeriorx + Extremoexteriorx
Pupilaizquierdax = (4.3)
2
Extremointeriory + Extremoexteriory
Pupilaizquierday = (4.4)
2
Calculando el centro de los ojos evitamos los casos cuando el sujeto no está mirando al frente y las
pupilas no están en el centro de los ojos.
La normalización se basa en el estándar ISO de imágenes [35]. A continuación, en la Tabla 4.2,
se muestran las características geométricas que deben tener el tipo de imágenes utilizadas, teniendo en
cuenta que el origen de coordenadas se encuentra en la esquina izquierda superior.
Características Valor
Ancho de la imagen W
Alto de la imagen W/0.75
Coordenada Y de los ojos 0.6*W
Coordenada X del ojo derecho (0.375*W)-1
Coordenada X del ojo izquierdo (0.625*W)-1
Distancia entre los ojos 0.25*W
En este proyecto se ha utilizado el valor de W=300 píxeles, ya que es el más utilizado por la mayoría
de sistemas automáticos de marcados de puntos característicos de la cara, asegurando siempre una buena
calidad.
La normalización consta de tres partes:
2. Compensación de escalado, es decir, todas las caras deben tener el mismo tamaño y la misma
distancia entre las pupilas.
3. Alineamiento.
Debido a este proceso se obtienen todas las imágenes de un mismo tamaño, lo que hace posible la
comparación de todos los rostros junto con la información que proporcionan los puntos marcados por
el examinador forense. Gracias a esta normalización, las imágenes se preparan para la caracterización
morfológica posterior, ya que ahora cuando, por ejemplo, comparemos el tamaño de las cejas de todas
las caras, lo haremos en la misma escala pudiendo distinguir entre los diferentes sujetos.
La siguiente parte del pre-procesado es la segmentación de los rasgos, además de pasar las imáge-
nes a escala de grises. En este proyecto se ha utilizado el extractor de rasgos implementado por Luis
Blázquez Pérez [36] en su Proyecto Fin de Carrera realizado en el grupo de reconocimiento biométrico
ATVS, que ha sido adaptado a las nuevas necesidades, permitiendo la extracción de las regiones de la
cara con el fin de ser procesadas adecuadamente. Se ha utilizado un extractor por puntos aprovechando
que la entrada del sistema son imágenes de caras con algunos de los puntos marcados.
Para realizar el extractor por puntos, primero se calcula el punto medio de los puntos característicos
situados en los extremos de cada rasgo. Desde la coordenada del punto medio calculado anteriormente,
se realiza un desplazamiento, tanto en sentido horizontal como en vertical, de un offset (dependiente
de la distancia entre pupilas, IPD), distinto para cada rasgo, pero el mismo para todos los usuarios. De
esta manera, se consigue que todos los rasgos comunes de los usuarios (por ejemplo, todas las narices)
tengan las mismas dimensiones y estén centradas/alineadas en el punto medio de cada región de interés.
Finalmente, se extraen, de la imagen original, cada uno de los rasgos característicos de la cara siguiendo
el método descrito.
En la Tabla 4.3, se muestran los offsets (iguales para todos los usuarios para rasgos comunes) obte-
nidos, en píxeles, para las imágenes normalizadas para la base de datos ATVS.
A continuación, se muestra la Figura 4.3 que representa la segmentación de todos los rasgos men-
cionados en la Tabla 4.3.
Esta etapa del sistema se puede considerar una de las más importantes, ya que de ella depende la
precisión con la que se determinarán las características morfológicas de cada sujeto. En este capítulo se
describe el proceso de pre-procesado para cada rasgo por separado, ya que en cada caso ha sido distinto.
Las siguientes secciones describen en detalle el pre-procesado de cada una de las regiones faciales
consideradas para la extracción de las características propuestas.
4.2.2.1 Frente
El primer paso del pre-procesado de frente es ajustar los niveles de intensidad de gris, ya que de
esta forma se consigue una mejora considerable en detección de bordes de dicho rasgo en muchos de
los casos estudiados. Se aplica la función de detección de bordes y se procede a la eliminación del ruido
que causan otros rasgos de la cara, como pueden ser los ojos, la nariz y las cejas.
Los ojos y las cejas se eliminan aplicando máscaras elípticas tomando como centro el punto medio
de los extremos de cada ojo. Los ejes de la elipse se calculan en función de las distancias entre los puntos
que marcan los extremos de cada ceja y cada ojo, es decir de la siguiente forma:
q
Distanciace ja = (Extremointeriorx − Extremoexteriorx )2 + (Extremointeriory − Extremoexteriory )2 (4.5)
4 · Distanciace ja
E jece ja = (4.6)
3
q
Distanciao jo = (Extremointeriorx − Extremoexteriorx )2 + (Extremointeriory − Extremoexteriory )2 (4.7)
Para eliminar la nariz se aplica una máscara rectangular y se aplica una máscara de bordes a toda
la imagen para eliminar el ruido de fondo. Para mejorar la calidad del rasgo detectado se utilizan las
técnicas de cierre morfológico. El diagrama de bloques que describe dicho proceso se puede observar
en la Figura 4.5.
Detección
de bordes
Eliminación de Eliminación de
ruido (ojos) ruido (nariz)
Cierre
morfológico
4.2.2.2 Cejas
Una vez segmentadas las cejas se les aplica la función de detección de bordes. El siguiente paso es
eliminar el ruido, es decir, los restos de otros elementos de la cara, que pueden aparecer cerca de las
cejas. Para ello se aplica la máscara de bordes y una vez terminado este paso se utilizan los operadores
morfológicos, en este caso el cierre, para conseguir algunas mejoras. En la Figura 4.6 se puede observar
el diagrama de bloques del pre-procesado de las cejas.
Para el análisis de los párpados y globos oculares se procede a pre-procesar la imagen segmentada
del ojo. El proceso del pre-procesado es bastante similar al de los otros rasgos, como por ejemplo la
frente, se aplica el ajuste de la intensidad de la escala de grises y la función de detección de los bordes.
Para eliminar el ruido producido por los restos de otros rasgos, como por ejemplo las cejas y el pelo,
se crea una máscara especial de forma parabólica ajustada a cada sujeto. Para ello se obtienen todos los
puntos posibles de la línea inferior de la ceja de cada usuario y se ajusta una parábola en función de
la forma de la ceja. De esta forma se consigue eliminar el máximo ruido posible. El resultado de este
pre-procesado se puede ver en la Figura 4.7.
Detección Eliminación
de bordes de ruido
4.2.2.4 Nariz
Para optimizar el pre-procesado de este rasgo y mejorar los resultados de las características morfo-
lógicas se han hecho dos segmentaciones. Por un lado se ha segmentado la nariz entera, como ya se ha
mencionado anteriormente. Y por otro lado se ha segmentado la raíz de la nariz junto con la parte de los
ojos para poder sacar el máximo número de las características morfológicas.
En este caso se han utilizado las técnicas aplicadas en los casos anteriores como la detección de
bordes, máscaras para eliminar el ruido y operadores morfológicos. La máscara que se ha utilizado es en
forma de trapecio, de esta forma se optimiza la eliminación de ruido. El resultado obtenido puede verse
en la Figura 4.8.
Detección Eliminación
de bordes de ruido
Detección Eliminación
de bordes de ruido
(b) Nariz
Figura 4.8: Resultado de pre-procesado de la raíz de la nariz y la nariz en general
4.2.2.5 Boca
Para conseguir mejores resultados y la boca más definida, el pre-procesado de boca se divide en dos
partes: primero se consiguen por separado las imágenes de labio superior e inferior y luego se juntan
para analizarlas como un conjunto.
Labio superior
El proceso de pre-procesado empieza con el ajuste de intensidad de escala de grises con el objetivo
de resaltar el labio. Una vez ejecutado este paso nos enfrentamos a una dificultad adicional: la
zona cercana al labio superior tiene partes de sombra de la nariz. Por lo que se necesita eliminar
la sombra que podría introducir ruido adicional a la imagen. Esto se hace mediante funciones
que consiguen suavizar el color del fondo y de esta forma hacerlo uniforme. El siguiente paso es
detectar los bordes del labio con las funciones utilizadas en los casos anteriores y las máscaras
elípticas. El paso final es la aplicación de algunos operadores morfológicos como eliminación de
píxeles sueltos, limpieza y unión de los píxeles separados con la ayuda de la función bwmorph de
MATLAB.
Otra de las dificultades de la detección de este rasgo son las arrugas y las sombras cerca de las
esquinas de la boca que no se han podido eliminar con el tratamiento de color de fondo. Por lo
tanto se utiliza un algoritmo especial para eliminar los píxeles que no pertenecen al labio superior.
El diagrama de bloques del pre-procesado y su resultado se pueden ver en la siguiente Figura 4.9.
Labio inferior
El proceso de pre-procesado del labio inferior es bastante parecido al labio superior, es decir, se
utilizan las mismas técnicas. Pero se pueden distinguir algunas diferencias:
4. Se utilizan otros operadores morfológicos, como por ejemplo cierre antes de la etapa de
detección de bordes.
Operadores Detección
morfológicos de bordes
Eliminación
de ruido
El último paso es juntar las dos partes y realizar un rellenado de la forma de los labios, representado en
la Figura 4.11.
4.2.2.6 Mentón
El proceso de pre-procesado de dicho rasgo empieza con el ajuste de intensidad de escala de grises
y la aplicación de la operación morfológica de apertura para distinguir mejor los bordes del mentón. A
continuación, se aplica la función de detección de bordes y se aplican las máscaras tanto para la parte su-
perior del mentón como para la zona del cuello. Con estas operaciones conseguimos eliminar los restos
de los rasgos como boca o parte de la nariz y cuello. De nuevo se aplican distintas operaciones morfoló-
gicas y se procede a la última etapa del pre-procesado. La última etapa del pre-procesado consiste en el
ajuste de una parábola a la forma del mentón.
En la Figura 4.12 se puede ver el diagrama de bloques del sistema de pre-procesado de mentón y su
resultado final.
Ajuste de Detección
intensidad de bordes
Apertura
morfológica
Eliminación
de ruido
Ajuste de
forma
(parábola) BWMORPH
Para el pre-procesado común para todos los rasgos en la base de datos MORPH, se han utilizado
las mismas distancias offset que para la base de datos ATVS, representadas en la Tabla 4.3. Pero para el
pre-procesado de los rasgos por separado se han efectuado algunos cambios resumidos en la Tabla 4.4.
Cabe mencionar que en el sistema implementado, la mayoría de los rasgos discretos se consiguen
a partir de los rasgos continuos obtenidos, realizando una conversión detallada más adelante en este
capítulo. Sin embargo, la forma de las cejas y la particularidad de la boca en forma de corazón, se han
obtenido directamente siguiendo el algoritmo, descrito más adelante en este capítulo, sin necesidad de
aplicar ningún tipo de conversión de los datos continuos.
A su vez, se pueden describir las características obtenidas utilizando otra clasificación llamada ni-
veles de medición. La medición puede definirse como la asignación de numerales a objetos o sucesos
siguiendo ciertas reglas, llamadas reglas Stevens [37]. En su trabajo, Stevens desarrolló un método para
clasificar los diferentes resultados de las mediciones, que llamó niveles de medición. Un nivel de medi-
ción es la escala que representa una jerarquía de precisión dentro de la cual una variable puede evaluarse,
en función de las características que rigen las escalas.
Para entender mejor el concepto de niveles podemos utilizar un ejemplo práctico: la variable anchura
de las cejas. Un conjunto de personas puede clasificarse según la anchura de las cejas que tenga: lineales,
estrechas o anchas, creando tres grupos. Para ello no es necesario recurrir a ninguna cinta métrica,
simplemente basta observar. El nivel de medición que corresponde a esta forma de medir es nominal.
También podemos colocar las caras de los sujetos y ordenarlos según su anchura de cejas, empezando
con las más estrechas y acabando con las más anchas. El nivel de medición en este caso es ordinal. Hasta
el momento no es posible decir cuánto unas cejas son más anchas que otras.
Ahora se pasa a medir la anchura de las cejas para obtener un valor numérico para seguir con la
clasificación. En este caso, además del orden se conoce la magnitud de la anchura. Esta forma de medir
es propia del nivel de intervalos, que permite saber la magnitud de los elementos comparando unos con
otros.
La cuarta posibilidad es, además de simplemente medir la anchura con una regla, utilizar un punto
de cero absoluto común para todas las cejas, por lo tanto, la anchura se define en función de dicho punto
dando lugar al nivel de razón o racional.
A continuación, se analiza la posibilidad de agrupar las características obtenidas en este proyecto
dentro de los cuatro niveles de medición descritos.
1. Nominal
Nivel nominal exige que las categorías sean mutuamente excluyentes entre sí, por lo que no es
posible que un mismo valor o sujeto esté en dos grupos a la vez y los sujetos pertenecientes a
distintos grupos no tienen ningún tipo de relación entre ellos.
Siguiendo la definición de este nivel las características morfológicas que se analizan en este pro-
yecto se pueden dividir por grupos de rasgos simplemente dándole una etiqueta a los datos. Se
definen los siguientes grupos de rasgos con sus respectivas características:
La comparación de estos grupos entre sí no tiene mucho sentido, ya que la comparación, por
ejemplo, de las longitudes de las orejas con la anchura del mentón no nos da ninguna información
sobre el aspecto de la persona.
2. Ordinal
El nivel ordinal describe las variables a lo largo de un continuo sobre el que se pueden ordenar los
valores. En este caso las variables no sólo se asignan a grupos sino que además, pueden estable-
cerse relaciones de “mayor que”, “menor que” o “igual que”, entre los elementos. Por ejemplo, se
pueden ordenar los elementos pertenecientes al conjunto de bocas de los sujetos en función de su
longitud.
En esta clasificación, los números asignados a los objetos representan el orden o rango de las
entidades medidas. Las operaciones aritméticas como la sustracción o la adición no tienen sentido
en este tipo de variables ya que no nos aportan ninguna información adicional.
Siguiendo la definición de los rasgos ordinales, todas las características analizadas en este proyec-
to se pueden clasificar a nivel ordinal, ya que se pueden hacer comparaciones entre ellas siempre y
cuando comparemos las mismas características del mismo rasgo. Es decir, no tiene mucho sentido
comparar el ángulo de inclinación de los ojos con el ángulo de la inclinación de las orejas. Todos
los rasgos pertenecientes al nivel ordinal están representados en la Tabla 4.5.
3. Nivel de intervalos
Este nivel integra las variables que pueden establecer intervalos iguales entre sus valores. Las
variables del nivel de intervalos permiten determinar la diferencia entre puntos a lo largo del
mismo continuo. Además, en este tipo de medida, los números asignados a los objetos tienen todas
las características de las medidas ordinales, y las diferencias entre medidas representan intervalos
equivalentes. Es decir, las diferencias entre un par arbitrario de medidas puede compararse de
manera significativa. Las variables medidas al nivel de intervalo se llaman variables de intervalo
o variables de escala.
Aplicando la definición de nivel de intervalos podemos clasificar las características obtenidas de
la siguiente forma (Tabla 4.6):
Las características como la dirección de las cejas, que puede ser horizontal, oblicua externa u
oblicua interna, no se puede medir a nivel de intervalos. Además, la dirección de una ceja no
puede ser más oblicua externa que otra. Y lo mismo pasa con la forma de las cejas, que puede ser
arqueada, rectilínea o sinuosa. Las particularidades de la boca que contienen las características
como comisura oblicua derecha, comisura oblicua izquierda o corazón tampoco pueden medirse
según los intervalos, ya que la forma de la boca puede ser en corazón pero no tiene sentido que
sea más corazón que otra. Por lo tanto, todas estas características se han asignado a la columna
“no intervalar” dentro de la tabla.
4. Nivel de razón
El nivel de razón integra aquellas variables con intervalos iguales que pueden situar un cero abso-
luto que no puede ser arbitrario. Estas variables nombran orden, presentan intervalos iguales y el
cero significa ausencia de la característica.
Es importante mencionar que los rasgos que no pertenecen al nivel de intervalo no pueden per-
tenecer al nivel de razón, ya que se trata de un sistema de clasificación jerárquico. Por lo que
nos queda ver si las características intervalares pertenecen también al nivel de razón. Todas las
características intervalares de la Tabla 4.6 se pueden medir con razón a un cero absoluto por lo
que también pertenecen al nivel de razón. Además, todas ellas son medidas físicas, es decir, tiene
sentido decir que las cejas de un sujeto son el doble de anchas que del otro, igual que comparar su
longitud o cualquier medida física de otros rasgos.
Para analizar todas las características de cada rasgo se ha seguido el manual de Retrato Hablado de
la Dirección General de la Guardia Civil [32], donde se detallan los protocolos para la comparación de
los rasgos morfológicos de un rosto humano.
Como se ha mencionado en el apartado anterior las medidas obtenidas se pueden dividir en dos
grupos: valores continuos y valores discretos. Los valores continuos se miden en píxeles de las imágenes
utilizadas en el proyecto. En cambio, los valores discretos han de obtenerse a través de los valores
continuos, para ellos se establecen umbrales sobre dichas características de forma que podamos realizar
la conversión de las mismas, por ejemplo, la longitud de la boca puede ser traducida a pequeña, mediana
o larga. El proceso de conversión seguido, se puede observar en la Figura 4.13 y se explica más adelante
en este capítulo.
Para establecer los umbrales se hace un estudio de medidas para cada rasgo, es decir, se utiliza un
conjunto de usuarios seleccionados de cada base de datos. La Tabla 4.7 muestra la cantidad proporcional
de mujeres y hombres escogidos dentro del conjunto de todos los usuarios. Es conveniente recordar que
en cada base de datos hay varias imágenes por usuario, 8 en caso de ATVS y 6 en caso de MORPH.
Como puede observarse se ha intentado balancear la selección en cuanto a sexo y cantidad, cogiendo tan
sólo el 40 % de ATVS y 33 % de MORPH de los usuarios totales. El porcentaje de los usuarios escogidos
es un parámetro digno de estudio, que debemos considerar para trabajo futuro, pudiendo variar el número
de usuarios para entrenar los umbrales, que a su vez modificará las características discretas y por lo tanto
su precisión.
El siguiente paso es la representación de forma gráfica de todos los valores continuos para cada
característica, que permite visualizar el conjunto de los valores obtenidos. Una vez se haya hecho el
histograma, se procede al establecimiento de los umbrales convenientes para cada caso, dependiendo de
la cantidad y propiedades de los valores discretos que pueden tomar las características. El ejemplo del
proceso de la conversión seguido se puede observan en la Figura 4.14.
30 120
110
25
Grande
Numero de imagenes
100
Altura (pixeles)
20
90
15 Mediana
80
10
70
Pequeña
5 60
0 50
50 60 70 80 90 100 110 120 130 0 50 100 150
Altura (pixeles) Imagenes
100
30
95
25
Numero de imagenes
90
Anchura (pixeles)
Grande
20 85
15 80
75 Pequeña
10
70
5
65
0 60
60 65 70 75 80 85 90 95 100 105 0 50 100 150
Anchura (pixeles) Imagenes
(c) Histograma de la anchura del mentón (d) Umbrales para la anchura del mentón
Figura 4.14: Determinación de los umbrales
En este caso la altura de la frente tiene tres posibles opciones: pequeño, mediano o grande, por lo que
los valores continuos obtenidos del grupo de las imágenes seleccionadas han de dividirse en 3 grupos
con la necesidad de se establecer 2 umbrales. A cada grupo se le asigna un valor numérico en orden
creciente (1, 2, 3, etc.):
Pequeña → 1
Mediana → 2
Grande → 3
Hay rasgos como por ejemplo boca en forma de corazón, en los que sólo hay dos posibilidades:
La conversión de todas las características se ha hecho según el orden de los valores discretos de la
Tabla 4.5, es decir, el orden de las características discretas en la tabla sigue el orden numérico creciente
como por ejemplo para la forma de las cejas tenemos:
Rectilíneas → 1
Arqueadas → 2
Sinuosas → 3
4.2.4.1 Frente
1. Altura
La altura se considera la posición existente entre la raíz de la nariz y la línea de comienzo del cabello
Para obtener las medidas se toma como inicio el punto de la raíz de la nariz, que está situado en el
punto medio entre las pupilas de los ojos. El punto final puede variar dependiendo de los distintos
peinados que puede llevar el sujeto. Además, la presencia de flequillo que tapa la frente, sobre
todo en los sujetos de sexo femenino, puede empeorar las medidas. Por lo tanto, se decide aplicar
una regla de proporciones representada en la Figura 4.15. La altura facial se divide en tres partes
iguales, el primer tercio va desde el trichion (TR) a la glabela (G), el tercio medio desde la glabela
al punto subnasal (SN) y desde este punto al mentón, que se corresponde con el tercio inferior de
la cara. De acuerdo a estas proporciones, se decide que el punto final de la altura de la frente se
encuentra en la linea de trichion.
(b) MORPH
(a) ATVS
Figura 4.15: Proporciones de la altura de la cara para las bases de datos ATVS y
MORPH
Para este proyecto se ha considerado, que el rasgo de la altura de la frente pertenece al conjunto
continuo, como la distancia medida en píxeles, y a su vez al conjunto discreto con tres posibles
valores.
2. Anchura
La anchura se determina sobre las paredes laterales del frontal y unos tres centímetros sobre las cejas
Una de las principales dificultades es el flequillo que puede cubrir una mitad de la frente, en estos
casos lo que se hace es que se comparan las dos mitades obtenidas y si una de las dos está por
debajo del umbral mínimo, se multiplica la mitad válida. En el caso contrario se suman las dos
mitades. Igual que en el caso de la altura, la anchura de la frente pertenece a la vez al conjunto
continuo y discreto.
4.2.4.2 Cejas
1. Situación
Las cejas por su situación pueden ser próximas o separadas y altas, bajas, medias o asimétricas
Por la definición proporcionada por el Retrato Hablado, la situación puede dividirse en dos grupos:
La separación se calcula como la distancia entre las cabezas de las cejas que vienen marcadas por
los puntos.
Y para obtener la altura de las cejas se calcula la distancia desde los extremos de cada ojo hasta la
línea inferior de la ceja (Figura 4.17).
Una vez obtenidas estas dos distancias se calcula la media para cada extremo y finalmente la
media común. Se han incluido varios valores numéricos a la matriz final de las características,
incluyendo la proximidad y la altura a la vez en el conjunto continuo y discreto.
2. Dirección
Según su dirección las cejas pueden ser horizontales, oblicuas internas u oblicuas externas
Las cejas oblicuas internas tienen la cabeza, o extremo interior, más baja que la cola, o extremo
exterior, y las externas, al revés. Las cejas horizontales tienen la cabeza y la cola a la misma
altura, por lo que para caracterizar las cejas se calcula el ángulo entre la cola y la cabeza de las
cejas representados en la Figura 4.18.
En este caso la dirección sólo pertenece a los rasgos discretos que se traducen en números.
3. Forma
Se clasifican las cejas, por su forma, en arqueadas, rectilíneas y sinuosas, según la línea de su trazado
En este caso, para caracterizar la forma, se ha decidido dividir la ceja en 3 tramos a lo largo de
su longitud y se ha buscado el punto más alto de la ceja. Si se superaba un umbral establecido las
cejas pasaban a ser arqueadas o sinuosas en función de la ubicación del punto más alto, en el caso
contrario se clasificaban como cejas rectilíneas. En la Figura 4.19 tenemos ejemplos de las cejas
presentes en la base de datos ATVS y MORPH. Como en el caso de la dirección, la forma sólo
forma parte del conjunto discreto de los datos.
Se puede observar las diferencias existentes entre las dos bases de datos en cuanto a calidad,
resolución e iluminación que afectan al proceso de procesado de las imágenes y análisis de las
características obtenidas.
4. Dimensiones
Atendiendo a las dimensiones las cejas son cortas o largas y lineales, estrechas o anchas
Como en el caso de la situación de la ceja por las dimensiones se puede dividir en dos grupos:
La longitud se obtiene con los puntos marcados en las imágenes. Y la anchura se obtiene calcu-
lando la distancia entre el borde inferior y superior de la ceja en todos los puntos a lo largo de
ésta, y calculando la media de todas las distancias calculadas.
En este caso, la característica forma parte tanto del conjunto continuo, como del discreto.
Tratándose de los párpados y globos oculares se han obtenido las características como la abertura
horizontal de los ojos y la distancia inteocular representados en la Figura 4.20.
(a) ATVS
(b) MORPH
Figura 4.20: Características de los párpados y globos oculares de las bases de datos
ATVS y MORPH
En este caso se calcula la distancia entre los dos puntos que marcan los extremos de los ojos.
En este caso el rasgo es continuo y ,además, se hace la conversión numérica para obtener su
equivalente discreta.
Puede ser grande, pequeña y normal. Como en el caso anterior, este rasgo tiene un valor continuo,
que expresa la distancia en píxeles y por el otro lado tiene los valores discretos en función del
grupo al que pertenece.
4.2.4.4 Nariz
Para el rasgo de la nariz se extraen varias medidas, como anchura entre las aletas, altura y anchura
de la raíz, como de puede observar en la Figura 4.21.
1. Anchura (AN)
Es la separación existente entre las partes más salientes de las aletas, en sentido transversal
La anchura puede ser pequeña, mediana o grande en función de la distancia. Para la matriz final
de características se ha considerado dicho rasgo tanto continuo como discreto.
2. Altura (AL)
Es la recta que une el punto más profundo de la raíz con el más bajo del tabique nasal
La altura puede ser pequeña, mediana o grande en función de la distancia. Para la matriz final de
características se ha considerado dicho rasgo tanto continuo como discreto.
3. Raíz (R)
Es la parte generalmente hundida que enlaza la nariz con la frente
La raíz está situada inmediatamente debajo de la zona interciliar. Para dicho rasgo sólo se ha
considerado su anchura, ya que es la única característica que puede obtenerse de las imágenes
frontales. La raíz puede ser ancha o estrecha, según la separación entre las órbitas de los ojos. Se
ha considerado este rasgo tanto continuo, la distancia, como discreto, ancha o estrecha.
4. Altura naso-labial
Es la distancia que media entre la base del tabique nasal y la abertura de la boca, estando cerrada
En este caso se mide la distancia tal y como se define en el documento del Retrato Hablado,
calculando la distancia entre el tabique nasal y la abertura de la boca en estado cerrado.
4.2.4.5 Boca
1. Anchura
En este caso el Retrato Hablado no considera como tal la anchura de la boca como una caracte-
rística. Se pueden mencionar dos características morfológicas similares como borde y grosor pero
dado a las pequeñas diferencias en su definición para este proyecto se decide obtener la caracte-
rística de anchura de la boca.
Se obtiene la anchura media de los labios según las distancias obtenidas por toda la boca como se
muestra en la Figura 4.22. Se considera que es un rasgo continuo y discreto, ya que a parte de las
distancias obtenidas, la anchura puede ser pequeña, mediana o grande.
(b) MORPH
(a) ATVS
Figura 4.22: Anchura de la boca extraida de las bases de datos ATVS y MORPH
2. Longitud
Es la dimensión de la boca en sentido horizontal
Para el cálculo de la distancia de la boca en sentido horizontal se han utilizado los puntos marca-
dos, que definen los extremos de la boca en todas las imágenes. Según el protocolo de la Guardia
Civil se toma como la boca media, la de 5 centímetros aproximadamente, la de 4 es pequeña, y
la de 6, grande. Sin embargo, dentro del Retrato Hablado proporcionado para este proyecto, para
la clasificación de la boca en distintos grupos, normalmente no se realiza la medición exacta del
rasgo, sino que la evaluación se hace por simple apreciación. En el caso de este proyecto se han
obtenido los umbrales para discretizar el rasgo como en los demás casos. Con la discretización
realizada, se ha conseguido incluir la longitud, a parte del conjunto continuo, al conjunto discreto.
Para conseguir detectar dicha forma lo que se hace es que se coge la parte central de la boca. Se
buscan los puntos más altos y los puntos más bajos y se compara su ubicación. Si el punto más
bajo está entre los puntos más altos y, además, se supera un umbral establecido de distancia, se
considera que la boca tiene la forma de corazón, tal y como se representa en la Figura 4.23.
Para comprobar los resultados de la detección de dicho rasgo se ha necesitado un examen visual
después de la detección hasta conseguir los umbrales adecuados para dicha forma de la boca. En
este caso, la particularidad sólo pertenece al conjunto discreto.
4.2.4.6 Mentón
1. Altura
Es la distancia desde el surco supramentoniano al plano horizontal colocado en la base del mentón
En este caso, dado que las fotos son frontales, la longitud se mide entre el punto central de la boca
hasta el punto situado en la base del mentón en la misma recta vertical que el punto inicial.
En la matriz final de características se incluye el valor de la distancia, además del valor discreto
de cada imagen, dado que la altura del mentón puede ser pequeña, mediana o grande.
2. Anchura
Según el Retrato Hablado el mentón puede ser pequeño o grande, mirando de frente. Para este
proyecto lo que se ha hecho es recorrer la parte de la cara desde la línea horizontal que forman
los lóbulos de las orejas hasta la base del mentón midiendo las distancias. Al final se obtiene la
distancia media que describe la anchura. Se puede observar el procedimiento aplicado en la Figura
4.24.
Figura 4.24: Anchura del mentón de las bases de datos ATVS y MORPH
Se ha considerado tanto la anchura obtenida en píxeles, que pertenece al conjunto continuo, como
sus descripciones cualitativas pertenecientes al conjunto discreto.
4.2.4.7 Orejas
Dentro de los protocolos de los sistemas forenses las orejas se pueden describir en función de sus
partes como helix, lóbulo, trago, etc. En este proyecto lo que se analiza son las imágenes frontales por
lo que conseguir la descripción de dichos rasgos es imposible. Pero se ha decidido obtener la longitud
de las orejas y los ángulos que forman los extremos utilizando los puntos marcados.
1. Longitud y ángulo
Como se ha mencionado anteriormente, se utilizan los puntos marcados en el extremo superior e
inferior de cada oreja en las imágenes, por lo que simplemente se calcula la distancia y el ángulo
que se forma entre estos dos puntos. En este caso no se discretiza ninguna característica, ya que
el protocolo no especifica ninguna división cualitativa.
La línea media corre empezando en la línea del pelo a través del centro de la cara y el arco de cupido
del labio, dividiéndolo en dos partes. Para conseguir la distancia de dicha línea se utilizan los segmentos
de la frente ya analizados. En algunos casos, debido a las dificultades que presenta el pelo, se calcula la
distancia según la simetría facial. Es decir, se considera que la línea media es 3/4 de la distancia entre el
punto de la base del mentón y el punto más alto de la cabeza, representada en la Figura 4.25. Como en
el caso de las orejas, no hay ninguna división en cualidades dentro del Retrato Hablado para una posible
discretización, por lo dicho rasgo sólo se asigna al conjunto continuo.
Figura 4.25: Línea media extraida de las bases de datos ATVS y MORPH
4.2.5 Identificación/Verificación
La última parte del sistema implementado incluye la parte de la Identificación/Verificación de los su-
jetos de las dos bases de datos. Previamente, las bases de datos se dividen en conjuntos de entrenamiento
y prueba y para cada usuario, del conjunto de entrenamiento y prueba se genera un modelo matemático,
que está compuesto por un vector de 55 características obtenidas.
El esquema de la última etapa se puede observar en la Figura 4.26.
Una vez obtenidas todas las características continuas y discretas se procede a la etapa de los experi-
mentos o identificación que consiste en el cálculo de las medidas de semejanza con diferentes distancias.
Una vez calculadas las distancias y obtenida una serie de scores para cada vector del sujeto, se pasa al
Decisor. En esta parte se verifica la identidad del usuario que pertenece al conjunto de prueba. Si el
score obtenido es más alto que el umbral establecido el usuario se considera genuino. Como resultado
final se obtiene el valor de EER del sistema explicado anteriormente.
Las técnicas y las distancias utilizadas se explican en más profundidad en el siguiente capítulo.
Una vez creada la matriz de características faciales que contiene 32 valores continuos y 23 discretos
para cada imagen analizada, se necesita definir un método de comparación entre todos los usuarios.
En este proyecto se ha escogido el método de medidas de proximidad o semejanza, que cuantifica
cómo de similares o diferentes dos vectores numéricos son entre sí. Es importante tener en cuenta que
aplicando estos métodos no se da mayor prioridad a ninguna característica en especial sino que todas
tienen el mismo peso dentro del vector. Existen varias medidas de semejanza:
1. Medidas de disimilitud
Cuanto más parecidos sean los vectores entre sí menor será la distancia o medida de disimilitud
entre ellos. En el caso de que la distancia sea cero los vectores se consideran idénticos.
2. Medidas de similitud
Al contrario que en el caso anterior, la medida de similitud mide cuánto de parecidos son los dos
vectores entre ellos, por lo que cuanto mayor sea el valor de la distancia más parecidos serán los
vectores entre ellos.
En este proyecto los vectores se han probado con los dos tipos de medidas tales como: distancia Euclídea,
Coseno y Mahalanobis para los vectores continuos y distancia Hamming para los vectores discretos.
Además se ha probado la distancia Mahalanobis con la matriz conjunta.
57
Reconocimiento Facial en el Ámbito Forense
Como se puede observar la distancia calcula la diferencia entre los vectores, por lo que se consi-
dera una medida de disimilitud.
2. Distancia Coseno
xT · y
DistanciaC = (5.2)
kxk · kyk
q q
Donde kxk = ∑li=1 xi2 y kyk = ∑li=1 y2i .
Cuanto mayor sea el valor de la distancia más parecidos serán los vectores, por lo que dicha
distancia se considera una medida de similitud.
3. Distancia de Mahalanobis
La distancia de Mahalanobis se diferencia de las distancias más comunes como Euclídea en que
tiene en cuenta la correlación entre las variables aleatorias. Se define como:
q
DistanciaM = (x − µi )T Σ−1 (x − µi ) (5.3)
k=1 k=1
DistanciaH = ∑ ∑ xi j (5.4)
i=0 j=0 i6= j
Una vez realizado el estudio de los vectores de las características por separado, se decide estudiar
la matriz en su totalidad, es decir, tanto las características continuas como las discretas se analizan con
la distancia de Mahalanobis. La elección de dicha distancia corresponde a que ésta toma en cuenta la
correlación entre las variables del vector. Al tratarse de una mezcla de variables discretas y continuas, no
existe un modelo de distancia estándar. Sin embargo, incorporando en la fórmula la varianza se pretende
igualar la importancia de todas las características presentes en la matriz [38].
El siguiente paso consiste en determinar si existe correlación entre algunas de las características para
poder analizar el sistema más detalladamente.
La correlación entre las variables indica la fuerza y la dirección de una relación lineal de proporcio-
nalidad entre dichas variables estadísticas. Se considera que dos variables cuantitativas están correlacio-
nadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos
de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen
también los de B y viceversa. Para las características de este proyecto se ha escogido el coeficiente de
correlación de Pearson que se puede expresar de la siguiente forma:
xdT · yd
CorrelaciónPearson = (5.5)
kxd k · kyd k
q q
Donde xd = [x1 − x̄, x2 − x̄...xi − x̄]T e yd = [y1 − ȳ, y2 − ȳ...yi − ȳ]T con x̄ = 1l ∑li=1 xi e ȳ = 1l ∑li=1 yi ,
llamados vectores de diferencia. El coeficiente toma valores entre 1 y -1. Lo interesante de la correlación
de Pearson es que su valor no depende directamente de los vectores x e y, sino de los vectores de dife-
rencia. El análisis de correlación para los rasgos continuos de la base de datos ATVS está representado
en la Figura 5.1, donde los ejes representan las características de los rasgos representados en la Tabla
5.1.
En la Figura 5.1 están señalados los casos más interesantes de correlación. Podemos observar que los
ángulos de los extremos de los ojos, rasgos 27 y 28, tienen una correlación positiva perfecta. El índice
indica una dependencia total entre ellas denominada relación directa: cuando una de ellas aumenta, la
otra también lo hace en proporción constante.
Si la correlación está entre 0 y 1, donde los casos más significativos son el ángulo de la ceja derecha y
el ángulo de la ceja izquierda, altura de la frente y línea media junto con el ángulo de la oreja derecha y el
ángulo de la oreja izquierda, se considera correlación positiva. Es decir que las dos variables aumentan
o disminuyen simultáneamente. Si nos paramos a analizarlo, los resultados que se han obtenido son
lógicos ya que por ejemplo, en el caso de la altura de la frente y la línea media, la altura de la frente
forma una parte de la distancia de la línea media. En el caso de las orejas y cejas, suelen ser bastante
parecidas la oreja izquierda con la oreja derecha y la ceja izquierda con la ceja derecha, salvo algún caso
especial.
En el caso contrario cuando la correlación sea -1, como en el caso de la distancia interocular con las
aberturas horizontales de los ojos, rasgos 24 y 25 respecto al 26, existe una correlación negativa perfecta.
El índice indica una dependencia total entre las variables, llamada relación inversa: cuando una de ellas
aumenta, la otra disminuye en proporción constante.
Cuando el valor de la correlación se encuentra ente 0 y -1 existe una correlación negativa. Este caso
lo podemos observar con rasgos como la longitud de las cejas y la distancia entre las mismas, rasgos 1
con 6 y 7, y anchura de la ceja izquierda y la distancia entre el ojo y la ceja izquierda, rasgos 4 y 9.
ID Rasgo
1 Distancia entre las cejas
2 Distancia entre el extremo exterior del ojo a la ceja (ojo derecho)
3 Distancia entre el extremo interior del ojo a la ceja (ojo derecho)
4 Distancia entre el extremo interior del ojo a la ceja (ojo izquierdo)
5 Distancia entre el extremo exterior del ojo a la ceja (ojo izquierdo)
6 Longitud de la ceja derecha
7 Longitud de la ceja izquierda
8 Anchura de la ceja derecha
9 Anchura de la ceja izquierda
10 Ángulo de la ceja derecha
11 Ángulo de la ceja izquierda
12 Longitud de la boca
13 Ángulo entre los extremos de la boca
14 Anchura media de la boca
15 Altura naso-labial
16 Altura de la nariz
17 Anchura de la nariz
18 Anchura de la raíz de la nariz
19 Altura del mentón
20 Anchura media del mentón
21 Altura de la frente
22 Anchura de la frente
23 Línea media
24 Abertura horizontal del ojo derecho
25 Abertura horizontal del ojo izquierdo
26 Distancia interocular
27 Ángulo del ojo derecho
28 Ángulo del ojo izquierdo
29 Longitud de la oreja derecha
30 Longitud de la oreja izquierda
31 Ángulo de la oreja derecha
32 Ángulo de la oreja izquierda
En este caso se ve claramente la correlación negativa perfecta entre las características 13 con 15 y
14 con 15. La correlación negativa perfecta se repite como en el caso de las características continuas, la
abertura de los ojos tiene un comportamiento completamente opuesto a la distancia interocular.
ID Rasgo ID Rasgo
1 Situación 1 de las cejas 13 Abertura horizontal del ojo derecho
2 Situación 2 de las cejas 14 Abertura horizontal del ojo izquierdo
3 Anchura de la ceja derecha 15 Distancia interocular
4 Anchura de la ceja izquierda 16 Dimensiones de la ceja derecha
5 Longitud de la boca 17 Dimensiones de la ceja izquierda
6 Altura de la nariz 18 Dirección de la ceja derecha
7 Anchura de la nariz 19 Dirección de la ceja izquierda
8 Anchura de la raíz de la nariz 20 Forma de la ceja derecha
9 Altura del mentón 21 Forma de la ceja izquierda
10 Anchura del mentón 22 Comisura de la boca
11 Altura de la frente 23 Boca en forma de corazón
12 Anchura de la frente
El mismo estudio se hace para las características continuas de la base de datos MORPH y se obtiene
la gráfica de la Figura 5.3.
Las diferencias principal es que en algunos casos como los rasgos 10 y 11, 4 y 9, o 31 y 32, la
correlación no es tan significativa. Sin embargo, vemos que los ángulos de los extremos de los ojos,
rasgo 27 y 28, siguen teniendo una correlación positiva perfecta como en el caso de la base de datos
ATVS. Y el rasgo de la longitud de las orejas, rasgos 29 y 30, tiene una correlación positiva mayor que
en el caso anterior.
Analizando la correlación negativa, siguen destacando las características 24 y 25 con respecto al 26.
Al repetir el estudio de la correlación entre las características discretas, los resultados obtenidos son
bastante parecidos a los resultados de la base de datos ATVS. La correlación más significativa es entre
los rasgos 13 y 14 con el rasgo 15, que se puede observar en la Figura 5.4.
Las diferencias que aparecen entre las dos bases de datos corresponden a que la base de datos de
MORPH está compuesta por las imágenes tomadas en las condiciones no controladas, por lo que los
resultados obtenidos pueden tener un margen de error mayor.
Figura 5.5: Análisis estadístico de las cejas para la base de datos ATVS
Figura 5.6: Análisis estadístico de las cejas para la base de datos MORPH
Las diferencias principales entre las dos bases de datos son la cantidad de usuarios y la calidad de las
imágenes. Pero sin embargo, podemos observar un patrón parecido en la distribución de las característi-
cas de las cejas. Para el rasgo de altura, en ninguna de las bases se han detectado los usuarios con cejas
altas y asimétricas, prevaleciendo la altura media. En anchura de la mayoría de los usuarios es estrecha
para las dos bases de datos, pero en la base de datos ATVS prevalecen las cejas anchas y en MORPH las
lineales.
Como en el caso de la cejas, la boca sigue un patrón parecido en las dos bases de datos, aunque
en la base de datos ATVS no hay usuarios con la comisura izquierda. Esto puede pasar debido a que
simplemente no hay ningún representante con dicha particularidad entre los 50 usuarios.
En las dos bases de datos prevalecen la anchura y altura medias, la única diferencia se observa en la
anchura de la raíz.
Como podemos observar, en las dos bases de datos predominan los mentones grandes frente a los
pequeños. Sin embargo, hay diferencias entre las dos bases de datos en la altura del mentón, se observa
que en MORPH están bastante igualados los usuarios con las alturas medianas y pequeñas y en la base
de datos ATVS hay más usuarios con mentones grandes que pequeños.
Figura 5.13: Análisis estadístico de la frente y ojos para la base de datos ATVS
Figura 5.14: Análisis estadístico de la frente y ojos para la base de datos MORPH
5.4 EXPERIMENTOS
Dado que las bases de datos incluyen pocos usuarios, 50 en el caso de ATVS y 130 en el caso de
MORPH, se ha decidido aplicar un método de validación cruzada, en concreto, el método Leave-one-out.
El método Leave-one-out implica separar los datos de forma que para cada iteración tengamos una
muestra para los datos de prueba y todo el resto conformando los datos de entrenamiento. Se tienen
que ejecutar tantas iteraciones como N muestras tengamos y para cada una analizar los datos tanto de
entrenamiento como de prueba (Figura 5.15). De esta forma podemos obtener el resultado más cercano
a la realidad, ya que ampliamos tanto el conjunto de prueba como de entrenamiento.
El experimento 1 consiste en la verificación del rendimiento del sistema separando la matriz conjun-
ta, es decir, por un lado se calcula el EER para los rasgos continuos y por el otro para los rasgos discretos.
Como se ha mencionado antes para los rasgos continuos se van a utilizar 3 distancias (Euclídea, Coseno
y Mahalanobis) y para los rasgos discretos se calculará la distancia de Hamming. Primero se prueba el
sistema con la base de datos controlada ATVS, el siguiente paso es ver como se comporta el sistema
en las condiciones no controladas, realizando el mismo experimento con la base de datos MORPH. Los
resultados obtenidos para las dos bases de datos se presentan en la Figura 5.16.
La primera conclusión que se obtiene viendo las dos gráficas, es que el sistema presenta mejores
resultados para la base de datos ATVS que contiene las imágenes tomadas en entornos controlados.
Además, tal y como se esperaba, para las dos bases de datos los mejores resultados se han obtenido
con la distancia Mahalanobis. Como se ha explicado antes, Mahalanobis muestra los mejores resultados
debido a que se toma en cuenta la media y la varianza.
El segundo experimento consiste en la verificación del rendimiento del sistema trabajando con la
matriz entera, es decir aplicando las mismas distancias para los rasgos continuos y discretos. En este
caso se utilizarán sólo las distancias que se aplican para los rasgos continuos como Euclídea, Coseno y
Mahalanobis, dado que se pueden aplicar en los casos de las variables reales. La distancia de Hamming
sólo se aplica en los casos discretos, por lo que se descarta. Como se ha comentado antes, para las dos
bases de datos el mejor resultado se consigue con la distancia Mahalanobis, como se puede observar en
la Figura 5.17.
Observando los resultados obtenidos y comparándolos con el Experimento 1 se pueden hacer varias
conclusiones. Se ha conseguido mejores resultados utilizando la distancia Mahalanobis para las dos
bases de datos en los dos experimentos por lo que en los siguientes experimentos se utilizará sólo esta
distancia. Además, se ve que separando la matriz conjunta en dos matrices de vectores continuos y
discretos y tratándolos por separado se obtienen mejores resultados.
Sin embargo, tanto la distancia Euclídea como Coseno no presentan mucha diferencia de EER entre
la matriz conjunta y sólo continua, debido a que en el cálculo de estas distancias no se toma en cuenta la
varianza entre las características. Por lo tanto, no se iguala la importancia de características continuas y
discretas, teniendo en cuenta que el rango de las discretas varía entre 1 y 4 como mucho y las continuas
pueden alcanzar los valores hasta varias centenas de píxeles, como la línea media o anchura de frente.
de entrenamiento/prueba. Los resultados obtenidos para las distancias Euclídea, Coseno y Hamming
también se pueden observar en la Tabla 5.3.
Entrenamiento/Prueba
Matriz 1/7 2/6 3/5 4/4 5/3 6/2 7/1
Conjunta 19.0 18.1 17.7 17.6 17.4 17.2 16.6
EUCLÍDEA
Continua 19.0 18.2 17.8 17.6 17.5 17.2 16.6
Conjunta 18.9 24.8 19.6 18.2 15.1 12.5 12.3
MAHALANOBIS
ATVS Continua 18.6 20.6 18.5 13.3 10.5 8.6 8.2
Conjunta 19.7 18.8 19.1 19.0 18.3 17.5 17.3
COSENO
Continua 19.7 18.9 19.1 19.1 18.3 17.7 17.4
HAMMING Discreta 20.4 13.8 13.1 12.8 11.6 10.7 9.3
De nuevo se puede comprobar que dado que estas dos distancias no contemplan la varianza, la
diferencia entre utilizar la matriz conjunta y la matriz continua no marca una diferencia considerable.
En la base de datos MORPH hay 6 sesiones con una toma por sesión y se ha hecho el mismo
procedimiento que para la base de datos anterior, obteniendo los siguientes resultados (Figura 5.18b).
Sobre la base de datos MORPH se pueden hacer las mismas conclusiones que para la base de datos
ATVS (Tabla 5.4).
Entrenamiento/Prueba
Matriz 1/5 2/4 3/3 4/2 5/1
Conjunta 32.8 31.4 31.0 30.7 29.9
EUCLÍDEA
Continua 32.8 31.4 30.9 30.7 30.0
Conjunta 33.7 35.7 33.5 32.1 29.4
MAHALANOBIS
MORPH Continua 32.8 35.0 19.1 31.8 18.4
Conjunta 32.9 32.3 31.8 31.9 32.0
COSENO
Continua 32.9 32.3 31.8 31.8 32.1
HAMMING Discreta 32.5 29.9 28.2 25.4 25.7
La fusión pesada sólo se ha calculado para el mejor caso posible que da la distancia de Mahalanobis.
En el caso de la base de datos ATVS los pesos que se han establecido han sido 70 % para el score de la
matriz continua y 30 % para la matriz discreta y en el caso de MORPH 72 % y 28 % respectivamente, ya
que con ellos se consigue el mejor resultado de EER.
Como se puede comprobar los resultados de EER han mejorado al fusionarse los dos sistemas.
Dicha técnica consiste en un proceso de búsqueda iterativa, es decir, siguiendo un criterio en cada
iteración del algoritmo, se van descartando o añadiendo las características morfológicas más discrimi-
nantes. El proceso finaliza cuando ya no es posible mejorar el rendimiento del sistema, en nuestro caso
es cuando ya no mejora el valor de EER.
Para la realización del experimento se ha considerado la distancia Mahalanobis para las caracterís-
ticas continuas y distancia Hamming para las discretas, ya que proporcionan el mejor rendimiento para
las dos bases de datos.
Para la base de datos ATVS las características continuas más discriminantes están representadas en
la Tabla 5.6 siendo la característica más discriminante la primera en la tabla.
ID Rasgo
19 Altura del mentón
17 Anchura de la nariz
31 Ángulo de la oreja derecha
16 Altura de la nariz
21 Altura de la frente
6 Longitud de la ceja derecha
29 Longitud de la oreja derecha
12 Longitud de la boca
26 Distancia interocular
1 Distancia entre las cejas
10 Ángulo de la ceja derecha
27 Ángulo del ojo derecho
32 Ángulo de la oreja izquierda
7 Longitud de la ceja izquierda
25 Abertura horizontal del ojo izquierdo
El valor de EER obtenido es ahora 9.2 y la característica más discriminante es la altura de la nariz.
Una vez obtenidos los dos resultados se procede a la fusión pesada de las dos partes del sistema. Los
pesos establecidos son 80 % para el score de la matriz continua y 20 % para la matriz discreta, ya que la
mejora de la matriz continua es bastante más significativa. El resultado final de EER común es 2.8.
En el caso de la base de datos MORPH la lista de las características continuas ha aumentado com-
parando con la ATVS. En este caso hay 20 características discriminantes. La diferencia está en que
desaparece de la lista ángulo del ojo derecho y se añaden las siguientes características:
Altura nasolabial
Anchura de la ceja derecha
Ángulo de la ceja izquierda
Abertura horizontal del ojo derecho
Longitud de la oreja izquierda
Ángulo entre los extremos de la boca
Como en el caso anterior, la característica más discriminante sigue siendo Altura del mentón. En
este caso el resultado es EER=14.3.
En el caso de las características discretas la lista disminuye, incluyendo sólo 13 características,
representadas en la Tabla 5.7.
ID Rasgo
9 Altura del mentón
5 Longitud de la boca
6 Altura de la nariz
1 Situación de las cejas
7 Anchura de la nariz
19 Dirección de la ceja izquierda
11 Altura de la frente
3 Anchura de la ceja derecha
17 Dimensiones de la ceja izquierda
2 Altura de las cejas
18 Dirección de la ceja derecha
8 Anchura de la raíz de la nariz
4 Anchura de la ceja izquierda
En este caso la más discriminante es altura del mentón coincidiendo con el caso continuo. El
resultado final de EER es 23.3.
Una vez obtenidos los dos resultados se procede a la fusión pesada de las dos partes del sistema.
Los pesos establecidos son 75 % para el score de la matriz continua y 25 % para la matriz discreta. El
resultado final de EER común es 12.7.
La Tabla 5.8 engloba los resultados de la aplicación del algoritmo SFFS para las dos bases de datos,
donde se reflejan el número de rasgos seleccionados por dicho algoritmo y su rendimiento final.
Tabla 5.8: Resultados del algoritmo SFFS para las bases de datos AVTS y MORPH
En resumen, con SFFS se consigue mejorar el sistema, tanto para la base de datos ATVS, como para
MORPH. Esto se ve reflejado en el valor de EER, que para la base de datos ATVS se ha conseguido
mejorar de 4.7 a 2.8 y para MORPH de 15.8 a 12.7.
El objetivo del presente proyecto fin de carrera ha sido el desarrollo, mejora, experimentación y
documentación del sistema completo de reconocimiento facial, basado en los protocolos de laboratorios
forenses como la Dirección General de la Guardia Civil [32] y NFI [33]. El sistema creado se centra en
los entornos controlados, pero también se ha demostrado su valía y utilidad en entornos no controlados.
Al tener un grupo reducido de usuarios dentro de las dos bases de datos se utiliza el método de vali-
dación cruzada Leave-one-out que permite ampliar tanto el conjunto de los datos de entrenamiento como
de prueba y acercar los resultados obtenidos a la realidad. Antes de empezar con la etapa de pruebas se
ha hecho un estudio de correlación entre todas las características obtenidas y posteriormente un análisis
estadístico de las dos bases de datos utilizadas. Como resultado final del estudio de correlación, se han
detectado varios tipos de dependencias entre las características, como por ejemplo la existencia de co-
rrelación negativa perfecta entre la abertura horizontal de los ojos y la distancia interocular o correlación
positiva entre la longitud de la línea media y la altura de la frente, como era de esperar.
Durante la etapa de experimentación se han utilizado las curvas ROC, que permiten ver la relación entre
VR y FAR del sistema, y como resultado final se han tenido en cuenta los valores de EER.
Durante la fase de desarrollo del sistema se ha propuesto un amplio conjunto de características
faciales tanto continuas como discretas, con el objetivo de ver su impacto durante el proceso de reco-
nocimiento facial automático mediante los experimentos llevados a cabo. Tras la realización de este
proyecto, se ha demostrado que dicho proceso basado en características puede ser de gran ayuda para
los expertos forenses, ya que automatiza el análisis morfológico facial llevado a cabo por los mismos.
Al finalizar la etapa de experimentación se procede a la etapa de análisis de los resultados obteni-
dos. Como ya se ha comentado en el capítulo anterior, se han realizado varias pruebas tanto con las
características continuas y discretas por separado, como conjuntas. Se ha comprobado que se consiguen
mejores resultados tratando las características continuas y discretas por separado, utilizado la distancia
de Mahalanobis para las continuas y Hamming para las discretas. La elección de la distancia Mahalano-
bis se debe a que ésta toma en cuenta la desviación típica entre las características, por lo que se iguala la
importancia de todas y cada una de las características utilizadas en la matriz final. Los resultados finales
79
Reconocimiento Facial en el Ámbito Forense
de EER para la base de datos ATVS han sido 8.2 para el sistema continuo y 9.3 para el sistema discreto
frente a 12.3 para el sistema conjunto. Sin embargo, tratándose de un conjunto de imágenes tomadas en
entornos no controlados los resultados finales de EER empeoran, siendo 18.4 para el conjunto continuo,
25.7 para el conjunto discreto frente a 29.4 para la matriz conjunta.
Mediante el estudio de muestras de entrenamiento se ha comprobado que aumentando la cantidad
de las muestras de entrenamiento se obtienen mejores resultados de EER, dado que se crea un patrón de
entrenamiento más parecido al patrón de prueba correspondiente. Por lo tanto, para el entrenamiento del
sistema, se recomienda utilizar varias imágenes para cada usuario tomadas con una separación temporal
adecuada.
Tras tratarse las características continuas y discretas por separado, el paso siguiente es la fusión
entre ellas para conseguir el resultado final de la matriz conjunta. Se utilizan dos tipos de fusión, suma
y pesada explicadas en el capítulo anterior. Analizando los datos de la Tabla 5.5 vemos que los mejores
resultados se consiguen con la fusión pesada debido a que ésta asigna mayor peso al sistema que presenta
mejores resultados de EER. Los mejores resultados obtenidos son 4.7 para la base de datos ATVS y 15.8
para los entornos no controlados.
Por último con el objetivo de mejorar el valor final de EER y disminuir el tiempo de ejecución del
sistema, se realiza la búsqueda de las características más discriminantes mediante el algoritmo SFFS.
Para las dos bases de datos se consigue reducir el número de las características utilizadas y mejorar
el rendimiento del sistema, además finalmente se aplica la fusión pesada, proporcionando una mejora
adicional para el valor de EER. Para la base de datos ATVS se consigue un total de 15 características
continuas y 19 discretas obteniendo el valor de EER de 2.8, donde el rasgo continuo más discriminante
es la altura del mentón y rasgo discreto, la altura de la nariz.
Para la base de batos MORPH se quedan 20 características continuas y 13 discretas obteniendo un
valor de EER igual a 12.7. El rasgo continuo más discriminante coincide con la base de datos ATVS,
siendo éste la altura del mentón. Sin embargo, para los entornos no controlados el rasgo discreto más
discriminante también sigue siendo la altura del mentón, coincidiendo con el caso continuo.
Con el objetivo de seguir mejorando el sistema se proponen las siguientes líneas de futuro desarrollo:
Ampliación del sistema para la creación del Retrato Hablado con otras razas que no sean la cau-
cásica. Ampliando el espectro de los sujetos que puedan ser analizados mediante el sistema pro-
puesto, su utilización puede ser posible en todas las partes del mundo.
Algunas de las características frontales no se han tenido en cuenta en el sistema propuesto, como
por ejemplo el amplio rango de las particularidades de la boca, globos oculares o cejas. Añadiendo
más características a la matriz creada, sería posible mejorar el resultado de la identificación.
Durante el desarrollo del sistema sólo se han utilizado las imágenes frontales, sin embargo, hay
rasgos como orejas, que para su análisis necesitan una imagen lateral. Por lo tanto, se propone
añadir tanto imágenes frontales como laterales al estudio con el objetivo de cubrir todos los rasgos
faciales.
Para las futuras investigaciones sería interesante, a parte de las distancias que se han aplicado en
los experimentos, estudiar el impacto que pueden tener otras medidas de semejanza.
El objetivo de este proyecto se centraba en las características morfológicas, pero existen también
las características cromáticas, que estudian el color de los rasgos faciales. Utilizando las fotos en
color, sería posible ampliar la lista de las características y posiblemente mejorar el rendimiento
del sistema.
El objetivo de este proyecto era el desarrollo del sistema que trabaje con las imágenes tomadas
en un entorno controlado y sólo se ajustaron algunos detalles para un sistema no controlado. Se
propone realizar un ajuste más preciso para un sistema no controlado que permitiese utilizar las
imágenes sacadas de grabaciones de las cámaras de vídeo vigilancia o teléfonos móviles.
El porcentaje de los usuarios utilizados para la definición de los umbrales es un parámetro que
afecta a la conversión de las características continuas a discretas, por lo que sería interesante
estudiar su efecto en los resultados obtenidos. Como trabajo futuro se propone variar el porcentaje
del conjunto de los datos dedicados a la definición de los umbrales y ver como este aspecto afecta
al rendimiento final del sistema.
[1] J. C. Klontz and A. K. Jain. A case study on unconstrained facial recognition using the boston
marathon bombings suspects. Technical Report MSU-CSE-13-4, 2013.
[4] G. Doran G. Porter. An anatomical and photographic technique for forensic facial identification.
Forensic Science International, vol. 114:97–105, 2000.
[5] A. Bertillon. Signaletic Instructions including the theory and practice of Anthropometrical Identi-
fication. The Werner Company, 1896.
[6] W.W. Bledsoe. Man-machine facial recognition. Tech. Report. PRI:22, Panoramic Res. Inc., 1966.
[7] A.J. Goldstein and L.D. Harmon. Identification of human faces. Proceedings of IEEE, vol.59, no5,
pages 748–760, 1971.
[8] T. Kanade. Picture Processing System by Computer Complex and Recognition of Human Faces.
Ph.d dissertation, Kyoto University, 1973.
[9] L. Sirovich and M. Kirby. Low dimensional procedure for the caracterization of human faces.
Journal of optical society of America, vol. 4(no.3):519–524, 1987.
[10] A. Pentland M. Turk. Eingenfaces for recognition. Cognitive Neuroscience, (3):72–86, 1991.
[11] E. Torres Lezama E. Garnica Olmos P. González Martín, A. Díaz de Pascual. Una aplicación del
análisis de componentes principales en el Área educativo. Instituto de Investigaciones Económicas
y Sociales, 2008.
[12] J.P. Hespanha P.L. Belhumeur and D.J. Kriegman. Eigenfaces vs. Fisherfaces: Recognition Using
Class Specific Linear Projection. IEEE Trans. on PAMI, vol. 19, no.7, 1997.
[13] B. Klare Anil K. Jain and U. Park. Face recognition: some challenges in forensics. 9’th Conference
on Automatic Face and Gesture Recognition, 2011.
[14] C. Malsburg L. Wiskott, N. Kruger. Face recognition by elastic bunch graph matching. 1999.
[15] U. Park Z. Li and K. Jain. A discriminative model for age invariant face recognition. IEEE trans.
on PAMI, 2006.
[16] N.A. Spaun. Forensic biometrics from images and video at the federal bureau of investigation. in
Proc. BTAS, 2007.
83
Reconocimiento Facial en el Ámbito Forense
[17] N.A. Spaun. Facial comparisons by subject matter experts:their role in biometrics and their trai-
ning. in Proc. ICB, 2009.
[18] A.K. Jain U. Park. Face matching and retrieval using soft biometrics. IEEE Trans. on IFS, Vol. 5,
2010.
[19] Pedro Tome. Acquisition scenario analysis for face recognition at a distance. Master’s thesis,
Universidad Autonoma de Madrid, October 2010. M.Phil.
[20] B. Klare and K. Jain. Heterogeneous face recognition: matching NIR to visible light images. Proc.
ICB, 2009.
[21] D. Lowe. Distinctive image features from scale-invariant keypoints. Int’l J. Computer vision Vol
60, pages 91–110, 2004.
[22] Z. Lei S. Li and M. Ao. The HFB face database for heterogeneous face biometrics research. Proc.
CVPRW, 2009.
[24] G. J. Edwards T. F. Cootes and C. J. Taylor. Active appearance models. Proceedings of the
European Conference on Computer Vision, (2):484–498, 1998.
[25] B. Klare Z. Li and K. Jain. Matching forensic sketches to mugshot photos. IEEE trans. on PAMI,
2011.
[26] L. Farkas. Anthropometry of the head and face. Raven Press, New-York, 1994.
[27] M. Dooley. Anthropometric modeling programs. IEEE Computer Graphics and Applications, vol.
2:17–25, 1982.
[28] S. Rogers. Personal identification from human remains. Charles C. Thomas, Publisher, LTD,,
1984.
[30] Julian Fierrez Nicomedes Exposito Ruben Vera-Rodriguez, Pedro Tome and Francisco Javier Vega.
Analysis of the variability of facial landmarks in a forensic scenario. In International Workshop on
Biometrics and Forensics, Lisboa, Portugal, April 2013.
[31] K. Ricanek and T. Tesafaye. Morph: a longitudinal image database of normal adult age-
progression. In Automatic Face and Gesture Recognition, 2006. FGR 2006. 7th International
Conference on, pages 341–345, april 2006.
[35] ISO/IEC JTC 1/SC 37 N 504. Biometric data interchange formats part 5: Face image. ISO, 2004.
[36] Luis Blázquez Pérez. Reconocimiento basado en los puntos característicos de la cara en entornor
no controlados. Pfc, EPS UAM, 2013.
84 BIBLIOGRAFÍA
Reconocimiento Facial en el Ámbito Forense
[37] S.S. Stevens. On the theory of scales measurement. Science, (no.103(2684)):677–680, 1946.
[39] J. Novovicová P. Pudil and J. Kittler. Floating search methods in feature selection. Pattern Recog-
nition Letters, (15(11)):1119–1125, 1994.
BIBLIOGRAFÍA 85
Reconocimiento Facial en el Ámbito Forense
86 BIBLIOGRAFÍA
Anexos
87
A
Presupuesto
1) Ejecución Material
Compra de ordenador personal (Software incluido) 1900 ¤
2) Gastos generales
sobre Ejecución Material 368 ¤
3) Beneficio Industrial
sobre Ejecución Material 138 ¤
4) Honorarios Proyecto
1200 horas a 15 ¤/ hora 18000 ¤
5) Material fungible
Gastos de impresión 150 ¤
Encuadernación 200 ¤
7) I.V.A. aplicable
21 % Subtotal Presupuesto 4336,50 ¤
8) Total presupuesto
Total Presupuesto 24986,50 ¤
89
Reconocimiento Facial en el Ámbito Forense
90 APÉNDICE A. PRESUPUESTO
Pliego de condiciones
B
PLIEGO DE CONDICIONES
Este documento contiene las condiciones legales que guiarán la realización, en este proyecto, de un
sistema de Reconocimiento Facial en el Ámbito Forense. En lo que sigue, se supondrá que el proyecto
ha sido encargado por una empresa cliente a una empresa consultora con la finalidad de realizar dicho
sistema. Dicha empresa ha debido desarrollar una línea de investigación con objeto de elaborar el pro-
yecto. Esta línea de investigación, junto con el posterior desarrollo de los programas está amparada por
las condiciones particulares del siguiente pliego.
Supuesto que la utilización industrial de los métodos recogidos en el presente proyecto ha sido
decidida por parte de la empresa cliente o de otras, la obra a realizar se regulará por las siguientes:
Condiciones generales.
2. El montaje y mecanización completa de los equipos que intervengan será realizado totalmente por
la empresa licitadora.
3. En la oferta, se hará constar el precio total por el que se compromete a realizar la obra y el tanto
por ciento de baja que supone este precio en relación con un importe límite si este se hubiera
fijado.
5. Aparte del Ingeniero Director, el contratista tendrá derecho a contratar al resto del personal, pu-
diendo ceder esta prerrogativa a favor del Ingeniero Director, quien no estará obligado a aceptarla.
91
Reconocimiento Facial en el Ámbito Forense
6. El contratista tiene derecho a sacar copias a su costa de los planos, pliego de condiciones y pre-
supuestos. El Ingeniero autor del proyecto autorizará con su firma las copias solicitadas por el
contratista después de confrontarlas.
7. Se abonará al contratista la obra que realmente ejecute con sujeción al proyecto que sirvió de base
para la contratación, a las modificaciones autorizadas por la superioridad o a las órdenes que con
arreglo a sus facultades le hayan comunicado por escrito al Ingeniero Director de obras siempre
que dicha obra se haya ajustado a los preceptos de los pliegos de condiciones, con arreglo a los
cuales, se harán las modificaciones y la valoración de las diversas unidades sin que el importe
total pueda exceder de los presupuestos aprobados. Por consiguiente, el número de unidades que
se consignan en el proyecto o en el presupuesto, no podrá servirle de fundamento para entablar
reclamaciones de ninguna clase, salvo en los casos de rescisión.
8. Tanto en las certificaciones de obras como en la liquidación final, se abonarán los trabajos realiza-
dos por el contratista a los precios de ejecución material que figuran en el presupuesto para cada
unidad de la obra.
10. Cuando se juzgue necesario emplear materiales o ejecutar obras que no figuren en el presupuesto
de la contrata, se evaluará su importe a los precios asignados a otras obras o materiales análogos
si los hubiere y cuando no, se discutirán entre el Ingeniero Director y el contratista, sometiéndolos
a la aprobación de la Dirección. Los nuevos precios convenidos por uno u otro procedimiento, se
sujetarán siempre al establecido en el punto anterior.
11. Cuando el contratista, con autorización del Ingeniero Director de obras, emplee materiales de
calidad más elevada o de mayores dimensiones de lo estipulado en el proyecto, o sustituya una
clase de fabricación por otra que tenga asignado mayor precio o ejecute con mayores dimensiones
cualquier otra parte de las obras, o en general, introduzca en ellas cualquier modificación que sea
beneficiosa a juicio del Ingeniero Director de obras, no tendrá derecho sin embargo, sino a lo que
le correspondería si hubiera realizado la obra con estricta sujeción a lo proyectado y contratado.
12. Las cantidades calculadas para obras accesorias, aunque figuren por partida alzada en el presu-
puesto final (general), no serán abonadas sino a los precios de la contrata, según las condiciones
de la misma y los proyectos particulares que para ellas se formen, o en su defecto, por lo que
resulte de su medición final.
13. El contratista queda obligado a abonar al Ingeniero autor del proyecto y director de obras así como
a los Ingenieros Técnicos, el importe de sus respectivos honorarios facultativos por formación del
proyecto, dirección técnica y administración en su caso, con arreglo a las tarifas y honorarios
vigentes.
14. Concluida la ejecución de la obra, será reconocida por el Ingeniero Director que a tal efecto
designe la empresa.
16. La forma de pago será por certificaciones mensuales de la obra ejecutada, de acuerdo con los
precios del presupuesto, deducida la baja si la hubiera.
17. La fecha de comienzo de las obras será a partir de los 15 días naturales del replanteo oficial de
las mismas y la definitiva, al año de haber ejecutado la provisional, procediéndose si no existe
reclamación alguna, a la reclamación de la fianza.
18. Si el contratista al efectuar el replanteo, observase algún error en el proyecto, deberá comuni-
carlo en el plazo de quince días al Ingeniero Director de obras, pues transcurrido ese plazo será
responsable de la exactitud del proyecto.
19. El contratista está obligado a designar una persona responsable que se entenderá con el Ingeniero
Director de obras, o con el delegado que éste designe, para todo relacionado con ella. Al ser el
Ingeniero Director de obras el que interpreta el proyecto, el contratista deberá consultarle cualquier
duda que surja en su realización.
20. Durante la realización de la obra, se girarán visitas de inspección por personal facultativo de la
empresa cliente, para hacer las comprobaciones que se crean oportunas. Es obligación del contra-
tista, la conservación de la obra ya ejecutada hasta la recepción de la misma, por lo que el deterioro
parcial o total de ella, aunque sea por agentes atmosféricos u otras causas, deberá ser reparado o
reconstruido por su cuenta.
21. El contratista, deberá realizar la obra en el plazo mencionado a partir de la fecha del contrato,
incurriendo en multa, por retraso de la ejecución siempre que éste no sea debido a causas de fuerza
mayor. A la terminación de la obra, se hará una recepción provisional previo reconocimiento y
examen por la dirección técnica, el depositario de efectos, el interventor y el jefe de servicio o un
representante, estampando su conformidad el contratista.
22. Hecha la recepción provisional, se certificará al contratista el resto de la obra, reservándose la
administración el importe de los gastos de conservación de la misma hasta su recepción definitiva
y la fianza durante el tiempo señalado como plazo de garantía. La recepción definitiva se hará
en las mismas condiciones que la provisional, extendiéndose el acta correspondiente. El Director
Técnico propondrá a la Junta Económica la devolución de la fianza al contratista de acuerdo con
las condiciones económicas legales establecidas.
23. Las tarifas para la determinación de honorarios, reguladas por orden de la Presidencia del Go-
bierno el 19 de Octubre de 1961, se aplicarán sobre el denominado en la actualidad "Presupuesto
de Ejecución de Contrata anteriormente llamado "Presupuesto de Ejecución Material"que hoy
2
Condiciones particulares.
La empresa consultora, que ha desarrollado el presente proyecto, lo entregará a la empresa cliente
bajo las condiciones generales ya formuladas, debiendo añadirse las siguientes condiciones particulares:
6. Si el proyecto pasa la etapa de desarrollo, cualquier modificación que se realice sobre él, deberá
ser notificada al Ingeniero Director del Proyecto y a criterio de éste, la empresa consultora decidirá
aceptar o no la modificación propuesta.
9. Si la empresa cliente decide desarrollar industrialmente uno o varios productos en los que resul-
te parcial o totalmente aplicable el estudio de este proyecto, deberá comunicarlo a la empresa
consultora.
10. La empresa consultora no se responsabiliza de los efectos laterales que se puedan producir en el
momento en que se utilice la herramienta objeto del presente proyecto para la realización de otras
aplicaciones.
11. La empresa consultora tendrá prioridad respecto a otras en la elaboración de los proyectos auxilia-
res que fuese necesario desarrollar para dicha aplicación industrial, siempre que no haga explícita
renuncia a este hecho. En este caso, deberá autorizar expresamente los proyectos presentados por
otros.
12. El Ingeniero Director del presente proyecto, será el responsable de la dirección de la aplicación
industrial siempre que la empresa consultora lo estime oportuno. En caso contrario, la persona
designada deberá contar con la autorización del mismo, quien delegará en él las responsabilidades
que ostente.