DFD 8
DFD 8
DFD 8
A
Revista
nálisis dede la Facultad
la compresión de Ingeniería
de imágenes Industrial
utilizando clustering bajo el enfoque de colonia de hormigas
16(2): 118-131 (2013) UNMSM
ISSN: 1560-9146 (Impreso) / ISSN: 1810-9993 (Electrónico)
1. Introducción
RESUMEN
Almacenar una imagen digital implica contar con un gran
El siguiente trabajo de investigación presenta espacio de memoria, y si se trata de varias imágenes se
una solución para el problema del alto costo de complica aún más. Por ello es deseable crear métodos
almacenamiento digital de las imágenes usadas
en diversos campos como ingeniería, medicina, y algoritmos que permitan realizar diferentes tipos de
educación, arquitectura, administración, trabajo (comprensión, clasificación, etc.) con imágenes y
entretenimiento, etc. videos, cuyo objetivo será reducir el espacio de memoria
La solución está basada en la aplicación u/o agilizar su procesamiento.
de un método de compresión utilizado en el
procesamiento de imágenes que es el de En la actualidad cuando se trabaja con grandes cantidades
clustering; en donde se usa el algoritmo de de imágenes se piensa en la comprensión de imágenes
colonia de hormigas, con la finalidad de reducir para reducir el espacio de almacenamiento.
el tamaño de la paleta de colores utilizada para
representar una imagen. Con ello se logra reducir
el tamaño de almacenamiento de la imagen sin
La Imagen Digital
que esto afecte la visualización de la misma por Una imagen digital es una representación bidimensional
parte de la persona.
de una imagen utilizando bits.
Palabras clave: imagen digital, mapa de bits,
compresión de imagen, clustering, algoritmo de
colonia de hormigas
ABSTRACT
The following research paper presents a solution
to the problem of high cost of digital storage of
images used in various fields such as engineering,
medicine, education, architecture, management,
entertainment, etc.
The solution is based on the implementation of a
compression method used in image processing
is that of clustering, in which the algorithm ant
colony is used, in order to reduce the size of the
color palette used to represent an image. This Figura 1. Imagen Digital.
will reduce the storage size of the image without
affecting the display of the same by the person.
Fuente: Marcelo Ragone, Juan Pablo Vittori. 2006. Fotografía Digital.
Keywords: digital image, bits map, image Especialización en lenguajes artísticos combinados.
compression, clustering, ant colony algorithms
María Elena Ruiz Rivera / Juan Eduardo Yarasca Carranza / Edgar Ruiz Lizama
Clustering
Clustering es el proceso de organizar objetos
en grupos y cuyos elementos sean similares de
alguna manera. Un cluster es una colección de
objetos “similares” entre ellos y que no lo son con
los objetos de otros clústeres [Matteucci, 2008].
Un criterio de similitud bastante usado es la
distancia: dos o más objetos pertenecen al mismo
cluster si están “cerca” de acuerdo con una
distancia dada, a esto se le llama distance – based
clustering.
Otra clase de clustering es el conceptual clustering,
en donde dos o más objetos pertenecen al mismo
clúster si uno de estos objetos define un concepto
común para todos los demás objetos.
Gráfica 1. Clustering.
Cuantificación Vectorial
Fuente: Matteo Matteucci. 2008. Clustering: An Introduction La idea base de la cuantificación vectorial es la de
[Matteucci, 2008]. representar un vector N-dimensional que puede
tomar cualquier valor continuo en cada una de sus N
componentes mediante otro vector seleccionado de
Compresión de Datos entre un conjunto finito de vectores N-dimensionales
(Codebook) [Galindo, García, Barrientos, 1999].
La compresión de datos trata de reducir el número
de bits necesarios para representar la información
[Piñeiro, 2010]. Como ejemplo tenemos que para
representar digitalmente un segundo de video, sin
compresión, se necesitan más de 20 megabits y
para representar 2 minutos de un CD de música se
requieren más de 84 millones de bits. Actualmente
se han producido significativos avances
tecnológicos que permiten transmitir o almacenar
cantidades de información cada vez más grandes.
Sin embargo, parece que las necesidades crecen
con mayor rapidez que los avances tecnológicos en
cuestión y, por ello, las técnicas de compresión se Gráfica 3. Proceso de Cuantificación Vectorial
hacen imprescindibles.
Fuente: Pedro Galindo, Carmen García, Juan Barrientos (1999). La
cuantificación vectorial. pág. 8.
2.2. Compresión
María Elena Ruiz Rivera / Juan Eduardo Yarasca Carranza / Edgar Ruiz Lizama
Formato de
Ventajas Desventajas
Archivo
María Elena Ruiz Rivera / Juan Eduardo Yarasca Carranza / Edgar Ruiz Lizama
Fuente: Mota, Gomes, Cavalcante. 2001. Optimal Image Quantization, Perception and the Median Cut Algorithm. pág. 10.
1
mi(t +1) =
S i(t )
∑x j
x j ∈Si( t )
Ecuación 3: K – Means, Centroide
soltar un ítem.
En donde d(i,j) Є [0,1] es la función de disimilitud
2
definida para 2 puntos de data en el espacio
k+ calculada como la función coseno, α Є [0,1] es un
p pick (i ) = + parámetro de escalamiento dato – dependiente, σ2
k + f (i ) es el tamaño del vecindario local, generalmente σ2
Є [9, 25].
f (i )
2
María Elena Ruiz Rivera / Juan Eduardo Yarasca Carranza / Edgar Ruiz Lizama
Fuente: Deneubourg et al., The dynamics of collective sorting: Robot-like ants and Ant-like robots. (Deneubourg et al., 1991).
2.5. Casos de Éxito del Algoritmo de Colonia de Yoon. Ellos proponen un algoritmo de clustering
Hormigas que imite el ecosistema teniendo en cuenta
las características de datos biológicos con la
Dentro de los casos en que se ha aplicado con éxito
finalidad de mejorar el proceso de análisis de
el algoritmo de colonia de hormigas tenemos:
los chips o micro arreglos de ADN, para ello han
a) Desarrollo de una aplicación para la gestión, implementado un sistema utilizando el algoritmo
clasificación y agrupamiento de documentos de colonia de hormigas. El sistema determina el
económicos con algoritmos bio-inspirados número de clústeres automáticamente, procesa
[Cobo y Rocha, 2007], este trabajo fue los datos biológicos de entrada, para luego
desarrollado por Ángel Cobo y Rocío Rocha, ejecutar el algoritmo de colonia de hormigas,
en el cual desarrollan una aplicación Web que asignar a los grupos genes y finalmente mostrar
utiliza técnicas bio-inspiradas para clasificar y el resultado. Se ha probado el algoritmo con una
agrupar colecciones multilingües de documentos base de datos de prueba de 100 y 1000 genes
en el campo de la economía y los negocios. La las cuales muestran resultados prometedores
aplicación identifica grupos relacionados de para la aplicación de este algoritmo para agrupar
documentos económicos, escritos en español los datos de chips de ADN.
e inglés, utilizando algoritmos de clustering
c) Enrutamiento Multicast Multiobjetivos
inspirados en el comportamiento de las colonias
basado en Colonia de Hormigas [Pinto et
de hormigas. Para la generación de una
al., 2005], desarrollado por Diego Pinto, Hugo
representación vectorial de los documentos que
Estigarribia, y Benjamín Barán. En su trabajo
resulte independiente del idioma, se utilizan
presentan a los algoritmos de optimización
varios recursos lingüísticos y herramientas
basados en Sistemas de Colonias de Hormigas
de procesamiento de documentos textuales.
(Ant Colony Optimization - ACO) como métodos
Cada documento es representado utilizando
meta-heurísticos recientes, inspirados en el
cuatro vectores de rasgos independientes del
comportamiento de colonias de hormigas
idioma, y la similitud entre ellos es calculada
reales. Proponen un algoritmo mult iobjetivo,
mediante combinaciones lineales convexas de
para la resolución del problema de Enrutamiento
las similitudes de esos vectores de rasgos.
Multicast en Ingeniería de Tráfico, denominado
b) An Ant-based Clustering System for Multi objective Ant Colony System (MOACS),
Knowledge Discovery in DNA Chip Analysis que está basado en ACO y que es utilizado
Data [Lee et al., 2007], este trabajo ha sido para la construcción del árbol multicast, en
desarrollado por Minsoo Lee, Yun-mi Kim, el contexto de transmisión de datos en redes
Yearn Jeong Kim, Yoon-kyung Lee, Hyejung de computadoras. El MOACS optimiza de
María Elena Ruiz Rivera / Juan Eduardo Yarasca Carranza / Edgar Ruiz Lizama
7. Propuesta AporteTeórico
La propuesta es desarrollar un aporte teórico –
práctico (conocimientos y herramienta tecnológica) Comparación de Algoritmos de Clustering
en el tema de codificación de imágenes basadas en Para analizar las ventajas y desventajas de
algoritmos de clustering. cada algoritmo de clustering presentados en
El desarrollo de este aporte se dará de manera la tesis he elaborado los siguientes cuadros
periódica e incremental, durante este proceso de comparativos.
- Procesamiento paralelo.
- Mejora constante del algoritmo.
- Complejidad de implementación
Ant Based Clustering - Auto-organización.
media.
- Algoritmo robusto.
- No necesitan información a priori.
Algoritmos
Leyenda:
Descripción Valor
Baja 1
Media 2
Alta 3
María Elena Ruiz Rivera / Juan Eduardo Yarasca Carranza / Edgar Ruiz Lizama
De este cuadro se elegirá el algoritmo cuyo valor algoritmo Ant – Based Clustering que tiene de
ponderado sea el mayor,lo que representaráque valor ponderado 3.00, el cual es superior al de los
el algoritmo otorga mayor beneficio frente a demás algoritmos de la tabla.
los demás algoritmos. En este caso se elige el
Algoritmos
Complejidad de
0.3 2 0.6 0.3 2 0.6 0.3 3 0.3 0.3 2 0.6
implementación
Uso de recursos
0.3 2 0.6 0.3 2 0.6 0.3 3 0.9 0.3 2 0.6
computacionales
Tiempo de
0.3 2 0.6 0.3 2 0.6 0.3 3 0.9 0.3 2 0.6
procesamiento
Necesidad de
0.1 1 0.1 0.1 1 0.1 0.1 3 0.1 0.1 1 0.1
información a priori
Leyenda:
Descripción Valor
Baja 1
Media 2
Alta 3
De este cuadro se elegirá el algoritmo cuyo valor las mejores condiciones para la implementación
ponderado sea el menor,lo que representaráque de un sistema de compresión de imágenes. Este
el algoritmo otorga menores costos en cuanto a sistema usará dicho algoritmo para localizar los
tiempo y esfuerzo empleados en la implementación colores característicos o predominantes de una
del mismo frente al de los demás algoritmos. En imagen, lo que dará origen al Codebook que será
este caso los algoritmos con menor ponderado utilizado en el proceso de cuantificación vectorial
sonel algoritmo Median Cut, el algoritmo K - Means al que será sometida la imagen. Para disminuir el
y el algoritmo Ant – Based Clustering los cuales error de cuantificación que se genera durante el
presentan un valor ponderado de 1.9. proceso se utilizará un algoritmo de dithering del
De las comparaciones realizadas se puede observar tipo error-difusión con el cual se distribuirá dicho
que el algoritmo Ant – Based Clustering presenta error en los píxeles vecinos de la imagen.
Conclusiones y Trabajos Futuros [2] [Ragone y Vittori, 2006b] Marcelo Ragone, Juan
Las conclusiones que he llegado en el desarrollo de Pablo Vittori. Fotografía Digital. Especialización
la tesis son las siguientes: en Lenguajes Artísticos Combinados. Instituto
Universitario Nacional de Arte. 2006. Buenos
−− El continuo avance en la tecnología de las Aires, Argentina. Pp 3-5.
telecomunicaciones ha conllevado a un el
aumento en la demanda del uso de imágenes, [3] [Ragone y Vittori, 2006c] Marcelo Ragone, Juan
audio y video en las diversas actividades Pablo Vittori. Fotografía Digital. Especialización
cotidianas como por ejemplo en la medicina, en Lenguajes Artísticos Combinados. Instituto
arquitectura, ingeniería, administración, Universitario Nacional de Arte. 2006. Buenos
educación, etc., esto ha generado ciertos Aires, Argentina. Pp 5-6.
aspectos a tener en cuenta debido a su alto
costo computacional, por un lado se tiene la [4] [Mota et al., 2001] Cicero Mota, Jonas Gomes
transmisión de los contenidos multimedia y por y María I. A. Cavalcante. Optimal Image
el otro su almacenamiento. Quantization, Perception and the Median
Cut Algorithm. Instituto de Ciencias Exactas.
−− La solución para estos problemas es utilizar una
Universidad del Amazonas. 2001. Manaus,
técnica de compresión basada en la clustering
Brasil. Pp. 14.
la cual consiste, en el caso de las imágenes, en
mapear una imagen original a full color, en otra [5] [Paul Heckbert, 1982] Paul S. Heckbert. Color
imagen que tenga una paleta de colores mucho Image Quantization for Frame Buffer Display.
más reducida que la de la imagen original y Laboratorio de Computación Gráfica del Intituto
además que las diferencias de percepción visual de Tecnología de New York. 1982. USA. Pp.
entre estas 2 imágenes sean mínimas. 4-8.
−− El algoritmo de compresión basado en colonia [6] [Piñeiro, 2010] Teoría de la Información y
de hormigas que se presenta en este artículo Codificación. Cándido Piñeiro Gómez. 2010.
permite reducir el peso de las imágenes en
Cap. I, Pp. 2.
aproximadamente un 66.41% sin afectar
drásticamente la percepción visual de las [7] [Dorigo y Stützel, 2005] The Ant Colony
mismas. Optimization Metaheuristic: Algorithms,
Los trabajos futuros que se pueden plantear a partir Applications, and Advances. Marco Dorigo,
de esta tesis serían: Thomas Stützel . 2005. Pp 24.
−− La optimización del algoritmo de colonia de [8] [Dekker, 1994] Kohonen Neural Networks for
hormigas, para evitar el gran consumo de Optimal Color Quantization. Anthony Dekker.
recursos computacionales cuando se procese 1994.
mayor volumen de información.
[9] [Lloyd, 1982] Stuart Lloyd. Least Squares
−− El uso del paralelismo para mejorar el tiempo de Quantization PCM. IEEE Transactions on
procesamiento, especialmente en la generación Information Theory, Vol. It-28, No. 2, 1982.
del Codebook.
[10] [Deneubourg et al., 1991] J. L. Deneubourg,
−− Preparar al algoritmo para que sea capaz de S. Goss, N. Franks, A. Sendova-Franks,
recibir una imagen de entrada en cualquier C. Detrain, y L. Chrétien. The dynamics of
formato gráfico y pueda procesarla sin collective sorting: Robot-like ants and Ant-like
inconvenientes.
robots. Université Libre de Bruxelles, Bélgica;
University of Bath, Reino Unido, 1991.
REFERENCIAS BIBLIOGRÁFICAS [11] [Lumer y Faieta, 1994] E. Lumer y B. Faieta.
Artículos Diversity and Adaptation in populations of
clustering ants. 1994
[1] [Galindo, García, Barrientos, 1999] Pedro
L. Galindo, Carmen García López, Juan M. [12] [Handl et al., 2003] J. Handl, J. Knowles and M.
Barrientos Villar. La Cuantificación Vectorial. Dorigo. Strategies for the increased robustness
Escuela Superior de Ingeniería Universidad de of ant – based clustering, Université Libre de
Cádiz.1999. Cádiz, España. Pp. 2, 3. Bruxelles, Bélgica. 2003.
María Elena Ruiz Rivera / Juan Eduardo Yarasca Carranza / Edgar Ruiz Lizama