Ejemplo de Paper PDF
Ejemplo de Paper PDF
Ejemplo de Paper PDF
Dependiendo del nivel de abstracción utilizado en la Una arquitectura tiene dos partes: una parte declarativa,
descripción de un sistema digital, VHDL tiene tres estilos de donde señales, componentes y constantes (entre otros) son
descripción los cuales se muestran en la Tabla 2. declarados y la parte de código propiamente dicha (desde
begin hacia abajo). Al igual que en el caso de una entidad, el
TABLA 2 nombre de la arquitectura puede ser cualquier palabra, excepto
NIVELES DE ABSTRACCIÓN Y ESTILOS DESCRIPTIVOS EN VHDL
las palabras reservadas del VHDL.
Nivel de abstracción Estilo descriptivo Además de dar un nombre a la arquitectura, debe indicarse
el nombre de la entidad a la que pertenece.
Funcional o comportamental Algorítmico
Transferencia de registros Flujo de datos VHDL proporciona varios tipos de operadores
Lógico o de compuertas Estructural predefinidos:
Operadores de asignación
<= usado para asignar un valor a una señal.
:= usado para asignar un valor a una variable,
Algorítmico: Refleja el comportamiento del sistema
constante o genérico, también es usado para asignar
mediante procesos concurrentes que contienen sentencias
valores iniciales.
secuenciales [4].
=> usado para asignar valores a elementos
Flujo de datos: La descripción se basa en un conjunto de
individuales de un vector o con OTHERS.
ecuaciones concurrentes, existe una correspondencia directa
entre el código y el hardware. Operadores Lógicos (NOT, AND, OR, NAND, NOR,
Estructural: La descripción se basa en conexiones de XOR, XNOR)
componentes. Operadores Aritméticos (+, -, *, /, **)
Una descripción en VHDL está formada por tres secciones Operadores de Comparación (=, /=, <, >, <=, >=)
fundamentales: declaración de librerías, entidad y Operadores de Desplazamiento (sll, srl)
arquitectura. Operador de Concatenación (&)
Una librería es una colección de piezas de código usadas En el estilo de descripción algorítmico, el lenguaje VHDL
frecuentemente. Los códigos son usualmente escritos en forma puede tener dos tipos de código: código concurrente y código
de funciones, procedimientos o componentes, los cuales son secuencial.
puestos dentro de un paquete (package) y son compilados en El código concurrente es un conjunto de instrucciones que
una librería de destino [5]. se ejecutan de forma concurrente (paralela). El código
La entidad define la interfaz del sistema electrónico con su concurrente tiene tres instrucciones: WHEN, GENERATE y
entorno. Especifica los pines (puertos) de entradas y salida de BLOCK.
un circuito. Su sintaxis es la siguiente: Instrucción WHEN. Se presenta en dos formas:
WHEN/ELSE y WITH/SELECT/WHEN. Su sintaxis es la
siguiente:
Donde:
signal_mode: Define la dirección de los pines del circuito
definido por la entidad y pueden ser: IN (entrada), OUT
(salida), INOUT (bidireccional), BUFFER (utilizado cuando
la señal de salida debe ser utilizada internamente). Instrucción GENERATE. Permite a una sección de
signal_type: Puede ser BIT, STD_LOGIC, INTEGER, etc. código repetirse un número de veces específico. Su sintaxis es
El nombre de la entidad puede ser cualquier palabra la siguiente:
excepto las palabras reservadas del VHDL.
La arquitectura es la descripción de cómo el circuito o
sistema debe comportarse. “Describe un conjunto de
operaciones sobre las entradas de la entidad, que determinan
el valor de la salida en cada momento” [4]. Su sintaxis es la
siguiente: Instrucción BLOCK. Esta instrucción sirve como una
simple forma de dividir localmente el código. Su sintaxis es la
siguiente:
4
III. SISTEMA DE ADQUISICIÓN, COMPRESIÓN Y JPEG y se disponen los datos comprimidos para que cumplan
ALMACENAMIENTO DE IMÁGENES con el formato de intercambio de archivos JFIF. Este módulo
El diagrama de bloques del sistema de adquisición, es implementado completamente sobre el FPGA Spartan-3A
compresión y almacenamiento de imágenes se muestra en la XC3S700A.
Figura 3. Algunas funciones en los módulos que se presentan Módulo de Transferencia y Almacenamiento de archivos.
en la Figura 3, son desarrolladas como rutinas dentro de un Consta de una sección de hardware y una sección de software.
programa en lenguaje Matlab. Esto se ha realizado con el fin Este módulo se encarga de transmitir los datos del archivo de
de solventar algunas limitaciones, en lo que respecta a imagen JPEG desde el módulo de desarrollo Spartan 3A
capacidad de recursos lógicos, que se encontrarían si dichas Starter Kit hacia el computador que ejecuta la aplicación de
funciones fueran realizadas en hardware, así como la Interfaz Gráfica de Control, para posteriormente, mediante
realización de funciones que no pueden hacerse netamente ésta, recibir los bytes formateados en JFIF y dar la extensión
sobre hardware (como la dotación de extensiones a archivos) .jpg para que el sistema operativo de la máquina reconozca el
archivo de imagen.
Módulo de Control. Este módulo se encarga de habilitar las
secciones de hardware del sistema, como también de controlar
el flujo de datos entre éstas.
Interfaz Gráfica de Control. Este módulo es desarrollado
mediante el entorno de programación visual GUIDE
disponible en el paquete computacional Matlab. Con esta
interfaz el usuario interactúa con el sistema para poder
controlar las funciones de adquisición, compresión y
almacenamiento, así como la visualización de resultados.
A. Módulo de Adquisición
El modulo de adquisición, se obtienen las imágenes sin
compresión de dos maneras: desde un archivo de imagen
mediante la instrucción imread de Matlab o capturando una
trama de imagen a través de una webcam mediante la
instrucción getsnapshot de Matlab. En ambas opciones la
imagen original es convertida a escala de grises (componente
de luminancia) y redimensionada a 160x120 pixeles; esto se
logra con las instrucciones rgb2gray e imresize de Matlab.
Los datos de la imagen redimensionada y convertida a escala
de grises, son divididos en bloques de 8x8 pixeles, mediante
un arreglo de lazos for anidados. La imagen dividida en
bloques de 8x8 pixeles, es enviada a través del puerto serial al
módulo de desarrollo Spartan-3A Starter Kit. En el módulo de
desarrollo, los datos son recibidos por un sistema de recepción
UART, y después almacenados en una memoria RAM de
19200 bytes (160x120 bytes) de capacidad. Mientras los datos
son almacenados en la memoria RAM, el módulo de control
monitorea el puerto de dirección de escritura de la memoria
Fig. 3. Arquitectura de un FPGA de la Familia Spartan-3A de RAM, para determinar el momento en que se tienen todos los
Xilinx datos de la imagen sin comprimir almacenados en la memoria.
Y0 k 0.3536Z 0 k Z 1k Z 2 k Z 3k Z 4 k Z 5 k Z 6 k Z 7 k
Y1k 0.4904Z 0 k Z 7 k 0.4157Z 1k Z 6 k 0.2778Z 2 k Z 5k 0.0975Z 3k Z 4 k
Y2 k 0.4619Z 0 k Z 7 k 0.1913Z 1k Z 6 k 0.1913Z 2 k Z 5k 0.4619Z 3k Z 4 k
Y3k 0.4157Z 0 k Z 7 k 0.0975Z 1k Z 6 k 0.4904Z 2 k Z 5 k 0.2778Z 3k Z 4 k
Y4 k 0.3536Z 0 k Z 7 k 0.3536Z 1k Z 6 k 0.3536Z 2 k Z 5 k 0.3536Z 3k Z 4 k
Y5k 0.2778Z 0 k Z 7 k 0.4904Z 1k Z 6 k 0.0975Z 2 k Z 5 k 0.4157Z 3k Z 4 k
Y6 k 0.1913Z 0 k Z 7 k 0.4619Z 1k Z 6 k 0.4619Z 2 k Z 5 k 0.1913Z 3k Z 4 k
Y7 k 0.0975Z 0 k Z 7 k 0.2778Z 1k Z 6 k 0.4157Z 2 k Z 5k 0.4904Z 3k Z 4 k
Referencia [6]
Fig. 4. Diagrama de Bloques del esquema de codificación Baseline del Mediante los dos conjuntos de expresiones indicados
estándar JPEG anteriormente, se puede deducir los sistemas digitales que
implementarán las dos transformadas discretas del coseno
Los bloques de 8x8 pixeles, almacenados en la memoria
unidimensionales. La Figura 5 muestra el diagrama de bloques
RAM del módulo de adquisición, son recuperados fila por fila.
del sistema digital, para implementar la primera transformada
Los elementos de cada fila son almacenados en 8 registros
discreta del coseno unidimensional, aplicada a las filas del
substrayendo previamente 128 a su valor, para desplazar el
bloque de 8x8 pixeles.
coeficiente DC al mismo rango de variación de los
coeficientes AC (-1023 a +1023) generados en la DCT-2D
[7].
El algoritmo utilizado para implementar la transformada
discreta del coseno en dos dimensiones, se basa en la
transformada discreta coseno unidimensional y consiste en
aplicar la transformada unidimensional a las filas del bloque
de la imagen y, posteriormente, sobre el resultado obtenido,
volver a aplicar la transformada unidimensional a las
columnas. Este algoritmo puede representarse de forma
matricial como se indica a continuación:
Y CXC T
Donde X representa el bloque de 8x8 pixeles, Y los
coeficientes DCT-2D, y C está dada por
Z k 0 0.3536 X k 0 X k1 X k 2 X k 3 X k 4 X k 5 X k 6 X k 7
Z k1 0.4904 X k 0 X k 7 0.4157 X k1 X k 6 0.2778 X k 2 X k 5 0.0975 X k 3 X k 4
Z k 2 0.4619 X k 0 X k 7 0.1913 X k1 X k 6 0.1913 X k 2 X k 5 0.4619 X k 3 X k 4
Z k 3 0.4157 X k 0 X k 7 0.0975 X k1 X k 6 0.4904 X k 2 X k 5 0.2778 X k 3 X k 4
Z k 4 0.3536 X k 0 X k 7 0.3536 X k1 X k 6 0.3536 X k 2 X k 5 0.3536 X k 3 X k 4
Z k 5 0.2778 X k 0 X k 7 0.4904 X k1 X k 6 0.0975 X k 2 X k 5 0.4157 X k 3 X k 4
Z k 6 0.1913 X k 0 X k 7 0.4619 X k1 X k 6 0.4619 X k 2 X k 5 0.1913 X k 3 X k 4
Z k 7 0.0975 X k 0 X k 7 0.2778 X k1 X k 6 0.4157 X k 2 X k 5 0.4904 X k 3 X k 4
TABLA 3
CATEGORÍAS PARA LOS COEFICIENTES AC
CATEGORÍA RANGO DE VALORES DE COEFICIENTES
1 -1, 1
2 -3 A -2, 2 A 3
3 -7 A -4, 4 A 7
4 -15 A -8, 8 A 15
5 -31 A -16, 16 A 31
6 -63 A -32, 32 A 63
7 -127 A -64, 64 A 127
Fig. 9. Orden en zig-zag para los coeficientes DCT-2D cuantizados 8 -255 A -128, 128 A 255
9 -511 A -256, 256 A 511
En la Figura 10 se muestra un diagrama de bloques 10 -1023 A -512, 512 A 1023
simplificado del bloque de exploración en zig-zag
implementado. Los datos del primer bloque de 64 coeficientes
cuantizados son almacenados, con la disposición en zig-zag, Para la palabra código A existen algunas consideraciones
en 66 ciclos de reloj. En la descripción VHDL de este bloque, especiales con respecto a la longitud de series de ceros que
se ha incluido una bandera que indica el momento en que los puede preceder a un coeficiente no nulo, con el objeto de
64 coeficientes cuantizados se encuentran almacenados con la optimizar los códigos de longitud variable utilizados para la
disposición en zig-zag. Esta bandera también sirve para codificación. En el estándar JPEG se establece que la longitud
desactivar la señal de reset del bloque de codificación de máxima antes de un coeficiente no nulo debe ser 15 ceros
Huffman. consecutivos. Cuando existe una cadena de 16 ceros se añade
una palabra código especial para indicar este hecho
denominada ZRL (zero-run-length); pueden concatenarse
varias de estas palabras hasta obtener una cadena de ceros
menor a 16 para poder codificar la palabra A mediante las
relaciones R/C que se especifican en el estándar.
Existe una palabra código A especial para indicar el fin de
un bloque de 8x8 o en su defecto que el resto de coeficientes
son ceros, y se denomina EOB (End of Block). En el caso
especial en que el último coeficiente (el coeficiente 64) no sea
Fig. 10. Diagrama de bloques simplificado del bloque de exploración en zig-
zag nulo, no se codifica la palabra código EOB sino la que
corresponda para ese coeficiente no nulo [9].
La palabra código B refleja directamente el valor del
Para la codificación de los coeficientes cuantizados se coeficiente cuantizado no nulo, se expresa en binario en
utiliza una variación de los códigos de Huffman, y se complemento a uno y su longitud está definida por la
codifican por separado los coeficientes AC y DC. categoría a la que pertenezca dicho coeficiente.
Para los coeficientes AC (sean de luminancia o La codificación de los coeficientes DC es algo parecido a la
crominancia) ordenados en zig-zag, cada coeficiente no nulo codificación en AC. De la misma manera se definen dos
se codifica mediante dos palabras de longitud variable, una palabras código de longitud variable denominadas A’ y B’. La
denominada A y la otra B. La palabra A está definida en codificación no se realiza directamente sobre el coeficiente
función de la categoría (C) a la que pertenezca el coeficiente y DC sino sobre un coeficiente diferencial que se define como
la longitud de series de ceros (R) que antecede a dicho la diferencia entre el coeficiente DC del bloque actual y el
coeficiente (relación R/C). La categoría del coeficiente se coeficiente DC del bloque precedente, el cual puede estar en
establece según el valor que posea éste, y para los coeficientes el rango de -2047 a 2047 y puede ser cero.
AC se establecen 10 categorías las cuales se muestran en la La definición de la palabra A’ se basa en la categoría a la
Tabla 3. La categoría define la cantidad de bits con los que se que pertenezca el coeficiente DC diferencial, la cual tiene el
puede representar el valor del coeficiente no nulo; debido a mismo significado que en el caso de los coeficientes AC. En
que los coeficientes AC, que se obtienen de la DCT-2D, están la Tabla 4 se presenta la definición de las categorías de los
en el rango de -1023 a 1023, se tiene que la máxima categoría coeficientes DC diferenciales. Establecida la categoría del
para los coeficientes AC es 10. coeficiente DC diferencial se puede consultar la palabra
Con la longitud de series de ceros y la categoría del código A’ que corresponda a dicha categoría en las tablas que
coeficiente establecidas, la palabra código A puede ser en el estándar se recomienda. Al igual que en el caso AC,
consultada en la tabla de códigos que se propone en el existen dos tablas de códigos, una para cada componente de
9
TABLA 4
CATEGORÍAS PARA LOS COEFICIENTES DC DIFERENCIALES
CATEGORÍA RANGO DE VALORES DE COEFICIENTES
0 0
1 -1, 1 Fig. 11. Esquema de direccionamiento para la memoria ROM con las
2 -3 A -2, 2 A 3 tablas de Huffman
3 -7 A -4, 4 A 7
4 -15 A -8, 8 A 15 Si la longitud de series de ceros es igual o mayor a 16, se
5 -31 A -16, 16 A 31 produce la dirección de memoria correspondiente a la palabra
6 -63 A -32, 32 A 63 ZRL, al mismo tiempo se resta 16 de la longitud de series de
7 -127 A -64, 64 A 127
8 -255 A -128, 128 A 255
ceros, y se verifica nuevamente si ésta es menor a 16. Este
9 -511 A -256, 256 A 511 procedimiento se repite hasta obtener una longitud de series
10 -1023 A -512, 512 A 1023 de ceros menor a 16, y poder obtener la dirección de memoria
11 -2047 A -1024, 1024 A 2047
como se indicó en la Figura 11. Mediante la dirección de
memoria establecida como lo indica la Figura 11, se obtiene
Cuando se inicia la codificación de los coeficientes DC, se
de las memorias ROM, la palabra código A y la longitud en
considera que el coeficiente DC que precede al coeficiente DC
bits de la palabra código A para el coeficiente AC no nulo (o
del primer bloque de 8x8 de la imagen es cero.
el coeficiente DC diferencial). La palabra código B, se halla
La palabra B’ se obtiene de la misma forma que con los
directamente con el valor del coeficientes AC no nulo (o el
coeficientes AC, es decir es igual al complemento a uno del
coeficiente DC diferencial) expresado en complemento a 1 en
valor del coeficiente diferencial y su longitud es igual a la
caso de que éste sea negativo. La longitud en bits de la palabra
categoría a la que pertenezca dicho coeficiente.
código B es la categoría del coeficiente no nulo. Una bandera
Para implementar este esquema de codificación, se
indica cuándo se tienen palabras código válidas.
almacena en dos memorias ROM, las palabras código A para
la componente de luminancia definidas en el estándar JPEG y
la longitud en bits de cada palabra, tanto para los coeficientes
AC y DC. La discriminación del coeficiente DC se lleva a
cabo mediante una bandera. La bandera se activa cada vez que
un contador módulo 64 inicia su cuenta (el contador tiene un
valor de 1). Cuando se detecta que la bandera de un
coeficiente DC está activa, se realiza la resta del coeficiente
DC actual y el coeficiente DC previo (almacenado en un
registro especial). Esta diferencia pasa a una serie de
comparadores para definir su categoría según la Tabla 3. Para
los coeficientes AC, existen dos comparadores; en el primer
comparador se verifica si el coeficiente es nulo, en caso de
serlo, se incrementa un contador, que define la longitud de
series de ceros. Cuando el coeficiente no es nulo, un segundo
comparador verifica en qué rango de la Tabla 4 está el valor
no nulo, para definir la categoría del coeficiente AC. Cabe
mencionar que el contador de coeficientes nulos, se habilita
sólo cuando la bandera que indica un coeficiente DC no está
activada, de esta manera siempre se tendrá para los
coeficientes DC, una longitud de series de ceros igual a cero.
Los datos de la bandera de coeficiente DC, la categoría y la
longitud de series de ceros, ingresan a una máquina de
estados, donde se verifica que la longitud de series de ceros no
sobrepase los 15 ceros consecutivos. Si la longitud de series
de ceros es menor a 16, la máquina de estados produce una
dirección de memoria concatenando los datos de entrada como
se indica en la Figura 11.
Con el objeto de identificar el último coeficiente cuantizado de datos de la imagen comprimida almacenados en el FIFO
de la imagen, cuando la señal de reset del bloque de del módulo de compresión. Después habilita la trasmisión de
codificación de Huffman se desactiva, se inicia la cuenta en un dos bytes que señalan el fin del stream del archivo de imagen.
contador módulo 19200. Cuando el contador alcanza su valor
máximo, una bandera se activa para indicar que los datos
procesados (categoría y longitud de series de ceros) IV. RESULTADOS OBTENIDOS
corresponden al último coeficiente de la imagen. En la Figura Los resultados de la síntesis en términos de recursos
12 se ilustra un diagrama de bloques para la implementación utilizados, de las secciones hardware del sistema de
de la codificación de Huffman. adquisición, compresión y almacenamiento de imágenes,
La palabra código A y la palabra código B válidas, ingresan utilizando el FPGA XC3S700A de la Familia Spartan-3A de
a un bloque de generación de bytes, el cual agrupa los bits de Xilinx y el lenguaje de descripción de hardware VHDL, se
datos de las palabras código y genera los bytes de datos de la muestran en la Figura 13.
imagen comprimida. La generación de bytes depende de la
longitud de las palabras código A y B. Los bytes generados
son almacenados en un FIFO y después transmitidos hacia una
PC con el formato de archivo JFIF. Cuando en el bloque de
generación de bytes se detecta que la bandera del último
coeficiente de la imagen está activa, otra bandera se activa
para indicar que el byte generado corresponde al último byte
de datos. Esta bandera indica al módulo de control cuándo
puede comenzar a transmitir el stream del archivo de imagen
Fig. 13. Recursos lógicos utilizados en la implementación del sistema de
generado.
adquisición compresión y almacenamiento de imágenes
C. Módulo de Transferencia y Almacenamiento de archivos
Este modulo se encarga de transmitir el stream de bytes del Con el nivel de utilización del dispositivo mostrado en la
archivo generado a través de un transmisor UART. Lo Figura 13, la frecuencia máxima a la que puede operar el
primero que se transmite es la cabecera de archivo JFIF, que hardware del sistema es de 82.7 MHz.
se encuentra almacenada en una memoria ROM. La cabecera Los resultados de la compresión de imágenes se ilustran en
JFIF contiene campos de datos que ayudan en la la Tabla 5. El escenario de pruebas consistió en la adquisición
decodificación de la imagen comprimida. Después de de los datos de la imagen sin comprimir desde un archivo
transmitir la cabecera JFIF, se empieza con la transmisión de bmp. Como se esperaba la calidad de imagen mejora conforme
los bytes de datos de la imagen comprimida, almacenados en se selecciona una factor de calidad de imagen superior.
el FIFO del módulo de compresión. Al terminar de transmitir Mediante la herramienta de software JPEGsnoop, se pudo
los bytes de datos de la imagen comprimida, se transmite dos verificar los parámetros de compresión establecidos, y obtener
bytes que indican el fin del archivo de imagen. El programa de las tasas de compresión de las imágenes comprimidas. En la
la interfaz gráfica de control, recepta los bytes transmitidos Tabla 6, se indica la tasa de compresión para cada imagen
desde el módulo de desarrollo Spartan-3A Starter Kit y los mostrada en la Tabla 5.
almacena en un fichero con extensión jpg. Con esto el sistema
operativo del computador puede reconocer al stream de bytes
recibidos como un archivo de imagen. V. CONCLUSIONES
Se verificó en la práctica el potencial que poseen los
D. Módulo de Control FPGAs actuales, y en caso particular la arquitectura de los
FPGAs de la plataforma Spartan 3, cuyos componentes (CLBs
Este módulo se encarga de habilitar las secciones de
y bloques embebidos) han facilitado la descripción VHDL e
hardware del sistema, como también de controlar el flujo de
implementación de funciones de gran complejidad de
datos entre éstas. El módulo de control habilita el
cómputo, como es el caso de la Transformada Discreta del
almacenamiento de los datos de la imagen sin comprimir.
Coseno y la codificación de entropía de Huffman, ambos
Cuando el módulo de control detecta que se han recibido los
bloques de suma importancia en el esquema de codificación
19200 bytes de la imagen sin comprimir, habilita la lectura de
Baseline del estándar JPEG.
la memoria RAM de almacenamiento del módulo de
adquisición y desactiva la señal de reset del módulo de
compresión, los datos de la memoria RAM son transportados TABLA 5. RESULTADOS DE LA COMPRESIÓN DE IMÁGENES CON EL
ha2cia el módulo de compresión. El módulo de control SISTEMA
monitorea la bandera del último byte de datos del módulo de FACTOR
compresión, y cuando esta está activa, procede a habilitar la DE IMAGEN JPEG
CALIDAD
transmisión de la cabecera de archivo JFIF y después los bytes
11