Medios de Digitalización
Medios de Digitalización
Medios de Digitalización
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Índice
1. Introducción.......................................................................................................................................... 5
2. Escáneres .............................................................................................................................................. 5
2.1. Introducción.................................................................................................................................. 5
2.2. Cómo funciona un escáner ........................................................................................................... 6
2.3. Características de los escáneres .................................................................................................. 11
2.4. Tipos de escáneres ...................................................................................................................... 19
2.4.1. Escáneres genéricos ............................................................................................................ 19
2.4.2. Escáneres específicos ......................................................................................................... 22
2.5. El estándar TWAIN .................................................................................................................... 30
2.6. OCR (Reconocimiento óptico de caracteres).............................................................................. 33
2.6.1. ¿Cómo funciona el OCR? ................................................................................................... 35
3. Cámaras digitales................................................................................................................................ 38
3.1. Introducción................................................................................................................................ 38
3.2. Cómo funcionan ......................................................................................................................... 39
3.3. Tipos de cámaras digitales .......................................................................................................... 40
3.4. Características de cámaras digitales ........................................................................................... 44
3.5. A la hora de la digitalización ...................................................................................................... 46
4. Conversión de audio y video a digital ................................................................................................ 48
4.1. Conversión a audio digital .......................................................................................................... 50
4.2. Conversión a video digital .......................................................................................................... 51
Tabla de Ilustraciones
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Ilustración 26: Captura de pantalla del software OCR ABBYY FineReader. ............................................ 34
Ilustración 27: Segmentación de la imagen ................................................................................................ 36
Ilustración 28: Detección de características (fuente: explainthatstuff.com) ............................................... 37
Ilustración 29: Ejemplo de matriz Bayer (fuente recursoswebs.com.ar) .................................................... 39
Ilustración 30: Cámara réflex Canon EOS 1100D de gama baja................................................................ 40
Ilustración 31: Ejemplo de visor réflex de una Pentax K-5 (fuente focopixelado.blogspot.com) .............. 40
Ilustración 32: Aperturas del diafragma del objetivo (fuente fotonavia.com) ............................................ 41
Ilustración 33: Cámara de medio formato Hasselblad H4X (Fuente: Hasselblad) ..................................... 41
Ilustración 34: Ejemplo de tecnología SLT de Sony en una Alpha 58 (Fuente: Sony) .............................. 42
Ilustración 35: Cámara EVIL Lumix GF1 y accesorios ............................................................................. 42
Ilustración 36: Cámara bridge Sony HX100V............................................................................................ 43
Ilustración 37: Cámara digital ultracompacta Olympus. ............................................................................ 43
Ilustración 38: Tarjetas de memoria. .......................................................................................................... 45
Ilustración 39: Movimiento de lentes internas de un objetivo para realizar zoom óptico (fuente Wikipedia)
............................................................................................................................................................ 45
Ilustración 40: Distancia focal: fuente notodoestodo.blogspot.com ........................................................... 46
Ilustración 41: Trípode con columna en horizontal .................................................................................... 47
Ilustración 42: Mesa de reproducción para digitalización con cámara (Fuente: www.digireflex.net)........ 47
Ilustración 43: Robot digitalizando El Guernica de Pablo Picasso............................................................. 48
Ilustración 44: Ejemplo de un convertidor de audio de analógico a digital, con las entradas de audio
analógico en la parte inferior derecha, y las salidas de audio digital en la parte inferior izquierda. ... 51
Ilustración 45: Conversor de video analógico a digital Blackmagic Multibridge ...................................... 51
Ilustración 47: Sistema de Telecine ............................................................................................................ 52
Ilustración 46: Escáner para films ARRISCAN ......................................................................................... 52
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
EQUIPO DOCENTE
Carlos.Martinez@cursodigitalizacion.com
+34 637 17 78 10
www.linkedin.com/in/carlosmartinezgarcia
cmartinez.cursodigitalizacion
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
1. Introducción
Cuando se habla de digitalización, parece inevitable que lo primero que nos venga a la
mente son los medios utilizados, y más en concreto, la palabra escáner. Aunque, como
veremos más adelante, la digitalización con cámara fotográfica se está generalizando
cada vez más, los escáneres siguen siendo en la actualidad uno de los principales
recursos, siempre y cuando lo permitan los objetos a digitalizar. A pesar del amplio
surtido que el mercado tecnológico nos ofrece para realizar el proceso de digitalización,
con modelos muy avanzados, la intervención humana todavía no es sustituible. Por ello
resulta prácticamente imprescindible conocer en cierta profundidad la herramienta a
utilizar para aprovechar al máximo las posibilidades que ésta nos ofrece, y saber
seleccionar en cada momento la mejor opción.
2. Escáneres
2.1. Introducción
El escáner1 es considerado el periférico de entrada por excelencia, pues permite la
captura de imágenes y textos desde un medio físico (como páginas de un libro o
fotografías) y su posterior conversión a un formato digital para ser visualizados o
manipulado desde un ordenador.
1. Superficie de escaneado
2. Tapa
3. Cabezal de lectura en operación de
reposo
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
2.2. Cómo funciona un escáner
El funcionamiento del escáner se basa en el principio de la transferencia de luz2, bien
por transmisión o por reflexión, y varía ligeramente dependiendo de la tecnología que se
utilice, CCD o CIS.:
2
Para comprender mejor estas propiedades de la luz, se recomienda leer la siguiente documentación:
http://www.aulafacil.com/cursos-fotografia/fotografia-iluminacion/curso/Lecc-8.htm
3
Inventado en 1969 en los laboratorios Bell por George Smith y Willard Boyle, lo que les valió el premio
Nobel de Física en 2009
4
Los píxeles son las unidades de color que forman una imagen digital, cada píxel se codifica en bits, por
lo tanto si una imagen es de 1bit, sus píxeles sólo podrán ser blancos o negros (0 o 1). Lo más común son
imágenes con los píxeles codificados en 8 bit (28 = 256 posibilidades de color en cada píxel, desde 0 hasta
255) en cada uno de sus tres canales rojo, verde y azul (RGB), siendo el negro absoluto un 0 para cada
color primario y el blanco absoluto un 255 para cada color primario.
6
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
○ Los CCD matriciales consisten en miles de fotodetectores
organizados en filas y columnas, formando una malla. Todos los puntos de la
matriz reciben la luz al mismo tiempo, por lo que no es necesario realizar un
barrido de la imagen
A continuación detallamos los pasos que se siguen al realizar una digitalización con un
escáner de tecnología CCD:
5
En algunos escáneres se utiliza un sistema de dos espejos, mientras que en otros se utilizan tres.
7
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
sobre una lente, que finalmente enfoca el haz a través de un filtro hacia el
dispositivo capturador CCD.
b) Dependiendo del modelo, existen dos formas de adquisición:
i) De una sola pasada (el más utilizado actualmente): que se caracterizan por
ser más rápidos y conseguir una iluminación más uniforme, que da lugar a
colores más reales y parecidos al original, y donde distinguimos dos
tipologías:
(1) Una única fuente de luz junto a un dispositivo CCD de color que captura
los colores rojo, verde y azul: La luz se divide mediante un prisma en
tres haces de luz, uno por cada color primario, que serán proyectados al
dispositivo capturador CCD. El CCD lineal está formado por tres filas de
fotosensores, cada fila con su propio filtro para procesar cada uno de los
colores primarios. Este tipo de escáneres realiza el proceso de una forma
más rápida.
(2) Tres focos independientes que se encienden para cada línea, junto a un
dispositivo CCD monocromático, lo que deriva en una velocidad de
escaneo menor y resultados pobres al digitalizar superficies no planas.
ii) De tres pasadas: similar a los tres focos independientes en los escáneres de
una pasada, pero en este caso, se realiza una pasada por cada color primario.
La descomposición de la luz se hace a través de tres filtros, que dejan pasar
únicamente el color primario que corresponda a la pasada. Entre la lente y el
sensor CCD6 se ubica un filtro, que sólo podrá atravesar el haz de luz del
color primario que corresponda en cada pasada. Al igual que en los
escáneres de una sola pasada, las tres versiones de la imagen se unifican para
generar la imagen final.
c) Como mencionamos anteriormente, el CCD genera señales eléctricas de distinta
potencia ante las intensidades de luz recibidas. Dichas tensiones eléctricas, de
carácter analógico, se transforman mediante un conversor a formato digital, para
6
Otra posibilidad es el uso de tres fuentes de luz distintas, una por color primario, que se utilizarán en
cada una de las pasadas.
8
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
poder ser interpretadas por un sistema informático. Según el tipo de conversor
utilizado, el valor de salida tendrá un número específico de bits7 que serán los
que indiquen la profundidad de color del escáner. Por ejemplo, si el conversor
soporta hasta 12 bits, la paleta de colores que podrá ofrecer el escáner será de 36
bits (12 multiplicado por los tres canales de color primarios), ya que cada uno de
los píxeles o puntos que componen la imagen está compuesto por la mezcla de
tres puntos (rojo, verde y azul), y el conversor tendrá que ser utilizado tres veces
por cada pixel.
● Escáner con tecnología CIS (Contact Image Sensor, Sensor de Imagen por
contacto): su funcionamiento es más simple que los escáneres CCD, pues prescinden
de espejos o filtros, por lo que resultan más baratos y ligeros que éstos, aunque no
ofrecen el mismo nivel de calidad y resolución. Se basan en que los sensores estén
ubicados extremadamente cerca del original a digitalizar, por lo que se prescinde de la
profundidad de campo, y todo aquello que no esté en contacto con la superficie de
cristal es demasiado distante para poder ser escaneado con nitidez (esto hace a los
escáneres CIS inapropiados para escanear objetos tridimensionales).
En este caso, el funcionamiento de este tipo de escáneres consta de los siguientes pasos:
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
intensidad. Dichas tensiones eléctricas, de carácter analógico, se transforman
mediante un conversor a formato digital, de manera que puedan ser interpretadas
finalmente por un sistema informático.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
detalles en las áreas oscuras y en las leves transiciones de color, realizar
escaneados de originales con gran calidad de color (como, por ejemplo,
originales fotográficos de gran tamaño para los que se quiera preservar la
riqueza cromática), o mejorar los resultados en fotografías con una mala
exposición, en las que sea necesario rectificar gamma, brillo o contraste.
● Además, muchos documentos de gran formato que necesitan ser digitalizados no
están en perfectas condiciones. Muchos están doblados, arrugados, o simplemente,
curvados por permanecer almacenados en rollos. Estos desperfectos puede resultar un
problema para cualquier escáner en gran formato, pero es casi imposible para cualquier
escáner basado en la tecnología CIS:
○ Las marcas de los dobleces son claramente identificables en el
escaneado con tecnología CIS, como consecuencia de una fuente de luz LED
débil.
○ La información en las áreas dobladas o de zonas cercanas al lomo
de un libro queda borrosa a consecuencia del enfoque corto del sistema de lentes
de CIS.
CIS CCD
Sensor con luz y ópticas integradas. Sensor con lámpara y lentes separadas.
Lentes de varas de cristal de enfoque Lentes de cámara de alta calidad.
reducido. Lámpara fluorescente de color exacto.
Iluminación LED RGB. Ratio excelente señal/ruido.
Ratio pobre señal/ruido. Captura RGB + sensor monocromo
Captura de color de 24 bits y de grises dedicado.
en 8 bits. Mejores resultados en cuanto a rango
Consumen menos energía (debido a dinámico y respeto por los colores
los LED) (debido a la fuente de iluminación)
Escáneres más pequeños y ligeros
Costes de producción inferiores (el
cabezal lector es más simple que el de
un escáner CCD)
Tabla 1: Diferencias entre los sensores CIS y CCD
9
El concepto de resolución puede resultar algo confuso, pues éste depende del medio sobre el que
estamos trabajando: resolución de una fotografía digital, de impresión, de escaneado, en monitores y
11
cámaras digitales, etc. Para aclarar este tema, se recomienda la lectura de los siguientes artículos:
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
aplicarse a medios impresos, aunque también es utilizada
para este tipo de dispositivos. La resolución es la capacidad
de un escáner para leer o distinguir la información o pixeles
que forman un documento.
La máxima resolución alcanzable por el escáner
determinará la máxima calidad10 con la que se podrá
digitalizar, pues mayor será el número de muestras tomadas
del original. Esta medida viene determinada en puntos por
pulgada (ppp) o dots per inch (dpi)11, y suele presentarse
con el formato [número]x[número]. Por ejemplo, un escáner
con resolución 600x1200ppp, nos indica que:
http://www.xatakafoto.com/guias/pixeles-y-puntos-por-pulgada
http://www.fotoenclave.com/2012/72-o-300-p-p-p-la-guerra-de-los-puntos-por-pulgada/
http://www.efectohd.com/2008/01/resolucin-de-vdeo-72-ppp.html
10
En la calidad final de la imagen influyen otros factores como el ruido del escáner, destellos, una
conversión defectuosa de analógico a digital, arañazos, polvo, anillos de Newton, sensores desenfocados,
software poco apropiado o una parametrización inapropiada del proceso de escaneo.
11
Un negativo fotográfico puede llegar a tener, aproximadamente, unos 4000 ppp, mientras que una
fotografía en papel no sobrepasa generalmente los 400 ppp (siempre en relación a su tamaño original).
12
Las fotografías digitales tienen la misma resolución en ambas direcciones, horizontal y vertical, como
12
por ejemplo 300x300 dpi, habitualmente denominada 300 dpi. Si tratamos de escanear una diapositiva a
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
En este caso hemos hablado de la resolución óptica o real, la máxima resolución que
puede alcanzar el escáner sin realizar ningún tipo de tratamiento software sobre la
información digitalizada13. Pero existe además el concepto de resolución interpolada,
que surge al digitalizar a una resolución mayor que la óptica. Este tipo de resolución no
aporta información real nueva y se consigue a partir del tratamiento software sobre la
información digitalizada con la máxima resolución óptica. Dicho tratamiento consiste
en obtener más pixeles a partir del promedio de color de los pixeles “reales”
circundantes. En el ejemplo que estamos utilizando, si la resolución óptica es de 600
ppp y la interpolada fuese de 1200ppp, el software estaría añadiendo un pixel entre cada
uno de los escaneados por el sensor CCD. Esto puede implicar la pérdida de la
fidelidad o de la realidad de la imagen, lo cual es especialmente crítico en casos como
digitalizaciones para fines científicos, donde se estarían generando pixeles que no
representasen datos reales y que podrían llevar a cálculos o interpretaciones erróneas de
la imagen. Por motivos de marketing, los fabricantes suelen hacer referencia a la
resolución interpolada en lugar de a la óptica, pues la primera siempre tiene valores
superiores.
2400 dpi usando un escáner de 1200x2400 dpi, el cabezal de escaneado puede avanzar a 2400 dpi de
manera vertical. Sin embargo, todas las muestras se superpondrán verticalmente, pues los sensores CCD
que dan la resolución óptica de 1200 dpi, son dos veces mayores que 1/2400 pulgada.
Horizontalmente, el sensor CCD solo puede tomar muestras a 1200 dpi, pero como nuestras imágenes
deben tener resolución "cuadrada", el software interpola de manera horizontal para crear la imagen
2400x2400 dpi. Hay que tener en cuenta que esta técnica no nos proporciona la misma calidad que una
digitalización con una resolución óptica de 2400 dpi.
13
Algunos escáneres tienen una función de optimización de píxeles, de tal forma que utilizan la
resolución total del CCD del escáner, incluso al escanear con resoluciones inferiores. Por ejemplo, al
escanear a 300ppp utiliza los 600ppp para procesar la imagen y luego promedia los datos para generar la
13
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Tamaño de impresión
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
fichero con un peso excesivo en megabytes (MB). Es aquí donde interviene el formato
elegido para guardar la imagen (tema que trataremos en profundidad más adelante): el
peso en MB puede reducirse utilizando un método de compresión con pérdida como
JPEG, pero que repercute en la calidad final de la imagen. Formatos de este tipo son los
adecuados para copias de acceso de la imagen digitalizada, como por ejemplo para su
difusión a través de Internet. Si es necesaria la máxima calidad en la imagen, como al
generar una copia maestra de nuestro original digitalizado, debe utilizarse una
compresión sin pérdida como TIFF.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
● Rango dinámico: Es el
total de variaciones tonales (desde
el más claro de los claros - valor
conocido como densidad mínima
o Dmin- hasta el más oscuro de
los negros - o densidad máxima,
Dmax) que puede adquirir el
escáner. Esta medida se obtiene a
partir del brillo de una imagen,
utilizando densitómetros
14
ópticos , donde los posibles
valores oscilan entre el 0.0
(blanco puro) y el 4.0 (negro Ilustración 7: Profundidad de color (fuente: fotonostra.com)
total), por lo que deducimos que
a mayor densidad, menor brillo. La densidad se mide en una escala logarítmica (similar
a la escala Richter para los terremotos), donde, por ejemplo, una densidad de 3.0 es 10
veces mayor que una densidad de 2.0.
Es una medida especialmente importante para aquellos trabajos en los que están
implicados medios transparentes, como diapositivas, transparencias y negativos15, pues
permite capturar más detalles en las sombras de una transparencia y en las zonas
brillantes de un negativos. Un
dispositivo de bajo rango
dinámico convierte a negro los
colores que están en las partes
oscuras de la imagen, provocando
una pérdida de detalle importante.
Por tanto, un escáner debería tener
un rango dinámico superior al
material fotográfico que se quiere
digitalizar, para asegurar que se
registre con fidelidad todo el
detalle del original:
○ Los escáneres
Ilustración 8: La imagen de la derecha se ha obtenido planos domésticos tienen un rango
mediante un escáner con alto rango dinámico (fuente:
dinámico comprendido entre 2.5 y
photo.net)
3.0, una medida suficiente para
14
Véase http://es.wikipedia.org/wiki/Densitómetro
15
Esta medida está condicionada por la profundidad de bits, pues cuanto mayor sea esta medida, se
dispondrán de más bits para almacenar más tonos (lo que nos permitiría obtener un mayor rango
16
dinámico, aunque no se garantiza que exista) y con la calidad de los sensores CCD.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
papeles fotográficos (de 2.2d a 2.5d) y papeles de acabado mate y con textura
(que no llegan a 2d), pero algo limitado para negativos, con un rango dinámico
de 3.0d
○ Los escáneres profesionales pueden llegar hasta 3.7d
○ Los de tambor oscilan entre los 3.6d y 4.5d, lo que los convierten
en apropiados para transparencias, con un rango dinámico de 4.0d.
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
instalada son la conexión directa del dispositivo a una red de área local (cableada o a
través de WI-FI) o la creación de un servidor de escaneo, al compartir un escáner
conectado directamente a un equipo miembro de una red.
● Tipo de carga: Algunos escáneres cargan de forma automática los originales a
digitalizar, liberando al usuario de la tediosa tarea de tener que introducir el documento
y esperar a su finalización para introducir el siguiente. Esto puede ser muy útil en tareas
donde se producen muchas digitalizaciones de forma sistemática (como en entornos
empresariales o corporativos), pero desaconsejable para originales frágiles o en malas
condiciones (algo frecuente en la digitalización de patrimonio cultural) por el
tratamiento mecánico que reciben, bien mediante rodillos o por “aspiración”, y que
podrían dañarlos irreversiblemente.
● Enfoque: esta característica depende principalmente de la calidad de la óptica
utilizada en la lente y del brillo de la fuente de luz. Una lámpara brillante de xenon
junto a una lente de alta calidad darán lugar a una imagen digital mucho más clara y
nítida que la obtenida con una lámpara estándar fluorescente y una lente básica.
Algunos aspectos que influyen en las lentes son:
○ Material de la lente, siendo altamente recomendable el cristal,
pues refleja mejor la luz y proporciona una mayor calidad de imagen que el
plástico.
○ Alineación precisa.
○ Método de enfoque:
■ Enfoque fijo, la lente se configura en base a una
distancia fija, que es la que separa la propia lente de la superficie de
escaneo.
■ Autoenfoque, para equipos de gama alta y que
ofrece buenos resultados en objetos tridimensionales (para capturar con
mayor nitidez los objetos situados al fondo) y transparencias (para
compensar la distancia entre el vidrio y la diapositiva).
● Software de captura: Los fabricantes suelen incluir un software o programa
que nos permite controlar el periférico y personalizar el proceso de digitalización según
el rol del usuario:
○ Para usuarios principiantes se ofrece previsualización,
reconocimiento automático del tipo de documento y optimización automática de
las imágenes digitales.
○ Para usuarios intermedios se permite tanto la elección de
funciones automatizadas como la configuración a medida de algunos aspectos:
ajuste de brillo y contraste, resolución, ubicación del fichero generado,
restauración de color, etc.
○ Para usuarios avanzados, se ofrece un control prácticamente total
sobre aspectos sofisticados del escaneo, como el ajuste tonal, la corrección de
gamma, el perfil de color, etc.
18
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Citamos a continuación los parámetros que se suelen configurar con mayor frecuencia
en los software de escaneo:
○ resolución
○ profundidad de color
○ escaneo en color o monocromo
○ formato del documento en el que se exportará la imagen digital:
TIFF, JPG, BMP, PDF, etc.
○ ubicación y nombre de los documentos digitales generados
○ en caso de escanear un documento de texto, uso de la tecnología
OCR (que veremos más adelante)
○ aplicar tareas básicas de tratamiento digital de imágenes como
recortar, girar, redimensionar, etc.
Escáner plano
Es el tradicional escáner de sobremesa, cuyo funcionamiento se asemeja al de una
fotocopiadora y que ofrece sus mejores resultados al digitalizar documentos opacos
como fotografías, ilustraciones, páginas de un libro o de revista, etc. La lectura de la
información del documento se realiza por el desplazamiento de la lámpara (barrido),
ubicado bajo una superficie de cristal sobre la que se apoya el original. Con una buena
relación calidad/precio, se trata de un periférico rápido y fácil de manejar, con
resoluciones ópticas medias (p.ej. 2400 dpi) y calidades aceptables.
El área de digitalización suele ser la correspondiente a un A4 (210x297.4 mm), aunque
también hay escáneres planos que admiten A3 (297x420 mm). Admite documentación
que no puede ser procesada de forma masiva a través de alimentadores automáticos
(debido a las condiciones físicas del original, que podría resultar dañado por los
rodillos), aunque algunos incluyen alimentadores como complementos orientados para
la carga de documentos (pero no a fotografías).
18
Los escáneres que aparecen en las ilustraciones se utilizan a modo de ejemplo, en ningún caso se
19
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
También se pueden incluir adaptadores y
soportes para escanear transparencias,
diapositivas y negativos, que consisten en un
marco que fija la película a presión por los
bordes y que evita que los originales estén en
contacto con la superficie de cristal y se
formen los denominados anillos de Newton19.
Hay que reseñar que algunos modelos
avanzados permiten configurar incluso la
distancia de enfoque de la lente para
compensar esta ligera separación entre el
Ilustración 9: Escáner plano Epson V500 vidrio y el soporte. Sin embargo, y a pesar de
Office con complemento para diapositivas estos complementos específicos, los
y negativos
resultados no son satisfactorios, pues
normalmente estos tipos de escáneres no disponen de la suficiente resolución óptica ni
rango dinámico.
Este modelo de escáneres tampoco resulta adecuado para digitalizar libros, pues el área
cercana al lomo suele aparecer distorsionada y sombreada al no estar completamente
apoyada sobre el cristal.
newton.html
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
alimentación automática.
Escáner de mano
Este modelo de escáneres no es
habitual en digitalización profesional
pues ofrece resultados de calidad
inferior a otros de sobremesa. Incluso
una cámara digital con una buena
lente de aproximación resulta más
adecuada que este escáner para
obtener resultados de calidad. Al ser
manejado manualmente por el usuario,
depende de un pulso firme y una
velocidad constante para digitalizar,
pues si la velocidad sufre variaciones,
el resultado es una imagen Ilustración 11: Versión actual de un escáner de
mano
distorsionada20. Además, la velocidad
de desplazamiento del escáner está directamente relacionada con la resolución deseada,
pues a mayor resolución, mayor lentitud en la exploración.
El clásico escáner de mano, con una apariencia similar a la de un lector de código de
barras, fue muy popular durante la década de los 90, aunque sus limitadas posibilidades
hicieron que cayera en desuso. Algunos de sus inconvenientes eran la digitalización
exclusivamente en blanco y negro, y que sólo permitía escanear pequeñas áreas,
obligando a repetir el proceso en caso de querer escanear un documento completo,
teniendo que unir después las distintas partes con un programa de edición gráfica.
Escáner portátil
Este tipo de dispositivos basados en la tecnología CIS, junto a las versiones actuales de
los escáneres de mano, son muy fáciles de transportar debido a su poco peso. En
principio, surgen para intentar dar solución a situaciones en las que se requieren
digitalizaciones “urgentes” de cierta calidad de documentos como recibos, tarjetas de
visita, contratos, informes, etc. Se trata de unos periféricos totalmente autónomos, pues
no necesitan estar conectados a un ordenador para transferir la información, ya que
pueden almacenar directamente los documentos digitales en tarjetas de memoria,
transferirlos de manera inalámbrica a dispositivos móviles o almacenamientos en la
nube (Google Drive, Dropbox, etc.) o enviarlos a través de e-mail. Además, tampoco
20
Habitualmente, estos escáneres disponen de un indicador luminoso que advierte si la exploración se
realizó demasiado rápido. Además, emiten una señal de reloj que permite su sincronización con el
21
ordenador.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
requieren de conexión a la red eléctrica, ya
que suelen incluir su propia batería, o se
alimentan a través del puerto USB.
Habitualmente las mayores dimensiones del
original que admiten son las de un A4.
La diferencia con los escáneres genéricos radica en su diseño especial para tipos
concretos de originales, además de la inclusión de otras características avanzadas como
21
Este hecho influye en la reducción de costes de mantenimiento pues las piezas móviles pueden
22
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
sistemas de eliminación de ruido electrónico, alto rango
dinámico y altos niveles de resolución.
Escáner de tambor
Son los escáneres con mayor resolución óptica del
mercado, llegando a alcanzar hasta los 24.000 ppi,
aunque esto repercute en la lentitud para efectuar el
proceso de escaneado22. Debido a su elevado precio,
están reservados a profesionales de la digitalización o de
las artes gráficas (laboratorios, imprentas, editoriales,
etc.). En la actualidad, pocas compañías fabrican ya
Ilustración 14: Transparencias
escáneres de tambor, aunque estos modelos conservan su adheridas al tambor de un
nicho de mercado dentro de un público profesional, dados escáner (fuente:
candelafineart.com)
los excelentes resultados obtenidos.
Este escáner está especialmente indicado para originales transparentes, aunque también
permite el escaneo de originales opacos, siempre que puedan curvarse sobre el tambor
(por lo que se desaconseja su uso para documentos frágiles).
En este tipo de periféricos, el sistema consiste en un tambor de cristal de gran pureza, al
cual se adhiere el original. En el caso de las transparencias, se añade un aceite especial
para evitar el efecto de anillos de
Newton. Así, este tambor gira a gran
velocidad a la vez que una fuente de
luz externa incide sobre el original (si
el documento es opaco), o a través de
él (si es transparente, ubicándose
entonces la fuente de luz dentro del
tambor de cristal). La luz es recogida
por unas lentes de precisión que la
redirigen hacia los sensores de tipo
PMT (foto-multiplicadores)23. Se
trata de unos tubos de vacío, muy
Ilustración 15: Escáner de tambor Howtek HiResolve
sensibles a intensidades bajas de luz,
8000 (fuente: candelafineart.com)
que convierten la luz en energía y la
amplifican. En los modelos recientes se usan 3 tubos foto-multiplicadores, encargados
de tratar los haces de luz de color rojo, verde y azul (una lente ha separado previamente
la luz recibida en los tres colores primarios). Por último, las señales eléctricas serán
transformadas en señales digitales.
22
En la siguiente web se detalla el funcionamiento de este tipo de escáner:
http://recursos.cnice.mec.es/fp/artes/ut.php?familia_id=5&ciclo_id=1&modulo_id=2&unidad_id=118&m
enu_id=1410&pagina=&pagestoyen=11&submenu_id=655&ncab=4.1.2&contadort=10
23
23
En algunos escáner de tambor se utiliza la tecnología CCD en lugar del PMT.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Escáner de planos
También conocido como escáner
de gran formato, es el tipo más
adecuado para la digitalización de
material planimétrico, cartográfico,
etc. Está especialmente diseñado
para digitalizar documentos de
gran formato en una toma digital
única, ya que en otro tipo de
escáneres el usuario debería de
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Su ámbito de uso se extiende, generalmente, a los siguientes materiales24:
● Microfilms
● Microfichas de 105 mm
● Películas de 16 y 35 mm
● Tarjetas de apertura25 (habituales en trabajos de ingeniería)
● Jackets26
Escáner cenital
Se utiliza para la digitalización de
material deteriorado, delicado o antiguo
(libros, manuscritos, mapas, periódicos,
etc.), para los que el proceso de escaneo
debe realizarse con el mínimo contacto
posible con el original27.
Básicamente, la estructura de estos
escáneres consiste en dos lámparas
laterales de luz “fría” y un brazo central,
donde se ubica una cámara de alta
resolución que efectúa una trayectoria
aérea sobre el original, para capturar
imágenes del mismo. El documento que
se quiere escanear se ubica a cierta Ilustración 18: Escáner cenital I2S Suprascan
distancia de la cámara, teniendo en Quartz
cuenta algunas consideraciones como:
● En caso de digitalizar un documento plano o un libro que pueda abrirse
completamente se acomoda un cristal o plástico que alisa las páginas.
● Si el ejemplar es antiguo y puede dañarse el lomo, no es necesario abrir
completamente el libro para su escaneado. Para ello, ubicaremos el libro en un atril
especial, lo que nos permitirá abrir el original en diferentes ángulos.
La intervención del usuario se limita a ir pasando las páginas del libro, aunque se han
desarrollado prototipos que emplean técnicas como la aspiración y la electricidad
estática para manejar las páginas de manera automática.
24
Documento elaborado por el South Carolina Department of Archives and History sobre los distintos
tipos de microfilm existentes: http://rm.sc.gov/leaflets/Documents/SEVEN.pdf
25
http://es.wikipedia.org/wiki/Tarjeta_perforada
26
http://upload.wikimedia.org/wikipedia/commons/e/e4/Microfiche_card.JPG
27
Dado el elevado precio de este tipo de escáneres, a continuación se adjuntan unos enlaces con
instrucciones para fabricar nuestro propio escáner de libros:
http://www.muycomputer.com/2009/12/14/actualidadnoticiasescanea-tus-
libros_we9erk2xxdbvemqw0zny9c9wocpjnhqqyroxpvszgv3uyfsd1ewtiwremm5x9wdc
25
27
http://derechoaleer.org/blog/2011/08/nuestro-do-it-yourself-book-scanner.html
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Algunos problemas frecuentes que
podemos encontrar a la hora de digitalizar
libros pueden solucionarse con las
características específicas de este tipo de
escáneres. Por ejemplo, los casos
siguientes:
● Sombras en las áreas cercanas al
lomo del libro: la mayoría de modelos
disponen de un sistema de balance por
Ilustración 19: Atril para mantener el libro hardware (mediante calibración de la
abierto a 120º iluminación y el cabezal óptico) para evitar
este problema.
● Distorsión de los caracteres cercanos al lomo cuando el libro está abierto
completamente: para solucionar esto, se puede utilizar el atril con un determinado
ángulo de apertura, y la cámara se ubicará de manera perpendicular respecto al
documento.
● Corrección de curvatura de las páginas en trabajos encuadernados, mediante el
uso del cristal que alisa la página o por procesamiento con software, que aplana la
imagen y “endereza” las líneas del texto.
● Eliminación del dedo del operario que sujeta la página o documento: también
mediante el cristal que alisa la página o bien, eliminado automáticamente mediante
software.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
impresión de 8x10 pulgadas (20.32x25.4 cm), es decir, un aumento de 9x.
Los formatos aceptados van desde el 35 mm. hasta placas de 9x12 cm, aunque también
existen escáneres multiformato que admiten todas las medidas (placas 4”x5”, 5”x7”,
etc.).
Este tipo de escáneres disponen de una serie de sistemas para solucionar algunos
problemas frecuentes en la digitalización de originales transparentes. Es el caso de:
28
Esta técnica no es aplicable a documentos opacos ni a todos los medios transparentes. Por ejemplo, las
partículas de una película de haluro de plata en blanco y negro también bloquean la luz infrarroja, por lo
que no es posible distinguir entre píxeles oscuros e imperfecciones.
27
29
http://es.wikipedia.org/wiki/Restauraci%C3%B3n_de_imagen
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Ilustración 21: Resultado al aplicar la tecnología ICE (fuente: asf.com)
● Reducción del grano en la imagen, habituales en fotografías tomadas con una
ISO alta (la que permite obtener mejores imágenes en situaciones con iluminación
deficiente), mediante el sistema software GEM. Esta metodología realiza análisis
matemáticos a partir de los diferentes colores de la imagen, para así obtener un patrón
sobre el ruido, lo que permitirá eliminarlo posteriormente. Es una técnica más efectiva y
que permite conservar más detalles (como colores, nitidez, variaciones tonales, etc) que
la reducción de ruido que habitualmente soportan los programas de edición gráfica.
uniforme, sino que afecta de distinta manera a zonas brillantes y a zonas de sombras.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
niveles o curvas de color de la imagen digital.
Escáner de documentos
Aunque el escaneado de documentación en texto (esto es, con unas necesidades
diferentes al de imágenes) se puede realizar con dispositivos genéricos, en
digitalizaciones masivas resulta más apropiado y eficiente utilizar un periférico especial,
con una serie de características concretas para este tipo de originales. Así, podemos
destacar:
● Mayor velocidad: de 20 a 150 páginas por minuto, habitualmente en escala de
grises, aunque en algunos modelos se permite el color (lo que no repercute en la
velocidad).
● Volúmenes diarios de trabajo: se trata de un factor esencial en digitalizaciones
de grandes volúmenes de documentación, siempre que se utilicen sistemas de
alimentación automática para no dañar el original. Pueden oscilar entre las 1000 y
15.000 páginas diarias. De esta característica, directamente relacionada con la velocidad
de escaneo, dependerá el tiempo efectivo de trabajo al día.
● Manejo de las hojas: para ello, suelen incorporar las siguientes características:
○ Posibilitan el escaneo a doble cara;
○ Poseen bandejas de alimentación de mayor capacidad (del orden
de 500 páginas) que las de escáneres genéricos o copiadoras;
○ Aceptan varios formatos y grosores de documento;
○ Incorporan sistemas de detección de elementos como clips, grapas
o ganchos, y de “doble alimentación” del escáner (en este caso, el alimentador
29
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Sin embargo, estas funcionalidades no evitan la intervención humana para optimizar y
agilizar la automatización del proceso, principalmente en la preparación (eliminando
dobleces o grapas que puedan atascar el escáner) y en la ordenación del material a
escanear. Para la posterior indexación de los archivos digitales, se puede hacer uso de
técnicas como la numeración Bates31 (habitual en entornos médicos y legales) o el
reconocimiento de códigos de barras que han sido asignados a los originales.
● Resolución: comprendida entre los 150 y los 300 ppp, lo que permite generar
documentos digitales con la suficiente calidad para su visualización y posterior
tratamiento OCR (reconocimiento óptico de caracteres).
● Formato: los
documentos digitales
generados, compuestos por
caracteres en negro sobre
fondo blanco, permiten su
almacenamiento en formato
TIFF sin pérdida de calidad,
pues la escasa gama de
colores genera archivos de
poco tamaño. Además, otros
formatos con pérdida como
JPEG, que resultan adecuados
para fotos, afectan
negativamente a los textos, al
dar, por ejemplo, un aspecto
Ilustración 24: Escáner para documentos Canon DR-X10CZ irregular a los bordes de los
caracteres.
31
Véase: http://www.ehowenespanol.com/son-numeros-bates-info_205985/
32
Una interfaz es básicamente un elemento que permite la comunicación e intercambio de datos entre
30
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
2. Localizar y abrir la aplicación proporcionada por el fabricante del
dispositivo para iniciar la digitalización.
3. Configurar las opciones del escaneo, como resolución, gama de colores,
etc.
4. Generar y guardar la imagen digital obtenida a partir del original.
5. Cerrar la aplicación del escáner.
6. Abrir el programa para el tratamiento de imágenes.
7. Localizar y abrir el fichero en dicho programa.
El primer paso fue entonces el desarrollo por parte de fabricantes de hardware y
software de sus propias interfaces para la adquisición de imágenes digitales. Pero dado
el creciente número, tanto de dispositivos existentes como de software de edición de
imágenes digitales, y para evitar el desarrollo de drivers33 específicos para cada
combinación entre un modelo y una aplicación software, surgió la necesidad de un
estándar que permitiese conectar, de manera universal, aplicaciones con dispositivos
digitalizadores. De esta forma, un desarrollador de software únicamente debe programar
su aplicación de acuerdo a dicho estándar, mientras que el fabricante de hardware creará
para su dispositivo un driver también compatible con el estándar.
Estos estándares para API’s34 y protocolos de comunicación (como es el caso de
TWAIN) deben cumplir una serie de objetivos: ser multiplataforma (funcionar en
diferentes sistemas operativos), soportar múltiples dispositivos (como escáneres
manuales, de sobremesa, cámaras digitales), estar preparados para cambios tecnológicos
futuros y permitir el intercambio de datos en una amplia variedad de formatos.
El funcionamiento de estos estándares se basa en que el driver del escáner transforma
los comandos ejecutados desde la aplicación (como iniciar un escaneo, o digitalizar en
monocromo o a una determinada resolución), en comandos hardware entendibles por el
periférico, y, además, permite al programa recuperar adecuadamente las imágenes
digitalizadas. Por ejemplo, el programa de tratamiento de imágenes Adobe Photoshop
soporta el estándar TWAIN, por lo que Photoshop puede adquirir una imagen de
cualquier escáner que incorpore un driver compatible con dicho estándar. Sin embargo,
cada fabricante, e incluso cada modelo, dispone de su propio driver basado en el
estándar, por lo que no todos los dispositivos permiten las mismas opciones. Resulta,
pues, muy interesante que el driver incluya el mayor número de opciones que nos
permitan parametrizar el proceso de digitalización, esto incluye a factores como:
● Resolución (ppp / dpi)
● Tipo de imagen: color, escala de grises, blanco y negro, line art.
● Brillo y contraste.
● Digitalización previa: nos permite seleccionar el área a digitalizar y es
33
Un driver es un programa que actúa como controlador de un dispositivo, permitiendo la comunicación
entre un ordenador y un periférico.
34
API es la abreviatura de Application Programming Interface. Un API es una serie de procedimientos,
servicios o funciones ofrecidos para realizar una determinada acción, como, por ejemplo, imprimir un
31
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
especialmente importante si queremos digitalizar un área pequeña a muy alta
resolución para así ahorrar tiempo.
● Control de gama de color.
● Filtros: difuminado, aclarado, resaltado de bordes, etc.
● Operaciones básicas en el tratamiento de imágenes digitales, como rotar,
invertir, cortar o redimensionar la imagen.
● Técnicas más avanzadas para la mejora35 de la imagen digital, como:
○ Eliminación de muaré (descreening)
○ Eliminación de grano (despeckling)
○ Enderezamiento de la imagen (deskewing)
○ Aumento de nitidez (sharpening)
○ Ajuste de profundidad de bits.
35
La mejora del documento digitalizado mediante software genera controversia acerca de la fidelidad y
autenticidad respecto al original, por lo que muchas instituciones no aplican estas mejoras sobre los
32
originales y las limitan a las versiones que serán difundidas, por ejemplo, mediante página Web.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
El estándar TWAIN36 es el más usado por la mayoría de escáneres (aunque inicialmente
estaba orientado a dispositivos básicos y domésticos), y está disponible para los
sistemas operativos Windows, Mac OS y Linux. Fue creado por el Twain Working
Group, un consorcio de empresas desarrolladoras de software y fabricantes de hardware
(formado en sus inicios por Adobe, Caere, Eastman Kodak, Hewlett Packard y
Logitech), y su primera versión se lanzó en febrero de 1992, hasta llegar a la actual 2.2.,
de febrero de 2012.
Otros ejemplos de API’s que podemos encontrar para escáneres son los siguientes:
● SANE37 (Scanner Access Now Easy) es un proyecto de software libre de API
para acceso a los escáneres. Habitualmente utilizado en sistemas operativos Unix y
Linux, existen versiones disponibles para OS/2, Mac OS X y Windows. Al contrario
que TWAIN, en SANE están claramente diferenciados el frontend (programas que
maneja el usuario) y el backend (drivers del escáner). SANE se centra en la
comunicación con el hardware, lo que facilita los escaneos dentro de una red local o en
digitalizaciones masivas.
● ISIS (Image and Scanner Interface Specification), creado por la compañía Pixel
Translations en 1990 (actualmente EMC captiva). Sigue utilizando la interfaz de
conexión SCSI-II por razones de rendimiento, y es usado, principalmente, en
digitalizaciones a gran escala o en aquellas que requieren tareas desarrolladas a medida,
pues facilita la programación para manejar todo tipo de características, operaciones y
formatos.
● WIA38 (Windows Image Acquisition) es una API desarrollada por Microsoft para
su uso en el S.O. Windows desde su versión Me (Millenium). WIA amplía las
funcionalidades ofrecidas por STI (Still Image Architecture) en Windows 98. Mientras
que STI se limitaba a la transferencia básica de datos desde/hacia el escáner, WIA es
más cercana al estándar TWAIN, y permite que una aplicación tenga acceso
prácticamente total a las posibilidades ofrecidas por el escáner.
36
http://www.twain.org/. Habitualmente se dice que TWAIN es el acrónimo de “Technology Without An
Interesting Name” (tecnología sin un nombre interesante), aunque en realidad procede del poema de
Rudyard Kypling, La Balada del Este y el Oeste: “... and never the twain shall meet” (y nunca los dos se
encontrarán), que trata de reflejar la dificultad de conectar escáneres y ordenadores personales.
37
http://www.sane-project.org/
33
38
http://msdn.microsoft.com/en-us/library/windows/desktop/ms630368(v=vs.85).aspx
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
reconocimiento de caracteres que permite identificar los símbolos de un determinado
alfabeto dentro de una imagen digital (en formato BMP, TIFF, JPG, PNG, etc), para
generar así un fichero de texto editable y comprensible por el ordenador (en formato
DOC, RTF, XLS, HTML, etc). El archivo resultante permitirá ser reformateado, realizar
búsquedas sobre el documento completo, facilitará su difusión online e incluso su
procesamiento a través de lenguajes de marcado como XML. Algunos ejemplos de este
tipo de software son:
● Read-Iris: http://www.readiris.com/
● Omnipage: http://www.omnipage.com/
● Fine-Reader: http://www.finereader.com/
Este sistema permite
automatizar la generación de
archivos textuales, evitando
introducir la información por
teclado (el OCR puede
alcanzar una velocidad de
lectura de hasta 1.200
caracteres por segundo), lo
que supone un importante
ahorro en tiempo, pero
también en consumo de
memoria, pues el espacio de
almacenamiento que requiere
una imagen digital es 3 veces
Ilustración 26: Captura de pantalla del software OCR ABBYY
mayor al de un documento de FineReader.
texto.
Las versiones actuales de este software permiten reconocer un elevado número de
tipografías y de sistemas de escritura (cirílico, árabe, hebreo, hindú, chino, japonés o
coreano) con un alto porcentaje de acierto, además de intentar respetar al máximo el
formato original del documento en lo que a imágenes, columnas y otros elementos no
textuales se refiere. Algunos software OCR incluso facilitan una versión “Narrador”,
capaz de leer en voz alta el documento escaneado, una función muy útil para personas
con discapacidad.
En cualquier caso, este sistema, aunque efectivo, no es infalible, por lo que se requiere
un control de calidad del archivo final por especialistas, de cara a la corrección de
errores, especialmente en documentos antiguos o en textos impresos con baja calidad.
En el ámbito de la digitalización del patrimonio cultural, el OCR se aplica en procesos
de digitalización de documentos históricos (en papel o en microfilms), tales como textos
impresos, prensa, páginas mecanografiadas, panfletos, partituras, etc, aunque los
resultados todavía no son satisfactorios para textos manuscritos. Además, tiene
aplicaciones en otros muchos aspectos de nuestra sociedad, como la digitalización de
34
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
material corporativo (albaranes, facturas, etc.), reconocimiento de matrículas,
herramientas de traducción asistida ...
Como requisito previo, hay que señalar que resulta muy recomendable escanear a
resoluciones altas para captar así el mayor número de detalles. Esto implica lo siguiente:
A. En textos con tipos de letra claros, escanear mínimo a 300 ppp
B. En textos con tipos de letra pequeña u originales de poca calidad, mínimo a 600
ppp.
Antes de actuar, el software OCR debe de intentar solucionar o, al menos, minimizar
algunos aspectos negativos del documento original o problemas surgidos durante la
digitalización, de cara a mejorar la precisión de los resultados. Entre esta serie de
problemas encontramos:
● Posibles problemas con los documentos originales:
○ Documentos deteriorados;
○ Letras borrosas o poco nítidas;
○ Letras fragmentadas o solapadas;
○ Manchas o transparencias en el papel;
○ Tipografías extrañas o fuera de uso;
○ La distancia que separa a unos caracteres de otros no es
homogénea (cuando el texto está justificado, con cursivas, dígitos, etc.), lo que
puede causar errores de reconocimiento.
● Posibles problemas con las imágenes digitales generadas:
○ La imagen digital incluye niveles de color que no aparecen en la
imagen original;
○ La imagen digital tiene ruido, lo que afecta a los píxeles que serán
procesados;
○ En ocasiones, existen píxeles comunes que conectan dos o más
caracteres.
El proceso que lleva a cabo el software OCR hasta la obtención del documento de texto
se compone de los siguientes pasos:
1. Preprocesamiento de la imagen digital:
● Binarizar la imagen: consiste en convertir la imagen a color o en escala
de grises a blanco y negro (también llamada imagen binaria porque solo tiene 2
colores), lo que nos facilitará aislar las partes de la imagen que contienen texto
(las partes en blanco pertenecen al fondo, y las partes en negro, a los caracteres).
Es en esta fase cuando pueden surgir los primeros problemas con originales
dañados o manchados. Imaginemos un periódico con una mancha de café en uno
de los artículos. Cuando pasemos la imagen escaneada a binario, la mancha se
35
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
caracteres afectados por la mancha.
● Enderezar la imagen: si el documento no estaba alineado correctamente
durante su digitalización, es recomendable girar la imagen con el objetivo de
hacer las líneas de texto totalmente horizontales o verticales.
● Eliminar ruido y suavizar los bordes: Algunas técnicas utilizadas para
remediar estos factores son:
○ Etiquetado: para la división de la imagen en regiones de
componentes conectadas.
○ Erosión / expansión: para la eliminación de pequeños
grupos de píxeles.
○ Umbralizado de histograma: para eliminar/seleccionar los
objetos más brillantes o más oscuros que componen la imagen.
2. Segmentación de la imagen
● Eliminar las líneas y otros elementos que no sean caracteres, lo que
permite mejorar el análisis de la estructura, y detectar de manera más eficiente
textos subrayados y tablas.
● Análisis de la estructura: identificar columnas, párrafos,
encabezamientos, pies de página, tablas y diagramas, números de página, etc.
● Fragmentación o segmentación de la imagen: permite detectar las
regiones de la imagen y, dentro de ellas, descomponerlas en sus
correspondientes caracteres. Una de las técnicas habituales son las proyecciones
lineales, que consiste en alinear una imagen con una rejilla uniforme, de tal
forma que las líneas verticales de la rejilla incidirán sobre áreas en negro
(caracteres).
39
Algunos software OCR realizan dos pasadas al documento. La segunda pasada es llamada “de
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
devuelve un listado ordenado de posibles caracteres. En ocasiones, el software nos
devuelve varios caracteres para imágenes confusas. Por ejemplo, el carácter "I" (letra i
mayúscula) podría traducirse como "I" (letra i mayúscula), "|" (barra vertical), "1"
(número uno) o "l" (letra ele minúscula).
● Reconocimiento o coincidencia con patrón: Se trata de la técnica más
común, y al ser más simple que la detección de características, también es más
limitada. Consiste en comparar cada uno de los caracteres detectados en la
imagen, pixel a pixel, con una colección de patrones o contornos de caracteres
(en mapa de bits), hasta encontrar alguno en el que se alcance un alto nivel de
parecido. La fiabilidad de esta técnica depende de que los caracteres en la
imagen hayan sido correctamente localizados, y que el patrón con el que vamos
a comparar sea de una tipografía y tamaño similar a la que tenemos disponible
en nuestro software. Esta técnica es apropiada para imágenes que contengan
textos con fuentes habituales, como Arial o Times New Roman, pero no para
tipografías poco comunes.
● Detección de características, también conocida como ICR (Intelligent
Character Recognition). En lugar de reconocer el patrón completo para un
carácter, descompone y compara las letras por sus elementos característicos
como trazos, curvas, bucles, intersecciones entre trazos, etc., los cuales serán
comunes para cada carácter independientemente de la tipografía utilizada. Esta
técnica es utilizada en sistemas avanzados como el reconocimiento de escritura a
mano40 o en las versiones más modernas de software OCR.
reconocimiento adaptativo”, y en ella, usa las formas de los caracteres reconocidos en la primera pasada
con alto nivel de coincidencia para aumentar las posibilidades de éxito en los caracteres pendientes. Esto
es especialmente útil para tipografías poco comunes, o para escaneos de baja calidad, donde la fuente está
distorsionada, borrosa o degradada.
40
El ICR también interviene en el reconocimiento de caracteres manuscritos, aplicando técnicas de
inteligencia artificial como el análisis de movimiento de la escritura a mano (orden en el que se escriben
los caracteres, la dirección, patrón al apoyar y levantar el bolígrafo, etc.). Algunas de las principales
dificultades que surgen son el detectar cuando acaba un carácter y empieza otro, o caracteres que no se
37
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
del documento) al que pertenece el original digitalizado: por ejemplo, un
diccionario técnico para una temática concreta (ingeniería, medicina…). Sin
embargo, esta técnica puede causar problemas si el documento contiene palabras
no incluidas en dicho léxico.
● Indicar el idioma al que pertenece el documento digitalizado permite
mejorar los resultados, pues a partir de la gramática podremos determinar si una
palabra es más probable que sea un verbo o un nombre dependiendo del
contexto.
● “Análisis por vecinos próximos”, basada en la frecuencia en la que
algunas palabras aparecen juntas para corregir errores. Por ejemplo,
“Washington D.C.” es mucho más frecuente en inglés que “Washington DOC”.
● Por último, el software podría “abstenerse” de realizar correcciones
automáticas y realizaría un marcado de aquellas palabras que considera no ha
decodificado correctamente, mostrando la imagen en su contexto de página para
que el revisor pueda interpretar qué palabra es la adecuada.
El documento final tras el proceso de reconocimiento de caracteres puede ser un fichero
de texto plano o, en sistemas más avanzados, se intenta mantener la estructura original
del documento, generando un fichero que incluya la imagen digitalizada y una
representación textual que permita búsquedas41.
Por último, mencionar la colaboración abierta y distribuida entre personas, también
conocida como “crowdsourcing”, que permite resolver o corregir con un alto nivel de
precisión caracteres que al software le resultan complicados por diversos motivos. Uno
de los ejemplos más comunes es el reCAPTCHA42 de Google, que podemos encontrar
en muchos formularios de páginas Web.
3. Cámaras digitales
3.1. Introducción
Las cámaras digitales son una evolución de las cámaras analógicas tradicionales. Las
primeras cámaras digitales únicamente permitían realizar capturas fotográficas con una
calidad bastante reducida, mientras que las actuales permiten incluso la captura de video
en alta definición.
Se han convertido en una alternativa atractiva a los escáneres comunes. Aunque siguen
teniendo desventajas frente a estos, como la distorsión, reflejos, sombras o bajo
41
Un ejemplo habitual son las hemerotecas on-line de periódicos, como las citadas en el Módulo 1 -
Unidad 3 “Buenas Prácticas”, a partir de la página 35.
38
42
Véase: http://www.google.com/recaptcha/digitizing
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
contraste, ofrecen ventajas como la velocidad, portabilidad y una mayor flexibilidad en
la digitalización de documentos grandes y pesados, sin dañarlos.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
3.3. Tipos de cámaras digitales
En el mercado, podemos encontrar varias familias de cámaras digitales, según sus
características y finalidad:
43
La distancia focal de una lente es la distancia entre el centro óptico de la misma y el punto de foco,
donde se concentran los rayos de luz. En un objetivo, la distancia focal es la distancia entre el diafragma
de éste y el punto de foco.
44
La profundidad de campo o PDC (DOF o Depth of field en inglés) es el espacio nítido que existe por
40
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
calidades, además de permitir una configuración total. Aunque no son exclusivos de las
cámaras réflex, los principales parámetros que se pueden configurar en las cámaras son:
● Sensibilidad ISO: El ISO es la sensibilidad del sensor a la luz. El valor nativo
de las cámaras se sitúa entre 100 y 200 dependiendo de la marca. A mayor número ISO,
mayor sensibilidad del sensor a la luz, permitiéndonos disparar a velocidades más
rápidas. Suele aumentarse dicho parámetro en situaciones de baja luminosidad, escenas
nocturnas en las que se fotografía sin el apoyo de un trípode, etc. También cabe destacar
que a mayor sensibilidad, mayor ruido digital45 aparecerá en la imagen.
● Velocidad de obturación: La velocidad de obturación se refiere al tiempo en que
el obturador está abierto permitiendo pasar la luz al sensor durante más o menos
segundos. Se expresa en segundos y fracciones de segundo, siendo generalmente los
valores de las cámaras comunes de entre 30” y 1/4000 (una cuatromilésima de
segundo), aunque cámaras de alta gama pueden llegar a velocidades de 1/8000.
● Apertura del diafragma: El
diafragma en un objetivo es una serie
de láminas metálicas que se cierran en
el momento de tomar la foto
regulando la cantidad de luz que
queremos que llegue al sensor. Este
parámetro se regula desde la cámara y
se especifica en números f/. Cuanto
45
Véase: http://es.wikipedia.org/wiki/Ruido_en_la_fotografía_digital
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
intercambiable como las réflex.
● El respaldo digital, que es donde está el sensor y es intercambiable,
pudiendo acoplarle al chasis respaldos de más de 80 megapíxel.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
No poseen visor óptico, pero se les puede acoplar uno como accesorio.
Cámaras ultracompactas
De fácil manejo y asequibles, están
destinadas a todos aquellos que
quieren llevar la cámara siempre
encima. Existen modelos ultrafinos de
incluso 12mm de grosor. Están
pensadas para ser usadas en modos
automáticos, aunque algunas de ellas
permiten el control manual de la
exposición. Tienen una lente zoom de
Ilustración 37: Cámara digital ultracompacta alcance medio, entre 5 y 7 aumentos,
Olympus. aunque también las hay con 15
aumentos. El sensor de estas cámaras es pequeñísimo, por lo que en condiciones de
poca luz, pueden generar bastante ruido digital en la imagen. Incorporan un flash
integrado con un alcance de entre 0,5 y 1,5m. El único visor que tienen estas cámaras es
la pantalla trasera, que actualmente tienden a ser táctiles y a ocupar todo el espacio
trasero de la cámara, sin dejar lugar a ningún botón físico. También es cada vez más
frecuente que la pantalla sea abatible.
43
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
3.4. Características de cámaras digitales
Resumiremos a continuación algunas de las características que hay que tener en cuenta
a la hora de seleccionar una cámara digital.
● Resolución: Medida en megapíxeles y con unos valores comprendidos entre los
6 y los 36 megapíxel en las cámaras más comunes. Este valor se consigue al multiplicar
los píxeles de alto por los de ancho. Es decir, una imagen de 1600px de ancho por
1200px de alto tiene 1.920.000px, es decir, 1,92mpx. Existe la falsa creencia de que a
mayor cantidad de megapíxeles, mayor calidad de la fotografía, cuando esta
característica, en realidad, viene determinada por la óptica del objetivo. A decir verdad,
este valor simplemente nos da el tamaño final de la imagen y sólo es importante cuanto
mayor sea la ampliación impresa de la foto, donde, además, hay que considerar también
la resolución de impresión, medida en PPP (Puntos por pulgada) o DPI (Dots per inch,
en inglés). A partir de 200ppp se puede considerar que la calidad de impresión es
aceptable. Para determinar el tamaño máximo de impresión de una imagen hay que
dividir el ancho por los ppp que tenga. Si tiene 1600px de ancho entre 200ppp,
1600/200=8, con lo que esa imagen tendría un tamaño de impresión máximo de 8
pulgadas (20.32 cm) con total calidad.
● Memoria externa: En la mayoría de los casos, la memoria externa es la
encargada de realizar el almacenamiento de las fotografías y los vídeos. Las principales
consideraciones de la memoria externa son su capacidad (desde 2 hasta 128gb), su
velocidad de escritura/lectura46 y su formato, siendo los más extendidos:
○ SD (SecureDigital) y microSD, son el soporte más estandarizado,
actualmente existen modelos con conexión wifi incluida en la tarjeta, lo que nos
permite transferir las fotos en tiempo real a cualquier dispositivo sin cables.
○ MMC (MultimediaCard) y SecureMMC
○ CompactFlash, muy utilizadas en el ámbito profesional, aunque
noticias recientes hablan de su camino a la extinción.
○ Memory Stick, de Sony, y XD, de Olympus y Fujifilm, cuya
presencia en el mercado va reduciéndose en comparación con el resto de
formatos.
46
Para usuarios comunes, este parámetro no tiene mucha importancia, cualquier tarjeta con una velocidad
normal nos permitirá hacer fotos y grabar vídeo en calidad óptima, pero en el mundo profesional sí que
son importantes estas velocidades. Para disparos en ráfaga (eventos sociales, deportes, etc.) en formato
RAW con muchos megapíxeles o grabación de vídeo en alta definición a 1080p, se necesitan velocidades
más altas de lo normal, ya que la cantidad de datos que se genera es muy grande. Las tarjetas rápidas para
estos menesteres actualmente existen desde 45mb/s hasta 90mb/s, aumentando su precio en proporción a
44
la velocidad.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Ilustración 38: Tarjetas de memoria.
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
construcción. Los de más calidad suelen ser de construcción metálica y sellados
contra salpicaduras de agua y partículas de polvo. Los de menor calidad son de
plástico y con componentes que se degradan antes, como los anillos de zoom o
enfoque, además de unos cristales con tratamientos menos costosos que los de
gama alta, pudiendo producir reflejos indeseados o cierta falta de nitidez.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
consiguiendo localizar así el punto dulce48, lo que nos permite sacar la mayor calidad
óptica del objetivo.
48
El punto dulce de un objetivo es el rango de aperturas donde se consigue la mejor calidad de éste. La
mayor nitidez, enfoque y menores aberraciones cromáticas se sitúan en este rango que por lo general va
47
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
sensibilidad a la misma. Dichos soportes también permiten una relativa flexibilidad a la
hora de orientar las luces para evitar así sombras indeseadas que interfieran en la
digitalización.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
una aplicación práctica posterior, no parece demasiado útil.
Por ello, se pretende dar una introducción general sobre los soportes analógicos tanto de
audio como de video que podemos encontrar y los medios disponibles para
digitalizarlos, sin entrar en detalle sobre los mismos.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
4.1. Conversión a audio digital
Para la conversión de archivos sonoros a un formato digital, nos encontramos con dos
tipos diferentes de soportes analógicos:
Discos: desde los fabricados con goma (en las primeras grabaciones) o acetato,
hasta materiales más resistentes como el vinilo o la pizarra, así como las copias
maestras en metal, a partir de las cuales se obtienen los discos comerciales. Este
tipo de soporte intenta reproducir, a través de surcos realizados sobre su
superficie, las ondas sonoras originales, que posteriormente serán interpretados
por la aguja del gramófono o tocadiscos.
Cintas magnéticas: hasta principios de los años se utilizó 60 una base de
acetato de celulosa para su fabricación, siendo posteriormente compuestas por
poliéster o PVC (policloruro de vinilo). En las cintas (bien en su forma de
cassette o de bobina abierta), la información de las señales eléctricas captadas
por el micrófono es grabada haciendo uso de las propiedades magnéticas de la
superficie (este tipo de soporte se explicará con más detalle en el siguiente
bloque de este módulo).
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Ilustración 44: Ejemplo de un convertidor de audio de analógico a digital, con las entradas de audio
analógico en la parte inferior derecha, y las salidas de audio digital en la parte inferior izquierda.
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
El caso del soporte fotoquímico el
proceso es algo más complejo. En
digitalizaciones profesionales, se utilizan
escáneres específicos para esta labor,
con altísimos niveles de resolución
óptica así como alto rango dinámico, que
procesarán cada fotograma del film de
una manera similar a la que lo hacen los
escáneres de negativos explicados en
este bloque didáctico.
Otra opción posible, aunque con unos resultados de peor calidad respecto al escáner, es
la del telecine, que consiste en la proyección de una película cinematográfica y su
migración a un formato de video, habitualmente digital (que podrá ser procesado
posteriormente por el ordenador).
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com