Medios de Digitalización

Curso en Digitalización del Patrimonio
Asignatura 1: Introducción a la Digitalización del

Patrimonio
Módulo 3. Medios, soportes y formatos para la digitalización
Unidad 1: Medios para la digitalización
___________________________________________________________________________________________
, www.cursocommunityfuned.com, info@cursocommuinityfuned.com
Página
Fundación UNED, Curso en Digitalización del Patrimonio 2ª Edición – Noviembre 2013, www.cursodigitalizacion.com
Índice
1. Introducción.......................................................................................................................................... 5
2. Escáneres .............................................................................................................................................. 5
2.1. Introducción.................................................................................................................................. 5
2.2. Cómo funciona un escáner ........................................................................................................... 6
2.3. Características de los escáneres .................................................................................................. 11
2.4. Tipos de escáneres ...................................................................................................................... 19
2.4.1. Escáneres genéricos ............................................................................................................ 19
2.4.2. Escáneres específicos ......................................................................................................... 22
2.5. El estándar TWAIN .................................................................................................................... 30
2.6. OCR (Reconocimiento óptico de caracteres).............................................................................. 33
2.6.1. ¿Cómo funciona el OCR? ................................................................................................... 35
3. Cámaras digitales................................................................................................................................ 38
3.1. Introducción................................................................................................................................ 38
3.2. Cómo funcionan ......................................................................................................................... 39
3.3. Tipos de cámaras digitales .......................................................................................................... 40
3.4. Características de cámaras digitales ........................................................................................... 44
3.5. A la hora de la digitalización ...................................................................................................... 46
4. Conversión de audio y video a digital ................................................................................................ 48
4.1. Conversión a audio digital .......................................................................................................... 50
4.2. Conversión a video digital .......................................................................................................... 51
Tabla de Ilustraciones
Ilustración 1: Partes básicas de un escáner (Fuente: EPSON) ...................................................................... 5

Ilustración 2: Sensor CCD lineal para un escáner. ....................................................................................... 6
Ilustración 3: Sensor CCD matricial para una cámara digital....................................................................... 7
Ilustración 4: Esquema de funcionamiento para una pasada (fuente: pcmag.com). ..................................... 8
Ilustración 5: Esquema de funcionamiento de un escáner CIS y de un escáner CCD ................................ 10
Ilustración 6: Distintas resoluciones ópticas y sus resultados (fuente: www.library.cornell.edu) .............. 12
Ilustración 7: Profundidad de color (fuente: fotonostra.com) ..................................................................... 16
Ilustración 8: La imagen de la derecha se ha obtenido mediante un escáner con alto rango dinámico
(fuente: photo.net) .............................................................................................................................. 16
Ilustración 9: Escáner plano Epson V500 Office con complemento para diapositivas y negativos ........... 20
Ilustración 10: Escáner con alimentación automática HP ScanJet Enterprise 8270. .................................. 20
Ilustración 11: Versión actual de un escáner de mano................................................................................ 21
Ilustración 12: Escáner portátil Canon imageFormula P-208 ..................................................................... 22
Ilustración 13: Escáner de cámara para documentos EPSON DC-11......................................................... 22
Ilustración 14: Transparencias adheridas al tambor de un escáner (fuente: candelafineart.com) ............... 23
Ilustración 15: Escáner de tambor Howtek HiResolve 8000 (fuente: candelafineart.com) ........................ 23
Ilustración 16: Escáner para planos Contex SD 4400................................................................................. 24
Ilustración 17: Escáner de microfilms Canon MS800 ................................................................................ 24
Ilustración 18: Escáner cenital I2S Suprascan Quartz ................................................................................ 25
Ilustración 19: Atril para mantener el libro abierto a 120º ......................................................................... 26
Ilustración 20: Escáner de negativos Nikon Super COOLSCAN 5000 ED ............................................... 26
Ilustración 21: Resultado al aplicar la tecnología ICE (fuente: asf.com) ................................................... 28
Ilustración 22: Antes y después de aplicar la tecnología GEM (fuente: asf.com) ...................................... 28
Ilustración 23: Antes y después de aplicar la tecnología ROC (fuente: asf.com) ....................................... 29
Ilustración 24: Escáner para documentos Canon DR-X10CZ .................................................................... 30
Ilustración 25: Técnicas de mejora de la imagen digital ............................................................................ 32
2
___________________________________________________________________________________________
Página
Ilustración 26: Captura de pantalla del software OCR ABBYY FineReader. ............................................ 34
Ilustración 27: Segmentación de la imagen ................................................................................................ 36
Ilustración 28: Detección de características (fuente: explainthatstuff.com) ............................................... 37
Ilustración 29: Ejemplo de matriz Bayer (fuente recursoswebs.com.ar) .................................................... 39
Ilustración 30: Cámara réflex Canon EOS 1100D de gama baja................................................................ 40
Ilustración 31: Ejemplo de visor réflex de una Pentax K-5 (fuente focopixelado.blogspot.com) .............. 40
Ilustración 32: Aperturas del diafragma del objetivo (fuente fotonavia.com) ............................................ 41
Ilustración 33: Cámara de medio formato Hasselblad H4X (Fuente: Hasselblad) ..................................... 41
Ilustración 34: Ejemplo de tecnología SLT de Sony en una Alpha 58 (Fuente: Sony) .............................. 42
Ilustración 35: Cámara EVIL Lumix GF1 y accesorios ............................................................................. 42
Ilustración 36: Cámara bridge Sony HX100V............................................................................................ 43
Ilustración 37: Cámara digital ultracompacta Olympus. ............................................................................ 43
Ilustración 38: Tarjetas de memoria. .......................................................................................................... 45
Ilustración 39: Movimiento de lentes internas de un objetivo para realizar zoom óptico (fuente Wikipedia)
............................................................................................................................................................ 45
Ilustración 40: Distancia focal: fuente notodoestodo.blogspot.com ........................................................... 46
Ilustración 41: Trípode con columna en horizontal .................................................................................... 47
Ilustración 42: Mesa de reproducción para digitalización con cámara (Fuente: www.digireflex.net)........ 47
Ilustración 43: Robot digitalizando El Guernica de Pablo Picasso............................................................. 48
Ilustración 44: Ejemplo de un convertidor de audio de analógico a digital, con las entradas de audio
analógico en la parte inferior derecha, y las salidas de audio digital en la parte inferior izquierda. ... 51
Ilustración 45: Conversor de video analógico a digital Blackmagic Multibridge ...................................... 51
Ilustración 47: Sistema de Telecine ............................................................................................................ 52
Ilustración 46: Escáner para films ARRISCAN ......................................................................................... 52
___________________________________________________________________________________________
Página
EQUIPO DOCENTE
Para cualquier consulta referente al contenido de este documento, póngase en contacto

con:
Nombre del profesor
Carlos.Martinez@cursodigitalizacion.com
+34 637 17 78 10
www.linkedin.com/in/carlosmartinezgarcia
cmartinez.cursodigitalizacion
___________________________________________________________________________________________
Página
1. Introducción
Cuando se habla de digitalización, parece inevitable que lo primero que nos venga a la
mente son los medios utilizados, y más en concreto, la palabra escáner. Aunque, como
veremos más adelante, la digitalización con cámara fotográfica se está generalizando
cada vez más, los escáneres siguen siendo en la actualidad uno de los principales
recursos, siempre y cuando lo permitan los objetos a digitalizar. A pesar del amplio
surtido que el mercado tecnológico nos ofrece para realizar el proceso de digitalización,
con modelos muy avanzados, la intervención humana todavía no es sustituible. Por ello
resulta prácticamente imprescindible conocer en cierta profundidad la herramienta a
utilizar para aprovechar al máximo las posibilidades que ésta nos ofrece, y saber
seleccionar en cada momento la mejor opción.
2. Escáneres
2.1. Introducción
El escáner1 es considerado el periférico de entrada por excelencia, pues permite la
captura de imágenes y textos desde un medio físico (como páginas de un libro o
fotografías) y su posterior conversión a un formato digital para ser visualizados o
manipulado desde un ordenador.
1. Superficie de escaneado
2. Tapa
3. Cabezal de lectura en operación de
reposo
Ilustración 1: Partes básicas de un escáner (Fuente: EPSON)

1
Este vocablo proviene del inglés scanner, que significa “repasar” o “explorar”.
5
___________________________________________________________________________________________
Página
2.2. Cómo funciona un escáner
El funcionamiento del escáner se basa en el principio de la transferencia de luz2, bien
por transmisión o por reflexión, y varía ligeramente dependiendo de la tecnología que se
utilice, CCD o CIS.:
● Escáner con tecnología CCD3 (Charged Coupled Device, Dispositivos de

Carga Acoplados): el CCD es el elemento fundamental de un dispositivo para la
digitalización, bien un escáner o una cámara digital. Podríamos definirlo como un ojo
electrónico, que recoge la luz y la convierte en una señal eléctrica. Un CCD es un
circuito integrado junto a una capa de silicio, compuesta por diminutos elementos
fotosensibles que reaccionan ante las diferentes intensidades de luz recibidas o fotones
(las zonas más claras reflejan más luz que las zonas más oscuras), y generan a partir de
ellas señales eléctricas de distinta intensidad (o electrones).
El sensor CCD puede ser lineal o matricial: el primero se utiliza en los escáneres planos
y de mano, y el segundo en escáneres de transparencias, cámaras fotográficas digitales y
cámaras de vídeo.
○ Un CCD lineal cuenta únicamente con una línea de fotodetectores
(a cada fotodetector le corresponde un píxel4 de una de las filas de puntos que
forman la imagen). Para generar la imagen digital, realiza un barrido sobre el
original a digitalizar.
Ilustración 2: Sensor CCD lineal para un escáner.
2
Para comprender mejor estas propiedades de la luz, se recomienda leer la siguiente documentación:
http://www.aulafacil.com/cursos-fotografia/fotografia-iluminacion/curso/Lecc-8.htm
3
Inventado en 1969 en los laboratorios Bell por George Smith y Willard Boyle, lo que les valió el premio
Nobel de Física en 2009
4
Los píxeles son las unidades de color que forman una imagen digital, cada píxel se codifica en bits, por
lo tanto si una imagen es de 1bit, sus píxeles sólo podrán ser blancos o negros (0 o 1). Lo más común son
imágenes con los píxeles codificados en 8 bit (28 = 256 posibilidades de color en cada píxel, desde 0 hasta
255) en cada uno de sus tres canales rojo, verde y azul (RGB), siendo el negro absoluto un 0 para cada
color primario y el blanco absoluto un 255 para cada color primario.
6
___________________________________________________________________________________________
Página
○ Los CCD matriciales consisten en miles de fotodetectores
organizados en filas y columnas, formando una malla. Todos los puntos de la
matriz reciben la luz al mismo tiempo, por lo que no es necesario realizar un
barrido de la imagen
Ilustración 3: Sensor CCD matricial para una cámara digital.
A continuación detallamos los pasos que se siguen al realizar una digitalización con un
escáner de tecnología CCD:
1) Colocamos el documento a digitalizar, con la cara a explorar boca abajo, en la

superficie de cristal del escáner, bajo el cual se sitúa el cabezal lector.
2) El cabezal lector, formado por un dispositivo capturador, una lámpara de luz
fluorescente fría de alta intensidad (CCFL) o de xenón, y un conjunto de lentes, se
desplaza longitudinalmente a través del área de exploración gracias a un cinturón
unido a un motor paso a paso. Además, el cabezal se une a una barra estabilizadora
para asegurar que no haya desviaciones durante el recorrido. Un aspecto importante
es la velocidad de barrido de este cabezal, pues determina la mayor o menor
resolución de las imágenes escaneadas - a menor velocidad de lector, más
información extraída-.
3) A la vez que el cabezal realiza el desplazamiento, la lámpara ilumina el documento
a digitalizar. Durante el barrido, dentro del cabezal lector se repite la siguiente serie
de pasos para cada una de las líneas del documento:
a) El reflejo que produce la iluminación al “impactar” sobre el documento es
redirigido desde un espejo oblicuo hacia otro espejo5. Éste último proyecta la luz
5
En algunos escáneres se utiliza un sistema de dos espejos, mientras que en otros se utilizan tres.
7
___________________________________________________________________________________________
Página
sobre una lente, que finalmente enfoca el haz a través de un filtro hacia el
dispositivo capturador CCD.
b) Dependiendo del modelo, existen dos formas de adquisición:
i) De una sola pasada (el más utilizado actualmente): que se caracterizan por
ser más rápidos y conseguir una iluminación más uniforme, que da lugar a
colores más reales y parecidos al original, y donde distinguimos dos
tipologías:
(1) Una única fuente de luz junto a un dispositivo CCD de color que captura
los colores rojo, verde y azul: La luz se divide mediante un prisma en
tres haces de luz, uno por cada color primario, que serán proyectados al
dispositivo capturador CCD. El CCD lineal está formado por tres filas de
fotosensores, cada fila con su propio filtro para procesar cada uno de los
colores primarios. Este tipo de escáneres realiza el proceso de una forma
más rápida.
(2) Tres focos independientes que se encienden para cada línea, junto a un
dispositivo CCD monocromático, lo que deriva en una velocidad de
escaneo menor y resultados pobres al digitalizar superficies no planas.
Ilustración 4: Esquema de funcionamiento para una pasada (fuente: pcmag.com).
ii) De tres pasadas: similar a los tres focos independientes en los escáneres de
una pasada, pero en este caso, se realiza una pasada por cada color primario.
La descomposición de la luz se hace a través de tres filtros, que dejan pasar
únicamente el color primario que corresponda a la pasada. Entre la lente y el
sensor CCD6 se ubica un filtro, que sólo podrá atravesar el haz de luz del
color primario que corresponda en cada pasada. Al igual que en los
escáneres de una sola pasada, las tres versiones de la imagen se unifican para
generar la imagen final.
c) Como mencionamos anteriormente, el CCD genera señales eléctricas de distinta
potencia ante las intensidades de luz recibidas. Dichas tensiones eléctricas, de
carácter analógico, se transforman mediante un conversor a formato digital, para
6
Otra posibilidad es el uso de tres fuentes de luz distintas, una por color primario, que se utilizarán en
cada una de las pasadas.
8
___________________________________________________________________________________________
Página
poder ser interpretadas por un sistema informático. Según el tipo de conversor
utilizado, el valor de salida tendrá un número específico de bits7 que serán los
que indiquen la profundidad de color del escáner. Por ejemplo, si el conversor
soporta hasta 12 bits, la paleta de colores que podrá ofrecer el escáner será de 36
bits (12 multiplicado por los tres canales de color primarios), ya que cada uno de
los píxeles o puntos que componen la imagen está compuesto por la mezcla de
tres puntos (rojo, verde y azul), y el conversor tendrá que ser utilizado tres veces
por cada pixel.
● Escáner con tecnología CIS (Contact Image Sensor, Sensor de Imagen por
contacto): su funcionamiento es más simple que los escáneres CCD, pues prescinden
de espejos o filtros, por lo que resultan más baratos y ligeros que éstos, aunque no
ofrecen el mismo nivel de calidad y resolución. Se basan en que los sensores estén
ubicados extremadamente cerca del original a digitalizar, por lo que se prescinde de la
profundidad de campo, y todo aquello que no esté en contacto con la superficie de
cristal es demasiado distante para poder ser escaneado con nitidez (esto hace a los
escáneres CIS inapropiados para escanear objetos tridimensionales).
En este caso, el funcionamiento de este tipo de escáneres consta de los siguientes pasos:
1) Colocamos el documento a digitalizar en la superficie de cristal del escáner, bajo el

cual se sitúa el cabezal lector y con la cara a explorar boca abajo.
2) El cabezal lector, ubicado justo debajo de la superficie de cristal (de ahí la

denominación de imagen por contacto), ocupa todo el ancho del área de exploración
y se desplaza longitudinalmente a través de ella. En este caso, es mucho más
compacto que el cabezal CCD, y está formado por:
1) Una fuente de iluminación que incluye tres filas de diodos LED (Light Emitting
Diode, Diodo Emisor de Luz), rojos, verdes y azules.
2) Una banda de fotosensores ópticos, ubicada debajo de una fila de lentes de
varilla.
3) Para cada línea del documento se realizan las siguientes tareas:

1) Los LED emiten haces de luz para cada color primario8, que serán reflejados por
la superficie del documento. Estos reflejos son proyectados sobre la fila de
lentes de vara de cristal (de enfoque corto), y una vez atraviesan dichas lentes,
llegan a la banda de fotosensores, que reaccionan ante las diferentes intensidades
de luz recibidas, generando a partir de ellas señales eléctricas de distinta
7
Bit es el acrónimo de Binary Digit (Dígito binario), es la unidad mínima de información empleada en
datos digitales. Se representa mediante dos valores, 0 ó 1. Pudiéndose asignar a estos números cualquier
valor, tales como encendido/apagado, blanco/negro, norte/sur...
8
Para el escaneado en color, los LED parpadean rápidamente, mientras que en monocromo, iluminan de
manera simultánea.
9
___________________________________________________________________________________________
Página
intensidad. Dichas tensiones eléctricas, de carácter analógico, se transforman
mediante un conversor a formato digital, de manera que puedan ser interpretadas
finalmente por un sistema informático.
Ilustración 5: Esquema de funcionamiento de un escáner CIS y de un escáner CCD
Éste sería, a grandes rasgos, el funcionamiento de los escáneres en función de la

tecnología utilizada. A continuación vamos a detallar algunas diferencias en cuanto a
los resultados obtenidos con uno u otro dispositivo orientadas a trabajos en proyectos de
digitalización de patrimonio cultural:
● En los escáneres CCD, la fuente de luz es una única lámpara fluorescente y de

alta intensidad, que, junto a un reflector, permite dirigir la luz al cristal de escaneado y
por tanto, al documento. Este sistema nos posibilita capturar prácticamente cualquier
documento de gran formato (dibujos, mapas, fotografías, etc.) con una mejor calidad de
imagen:
○ En escaneado monocromo, los escáneres CIS utilizan sólo su
canal verde de 8 bits (256 niveles de sombras) para capturar los datos de la
imagen, así solo tienen que procesar una tercera parte de la información, lo que
consume menos tiempo y recursos, a costa de pérdida en la calidad. Es por ello
que se aconseja escanear en color y posteriormente, con un programa de edición
fotográfica, convertir a escala de grises.
○ Escaneado en color, los escáneres CIS son capaces de capturar
tan sólo 24 bits de datos de color. Al almacenar los archivos con esta
profundidad, no se produce ningún tipo de ajuste inteligente de los datos de la
imagen. Sin embargo, un sensor CCD de alta definición captura color de 48 bits,
lo que permite realizar una captura inicial con esta profundidad de bits para
después seleccionar los mejores 24 bits de datos. Cuanto mayor es la muestra,
mayor precisión de color y de detalle. Esto resulta fundamental para captar
10
___________________________________________________________________________________________
Página
detalles en las áreas oscuras y en las leves transiciones de color, realizar
escaneados de originales con gran calidad de color (como, por ejemplo,
originales fotográficos de gran tamaño para los que se quiera preservar la
riqueza cromática), o mejorar los resultados en fotografías con una mala
exposición, en las que sea necesario rectificar gamma, brillo o contraste.
● Además, muchos documentos de gran formato que necesitan ser digitalizados no
están en perfectas condiciones. Muchos están doblados, arrugados, o simplemente,
curvados por permanecer almacenados en rollos. Estos desperfectos puede resultar un
problema para cualquier escáner en gran formato, pero es casi imposible para cualquier
escáner basado en la tecnología CIS:
○ Las marcas de los dobleces son claramente identificables en el
escaneado con tecnología CIS, como consecuencia de una fuente de luz LED
débil.
○ La información en las áreas dobladas o de zonas cercanas al lomo
de un libro queda borrosa a consecuencia del enfoque corto del sistema de lentes
de CIS.
CIS CCD
 Sensor con luz y ópticas integradas.  Sensor con lámpara y lentes separadas.
 Lentes de varas de cristal de enfoque  Lentes de cámara de alta calidad.
reducido.  Lámpara fluorescente de color exacto.
 Iluminación LED RGB.  Ratio excelente señal/ruido.
 Ratio pobre señal/ruido.  Captura RGB + sensor monocromo
 Captura de color de 24 bits y de grises dedicado.
en 8 bits.  Mejores resultados en cuanto a rango
 Consumen menos energía (debido a dinámico y respeto por los colores
los LED) (debido a la fuente de iluminación)
 Escáneres más pequeños y ligeros
 Costes de producción inferiores (el
cabezal lector es más simple que el de
un escáner CCD)
Tabla 1: Diferencias entre los sensores CIS y CCD
2.3. Características de los escáneres

La característica principal de un escáner es su resolución9, una medida que suele
9
El concepto de resolución puede resultar algo confuso, pues éste depende del medio sobre el que
estamos trabajando: resolución de una fotografía digital, de impresión, de escaneado, en monitores y
11
cámaras digitales, etc. Para aclarar este tema, se recomienda la lectura de los siguientes artículos:
___________________________________________________________________________________________
Página
aplicarse a medios impresos, aunque también es utilizada
para este tipo de dispositivos. La resolución es la capacidad
de un escáner para leer o distinguir la información o pixeles
que forman un documento.
La máxima resolución alcanzable por el escáner
determinará la máxima calidad10 con la que se podrá
digitalizar, pues mayor será el número de muestras tomadas
del original. Esta medida viene determinada en puntos por
pulgada (ppp) o dots per inch (dpi)11, y suele presentarse
con el formato [número]x[número]. Por ejemplo, un escáner
con resolución 600x1200ppp, nos indica que:
● Resolución óptica (u horizontal): El dispositivo Ilustración 6: Distintas

resoluciones ópticas y sus
puede resolver u obtener 600 puntos distintos por cada resultados (fuente:
pulgada de todo el ancho que está digitalizando. Este factor www.library.cornell.edu)
está íntimamente ligado al número y la calidad de los
dispositivos capturadores:
○ En este ejemplo de resolución óptica de 600 ppp, en una
superficie de exploración con un ancho de 21,6 cm (8,5 pulgadas), debemos
tener un mínimo de 5.102 celdas fotosensibles en el CCD (en el caso de un
escáner de una sola pasada, tendríamos 3 filas - una por color primario - de
5.102 sensores).
● Resolución mecánica (o vertical): esta medida se corresponde con la velocidad

de desplazamiento del cabezal de digitalización y no influye en la resolución óptica: el
motor paso a paso que mueve el cabezal no rota de forma continua como el resto de
motores, sino que recibe pulsaciones que le hacen moverse en rotaciones muy precisas,
de sólo unos pocos grados.
En nuestro ejemplo, el cabezal se movería 1/1200 (0.000833) pulgadas de manera
vertical para cada pulsación recibida por el motor: si escaneásemos con una resolución
óptica de 300 dpi, el cabezal se movería verticalmente 4 pasos por cada pulsación
(1200/300), entonces se detendría, tomaría las muestras y reconstruiría la información
de esa línea a un ¼ de forma horizontal, para así obtener una imagen de 300x300 dpi12.
http://www.xatakafoto.com/guias/pixeles-y-puntos-por-pulgada
http://www.fotoenclave.com/2012/72-o-300-p-p-p-la-guerra-de-los-puntos-por-pulgada/
http://www.efectohd.com/2008/01/resolucin-de-vdeo-72-ppp.html
10
En la calidad final de la imagen influyen otros factores como el ruido del escáner, destellos, una
conversión defectuosa de analógico a digital, arañazos, polvo, anillos de Newton, sensores desenfocados,
software poco apropiado o una parametrización inapropiada del proceso de escaneo.
11
Un negativo fotográfico puede llegar a tener, aproximadamente, unos 4000 ppp, mientras que una
fotografía en papel no sobrepasa generalmente los 400 ppp (siempre en relación a su tamaño original).
12
Las fotografías digitales tienen la misma resolución en ambas direcciones, horizontal y vertical, como
12
por ejemplo 300x300 dpi, habitualmente denominada 300 dpi. Si tratamos de escanear una diapositiva a
___________________________________________________________________________________________
Página
En este caso hemos hablado de la resolución óptica o real, la máxima resolución que
puede alcanzar el escáner sin realizar ningún tipo de tratamiento software sobre la
información digitalizada13. Pero existe además el concepto de resolución interpolada,
que surge al digitalizar a una resolución mayor que la óptica. Este tipo de resolución no
aporta información real nueva y se consigue a partir del tratamiento software sobre la
información digitalizada con la máxima resolución óptica. Dicho tratamiento consiste
en obtener más pixeles a partir del promedio de color de los pixeles “reales”
circundantes. En el ejemplo que estamos utilizando, si la resolución óptica es de 600
ppp y la interpolada fuese de 1200ppp, el software estaría añadiendo un pixel entre cada
uno de los escaneados por el sensor CCD. Esto puede implicar la pérdida de la
fidelidad o de la realidad de la imagen, lo cual es especialmente crítico en casos como
digitalizaciones para fines científicos, donde se estarían generando pixeles que no
representasen datos reales y que podrían llevar a cálculos o interpretaciones erróneas de
la imagen. Por motivos de marketing, los fabricantes suelen hacer referencia a la
resolución interpolada en lugar de a la óptica, pues la primera siempre tiene valores
superiores.
Algunas situaciones concretas donde podemos comprobar los beneficios de una

resolución óptica alta son los siguientes:
● Dibujos lineales en blanco y negro: en este tipo de originales, los píxeles
de la imagen digital equivalen a los puntos de impresión, por lo que
necesitaremos una alta resolución para capturar de forma nítida las líneas y los
bordes.
● Ampliaciones de originales pequeños: para ello, debemos aumentar la
resolución de escaneado de manera proporcional al aumento en el tamaño de la
imagen, y así, poder capturar los detalles suficientes sin necesidad de recurrir a
la interpolación.
2400 dpi usando un escáner de 1200x2400 dpi, el cabezal de escaneado puede avanzar a 2400 dpi de
manera vertical. Sin embargo, todas las muestras se superpondrán verticalmente, pues los sensores CCD
que dan la resolución óptica de 1200 dpi, son dos veces mayores que 1/2400 pulgada.
Horizontalmente, el sensor CCD solo puede tomar muestras a 1200 dpi, pero como nuestras imágenes
deben tener resolución "cuadrada", el software interpola de manera horizontal para crear la imagen
2400x2400 dpi. Hay que tener en cuenta que esta técnica no nos proporciona la misma calidad que una
digitalización con una resolución óptica de 2400 dpi.
13
Algunos escáneres tienen una función de optimización de píxeles, de tal forma que utilizan la
resolución total del CCD del escáner, incluso al escanear con resoluciones inferiores. Por ejemplo, al
escanear a 300ppp utiliza los 600ppp para procesar la imagen y luego promedia los datos para generar la
13
imagen final, logrando así una calidad de imagen más auténtica.

___________________________________________________________________________________________
Página
Tamaño de impresión
Pixeles 4x6” 5x7” 8x10” A4 10x12” A3 13x19”

(100x150 (130x180 (200x254 (210x297 (254x305 (297x420 (329x483
mm) mm) mm) mm) mm) mm) mm)
5 millones de 463 dpi 386 dpi 274 dpi 234 dpi 228 dpi 165 dpi 144 dpi
pixeles
(2736x1824
pixeles)
pixeles
(3008x2000
pixeles)
pixeles
(3488x2320
pixeles)
10 millones 656 dpi 546 dpi 387 dpi 331 dpi 322 dpi 234 dpi 204 dpi
de pixeles
(3872x2592
pixeles)
de pixeles
(4288x2848
pixeles)
de pixeles
(4608x3072
pixeles)
Tabla 2: Equivalencias de tamaños de impresión según la resolución en píxeles
● Edición precisa de píxeles, especialmente indicado para diseñadores

gráficos o para el retoque profesional de fotografía, a partir de datos “reales”
capturados del original en lugar de interpolados.
La resolución es un aspecto relevante en el tamaño del fichero final: duplicar el valor de

la resolución cuadriplica el tamaño del archivo, por lo que debe elegirse un valor para la
resolución del escaneado que conserve un nivel suficiente de detalle, pero que evite un
14
___________________________________________________________________________________________
Página
fichero con un peso excesivo en megabytes (MB). Es aquí donde interviene el formato
elegido para guardar la imagen (tema que trataremos en profundidad más adelante): el
peso en MB puede reducirse utilizando un método de compresión con pérdida como
JPEG, pero que repercute en la calidad final de la imagen. Formatos de este tipo son los
adecuados para copias de acceso de la imagen digitalizada, como por ejemplo para su
difusión a través de Internet. Si es necesaria la máxima calidad en la imagen, como al
generar una copia maestra de nuestro original digitalizado, debe utilizarse una
compresión sin pérdida como TIFF.
Otras características generales propias de los escáneres (independientemente de su tipo)

son:
● Profundidad de color (medida en bits): define la cantidad de bits utilizados
para cada píxel, por lo que a mayor cantidad de bits/píxel podemos capturar mayor
cantidad de colores (en el caso de escaneos monocromo, esta medida se traduce en
niveles de gris):
○ una profundidad adecuada para digitalizar imágenes y textos es la
de 24 bits (224 ó 16 millones de colores), valor conocido como “color real” y que
soportan la mayoría de los escáneres.
○ para la digitalización de negativos o transparencias o de fotografía
profesional, es más adecuado una profundidad de bits desde 30 hasta 48 bits.
Modo de escaneo Cantidad de colores reconocidos

Dos niveles (1 bit por pixel) 21 = 2 colores (negro y blanco)
Escala de grises de 8 bits 28 = 256 tonalidades de gris
Escala de grises de 10 bits 210 = 1024 tonalidades de gris
Color de 8 bits (color indexado) 28 = 256 colores
RGB de 24 bits (8 bits por píxel, por color) 224 = 16.7 millones de colores
RGB de 36 bits (12 bits por píxel, por color) 236 = Más de 68 mil millones de colores
RGB de 48 bits (16 bits por píxel, por color) 248 = Más de 250 billones de colores
Tabla 3: Profundidad de color

En la mayoría de casos, el documento final tendrá una profundidad de 24 bits (8 bits por
color), soportada por la mayoría de tarjetas gráficas e impresoras. En estas situaciones,
si hubiésemos digitalizado a 48 bits, se podrían elegir los 24 mejores bits mediante una
serie de procedimientos software. Otra posibilidad es enviar la imagen digital de 48 bits
a una aplicación que permita trabajar con ella, como Adobe Photoshop, lo que nos
permite tener acceso a los datos completos de la imagen, pudiendo realizar ajustes
tonales o gamma. La profundidad de bit que elijamos para digitalizar nuestros originales
afectará tanto al tamaño del archivo como al tiempo de escaneado.
15
___________________________________________________________________________________________
Página
● Rango dinámico: Es el
total de variaciones tonales (desde
el más claro de los claros - valor
conocido como densidad mínima
o Dmin- hasta el más oscuro de
los negros - o densidad máxima,
Dmax) que puede adquirir el
escáner. Esta medida se obtiene a
partir del brillo de una imagen,
utilizando densitómetros
14
ópticos , donde los posibles
valores oscilan entre el 0.0
(blanco puro) y el 4.0 (negro Ilustración 7: Profundidad de color (fuente: fotonostra.com)
total), por lo que deducimos que
a mayor densidad, menor brillo. La densidad se mide en una escala logarítmica (similar
a la escala Richter para los terremotos), donde, por ejemplo, una densidad de 3.0 es 10
veces mayor que una densidad de 2.0.
Es una medida especialmente importante para aquellos trabajos en los que están
implicados medios transparentes, como diapositivas, transparencias y negativos15, pues
permite capturar más detalles en las sombras de una transparencia y en las zonas
brillantes de un negativos. Un
dispositivo de bajo rango
dinámico convierte a negro los
colores que están en las partes
oscuras de la imagen, provocando
una pérdida de detalle importante.
Por tanto, un escáner debería tener
un rango dinámico superior al
material fotográfico que se quiere
digitalizar, para asegurar que se
registre con fidelidad todo el
detalle del original:
○ Los escáneres
Ilustración 8: La imagen de la derecha se ha obtenido planos domésticos tienen un rango
mediante un escáner con alto rango dinámico (fuente:
dinámico comprendido entre 2.5 y
photo.net)
3.0, una medida suficiente para
14
Véase http://es.wikipedia.org/wiki/Densitómetro
15
Esta medida está condicionada por la profundidad de bits, pues cuanto mayor sea esta medida, se
dispondrán de más bits para almacenar más tonos (lo que nos permitiría obtener un mayor rango
16
dinámico, aunque no se garantiza que exista) y con la calidad de los sensores CCD.
___________________________________________________________________________________________
Página
papeles fotográficos (de 2.2d a 2.5d) y papeles de acabado mate y con textura
(que no llegan a 2d), pero algo limitado para negativos, con un rango dinámico
de 3.0d
○ Los escáneres profesionales pueden llegar hasta 3.7d
○ Los de tambor oscilan entre los 3.6d y 4.5d, lo que los convierten
en apropiados para transparencias, con un rango dinámico de 4.0d.
● Velocidad de escaneo (medida en ppm - páginas por minuto): Define el

tiempo que tarda en digitalizar completamente un documento, aunque esta característica
depende directamente de otros factores como el formato del documento, la resolución
elegida o la profundidad de color. Si no estamos realizando digitalizaciones masivas de
documentación, es preferible sacrificar la velocidad de escaneo para obtener unas
resoluciones mayores.
● Formato del documento:
○ Escáner doméstico: habitualmente ofrecen un formato A4 (21 x
29,7 cm) y con menor frecuencia, A3 (29,7 x 42 cm).
○ Escáner de negativos y transparencias: desde 35 mm. hasta placas
de 9x12 cm.
○ Escáner de planos o de gran formato: hasta A0 (84,1 x 118,9 cm)
● Tipo de conexión: las conexiones predominantes en los escáneres domésticos se
realizan a través del puerto USB (Universal Serie Bus) o el IEEE 1394 (también
conocido como Firewire) -quedando atrás el obsoleto puerto paralelo por su lentitud en
la transferencia de datos y sus dificultades para soportar varios dispositivos
simultáneamente -, mientras que en algunos modelos profesionales se utiliza la interfaz
de conexión SCSI-2 (Small Computer System Interface), que proporciona altas
velocidades pero que requiere la instalación de una interfaz extra en nuestro equipo. Sin
obviar ventajas como la facilidad de uso, la conexión Plug and Play16 o la total
implantación en el mercado, la alta tasa de transferencia de datos entre el periférico y el
ordenador que proporciona el USB17 (desde los 1.5MB/s en su versión 1.1 hasta los
640MB/s en la reciente 3.0) o el Firewire (desde los 50 hasta los 400 MB/s,
especialmente indicado para digitalización de imágenes a alta resolución), es un aspecto
relevante dado el tamaño que ocupan los documentos digitalizados: Por ejemplo, un
documento de 23 x 28 cm - ligeramente mayor que un A4 - digitalizado a una
resolución de 600 ppp y con una profundidad de bits de 24-bit, suponen 100 MB de
datos que deben ser transferidos de la manera más rápida posible al ordenador, para su
posterior procesado o almacenamiento.
Otras posibilidades que ofrecen los periféricos que disponen de una tarjeta de red
16
Si el periférico - en este caso un escáner - está encendido, el dispositivo es detectado automáticamente
por el sistema operativo del ordenador.
17
Hemos de recordar que estamos hablando de velocidades de transferencia de datos para interfaces, no
nos referimos a la velocidad de procesamiento del escáner, que es notablemente inferior, debido
17
principalmente al tiempo de exposición del dispositivo CCD.

___________________________________________________________________________________________
Página
instalada son la conexión directa del dispositivo a una red de área local (cableada o a
través de WI-FI) o la creación de un servidor de escaneo, al compartir un escáner
conectado directamente a un equipo miembro de una red.
● Tipo de carga: Algunos escáneres cargan de forma automática los originales a
digitalizar, liberando al usuario de la tediosa tarea de tener que introducir el documento
y esperar a su finalización para introducir el siguiente. Esto puede ser muy útil en tareas
donde se producen muchas digitalizaciones de forma sistemática (como en entornos
empresariales o corporativos), pero desaconsejable para originales frágiles o en malas
condiciones (algo frecuente en la digitalización de patrimonio cultural) por el
tratamiento mecánico que reciben, bien mediante rodillos o por “aspiración”, y que
podrían dañarlos irreversiblemente.
● Enfoque: esta característica depende principalmente de la calidad de la óptica
utilizada en la lente y del brillo de la fuente de luz. Una lámpara brillante de xenon
junto a una lente de alta calidad darán lugar a una imagen digital mucho más clara y
nítida que la obtenida con una lámpara estándar fluorescente y una lente básica.
Algunos aspectos que influyen en las lentes son:
○ Material de la lente, siendo altamente recomendable el cristal,
pues refleja mejor la luz y proporciona una mayor calidad de imagen que el
plástico.
○ Alineación precisa.
○ Método de enfoque:
■ Enfoque fijo, la lente se configura en base a una
distancia fija, que es la que separa la propia lente de la superficie de
escaneo.
■ Autoenfoque, para equipos de gama alta y que
ofrece buenos resultados en objetos tridimensionales (para capturar con
mayor nitidez los objetos situados al fondo) y transparencias (para
compensar la distancia entre el vidrio y la diapositiva).
● Software de captura: Los fabricantes suelen incluir un software o programa
que nos permite controlar el periférico y personalizar el proceso de digitalización según
el rol del usuario:
○ Para usuarios principiantes se ofrece previsualización,
reconocimiento automático del tipo de documento y optimización automática de
las imágenes digitales.
○ Para usuarios intermedios se permite tanto la elección de
funciones automatizadas como la configuración a medida de algunos aspectos:
ajuste de brillo y contraste, resolución, ubicación del fichero generado,
restauración de color, etc.
○ Para usuarios avanzados, se ofrece un control prácticamente total
sobre aspectos sofisticados del escaneo, como el ajuste tonal, la corrección de
gamma, el perfil de color, etc.
18
___________________________________________________________________________________________
Página
Citamos a continuación los parámetros que se suelen configurar con mayor frecuencia
en los software de escaneo:
○ resolución
○ profundidad de color
○ escaneo en color o monocromo
○ formato del documento en el que se exportará la imagen digital:
TIFF, JPG, BMP, PDF, etc.
○ ubicación y nombre de los documentos digitales generados
○ en caso de escanear un documento de texto, uso de la tecnología
OCR (que veremos más adelante)
○ aplicar tareas básicas de tratamiento digital de imágenes como
recortar, girar, redimensionar, etc.
2.4. Tipos de escáneres

A continuación estableceremos una clasificación de los distintos tipos de escáneres
según el objetivo que persigamos con su utilización18:
2.4.1. Escáneres genéricos
Escáner plano
Es el tradicional escáner de sobremesa, cuyo funcionamiento se asemeja al de una
fotocopiadora y que ofrece sus mejores resultados al digitalizar documentos opacos
como fotografías, ilustraciones, páginas de un libro o de revista, etc. La lectura de la
información del documento se realiza por el desplazamiento de la lámpara (barrido),
ubicado bajo una superficie de cristal sobre la que se apoya el original. Con una buena
relación calidad/precio, se trata de un periférico rápido y fácil de manejar, con
resoluciones ópticas medias (p.ej. 2400 dpi) y calidades aceptables.
El área de digitalización suele ser la correspondiente a un A4 (210x297.4 mm), aunque
también hay escáneres planos que admiten A3 (297x420 mm). Admite documentación
que no puede ser procesada de forma masiva a través de alimentadores automáticos
(debido a las condiciones físicas del original, que podría resultar dañado por los
rodillos), aunque algunos incluyen alimentadores como complementos orientados para
la carga de documentos (pero no a fotografías).
18
Los escáneres que aparecen en las ilustraciones se utilizan a modo de ejemplo, en ningún caso se
19
pretende recomendar marcas o modelos concretos.

___________________________________________________________________________________________
Página
También se pueden incluir adaptadores y
soportes para escanear transparencias,
diapositivas y negativos, que consisten en un
marco que fija la película a presión por los
bordes y que evita que los originales estén en
contacto con la superficie de cristal y se
formen los denominados anillos de Newton19.
Hay que reseñar que algunos modelos
avanzados permiten configurar incluso la
distancia de enfoque de la lente para
compensar esta ligera separación entre el
Ilustración 9: Escáner plano Epson V500 vidrio y el soporte. Sin embargo, y a pesar de
Office con complemento para diapositivas estos complementos específicos, los
y negativos
resultados no son satisfactorios, pues
normalmente estos tipos de escáneres no disponen de la suficiente resolución óptica ni
rango dinámico.
Este modelo de escáneres tampoco resulta adecuado para digitalizar libros, pues el área
cercana al lomo suele aparecer distorsionada y sombreada al no estar completamente
apoyada sobre el cristal.
Escáner con alimentador de hojas

Especialmente recomendado para digitalización masiva de documentación, habitual en
entornos corporativos o empresariales. Se trata de una evolución del escáner plano,
donde la carga se realiza de forma
automática, similar a un fax, liberando al
usuario de todo el proceso de introducción
de documentos. Es muy habitual encontrar
esta funcionalidad en los tan extendidos
equipos multifunción (que aúnan escáner,
impresora y fax)
Al contrario que el escáner de sobremesa,
en este tipo de escáneres el cabezal lector
permanece fijo, mientras lo que se mueve Ilustración 10: Escáner con alimentación automática
HP ScanJet Enterprise 8270.
es el documento, mediante un sistema de
tracción por rodillos, cinta, etc. Sólo permite el uso de documentos en hojas sueltas, por
lo que se recomienda elegir aquellos en buen estado que soporte “físicamente” la
19
Los Anillos de Newton son un fenómeno producido por la reflexión de la luz entre dos superficies que
no son totalmente planas. Se trata de unos anillos concéntricos de diferentes colores que aparecen en una
imagen escaneada, fruto de la tensión superficial entre el cristal y el original. Este efecto es similar a los
arco iris que aparecen en las burbujas del jabón http://coloreslab.blogspot.com.es/2010/01/anillos-de-
20
newton.html
___________________________________________________________________________________________
Página
alimentación automática.
Escáner de mano
Este modelo de escáneres no es
habitual en digitalización profesional
pues ofrece resultados de calidad
inferior a otros de sobremesa. Incluso
una cámara digital con una buena
lente de aproximación resulta más
adecuada que este escáner para
obtener resultados de calidad. Al ser
manejado manualmente por el usuario,
depende de un pulso firme y una
velocidad constante para digitalizar,
pues si la velocidad sufre variaciones,
el resultado es una imagen Ilustración 11: Versión actual de un escáner de
mano
distorsionada20. Además, la velocidad
de desplazamiento del escáner está directamente relacionada con la resolución deseada,
pues a mayor resolución, mayor lentitud en la exploración.
El clásico escáner de mano, con una apariencia similar a la de un lector de código de
barras, fue muy popular durante la década de los 90, aunque sus limitadas posibilidades
hicieron que cayera en desuso. Algunos de sus inconvenientes eran la digitalización
exclusivamente en blanco y negro, y que sólo permitía escanear pequeñas áreas,
obligando a repetir el proceso en caso de querer escanear un documento completo,
teniendo que unir después las distintas partes con un programa de edición gráfica.
Escáner portátil
Este tipo de dispositivos basados en la tecnología CIS, junto a las versiones actuales de
los escáneres de mano, son muy fáciles de transportar debido a su poco peso. En
principio, surgen para intentar dar solución a situaciones en las que se requieren
digitalizaciones “urgentes” de cierta calidad de documentos como recibos, tarjetas de
visita, contratos, informes, etc. Se trata de unos periféricos totalmente autónomos, pues
no necesitan estar conectados a un ordenador para transferir la información, ya que
pueden almacenar directamente los documentos digitales en tarjetas de memoria,
transferirlos de manera inalámbrica a dispositivos móviles o almacenamientos en la
nube (Google Drive, Dropbox, etc.) o enviarlos a través de e-mail. Además, tampoco
20
Habitualmente, estos escáneres disponen de un indicador luminoso que advierte si la exploración se
realizó demasiado rápido. Además, emiten una señal de reloj que permite su sincronización con el
21
ordenador.
___________________________________________________________________________________________
Página
requieren de conexión a la red eléctrica, ya
que suelen incluir su propia batería, o se
alimentan a través del puerto USB.
Habitualmente las mayores dimensiones del
original que admiten son las de un A4.
Escáner de cámara para documentos

Aunque su uso para tareas de presentación o
proyección está muy extendido (especialmente
en el ámbito educacional), nos centraremos
Ilustración 12: Escáner portátil Canon
exclusivamente en su funcionalidad como imageFormula P-208
escáner. De esta forma, podríamos
caracterizarlo como la versión ligera o portable de un escáner cenital: el proceso de
captura en este tipo de escáneres se realiza en un solo paso, digitalizando el documento
completo de forma prácticamente instantánea, lo que supone una importante reducción
del tiempo invertido. La principal diferencia radica en que no es necesario ningún
movimiento para realizar el escaneado21 (en el caso de los escáneres de sobremesa, se
mueve el cabezal lector, y en los dispositivos con alimentación automática, se mueve el
documento a través de rodillos). Sin embargo,
presentan algunos inconvenientes como la
influencia en los resultados obtenidos de factores
externos, como la iluminación del original.
El documento se ubica en una superficie plana,

bajo el área de captura de la cámara y a una cierta
distancia de la misma. Al no ser necesario que los
originales estén en contacto con la cámara, esto
posibilita digitalizar documentos que en otros casos
hubiesen presentado dificultades en un escáner de
Ilustración 13: Escáner de cámara para alimentación automática, donde podrían quedar
documentos EPSON DC-11 atascados documentos de distintos tamaños y
formas, grapados, doblados o arrugados.
2.4.2. Escáneres específicos
La diferencia con los escáneres genéricos radica en su diseño especial para tipos
concretos de originales, además de la inclusión de otras características avanzadas como
21
Este hecho influye en la reducción de costes de mantenimiento pues las piezas móviles pueden
22
estropearse con un uso intensivo.

___________________________________________________________________________________________
Página
sistemas de eliminación de ruido electrónico, alto rango
dinámico y altos niveles de resolución.
Escáner de tambor
Son los escáneres con mayor resolución óptica del
mercado, llegando a alcanzar hasta los 24.000 ppi,
aunque esto repercute en la lentitud para efectuar el
proceso de escaneado22. Debido a su elevado precio,
están reservados a profesionales de la digitalización o de
las artes gráficas (laboratorios, imprentas, editoriales,
etc.). En la actualidad, pocas compañías fabrican ya
Ilustración 14: Transparencias
escáneres de tambor, aunque estos modelos conservan su adheridas al tambor de un
nicho de mercado dentro de un público profesional, dados escáner (fuente:
candelafineart.com)
los excelentes resultados obtenidos.
Este escáner está especialmente indicado para originales transparentes, aunque también
permite el escaneo de originales opacos, siempre que puedan curvarse sobre el tambor
(por lo que se desaconseja su uso para documentos frágiles).
En este tipo de periféricos, el sistema consiste en un tambor de cristal de gran pureza, al
cual se adhiere el original. En el caso de las transparencias, se añade un aceite especial
para evitar el efecto de anillos de
Newton. Así, este tambor gira a gran
velocidad a la vez que una fuente de
luz externa incide sobre el original (si
el documento es opaco), o a través de
él (si es transparente, ubicándose
entonces la fuente de luz dentro del
tambor de cristal). La luz es recogida
por unas lentes de precisión que la
redirigen hacia los sensores de tipo
PMT (foto-multiplicadores)23. Se
trata de unos tubos de vacío, muy
Ilustración 15: Escáner de tambor Howtek HiResolve
sensibles a intensidades bajas de luz,
8000 (fuente: candelafineart.com)
que convierten la luz en energía y la
amplifican. En los modelos recientes se usan 3 tubos foto-multiplicadores, encargados
de tratar los haces de luz de color rojo, verde y azul (una lente ha separado previamente
la luz recibida en los tres colores primarios). Por último, las señales eléctricas serán
transformadas en señales digitales.
22
En la siguiente web se detalla el funcionamiento de este tipo de escáner:
http://recursos.cnice.mec.es/fp/artes/ut.php?familia_id=5&ciclo_id=1&modulo_id=2&unidad_id=118&m
enu_id=1410&pagina=&pagestoyen=11&submenu_id=655&ncab=4.1.2&contadort=10
23
23
En algunos escáner de tambor se utiliza la tecnología CCD en lugar del PMT.
___________________________________________________________________________________________
Página
Escáner de planos
También conocido como escáner
de gran formato, es el tipo más
adecuado para la digitalización de
material planimétrico, cartográfico,
etc. Está especialmente diseñado
para digitalizar documentos de
gran formato en una toma digital
única, ya que en otro tipo de
escáneres el usuario debería de
intervenir para escanear el

Ilustración 16: Escáner para planos Contex SD 4400
documento por secciones y
posteriormente, fotocomponer las distintas partes.
Al tratarse de originales de una naturaleza delicada, estos dispositivos disponen de
sábanas de recubrimiento, que no afectan al proceso de digitalización, pero que, sin
embargo, protegen la integridad del documento, evitando así posibles daños
ocasionados por la tracción de la alimentación automática.
Escáner para microfilm

El microfilm, en sus diferentes formatos, sigue siendo un soporte ampliamente utilizado
en archivos históricos, instituciones financieras y sanitarias, medios de comunicación,
etc. Sin embargo, su complicada consulta y manejo, así como su conservación, afectada
por factores tan variados como la temperatura y la humedad, hacen que resulte
altamente recomendable su migración al formato
digital.
El funcionamiento de este tipo específico de
escáneres es similar al de transparencias,
combinando las características de escáner y de
visor de microfilms, e incluyendo zoom, enfoque,
rotación del original y control de exposición,
tanto automático como manual. Así, una de las
funcionalidades más útiles que posee es la
indexación de los archivos digitales, haciendo
uso de los blips, pequeños contadores creados
cuando se hizo la película, y que permiten
Ilustración 17: Escáner de microfilms
Canon MS800 identificar distintas páginas o carpetas.
24
___________________________________________________________________________________________
Página
Su ámbito de uso se extiende, generalmente, a los siguientes materiales24:
● Microfilms
● Microfichas de 105 mm
● Películas de 16 y 35 mm
● Tarjetas de apertura25 (habituales en trabajos de ingeniería)
● Jackets26
Escáner cenital
Se utiliza para la digitalización de
material deteriorado, delicado o antiguo
(libros, manuscritos, mapas, periódicos,
etc.), para los que el proceso de escaneo
debe realizarse con el mínimo contacto
posible con el original27.
Básicamente, la estructura de estos
escáneres consiste en dos lámparas
laterales de luz “fría” y un brazo central,
donde se ubica una cámara de alta
resolución que efectúa una trayectoria
aérea sobre el original, para capturar
imágenes del mismo. El documento que
se quiere escanear se ubica a cierta Ilustración 18: Escáner cenital I2S Suprascan
distancia de la cámara, teniendo en Quartz
cuenta algunas consideraciones como:
● En caso de digitalizar un documento plano o un libro que pueda abrirse
completamente se acomoda un cristal o plástico que alisa las páginas.
● Si el ejemplar es antiguo y puede dañarse el lomo, no es necesario abrir
completamente el libro para su escaneado. Para ello, ubicaremos el libro en un atril
especial, lo que nos permitirá abrir el original en diferentes ángulos.
La intervención del usuario se limita a ir pasando las páginas del libro, aunque se han
desarrollado prototipos que emplean técnicas como la aspiración y la electricidad
estática para manejar las páginas de manera automática.
24
Documento elaborado por el South Carolina Department of Archives and History sobre los distintos
tipos de microfilm existentes: http://rm.sc.gov/leaflets/Documents/SEVEN.pdf
25
http://es.wikipedia.org/wiki/Tarjeta_perforada
26
http://upload.wikimedia.org/wikipedia/commons/e/e4/Microfiche_card.JPG
27
Dado el elevado precio de este tipo de escáneres, a continuación se adjuntan unos enlaces con
instrucciones para fabricar nuestro propio escáner de libros:
http://www.muycomputer.com/2009/12/14/actualidadnoticiasescanea-tus-
libros_we9erk2xxdbvemqw0zny9c9wocpjnhqqyroxpvszgv3uyfsd1ewtiwremm5x9wdc
25
27
http://derechoaleer.org/blog/2011/08/nuestro-do-it-yourself-book-scanner.html
___________________________________________________________________________________________
Página
Algunos problemas frecuentes que
podemos encontrar a la hora de digitalizar
libros pueden solucionarse con las
características específicas de este tipo de
escáneres. Por ejemplo, los casos
siguientes:
● Sombras en las áreas cercanas al
lomo del libro: la mayoría de modelos
disponen de un sistema de balance por
Ilustración 19: Atril para mantener el libro hardware (mediante calibración de la
abierto a 120º iluminación y el cabezal óptico) para evitar
este problema.
● Distorsión de los caracteres cercanos al lomo cuando el libro está abierto
completamente: para solucionar esto, se puede utilizar el atril con un determinado
ángulo de apertura, y la cámara se ubicará de manera perpendicular respecto al
documento.
● Corrección de curvatura de las páginas en trabajos encuadernados, mediante el
uso del cristal que alisa la página o por procesamiento con software, que aplana la
imagen y “endereza” las líneas del texto.
● Eliminación del dedo del operario que sujeta la página o documento: también
mediante el cristal que alisa la página o bien, eliminado automáticamente mediante
software.
Escáner de negativos o transparencias

Dichos escáneres permiten la digitalización de documentos transparentes, como
negativos fotográficos y diapositivas en color o en blanco y negro, que por su tipología
no pueden ser escaneados de forma directa, es decir, utilizando el foco de luz directa
empleada por los escáneres tradicionales.
Como mencionamos anteriormente en el
apartado de los escáneres “genéricos”, existen en
el mercado adaptadores para que un escáner
plano admita transparencias, aunque los
resultados no suelen ser satisfactorios, por lo que
se recomienda este otro tipo específico de
escáner, que ofrece, además, altas resoluciones y
rangos dinámicos (aunque hay que señalar que
no admite documentos opacos): un escáner para
películas de 35 mm proporciona desde 2700
hasta 4000 dpi. Una película de 35mm Ilustración 20: Escáner de negativos
escaneada a 2700 dpi permite generar una Nikon Super COOLSCAN 5000 ED
26
___________________________________________________________________________________________
Página
impresión de 8x10 pulgadas (20.32x25.4 cm), es decir, un aumento de 9x.
Los formatos aceptados van desde el 35 mm. hasta placas de 9x12 cm, aunque también
existen escáneres multiformato que admiten todas las medidas (placas 4”x5”, 5”x7”,
etc.).
El fenómeno de la reflexión de la luz explicado en el apartado “Cómo funcionan los

escáneres” no se produce de forma adecuada con documentos transparentes en este
escáner. Para solucionar este inconveniente, el documento a digitalizar debe ser
iluminado desde arriba (y no desde abajo, como en los escáneres tradicionales). De este
modo, la luz emitida por la lámpara atraviesa la diapositiva/negativo, y los cambios de
luminosidad son recogidos por el sensor CCD. El resto de pasos son los mismos que en
supuestos anteriores.
Este tipo de escáneres disponen de una serie de sistemas para solucionar algunos
problemas frecuentes en la digitalización de originales transparentes. Es el caso de:
● Eliminación de motas de polvo, desperfectos o impurezas del negativo (pelos,

etc.): el sistema ICE (Image Correction and Enhacement, Corrección y mejora de la
imagen), desarrollado por la compañía Applied Science Fiction (una división de Kodak
Professional), que combina hardware y software para realizar esta tarea: la fase
“hardware” se basa en el escaneado del original utilizando un canal adicional al de los
tres colores primarios, el infrarrojo, el cual es “bloqueado” cuando encuentra estas
imperfecciones28 y permite a los sensores CCD ubicar la imperfección. La etapa
“software” elimina estos defectos teniendo en cuenta su posición, tamaño y forma,
utilizando bien el reescalado de los píxeles dañados, bien el “inpainting”29 (si un pixel
está muy dañado, se interpola su valor a través de los píxeles vecinos no dañados).
Dependiendo de los fabricantes, esta técnica recibe distintos nombres: por ejemplo,
Epson, Nikon o Microtek la denominan Digital ICE, mientras Canon utiliza su propia
denominación: FARE (Film Automatic Retouching and Enhancement System).
28
Esta técnica no es aplicable a documentos opacos ni a todos los medios transparentes. Por ejemplo, las
partículas de una película de haluro de plata en blanco y negro también bloquean la luz infrarroja, por lo
que no es posible distinguir entre píxeles oscuros e imperfecciones.
27
29
http://es.wikipedia.org/wiki/Restauraci%C3%B3n_de_imagen
___________________________________________________________________________________________
Página
Ilustración 21: Resultado al aplicar la tecnología ICE (fuente: asf.com)
● Reducción del grano en la imagen, habituales en fotografías tomadas con una
ISO alta (la que permite obtener mejores imágenes en situaciones con iluminación
deficiente), mediante el sistema software GEM. Esta metodología realiza análisis
matemáticos a partir de los diferentes colores de la imagen, para así obtener un patrón
sobre el ruido, lo que permitirá eliminarlo posteriormente. Es una técnica más efectiva y
que permite conservar más detalles (como colores, nitidez, variaciones tonales, etc) que
la reducción de ruido que habitualmente soportan los programas de edición gráfica.
Ilustración 22: Antes y después de aplicar la tecnología GEM (fuente: asf.com)

● Transparencias o negativos descoloridos por el desgaste o por efecto del
tiempo30: el sistema software ROC (Restoration Of Color) analiza el rastro dejado por
los colorantes en el material del film para intentar determinar el aspecto original. Una
vez realizados estos cálculos, lleva a cabo las correcciones oportunas ajustando los
30
Los colorantes usados en este tipo de films se deterioran con el tiempo debido a factores ambientales
como la temperatura, la humedad relativa o la exposición a la luz. Esta decoloración además no es
28
uniforme, sino que afecta de distinta manera a zonas brillantes y a zonas de sombras.
___________________________________________________________________________________________
Página
niveles o curvas de color de la imagen digital.
Ilustración 23: Antes y después de aplicar la tecnología ROC (fuente: asf.com)
Escáner de documentos
Aunque el escaneado de documentación en texto (esto es, con unas necesidades
diferentes al de imágenes) se puede realizar con dispositivos genéricos, en
digitalizaciones masivas resulta más apropiado y eficiente utilizar un periférico especial,
con una serie de características concretas para este tipo de originales. Así, podemos
destacar:
● Mayor velocidad: de 20 a 150 páginas por minuto, habitualmente en escala de
grises, aunque en algunos modelos se permite el color (lo que no repercute en la
velocidad).
● Volúmenes diarios de trabajo: se trata de un factor esencial en digitalizaciones
de grandes volúmenes de documentación, siempre que se utilicen sistemas de
alimentación automática para no dañar el original. Pueden oscilar entre las 1000 y
15.000 páginas diarias. De esta característica, directamente relacionada con la velocidad
de escaneo, dependerá el tiempo efectivo de trabajo al día.
● Manejo de las hojas: para ello, suelen incorporar las siguientes características:
○ Posibilitan el escaneo a doble cara;
○ Poseen bandejas de alimentación de mayor capacidad (del orden
de 500 páginas) que las de escáneres genéricos o copiadoras;
○ Aceptan varios formatos y grosores de documento;
○ Incorporan sistemas de detección de elementos como clips, grapas
o ganchos, y de “doble alimentación” del escáner (en este caso, el alimentador
29
automático introduce dos o más hojas de manera simultánea en el escáner).

___________________________________________________________________________________________
Página
Sin embargo, estas funcionalidades no evitan la intervención humana para optimizar y
agilizar la automatización del proceso, principalmente en la preparación (eliminando
dobleces o grapas que puedan atascar el escáner) y en la ordenación del material a
escanear. Para la posterior indexación de los archivos digitales, se puede hacer uso de
técnicas como la numeración Bates31 (habitual en entornos médicos y legales) o el
reconocimiento de códigos de barras que han sido asignados a los originales.
● Resolución: comprendida entre los 150 y los 300 ppp, lo que permite generar
documentos digitales con la suficiente calidad para su visualización y posterior
tratamiento OCR (reconocimiento óptico de caracteres).
● Formato: los
documentos digitales
generados, compuestos por
caracteres en negro sobre
fondo blanco, permiten su
almacenamiento en formato
TIFF sin pérdida de calidad,
pues la escasa gama de
colores genera archivos de
poco tamaño. Además, otros
formatos con pérdida como
JPEG, que resultan adecuados
para fotos, afectan
negativamente a los textos, al
dar, por ejemplo, un aspecto
Ilustración 24: Escáner para documentos Canon DR-X10CZ irregular a los bordes de los
caracteres.
2.5. El estándar TWAIN

Las aplicaciones informáticas para el manejo y la edición de imágenes digitales
necesitan comunicarse con el escáner (u otros dispositivos como cámaras digitales).
Hasta la aparición de las interfaces32, que permiten a las aplicaciones acceder
directamente al escáner sin necesidad de conocer detalles sobre el mismo ni de ejecutar
pasos intermedios, el proceso de digitalización resultaba tedioso, pues consumía
demasiado tiempo con la siguiente sucesión habitual de tareas:
1. Cerrar la aplicación para el tratamiento de imágenes.
31
Véase: http://www.ehowenespanol.com/son-numeros-bates-info_205985/
32
Una interfaz es básicamente un elemento que permite la comunicación e intercambio de datos entre
30
dispositivos de cualquier tipo.

___________________________________________________________________________________________
Página
2. Localizar y abrir la aplicación proporcionada por el fabricante del
dispositivo para iniciar la digitalización.
3. Configurar las opciones del escaneo, como resolución, gama de colores,
etc.
4. Generar y guardar la imagen digital obtenida a partir del original.
5. Cerrar la aplicación del escáner.
6. Abrir el programa para el tratamiento de imágenes.
7. Localizar y abrir el fichero en dicho programa.
El primer paso fue entonces el desarrollo por parte de fabricantes de hardware y
software de sus propias interfaces para la adquisición de imágenes digitales. Pero dado
el creciente número, tanto de dispositivos existentes como de software de edición de
imágenes digitales, y para evitar el desarrollo de drivers33 específicos para cada
combinación entre un modelo y una aplicación software, surgió la necesidad de un
estándar que permitiese conectar, de manera universal, aplicaciones con dispositivos
digitalizadores. De esta forma, un desarrollador de software únicamente debe programar
su aplicación de acuerdo a dicho estándar, mientras que el fabricante de hardware creará
para su dispositivo un driver también compatible con el estándar.
Estos estándares para API’s34 y protocolos de comunicación (como es el caso de
TWAIN) deben cumplir una serie de objetivos: ser multiplataforma (funcionar en
diferentes sistemas operativos), soportar múltiples dispositivos (como escáneres
manuales, de sobremesa, cámaras digitales), estar preparados para cambios tecnológicos
futuros y permitir el intercambio de datos en una amplia variedad de formatos.
El funcionamiento de estos estándares se basa en que el driver del escáner transforma
los comandos ejecutados desde la aplicación (como iniciar un escaneo, o digitalizar en
monocromo o a una determinada resolución), en comandos hardware entendibles por el
periférico, y, además, permite al programa recuperar adecuadamente las imágenes
digitalizadas. Por ejemplo, el programa de tratamiento de imágenes Adobe Photoshop
soporta el estándar TWAIN, por lo que Photoshop puede adquirir una imagen de
cualquier escáner que incorpore un driver compatible con dicho estándar. Sin embargo,
cada fabricante, e incluso cada modelo, dispone de su propio driver basado en el
estándar, por lo que no todos los dispositivos permiten las mismas opciones. Resulta,
pues, muy interesante que el driver incluya el mayor número de opciones que nos
permitan parametrizar el proceso de digitalización, esto incluye a factores como:
● Resolución (ppp / dpi)
● Tipo de imagen: color, escala de grises, blanco y negro, line art.
● Brillo y contraste.
● Digitalización previa: nos permite seleccionar el área a digitalizar y es
33
Un driver es un programa que actúa como controlador de un dispositivo, permitiendo la comunicación
entre un ordenador y un periférico.
34
API es la abreviatura de Application Programming Interface. Un API es una serie de procedimientos,
servicios o funciones ofrecidos para realizar una determinada acción, como, por ejemplo, imprimir un
31
carácter en pantalla, leer el teclado, escribir en un fichero de disco, etc.

___________________________________________________________________________________________
Página
especialmente importante si queremos digitalizar un área pequeña a muy alta
resolución para así ahorrar tiempo.
● Control de gama de color.
● Filtros: difuminado, aclarado, resaltado de bordes, etc.
● Operaciones básicas en el tratamiento de imágenes digitales, como rotar,
invertir, cortar o redimensionar la imagen.
● Técnicas más avanzadas para la mejora35 de la imagen digital, como:
○ Eliminación de muaré (descreening)
○ Eliminación de grano (despeckling)
○ Enderezamiento de la imagen (deskewing)
○ Aumento de nitidez (sharpening)
○ Ajuste de profundidad de bits.
Eliminación de muaré Eliminación de grano
Enderazamiento de la imagen Aumento de la nitidez
Ilustración 25: Técnicas de mejora de la imagen digital

● Para procesos de digitalización masiva, es un aspecto muy importante
que este software nos permita también parametrizar una configuración por
defecto, con el objetivo de poder automatizar así esta tarea.
35
La mejora del documento digitalizado mediante software genera controversia acerca de la fidelidad y
autenticidad respecto al original, por lo que muchas instituciones no aplican estas mejoras sobre los
32
originales y las limitan a las versiones que serán difundidas, por ejemplo, mediante página Web.
___________________________________________________________________________________________
Página
El estándar TWAIN36 es el más usado por la mayoría de escáneres (aunque inicialmente
estaba orientado a dispositivos básicos y domésticos), y está disponible para los
sistemas operativos Windows, Mac OS y Linux. Fue creado por el Twain Working
Group, un consorcio de empresas desarrolladoras de software y fabricantes de hardware
(formado en sus inicios por Adobe, Caere, Eastman Kodak, Hewlett Packard y
Logitech), y su primera versión se lanzó en febrero de 1992, hasta llegar a la actual 2.2.,
de febrero de 2012.
Otros ejemplos de API’s que podemos encontrar para escáneres son los siguientes:
● SANE37 (Scanner Access Now Easy) es un proyecto de software libre de API
para acceso a los escáneres. Habitualmente utilizado en sistemas operativos Unix y
Linux, existen versiones disponibles para OS/2, Mac OS X y Windows. Al contrario
que TWAIN, en SANE están claramente diferenciados el frontend (programas que
maneja el usuario) y el backend (drivers del escáner). SANE se centra en la
comunicación con el hardware, lo que facilita los escaneos dentro de una red local o en
digitalizaciones masivas.
● ISIS (Image and Scanner Interface Specification), creado por la compañía Pixel
Translations en 1990 (actualmente EMC captiva). Sigue utilizando la interfaz de
conexión SCSI-II por razones de rendimiento, y es usado, principalmente, en
digitalizaciones a gran escala o en aquellas que requieren tareas desarrolladas a medida,
pues facilita la programación para manejar todo tipo de características, operaciones y
formatos.
● WIA38 (Windows Image Acquisition) es una API desarrollada por Microsoft para
su uso en el S.O. Windows desde su versión Me (Millenium). WIA amplía las
funcionalidades ofrecidas por STI (Still Image Architecture) en Windows 98. Mientras
que STI se limitaba a la transferencia básica de datos desde/hacia el escáner, WIA es
más cercana al estándar TWAIN, y permite que una aplicación tenga acceso
prácticamente total a las posibilidades ofrecidas por el escáner.
2.6. OCR (Reconocimiento óptico de

caracteres)
Una de las funcionalidades indispensables en la digitalización de textos es el OCR
(Optical Character Recognition), que consiste en un software (o servicio Web) de
36
http://www.twain.org/. Habitualmente se dice que TWAIN es el acrónimo de “Technology Without An
Interesting Name” (tecnología sin un nombre interesante), aunque en realidad procede del poema de
Rudyard Kypling, La Balada del Este y el Oeste: “... and never the twain shall meet” (y nunca los dos se
encontrarán), que trata de reflejar la dificultad de conectar escáneres y ordenadores personales.
37
http://www.sane-project.org/
33
38
http://msdn.microsoft.com/en-us/library/windows/desktop/ms630368(v=vs.85).aspx
___________________________________________________________________________________________
Página
reconocimiento de caracteres que permite identificar los símbolos de un determinado
alfabeto dentro de una imagen digital (en formato BMP, TIFF, JPG, PNG, etc), para
generar así un fichero de texto editable y comprensible por el ordenador (en formato
DOC, RTF, XLS, HTML, etc). El archivo resultante permitirá ser reformateado, realizar
búsquedas sobre el documento completo, facilitará su difusión online e incluso su
procesamiento a través de lenguajes de marcado como XML. Algunos ejemplos de este
tipo de software son:
● Read-Iris: http://www.readiris.com/
● Omnipage: http://www.omnipage.com/
● Fine-Reader: http://www.finereader.com/
Este sistema permite
automatizar la generación de
archivos textuales, evitando
introducir la información por
teclado (el OCR puede
alcanzar una velocidad de
lectura de hasta 1.200
caracteres por segundo), lo
que supone un importante
ahorro en tiempo, pero
también en consumo de
memoria, pues el espacio de
almacenamiento que requiere
una imagen digital es 3 veces
Ilustración 26: Captura de pantalla del software OCR ABBYY
mayor al de un documento de FineReader.
texto.
Las versiones actuales de este software permiten reconocer un elevado número de
tipografías y de sistemas de escritura (cirílico, árabe, hebreo, hindú, chino, japonés o
coreano) con un alto porcentaje de acierto, además de intentar respetar al máximo el
formato original del documento en lo que a imágenes, columnas y otros elementos no
textuales se refiere. Algunos software OCR incluso facilitan una versión “Narrador”,
capaz de leer en voz alta el documento escaneado, una función muy útil para personas
con discapacidad.
En cualquier caso, este sistema, aunque efectivo, no es infalible, por lo que se requiere
un control de calidad del archivo final por especialistas, de cara a la corrección de
errores, especialmente en documentos antiguos o en textos impresos con baja calidad.
En el ámbito de la digitalización del patrimonio cultural, el OCR se aplica en procesos
de digitalización de documentos históricos (en papel o en microfilms), tales como textos
impresos, prensa, páginas mecanografiadas, panfletos, partituras, etc, aunque los
resultados todavía no son satisfactorios para textos manuscritos. Además, tiene
aplicaciones en otros muchos aspectos de nuestra sociedad, como la digitalización de
34
___________________________________________________________________________________________
Página
material corporativo (albaranes, facturas, etc.), reconocimiento de matrículas,
herramientas de traducción asistida ...
2.6.1. ¿Cómo funciona el OCR?
Como requisito previo, hay que señalar que resulta muy recomendable escanear a
resoluciones altas para captar así el mayor número de detalles. Esto implica lo siguiente:
A. En textos con tipos de letra claros, escanear mínimo a 300 ppp
B. En textos con tipos de letra pequeña u originales de poca calidad, mínimo a 600
ppp.
Antes de actuar, el software OCR debe de intentar solucionar o, al menos, minimizar
algunos aspectos negativos del documento original o problemas surgidos durante la
digitalización, de cara a mejorar la precisión de los resultados. Entre esta serie de
problemas encontramos:
● Posibles problemas con los documentos originales:
○ Documentos deteriorados;
○ Letras borrosas o poco nítidas;
○ Letras fragmentadas o solapadas;
○ Manchas o transparencias en el papel;
○ Tipografías extrañas o fuera de uso;
○ La distancia que separa a unos caracteres de otros no es
homogénea (cuando el texto está justificado, con cursivas, dígitos, etc.), lo que
puede causar errores de reconocimiento.
● Posibles problemas con las imágenes digitales generadas:
○ La imagen digital incluye niveles de color que no aparecen en la
imagen original;
○ La imagen digital tiene ruido, lo que afecta a los píxeles que serán
procesados;
○ En ocasiones, existen píxeles comunes que conectan dos o más
caracteres.
El proceso que lleva a cabo el software OCR hasta la obtención del documento de texto
se compone de los siguientes pasos:
1. Preprocesamiento de la imagen digital:
● Binarizar la imagen: consiste en convertir la imagen a color o en escala
de grises a blanco y negro (también llamada imagen binaria porque solo tiene 2
colores), lo que nos facilitará aislar las partes de la imagen que contienen texto
(las partes en blanco pertenecen al fondo, y las partes en negro, a los caracteres).
Es en esta fase cuando pueden surgir los primeros problemas con originales
dañados o manchados. Imaginemos un periódico con una mancha de café en uno
de los artículos. Cuando pasemos la imagen escaneada a binario, la mancha se
35
convertirá en negro, lo que confundirá al software OCR a la hora de detectar los

___________________________________________________________________________________________
Página
caracteres afectados por la mancha.
● Enderezar la imagen: si el documento no estaba alineado correctamente
durante su digitalización, es recomendable girar la imagen con el objetivo de
hacer las líneas de texto totalmente horizontales o verticales.
● Eliminar ruido y suavizar los bordes: Algunas técnicas utilizadas para
remediar estos factores son:
○ Etiquetado: para la división de la imagen en regiones de
componentes conectadas.
○ Erosión / expansión: para la eliminación de pequeños
grupos de píxeles.
○ Umbralizado de histograma: para eliminar/seleccionar los
objetos más brillantes o más oscuros que componen la imagen.
2. Segmentación de la imagen
● Eliminar las líneas y otros elementos que no sean caracteres, lo que
permite mejorar el análisis de la estructura, y detectar de manera más eficiente
textos subrayados y tablas.
● Análisis de la estructura: identificar columnas, párrafos,
encabezamientos, pies de página, tablas y diagramas, números de página, etc.
● Fragmentación o segmentación de la imagen: permite detectar las
regiones de la imagen y, dentro de ellas, descomponerlas en sus
correspondientes caracteres. Una de las técnicas habituales son las proyecciones
lineales, que consiste en alinear una imagen con una rejilla uniforme, de tal
forma que las líneas verticales de la rejilla incidirán sobre áreas en negro
(caracteres).
Ilustración 27: Segmentación de la imagen

● Análisis de caracteres solapados o fragmentados: en este caso es
necesario detectar la posición correcta de cada carácter.
● Ajustar escala o tamaño de los caracteres.
3. Reconocimiento de caracteres39: Según el algoritmo utilizado, el sistema nos

36
39
Algunos software OCR realizan dos pasadas al documento. La segunda pasada es llamada “de
___________________________________________________________________________________________
Página
devuelve un listado ordenado de posibles caracteres. En ocasiones, el software nos
devuelve varios caracteres para imágenes confusas. Por ejemplo, el carácter "I" (letra i
mayúscula) podría traducirse como "I" (letra i mayúscula), "|" (barra vertical), "1"
(número uno) o "l" (letra ele minúscula).
● Reconocimiento o coincidencia con patrón: Se trata de la técnica más
común, y al ser más simple que la detección de características, también es más
limitada. Consiste en comparar cada uno de los caracteres detectados en la
imagen, pixel a pixel, con una colección de patrones o contornos de caracteres
(en mapa de bits), hasta encontrar alguno en el que se alcance un alto nivel de
parecido. La fiabilidad de esta técnica depende de que los caracteres en la
imagen hayan sido correctamente localizados, y que el patrón con el que vamos
a comparar sea de una tipografía y tamaño similar a la que tenemos disponible
en nuestro software. Esta técnica es apropiada para imágenes que contengan
textos con fuentes habituales, como Arial o Times New Roman, pero no para
tipografías poco comunes.
● Detección de características, también conocida como ICR (Intelligent
Character Recognition). En lugar de reconocer el patrón completo para un
carácter, descompone y compara las letras por sus elementos característicos
como trazos, curvas, bucles, intersecciones entre trazos, etc., los cuales serán
comunes para cada carácter independientemente de la tipografía utilizada. Esta
técnica es utilizada en sistemas avanzados como el reconocimiento de escritura a
mano40 o en las versiones más modernas de software OCR.
Ilustración 28: Detección de características (fuente:

explainthatstuff.com)
4. Post-procesado del documento:

Existen varias técnicas para optimizar el proceso de reconocimiento de los textos por
parte del software OCR:
● Asignamos un léxico o un contexto (lista de palabras permitidas dentro
reconocimiento adaptativo”, y en ella, usa las formas de los caracteres reconocidos en la primera pasada
con alto nivel de coincidencia para aumentar las posibilidades de éxito en los caracteres pendientes. Esto
es especialmente útil para tipografías poco comunes, o para escaneos de baja calidad, donde la fuente está
distorsionada, borrosa o degradada.
40
El ICR también interviene en el reconocimiento de caracteres manuscritos, aplicando técnicas de
inteligencia artificial como el análisis de movimiento de la escritura a mano (orden en el que se escriben
los caracteres, la dirección, patrón al apoyar y levantar el bolígrafo, etc.). Algunas de las principales
dificultades que surgen son el detectar cuando acaba un carácter y empieza otro, o caracteres que no se
37
ajustan al “estándar” - ya que cada persona escribe de una forma distinta-.

___________________________________________________________________________________________
Página
del documento) al que pertenece el original digitalizado: por ejemplo, un
diccionario técnico para una temática concreta (ingeniería, medicina…). Sin
embargo, esta técnica puede causar problemas si el documento contiene palabras
no incluidas en dicho léxico.
● Indicar el idioma al que pertenece el documento digitalizado permite
mejorar los resultados, pues a partir de la gramática podremos determinar si una
palabra es más probable que sea un verbo o un nombre dependiendo del
contexto.
● “Análisis por vecinos próximos”, basada en la frecuencia en la que
algunas palabras aparecen juntas para corregir errores. Por ejemplo,
“Washington D.C.” es mucho más frecuente en inglés que “Washington DOC”.
● Por último, el software podría “abstenerse” de realizar correcciones
automáticas y realizaría un marcado de aquellas palabras que considera no ha
decodificado correctamente, mostrando la imagen en su contexto de página para
que el revisor pueda interpretar qué palabra es la adecuada.
El documento final tras el proceso de reconocimiento de caracteres puede ser un fichero
de texto plano o, en sistemas más avanzados, se intenta mantener la estructura original
del documento, generando un fichero que incluya la imagen digitalizada y una
representación textual que permita búsquedas41.
Por último, mencionar la colaboración abierta y distribuida entre personas, también
conocida como “crowdsourcing”, que permite resolver o corregir con un alto nivel de
precisión caracteres que al software le resultan complicados por diversos motivos. Uno
de los ejemplos más comunes es el reCAPTCHA42 de Google, que podemos encontrar
en muchos formularios de páginas Web.
3. Cámaras digitales
3.1. Introducción
Las cámaras digitales son una evolución de las cámaras analógicas tradicionales. Las
primeras cámaras digitales únicamente permitían realizar capturas fotográficas con una
calidad bastante reducida, mientras que las actuales permiten incluso la captura de video
en alta definición.
Se han convertido en una alternativa atractiva a los escáneres comunes. Aunque siguen
teniendo desventajas frente a estos, como la distorsión, reflejos, sombras o bajo
41
Un ejemplo habitual son las hemerotecas on-line de periódicos, como las citadas en el Módulo 1 -
Unidad 3 “Buenas Prácticas”, a partir de la página 35.
38
42
Véase: http://www.google.com/recaptcha/digitizing
___________________________________________________________________________________________
Página
contraste, ofrecen ventajas como la velocidad, portabilidad y una mayor flexibilidad en
la digitalización de documentos grandes y pesados, sin dañarlos.
3.2. Cómo funcionan

Básicamente, su funcionamiento es el mismo que el de los escáneres, pues se encargan
de transformar la información analógica (las distintas intensidades de luz) en señales
eléctricas mediante un sensor (CCD o CMOS) para convertir después estas distintas
tensiones en datos digitales, que conformarán la imagen final.
Los dispositivos CCD (ya explicados en el apartado relativo a los escáneres)
transportan la carga a través del chip hasta un convertidor analógico-digital, que
midiendo la carga que le llega, convierte el valor de cada píxel en un valor digital.
Dependiendo del número de bits del conversor, obtendremos un mayor o menor número
de gamas de color (lo que denominamos profundidad de bit).
En cambio, con el sensor CMOS (complementary metal oxide semiconductor,
semiconductor complementario de óxido metálico), la digitalización de cada pixel se
hace internamente mediante transistores que lleva cada celda. Al procesar la imagen
dentro del propio sensor, los sensores CMOS generan más ruido que los CCD, pues
éstos últimos realizan el procesado en un chip externo y exclusivo para esta tarea.
En cuanto al rango dinámico, se obtienen mejores resultados con sensores CCD
respecto a los CMOS, porque al tener los primeros menos sensibilidad a la luz, los
extremos son mejor tolerados.
Actualmente, casi la totalidad de cámaras poseen sensor de tipo CMOS, al ser más
baratos de fabricar y permitir una reducción de tamaño considerable en la cámara
digital.
La mayoría de sensores CCD y CMOS de las cámaras
digitales captan los colores mediante un filtro colocado
delante del sensor monocromo, con el patrón Bayer. Este
patrón se comporta de la siguiente manera:
En la primera fila se alternan filtros verdes y rojos, en la
segunda verdes y azules, y así sucesivamente. La matriz
Bayer está compuesta por un 50% de filtros verdes, 25% de
rojos y 25% de azules, ya que el ojo humano tiene más
sensibilidad al color verde. Un píxel de color estaría formado Ilustración 29: Ejemplo de
matriz Bayer (fuente
por cuatro de estas celdas, dos verdes, una roja y una azul. recursoswebs.com.ar)
39
___________________________________________________________________________________________
Página
3.3. Tipos de cámaras digitales
En el mercado, podemos encontrar varias familias de cámaras digitales, según sus
características y finalidad:
Cámaras réflex o DSLR (Digital

Single Lens Réflex)
Caracterizadas por el uso de objetivos
intercambiables que exponen la luz sobre un
sensor, son las cámaras que mejor calidad de
imagen ofrecen. Aunque por sus prestaciones
y precios son cámaras destinadas al sector
profesional, recientemente ha ganado adeptos
entre usuarios aficionados a la fotografía.
Ilustración 30: Cámara réflex Canon EOS

Las réflex incluyen un sensor de mayor 1100D de gama baja
tamaño que las cámaras compactas, lo que
permite capturar distancias focales43 mayores y con ello, obtener un mayor control sobre
la profundidad de campo44. El visor réflex, a través del cual podemos ver directamente
la imagen a capturar (y no una recreación digital en una pantalla, como ocurre en las
compactas), funciona de la siguiente manera: La luz pasa a través del objetivo
reflejándose en un espejo colocado a 45º, desviando esta luz hacia arriba, donde se
encuentra el pentaprisma (un polígono
de cristal de cinco lados) que se encarga
de rebotar esta luz de nuevo hacia el
visor. A la hora de la captura, al
presionar el botón, el espejo se levanta
dejando que la luz impacte sobre el
sensor para generar así la imagen final.
Ilustración 31: Ejemplo de visor réflex de una

Pentax K-5 (fuente focopixelado.blogspot.com)
Como dijimos anteriormente, en esta
familia de cámaras los objetivos son intercambiables, con un surtido amplio de focales y
43
La distancia focal de una lente es la distancia entre el centro óptico de la misma y el punto de foco,
donde se concentran los rayos de luz. En un objetivo, la distancia focal es la distancia entre el diafragma
de éste y el punto de foco.
44
La profundidad de campo o PDC (DOF o Depth of field en inglés) es el espacio nítido que existe por
40
delante y por detrás del plano enfocado.

___________________________________________________________________________________________
Página
calidades, además de permitir una configuración total. Aunque no son exclusivos de las
cámaras réflex, los principales parámetros que se pueden configurar en las cámaras son:
● Sensibilidad ISO: El ISO es la sensibilidad del sensor a la luz. El valor nativo
de las cámaras se sitúa entre 100 y 200 dependiendo de la marca. A mayor número ISO,
mayor sensibilidad del sensor a la luz, permitiéndonos disparar a velocidades más
rápidas. Suele aumentarse dicho parámetro en situaciones de baja luminosidad, escenas
nocturnas en las que se fotografía sin el apoyo de un trípode, etc. También cabe destacar
que a mayor sensibilidad, mayor ruido digital45 aparecerá en la imagen.
● Velocidad de obturación: La velocidad de obturación se refiere al tiempo en que
el obturador está abierto permitiendo pasar la luz al sensor durante más o menos
segundos. Se expresa en segundos y fracciones de segundo, siendo generalmente los
valores de las cámaras comunes de entre 30” y 1/4000 (una cuatromilésima de
segundo), aunque cámaras de alta gama pueden llegar a velocidades de 1/8000.
● Apertura del diafragma: El
diafragma en un objetivo es una serie
de láminas metálicas que se cierran en
el momento de tomar la foto
regulando la cantidad de luz que
queremos que llegue al sensor. Este
parámetro se regula desde la cámara y
se especifica en números f/. Cuanto
menor sea el número f/, mayor será la

Ilustración 32: Aperturas del diafragma del objetivo
cantidad de luz que entrará al sensor (fuente fotonavia.com)
durante el tiempo que dure la captura,
lo que nos permite hacer fotos a mayores velocidades sin riesgo de trepidación
(vibración), pero menor será la profundidad de campo. Cuanto mayor sea el número f/
menos luz entrará al sensor, pero tendremos más espacio en la foto enfocado.
Cámaras de medio formato

Las cámaras de medio formato poseen un sensor
mucho más grande que las réflex comunes y su
uso está dedicado únicamente a los profesionales
y científicos donde hacer ampliaciones
realmente grandes y nítidas es lo primordial.
Estas cámaras se dividen en varias partes:
● El chasis: el cuerpo en sí, donde está el
agarre.
● Visor y botoneras.
Ilustración 33: Cámara de medio formato
● El objetivo, que también es
Hasselblad H4X (Fuente: Hasselblad)
41
45
Véase: http://es.wikipedia.org/wiki/Ruido_en_la_fotografía_digital
___________________________________________________________________________________________
Página
intercambiable como las réflex.
● El respaldo digital, que es donde está el sensor y es intercambiable,
pudiendo acoplarle al chasis respaldos de más de 80 megapíxel.
Al estar enfocada a un sector específico, sus componentes son de mucha precisión y

tanto las cámaras como los accesorios suelen tener precios muy elevados.
Cámaras SLT (Single Lens

Translucent)
Podemos considerarlas una derivación de las
cámaras réflex. Actualmente Sony es la
propietaria y desarrolladora de esta
tecnología, que elimina el pentaprisma del
cuerpo y sustituye el espejo mecánico por un
espejo fijo translúcido que actúa también
como pantalla de enfoque. El visor óptico
también es sustituido por uno electrónico.
Esto implica un desgaste menor de las piezas
Ilustración 34: Ejemplo de tecnología SLT
móviles, ya que con cada obturación no se de Sony en una Alpha 58 (Fuente: Sony)
tiene que levantar y bajar el espejo, lo que
permite una velocidad de disparo en ráfaga mayor y menos vibraciones a la hora de la
captura. Como contrapartida, para ver por el visor, la cámara debe permanecer
encendida.
Cámaras Evil (Electronic

Viewfinder Interchangeable Lens)
Nueva familia de cámaras digitales, con
ópticas intercambiables pero sin espejo
como las réflex. También conocidas como
CSC (Compact System Camera), MSC
(Mirrorless System Camera) o DSLM
(Digital Single Lens Mirrorless). Las
ópticas intercambiables de las EVIL
generalmente tienen un diámetro más
reducido que el de las réflex, aunque una
Ilustración 35: Cámara EVIL Lumix GF1 y
accesorios gran ventaja es que, mediante un
adaptador, se pueden acoplar objetivos de
estas últimas, pudiendo tener las ventajas de ambos mundos: ópticas de gran calidad
fabricadas para las réflex, con un cuerpo de tamaño reducido y ligero. Actualmente ya
se fabrican objetivos de excelente calidad para este tipo de cámaras.
42
___________________________________________________________________________________________
Página
No poseen visor óptico, pero se les puede acoplar uno como accesorio.
Cámaras bridge o ultrazoom

Podríamos decir que se trata del modelo
intermedio entre las réflex y las compactas, de
ahí el término bridge, (puente en inglés). La
principal diferencia está en el zoom óptico,
que puede llegar hasta los 20 aumentos,
utilizado para primeros planos, fotografías de
naturaleza, etc. Estas cámaras tienen una
única lente no intercambiable con zoom
motorizado. Tampoco poseen visor óptico ni
espejo. Aunque más grandes que las
compactas, no hay que olvidar que las bridge
Ilustración 36: Cámara bridge Sony
no son más que eso, compactas con funciones HX100V
avanzadas sin llegar a la cantidad de
parámetros de las réflex.
Cámaras ultracompactas
De fácil manejo y asequibles, están
destinadas a todos aquellos que
quieren llevar la cámara siempre
encima. Existen modelos ultrafinos de
incluso 12mm de grosor. Están
pensadas para ser usadas en modos
automáticos, aunque algunas de ellas
permiten el control manual de la
exposición. Tienen una lente zoom de
Ilustración 37: Cámara digital ultracompacta alcance medio, entre 5 y 7 aumentos,
Olympus. aunque también las hay con 15
aumentos. El sensor de estas cámaras es pequeñísimo, por lo que en condiciones de
poca luz, pueden generar bastante ruido digital en la imagen. Incorporan un flash
integrado con un alcance de entre 0,5 y 1,5m. El único visor que tienen estas cámaras es
la pantalla trasera, que actualmente tienden a ser táctiles y a ocupar todo el espacio
trasero de la cámara, sin dejar lugar a ningún botón físico. También es cada vez más
frecuente que la pantalla sea abatible.
43
___________________________________________________________________________________________
Página
3.4. Características de cámaras digitales
Resumiremos a continuación algunas de las características que hay que tener en cuenta
a la hora de seleccionar una cámara digital.
● Resolución: Medida en megapíxeles y con unos valores comprendidos entre los
6 y los 36 megapíxel en las cámaras más comunes. Este valor se consigue al multiplicar
los píxeles de alto por los de ancho. Es decir, una imagen de 1600px de ancho por
1200px de alto tiene 1.920.000px, es decir, 1,92mpx. Existe la falsa creencia de que a
mayor cantidad de megapíxeles, mayor calidad de la fotografía, cuando esta
característica, en realidad, viene determinada por la óptica del objetivo. A decir verdad,
este valor simplemente nos da el tamaño final de la imagen y sólo es importante cuanto
mayor sea la ampliación impresa de la foto, donde, además, hay que considerar también
la resolución de impresión, medida en PPP (Puntos por pulgada) o DPI (Dots per inch,
en inglés). A partir de 200ppp se puede considerar que la calidad de impresión es
aceptable. Para determinar el tamaño máximo de impresión de una imagen hay que
dividir el ancho por los ppp que tenga. Si tiene 1600px de ancho entre 200ppp,
1600/200=8, con lo que esa imagen tendría un tamaño de impresión máximo de 8
pulgadas (20.32 cm) con total calidad.
● Memoria externa: En la mayoría de los casos, la memoria externa es la
encargada de realizar el almacenamiento de las fotografías y los vídeos. Las principales
consideraciones de la memoria externa son su capacidad (desde 2 hasta 128gb), su
velocidad de escritura/lectura46 y su formato, siendo los más extendidos:
○ SD (SecureDigital) y microSD, son el soporte más estandarizado,
actualmente existen modelos con conexión wifi incluida en la tarjeta, lo que nos
permite transferir las fotos en tiempo real a cualquier dispositivo sin cables.
○ MMC (MultimediaCard) y SecureMMC
○ CompactFlash, muy utilizadas en el ámbito profesional, aunque
noticias recientes hablan de su camino a la extinción.
○ Memory Stick, de Sony, y XD, de Olympus y Fujifilm, cuya
presencia en el mercado va reduciéndose en comparación con el resto de
formatos.
46
Para usuarios comunes, este parámetro no tiene mucha importancia, cualquier tarjeta con una velocidad
normal nos permitirá hacer fotos y grabar vídeo en calidad óptima, pero en el mundo profesional sí que
son importantes estas velocidades. Para disparos en ráfaga (eventos sociales, deportes, etc.) en formato
RAW con muchos megapíxeles o grabación de vídeo en alta definición a 1080p, se necesitan velocidades
más altas de lo normal, ya que la cantidad de datos que se genera es muy grande. Las tarjetas rápidas para
estos menesteres actualmente existen desde 45mb/s hasta 90mb/s, aumentando su precio en proporción a
44
la velocidad.
___________________________________________________________________________________________
Página
Ilustración 38: Tarjetas de memoria.
● Pantalla LCD: Una de las ventajas más importantes de las cámaras

digitales es que permiten visualizar las fotografías y los vídeos realizados a
través de una pantalla LCD integrada en la cámara. El tamaño de esta pantalla
oscila entre las 1,1 y las 4 pulgadas. En muchos modelos esta pantalla es
totalmente abatible, pudiéndose adaptar a cualquier ángulo, facilitando así la
captura de imágenes mediante el sistema Live View, es decir, mirar por la
pantalla en tiempo real en lugar de por el visor.
● Zoom: Las cámaras digitales, al igual que
las tradicionales, proporcionan un zoom óptico
basado en el movimiento de sus lentes. Sin
embargo, también ofrecen otro tipo de zoom, el
digital, basado en el procesamiento software de la
imagen y que es capaz de aumentar el tamaño de
una determinada área de la imagen, a costa de la
pérdida de calidad del resultado generado (lo que
hace que no sea recomendable para digitalización).
● Óptica: podemos convenir que es un
aspecto que influye decisivamente en el resultado
final de la fotografía. Los factores determinantes Ilustración 39: Movimiento de
para la calidad del objetivo son: el tipo de lente y la lentes internas de un objetivo
luminosidad del propio objetivo. Las ópticas que para realizar zoom óptico
(fuente Wikipedia)
más calidad ofrecen son las de distancia focal47 fija
(sin zoom), que ofrecen menores aberraciones cromáticas, mayor nitidez, y una
apertura de diafragma más grande, y que, por lo tanto, son más luminosas. Para
que una lente zoom alcance la calidad de una fija, su coste debe ser muy
elevado. Las ópticas zoom en la actualidad llegan a aperturas de f/2.8, mientras
que las fijas llegan a f/1.2 e, incluso, algunas muy exclusivas, hasta f/0.95.
Algunos de sus fabricantes más importantes son Carl Zeiss, Nikon (Nikkor),
Sigma, Sony, Tamron y Canon.
La calidad del objetivo, además de la calidad de los cristales, viene dada por su
47
La distancia focal de una lente es la distancia entre el centro óptico de la misma y el punto de foco. El
punto de foco es donde se concentran los rayos de luz. En un objetivo, la distancia focal es la distancia
45
entre el diafragma de éste y el punto de foco.

___________________________________________________________________________________________
Página
construcción. Los de más calidad suelen ser de construcción metálica y sellados
contra salpicaduras de agua y partículas de polvo. Los de menor calidad son de
plástico y con componentes que se degradan antes, como los anillos de zoom o
enfoque, además de unos cristales con tratamientos menos costosos que los de
gama alta, pudiendo producir reflejos indeseados o cierta falta de nitidez.
Ilustración 40: Distancia focal: fuente notodoestodo.blogspot.com
3.5. A la hora de la digitalización

Cuando vayamos a digitalizar con cámara fotográfica, hay que tener en cuenta la
necesidad de disponer del equipo idóneo para ello. Esto podría incluir, entre otros
:
● La cámara: Lo más habitual es hacerlo con una cámara réflex, con una
resolución de al menos de 10mpx, y que sea capaz de captar imágenes en formato sin
pérdida, como RAW. Lo mejor sería utilizar una cámara réflex con sensor de 35mm o
“Full Frame”, ya que gestionan mejor las distancias focales más angulares (las que
abarcan más campo de visión). Además, los sensores más grandes generan menos ruido
que los APSC (Advanced Photo System Classic o Sistema Avanzado de Fotografía
Clásico en español) si incrementamos el ISO si la situación así lo requiere.
● El objetivo: La utilización de un objetivo u otro, fijo o zoom, dependerá en gran
medida del tipo de soporte o de trípode que utilicemos. Lo ideal es un objetivo fijo, que
en formato de 35mm equivalga a 50mm de distancia focal. En un sensor APSC, un
objetivo de 50mm, con el factor de multiplicación, nos proporcionaría unos 75mm. Un
objetivo zoom normal, como uno de 18-55mm, también nos serviría perfectamente. La
distancia focal de 50mm es la que simula la visión del ojo humano, y la que ofrece
menos distorsiones en la imagen. Hay que usar aperturas pequeñas o cerradas,
46
___________________________________________________________________________________________
Página
consiguiendo localizar así el punto dulce48, lo que nos permite sacar la mayor calidad
óptica del objetivo.
● Un soporte o trípode: El trípode fija la cámara y nos

permite usar aperturas pequeñas, de forma que podamos
conseguir mayor profundidad de campo y obtener entonces
la mejor calidad del objetivo.
En la elección de un trípode para este cometido no debemos
escatimar recursos y es mejor hacernos con un trípode
robusto. Los más baratos que existen actualmente en el
mercado son endebles y no permiten poner la cámara en
posiciones complejas. Lo ideal es algún modelo en el que la
Ilustración 41: Trípode con
columna central se pueda desmontar y poner de manera columna en horizontal
horizontal, si el objeto lo requiere. En estos trípodes, el
final de la columna suele llevar un enganche retráctil para colgar algún elemento a
modo de contrapeso, con el objetivo de no desestabilizar la estructura y que el equipo
acabe cayendo hacia delante. También es recomendable incluir una rótula con zapata de
liberación rápida (de esta forma, la cámara queda libre del trípode con un simple giro de
tuerca o movimiento de palanca) que sea de buena calidad, ya que es donde irá montada
la cámara.
Sin embargo, para la
digitalización de
libros y de
documentos
delicados, suele
utilizarse
generalmente la
cámara digital
acoplada a un
soporte específico
para este tipo de
trabajos, los cuales
fijan la cámara en la
parte superior de
manera segura, pero Ilustración 42: Mesa de reproducción para digitalización con cámara
(Fuente: www.digireflex.net)
permitiendo subir o
bajar la altura de la misma según las necesidades. A los laterales suele haber unos
soportes para la iluminación más adecuada, según el objeto que haya que digitalizar y su
48
El punto dulce de un objetivo es el rango de aperturas donde se consigue la mejor calidad de éste. La
mayor nitidez, enfoque y menores aberraciones cromáticas se sitúan en este rango que por lo general va
47
desde f8 hasta f11.

___________________________________________________________________________________________
Página
sensibilidad a la misma. Dichos soportes también permiten una relativa flexibilidad a la
hora de orientar las luces para evitar así sombras indeseadas que interfieran en la
digitalización.
● Un disparador remoto: Es conveniente que la cámara que utilicemos disponga de

un puerto de conexión para un disparador remoto. Estar todo el rato presionando el
botón de la cámara no es una buena práctica, ya que esto nos podría generar
trepidaciones en la imagen por el movimiento del aparato. Usando el disparador no es
necesario tocar la cámara. Otra opción para que la imagen no salga movida o
desenfocada, y si no se quiere usar un disparador remoto, o si nuestra cámara no
dispone de un puerto de conexión, es usar el retardo de 2 segundos desde que se
presiona el botón del obturador hasta que se hace la fotografía.
● Iluminación: En la digitalización no se debería usar el flash bajo ningún
concepto, pues la luz que estos emiten puede dañar los documentos o ciertos objetos
delicados. Una opción posible es que utilicemos nuestras propias fuentes de luz, con un
par de luces laterales adecuadas que, sin dañar el objeto a digitalizar, iluminen
oblicuamente éste (puestos en ángulos de 45º para evitar esas sombras o reflejos).
● Unidades robotizadas: Cuando se quieren reproducir obras de arte con mucho
detalle para visitas virtuales o para poder analizarlas en profundidad, es cada vez más
frecuente que se usen ciertos robots
específicos. Estos robots son habitualmente
controlados por ordenador, de forma que
dividen la foto en sectores que van
fotografiando con sumo detalle, siendo
necesarias entonces miles de fotografías
para componer la imagen final. Una de las
mayores ventajas de esta técnica es que se
puede ampliar la imagen hasta el más
mínimo detalle, garantizándonos una
Ilustración 43: Robot digitalizando El
digitalización, podríamos decir, casi Guernica de Pablo Picasso
perfecta.
4. Conversión de audio y video a digital

El mundo del video y del audio, tanto analógico como digital, es un tema complejo,
cuyo proceso de digitalización requiere unos conocimientos sobre los dos ámbitos que,
tratados con el detalle necesario, excederían los contenidos y objetivos de este curso.
Además, la edición de audio y video digital, al contrario que en lo relativo a la imagen,
no tendrán un capítulo específico en este curso, por lo que exponer esta información sin
48
___________________________________________________________________________________________
Página
una aplicación práctica posterior, no parece demasiado útil.
Por ello, se pretende dar una introducción general sobre los soportes analógicos tanto de
audio como de video que podemos encontrar y los medios disponibles para
digitalizarlos, sin entrar en detalle sobre los mismos.
En primer lugar, la diferencia fundamental respecto a los originales capturados con

escáneres o cámaras digitales, es que la digitalización de audio y video requerirá, la
mayoría de veces, de un reproductor para los soportes que almacenan este tipo
información en formato analógico. Esto es, en muchas ocasiones, un obstáculo, pues
dichos aparatos, o bien no se fabrican, o es muy complicado encontrar recambios para
las piezas deterioradas y/o personal cualificado que sepa manejar, configurar o reparar
estos dispositivos.
Otro aspecto importante es la puesta a punto y/o restauración previa al proceso de

digitalización, una tarea frecuente dado que en este caso, tanto los soportes originales
como los reproductores deben estar en condiciones óptimas de limpieza y
funcionamiento, siendo uno de los aspectos más importantes un control estricto de
factores ambientales como temperatura o humedad en el almacenamiento de los
soportes, de cara a minimizar los efectos de la degradación de los mismos.
En cualquier caso, la digitalización de audio y video nos proporciona numerosas

ventajas entre las que podemos citar:
 Las copias digitales son más resistentes al paso del tiempo y menos propensas al
deterioro por factores ambientales que los soportes analógicos (un ejemplo es el
“síndrome del vinagre” que afecta al acetato de celulosa del que se compone el
material fílmico). Además, a diferencia de los originales analógicos, las
sucesivas copias y reproducciones no merman la calidad de la copia maestra.
 Evitamos el manejo de una gran cantidad de soportes, y por consiguiente, de
reproductores que sean capaces de leerlos.
 Tareas como el almacenamiento, copia, edición o compresión resultan mucho
más fáciles de realizar sobre archivos digitales
 Los soportes en los que podemos almacenar documentos digitales (y que
veremos con mayor profundidad en el siguiente bloque) son muy variados y
cada vez con una mayor capacidad a un menor coste: CD, DVD, memorias
flash, discos duros, almacenamiento en la red, etc.
49
___________________________________________________________________________________________
Página
4.1. Conversión a audio digital
Para la conversión de archivos sonoros a un formato digital, nos encontramos con dos
tipos diferentes de soportes analógicos:
 Discos: desde los fabricados con goma (en las primeras grabaciones) o acetato,
hasta materiales más resistentes como el vinilo o la pizarra, así como las copias
maestras en metal, a partir de las cuales se obtienen los discos comerciales. Este
tipo de soporte intenta reproducir, a través de surcos realizados sobre su
superficie, las ondas sonoras originales, que posteriormente serán interpretados
por la aguja del gramófono o tocadiscos.
 Cintas magnéticas: hasta principios de los años se utilizó 60 una base de
acetato de celulosa para su fabricación, siendo posteriormente compuestas por
poliéster o PVC (policloruro de vinilo). En las cintas (bien en su forma de
cassette o de bobina abierta), la información de las señales eléctricas captadas
por el micrófono es grabada haciendo uso de las propiedades magnéticas de la
superficie (este tipo de soporte se explicará con más detalle en el siguiente
bloque de este módulo).
Para la digitalización de cualquiera de estos soportes, se recomienda el uso de un

conversor externo de audio analógico a digital, que interpretará las señales eléctricas
generadas por el reproductor analógico (bien un gramófono, un reproductor de casetes o
un magnetófono de carrete abierto) y generará a partir de ellas los datos digitales,
transmitidos a las entradas de audio digital del ordenador, para su posterior
almacenamiento o manipulación. Se trata de un dispositivo específico para esta tarea
que evita que el proceso de conversión deba ser realizado por el ordenador y afecte a su
rendimiento.
Otras opciones disponibles son el uso de la tarjeta de sonido, conectada directamente al

reproductor analógico, o en el caso de los vinilos, podemos encontrar en el mercado
nuevas generaciones de tocadiscos “digitales” capaces de generar ficheros de sonido y
transferirlos directamente al ordenador.
50
___________________________________________________________________________________________
Página
Ilustración 44: Ejemplo de un convertidor de audio de analógico a digital, con las entradas de audio
analógico en la parte inferior derecha, y las salidas de audio digital en la parte inferior izquierda.
4.2. Conversión a video digital

En este caso también encontramos dos familias de video analógico:
 Cintas en soporte magnético, como U-Matic, 1 y 2 pulgadas, VHS o BETA
 Soportes fotoquímicos o fílmicos, como Super-8, 16 o 35mm.
En el primero de los casos, las opciones son similares a la digitalización de soportes

magnéticos de audio, y podremos utilizar bien un conversor de analógico a digital
externo, o una tarjeta capturadora de video. En ambos casos, al igual que en lo referente
al sonido, deberán disponer de las tomas necesarias para conectar con el reproductor
analógico y que el conversor pueda adquirir tanto la señal de vídeo como la señal de
audio.
Ilustración 45: Conversor de video analógico a digital Blackmagic Multibridge

51
___________________________________________________________________________________________
Página
El caso del soporte fotoquímico el
proceso es algo más complejo. En
digitalizaciones profesionales, se utilizan
escáneres específicos para esta labor,
con altísimos niveles de resolución
óptica así como alto rango dinámico, que
procesarán cada fotograma del film de
una manera similar a la que lo hacen los
escáneres de negativos explicados en
este bloque didáctico.
Ilustración 46: Escáner para films ARRISCAN
Otra opción posible, aunque con unos resultados de peor calidad respecto al escáner, es
la del telecine, que consiste en la proyección de una película cinematográfica y su
migración a un formato de video, habitualmente digital (que podrá ser procesado
posteriormente por el ordenador).
Ilustración 47: Sistema de Telecine

52
___________________________________________________________________________________________
Página

Medios de Digitalización

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Medios de Digitalización

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Medios de Digitalización

Cargado por

Copyright:

Formatos disponibles

Curso en Digitalización del Patrimonio

Asignatura 1: Introducción a la Digitalización del

Módulo 3. Medios, soportes y formatos para la digitalización

Unidad 1: Medios para la digitalización

Ilustración 1: Partes básicas de un escáner (Fuente: EPSON) ...................................................................... 5

Para cualquier consulta referente al contenido de este documento, póngase en contacto

Nombre del profesor

Ilustración 1: Partes básicas de un escáner (Fuente: EPSON)

● Escáner con tecnología CCD3 (Charged Coupled Device, Dispositivos de

Ilustración 2: Sensor CCD lineal para un escáner.

Ilustración 3: Sensor CCD matricial para una cámara digital.

1) Colocamos el documento a digitalizar, con la cara a explorar boca abajo, en la

Ilustración 4: Esquema de funcionamiento para una pasada (fuente: pcmag.com).

1) Colocamos el documento a digitalizar en la superficie de cristal del escáner, bajo el

2) El cabezal lector, ubicado justo debajo de la superficie de cristal (de ahí la

3) Para cada línea del documento se realizan las siguientes tareas:

Ilustración 5: Esquema de funcionamiento de un escáner CIS y de un escáner CCD

Éste sería, a grandes rasgos, el funcionamiento de los escáneres en función de la

● En los escáneres CCD, la fuente de luz es una única lámpara fluorescente y de

2.3. Características de los escáneres

● Resolución óptica (u horizontal): El dispositivo Ilustración 6: Distintas

● Resolución mecánica (o vertical): esta medida se corresponde con la velocidad

Algunas situaciones concretas donde podemos comprobar los beneficios de una

imagen final, logrando así una calidad de imagen más auténtica.

Pixeles 4x6” 5x7” 8x10” A4 10x12” A3 13x19”

● Edición precisa de píxeles, especialmente indicado para diseñadores

La resolución es un aspecto relevante en el tamaño del fichero final: duplicar el valor de

Otras características generales propias de los escáneres (independientemente de su tipo)

Modo de escaneo Cantidad de colores reconocidos

Tabla 3: Profundidad de color

● Velocidad de escaneo (medida en ppm - páginas por minuto): Define el

principalmente al tiempo de exposición del dispositivo CCD.

2.4. Tipos de escáneres

2.4.1. Escáneres genéricos

pretende recomendar marcas o modelos concretos.

Escáner con alimentador de hojas

Escáner de cámara para documentos

El documento se ubica en una superficie plana,

2.4.2. Escáneres específicos

estropearse con un uso intensivo.

intervenir para escanear el

Escáner para microfilm

Escáner de negativos o transparencias

El fenómeno de la reflexión de la luz explicado en el apartado “Cómo funcionan los

● Eliminación de motas de polvo, desperfectos o impurezas del negativo (pelos,

Ilustración 22: Antes y después de aplicar la tecnología GEM (fuente: asf.com)

Ilustración 23: Antes y después de aplicar la tecnología ROC (fuente: asf.com)

automático introduce dos o más hojas de manera simultánea en el escáner).

2.5. El estándar TWAIN

dispositivos de cualquier tipo.

carácter en pantalla, leer el teclado, escribir en un fichero de disco, etc.

Eliminación de muaré Eliminación de grano

Enderazamiento de la imagen Aumento de la nitidez

Ilustración 25: Técnicas de mejora de la imagen digital

2.6. OCR (Reconocimiento óptico de

2.6.1. ¿Cómo funciona el OCR?

convertirá en negro, lo que confundirá al software OCR a la hora de detectar los

Ilustración 27: Segmentación de la imagen