Análisis y reconocimiento de imágenes
Análisis y reconocimiento de imágenes
Análisis y reconocimiento de imágenes
Se necesitan algoritmos específicos para las diferentes tareas de DIAR. Los principales
procesos son los siguientes:
Procesamiento y mejora de la imagen. Técnicas aplicadas para mejorar la calidad y la
visualización, ya sea para hacerlos más legibles para las personas o para facilitar que
sistemas automáticos los interpreten mejor.
Análisis de la estructura y segmentación. Técnicas aplicadas para detectar y segmentar
las diferentes regiones de la imagen (ej. Detectar los párrafos, imágenes, tablas, logos,
etc. que aparecen en el documento)
Clasificación de documentos. Técnicas para clasificar los documentos según su tipología
(ej. documentos gráficos de textuales, cartas, facturas, etc.).
Reconocimiento de texto impreso. El reconocimiento óptico de caracteres (OCR en
inglés) consiste en agrupar píxeles en letras, y así convertir una imagen en un archivo de
texto editable por un procesador de textos.
1
Curso online en Humanidades Digitales
Bibliografia de referencia
- (En inglés): Richard Szeliski, Computer Vision: Algorithms and Applications, Springer
(Texts in computer Science) 2011. (http://szeliski.org/Book)
- (En catalán): A.Fornés, J.Lladós, O.Ramos, M.Rusiñol. La visió per computador com a
eina per a la interpretació automàtica de fonts documentals. LLIGALL, Revista
Catalana d'Arxivística, vol. 39: Digitalització i reconeixement de caràcters: quan les
màquines llegeixen documents, (ISSN: 1130‐5398), 2016.
http://www.cvc.uab.es/people/afornes/publi/journals/2016_Lligall.pdf
2
Curso online en Humanidades Digitales
Enlaces de interés