PDF - Wikipedia, La Enciclopedia Libre
PDF - Wikipedia, La Enciclopedia Libre
PDF - Wikipedia, La Enciclopedia Libre
PDF (siglas en inglés de Portable Document Format, 'formato de documento portátil') es un formato
de almacenamiento para documentos digitales independientes de plataformas de software o
hardware. Este formato es de tipo compuesto (imagen vectorial, mapa de bits y texto).
Inicialmente desarrollado por la empresa Adobe Systems, fue oficialmente lanzado como un
estándar abierto el 1 de julio de 2008 y publicado por la Organización Internacional de
Estandarización (ISO) como ISO 32000-1 (https://www.iso.org/standard/51502.html) .
Puede contener cualquier combinación de texto, elementos multimedia como vídeos o sonido,
elementos de hipertexto como vínculos y marcadores, enlaces y miniaturas de páginas.
Los archivos PDF no pierden el formato con el envío a otros usuarios, como sí sucede cuando se
envían documentos de texto (se desordenan las páginas, se desorganizan los párrafos, etc.).[1]
Es uno de los formatos más extendidos en Internet para el intercambio de documentos. Por ello,
es muy utilizado por empresas, gobiernos e instituciones educativas.
Es una especificación abierta, para la que se han adaptado herramientas de software comercial
como las suites ofimáticas Microsoft Office y WordPerfect Office y creado otras en software libre
que permiten crear, visualizar o modificar documentos en formato PDF, como OpenOffice.org,
LibreOffice y Calligra Suite así como sistemas de composición de textos (LaTeX o ConTeXt).
Un archivo PDF puede crearse desde varias aplicaciones exportando el archivo, como es el caso
de OpenOffice.org, LibreOffice y Microsoft Office (a partir de la versión 2007, si se actualiza a
SP2[2] ).
Puede generarse desde cualquier aplicación mediante la instalación de una «impresora virtual»
en el sistema operativo, en caso de usar aplicaciones sin esa funcionalidad integrada.
Reseña histórica
Desarrollador
Imagen vectorial
Mapa de bits
Extendido de PostScript
Los archivos PDF se utilizan para almacenar documentos e información, interactivos y regulares, así
como mapas, gráficos, catálogos, presentaciones y libros electrónicos.
Las versiones tempranas de los documentos PDF no tenían hipervínculos externos; por este motivo,
su adopción en Internet era considerablemente reducida y no tenía mucha popularidad. En esos
tiempos, eran comunes las conexiones lentas a Internet a través de módems telefónicos, y el
tamaño de los documentos PDF era mucho más grande que otros tipos de documentos, como por
ejemplo el texto simple (sin formato); por lo tanto, la banda ancha fue un factor clave para su
aceptación en Internet. Además, ya existían otros tipos de documentos que le hacían fuerte
competencia al tipo de documentos PDF, como por ejemplo, los documentos PostScript ( .ps ), los
cuales, en esos tiempos, eran considerablemente comunes.
Con el tiempo, el formato PDF fue adquiriendo popularidad de varias formas diferentes, como
publicidad, hasta convertirse en un estándar de facto.[5] Este formato es visto como una “página
digital” que está lista para imprimirse exactamente como se muestra en la pantalla, sin problemas
de márgenes a la hora de imprimir, a diferencia de lo que sucede en otros formatos digitales de
documento.
En los años recientes, han surgido varias aplicaciones lectoras de este tipo de archivos tales como
Evince, Atril y Okular, que son de software libre, entre otras. Su popularidad ha abierto la posibilidad
de crear documentos PDF con programas de software privativo y libre tales como Microsoft Office,
WordPerfect Office, OpenOffice.org, LibreOffice y Calligra Suite. Otras aplicaciones, son incluso
capaces de editarlos de manera directa, sin necesidad de usar la típica aplicación para crear y
editar documentos PDF de Adobe.
Un archivo de sólo imágenes se presenta como una imagen de mapa de bits o una instantánea.
Debido a que es el equivalente a una fotografía no es posible hacer búsquedas por texto, porque lo
visualizado es la imagen que genera el texto, no el texto en sí mismo (igual que se le puede hacer
una foto a un libro). Sin embargo, este formato es útil cuando las versiones digitales deben ser
absolutamente fieles a las originales, como en los casos de facturas o documentos legales.
Los documentos sin etiquetar se han creado sin etiquetas PDF. Las etiquetas PDF son similares a
las etiquetas utilizadas en el código HTML para hacer la búsqueda Web más accesible. El texto en
documentos sin etiqueta es a menudo difícil de leer.
Documentos etiquetados
Los documentos etiquetados son fáciles de encontrar a través de una búsqueda web. Son fáciles
de leer, optimizados para ser vistos en una pantalla pequeña y capaz de ser copiados.
Formularios electrónicos
Los formularios PDF electrónicos ofrecen al usuario la posibilidad de guardar los datos
introducidos con el teclado o copiados de un archivo existente. Los formularios terminados pueden
ser protegidos con contraseña y guardados. Los formularios también pueden ser publicados en
Internet o enviados a través de correo electrónico.
Independientemente de cómo se hayan creado los archivos PDF, todos ellos comparten la misma
estructura interna compuesta de cuatro partes:
Cabecera: información sobre la especificación del estándar PDF que se ha seguido, en donde se
indica, por ejemplo, la versión.
Tabla de referencias cruzadas: información de los elementos usados en las páginas del archivo.
Hay que notar que, cuando un archivo PDF se modifica y se añade nuevo contenido, este tendrá
nuevas secciones de cuerpo, tabla de referencias cruzadas y coda, pero al guardar este documento
se puede optimizarlo para que las secciones duplicadas se fusionen en una sola y se reorganice el
archivo.
El formato PDF está indicado para la impresión de documentos, ya que especifica toda la
información necesaria que los definen. Es interesante especificar cómo se hace la representación
de colores del fichero en PDF. En el formato PDF se especifican espacios de color, esto es la
descripción de cómo hay que interpretar los colores del documento.
Es la forma más simple e imprecisa de reproducir colores, usada por aparatos que no disponen de
gestores de color. Cada punto es descrito por un color que está compuesto de ciertas cantidades
de colorantes.
Para PDF existen tres espacios de colores distintos dependientes del dispositivo:
CMYK del dispositivo: los valores de composición de los colores son descritos por los colores
primarios de pigmento CMYK (Acrónimo de “Cyan, Magenta, Yellow y Black”; Cian, Magenta,
Amarillo y Negro) mediante mezcla sustractiva que es la usada en pintura y artes gráficas.
RGB del dispositivo: los valores de composición de los colores son descritos por los colores
primarios de la luz RGB (“Rojo, Verde y Azul”) mediante mezcla aditiva.
Gris del dispositivo: los valores de composición de los colores son descritos por una escala
acromática de blanco a negro.
Al usar la definición de color dependiente, aunque tenga unos mismos valores del color, la
reproducción de ellos variará según el dispositivo que lo reproduzca.
Para PDF existen cuatro espacios de colores distintos independientes del dispositivo:
RGB calibrado: los valores de composición de los colores son descritos por los colorantes RGB
mediante mezcla aditiva pero tanto la intensidad, tonalidad y gradación dependen de funciones
decodificadoras en las que se aplica un valor gamma particular para cada colorante.
Gris calibrado: los valores de composición de los colores son descritos por una escala
acromática de blanco a negro pero la intensidad, la tonalidad y la gradación dependen de
funciones decodificadoras en las que se aplica un valor gamma particular para el colorante.
Lab: espacio de color basado en CIE compuestos por “A, B y C” que se les asigna los valores L*,
a* y b* del espacio de color CIELAB (espacio de color Lab).
Basado en ICC: basados en los espacios de color del Consorcio Internacional del Color, el cual no
se basa en las entradas de los diccionarios de espacio de color sino en perfiles de color
International Color Consortium (ICC).
Espaciales
Espacios de color Separación: son espacios de color monocromos en donde se usan colorantes
especiales como tintas metálicas o fluorescentes.
Espacios de color Dispositivo: usados para ocasiones en que los objetos necesiten utilizar más
colorantes en la impresión. Estos espacios de color permite que los colorantes que haya en el
dispositivo se traten como un espacio de color del dispositivo con varios componentes.
Compresión en PDF
Los archivos PDF se pueden comprimir y cada elemento del mismo es comprimido mediante uno u
otro algoritmo. Los textos y órdenes de formato PostScript se pueden comprimir usando el
algoritmo Lempel Ziv Welch (LZW) y las imágenes mediante JPEG, ZIP o RLE.
JPEG
JPEG (Joint Photographic Experts Group), en modo con pérdidas o sin pérdidas usado para
imágenes en escala de grises o cuatricromías. Si se recomprime causa pérdida acumulativa de
información.
ZIP
ZIP (Formato de compresión ZIP) realizada mediante el algoritmo LZW, sin pérdidas, en donde
reemplaza secuencias repetidas por marcadores. Indicado para imágenes en color y escala de
grises.
RLE
RLE (Run-length encoding) sistema sin pérdidas usado para imágenes de línea (gráfico rasterizado).
Referencias
3. Jim King (4-12-2007) ISO Ballot for PDF 1.7 Passed! (http://blogs.adobe.com/insidepdf/2007/1
2/iso_ballot_for_pdf_17_passed.html) , Adobe systems (en inglés).
5. «Document management — Portable document format — Part 1: PDF 1.7 (PDF 32000-1:2008)»
(http://www.adobe.com/content/dam/Adobe/en/devnet/acrobat/pdfs/PDF32000_2008.pdf)
(en inglés). Adobe Systems Incorporated. p. 6. Consultado el 18 de febrero de 2017.
Véase también
E-comic
Formato abierto
Formulario
PostScript
DjVu
Gestor documental
Impresora multi-funcional (MFP), que puede usarse para digitalizar documentos a PDF.
Sellado de tiempo
Enlaces externos
Datos: Q42332
Multimedia: Portable Document Format (https://commons.wikimedia.org/wiki/Category:Port
able_Document_Format) / Q42332 (https://commons.wikimedia.org/wiki/Special:MediaSearch?
type=image&search=%22Q42332%22)