2017 Metadatos
2017 Metadatos
2017 Metadatos
ISSN: 0187-750X
public@dgb.unam.mx
Universidad Nacional Autónoma de
México
México
Una de las necesidades de los usuarios al buscar información en la Web es encontrar Keywords:
con precisión aquella información que necesitan, es decir, que al efectuar una bús- Semantic Web, Metadata, rdf
queda no se recuperen grandes cantidades de documentos, los que en ocasiones nada Electronic information organiza-
tion, Subject retrieval in the Web
tienen que ver con la búsqueda que efectúan. Lo anterior implica la existencia de una
Web Semántica, en donde los sistemas de información puedan entender el significado
del contenido, particularmente el temático, de los recursos u objetos de información.
Si se toma en cuenta que en la Web Semántica los datos o atributos deberán tener ma-
yor contexto y significado, entonces esos datos o atributos se tienen que organizar y
estructurar adecuadamente, utilizando diversas opciones, entre las que se encuentran
los metadatos. Por lo anterior, el objetivo de este documento es presentar un acerca-
miento a la relación existente entre los metadatos, particularmente los de contenido,
y la Web Semántica. En primer lugar se aborda el tema de los metadatos, definiendo
y subrayando su función. Posteriormente se aborda el tema de la Web Semántica y
los retos que implica el uso de los metadatos de contenido para apoyar su desarrollo.
ABSTRACT
One of the user needs when searching for information on the Web is to find those
precise information they need; That is, when doing a search, they do not should re-
cover large amounts of documents, which sometimes have nothing to do with the
search they make. This implies the existence of a Semantic Web, where information
systems can understand the meaning of content, particularly thematic content of in-
formation resources. If it is taken into account that in the Semantic Web the content
data or attributes should have a greater context and meaning, then those data or at-
tributes must be organized and structured appropiately, using various options, among
them, metadata. Therefore, the purpose of this document is to present an approach
to the relationship between metadata, particularly content metadata, and the Seman-
tic Web. First, the topic of metadata is discussed, defining and underlining its role.
Subsequently, the topic of the Semantic Web and the challenges of using content
metadata to support its development are discussed.
BIBLIOTECA UNIVERSITARIA
Volumen 20, número 1, enero-junio 2017
3
El papel de los metadatos en la Web Semántica
P
ensar en una web en donde los usuarios datos, debido a que proporcionan datos sobre las ca-
puedan encontrar la información que ne- racterísticas o los atributos de un recurso de informa-
cesitan sin tener ningún problema en cuan- ción. Desde la perspectiva de este concepto, un ejem-
to a su recuperación con precisión, es decir, que plo podrían ser los registros de un catálogo, los cuales
al efectuar una búsqueda solamente se recupere –según algunos autores–, son el principio o el antece-
aquella información relacionada con sus necesida- dente más antiguo de los metadatos. Sin embargo, los
des y no las grandes cantidades de documentos metadatos van más allá de la simple descripción de
que actualmente se recuperan por los buscado- las características o atributos de un recurso, puesto
res, y que en ocasiones nada tienen que ver con que también posibilitan su localización y recuperación.
la búsqueda que se efectúa, es hablar de la Web
Semántica. Una web en donde los sistemas de in- Por otro lado, también ha sido señalado que los meta-
formación puedan entender el significado del con- datos son datos altamente estructurados que descri-
tenido, particularmente el temático, de los recur- ben diversos aspectos de los recursos de información,
sos u objetos de información. Evidentemente, el tales como su contenido, calidad, proceso de produc-
problema es cómo lograr que los datos puedan ser ción, detalles de los formatos y otras características.
entendidos por los sistemas de búsqueda y recu- Por lo tanto, los metadatos son un conjunto de infor-
peración de información. Si se toma en cuenta que mación sobre los diferentes atributos de los recursos
en la Web Semántica los datos o atributos deberán u objetos de información.
tener mayor contexto y significado, entonces esos
datos o atributos se tienen que organizar y estruc- Las estructuras de los esquemas de metadatos se en-
turar adecuadamente, utilizando diversas opcio- cuentran conformadas por campos, los que permiten
nes, entre las que se encuentran los metadatos. su utilización en la organización y recuperación de la
Considerando lo anterior, el objetivo de este docu- información. Asimismo, es importante mencionar que
mento es presentar un acercamiento a la relación los metadatos se enfocan al manejo de diversos as-
existente entre los metadatos, particularmente los pectos de los recursos de información, siendo estos
de contenido, y la Web Semántica. En primer lugar aspectos los siguientes: descriptivos, administrativos,
se aborda el tema de los metadatos, definiendo y estructurales y semánticos. Lo anterior ha motivado
subrayando su función. Posteriormente se aborda que los metadatos también pueden ser de estos tipos,
el tema de la Web Semántica y los retos que im- los que son caracterizados de la siguiente forma:
plica el uso de los metadatos de contenido para
apoyar su desarrollo. • Metadatos Descriptivos. Se utilizan para des-
cribir e identificar los principales atributos o carac-
terísticas de los recursos de información, siendo
Los metadatos algunos de los tienen mayor relevancia los relacio-
nados con su contenido intelectual o temático.
Para mejorar el funcionamiento de los sistemas • Metadatos Administrativos. Están relacionados
de recuperación de información, es importante la con el contexto administrativo de un determinado
representación y descripción de las caracterís- recurso de información, facilitando el registro y
ticas o atributos de los recursos de información manejo de diferentes aspectos, tales como los de-
mediante esquemas de metadatos adecuados, rechos de autor y permisos de acceso, así como
además de utilizar algún lenguaje de marcado con las acciones necesarias para su preservación.
la sintaxis y la semántica necesarias para regis- • Metadatos Estructurales. Facilitan la nave-
trarlos, los cuales pueden mejorar la recuperación gación y visualización de los recursos de infor-
de información en la www .1 mación, a través del establecimiento de las re-
laciones intrínsecas y extrínsecas de un recurso
El término metadatos fue acuñado por Jack Myers en o conjunto de recursos, es decir, proporcionan
la década de los 60s y es utilizado para describir con-
2 Caplan, Priscilla. You call it corn, we call it syntax-indepen-
1 Doan, Bich-Lien., Beingbeder, Michel, Girardot, Jean-Jacques. & dent metadata for document like objects. The Public Access
Jaillon, Philippe. Using metadata to improve organization and in- Computer Systems Review, 4(69, 19-23. [en línea]. 1995.
formation retrieval on the www. [en línea]. 1998. <http://files.eric. <https://journals.tdl.org/pacsr/index.php/pacsr/article/view-
ed.gov/fulltext/ED427698.pdf> [Consulta 15 enero 2015]. File/5992/5621> [Consulta 15 enero 2015].
BIBLIOTECA UNIVERSITARIA
Volumen 20, número 1, enero-junio 2017
4
Filiberto Felipe Martínez Arellano, Miguel Ángel Amaya Ramírez
información sobre la estructura interna de los re- Este esquema de metadatos se puede utilizar no única-
cursos estableciendo, por ejemplo, las relaciones mente con el lenguaje de marcado html, sino también
técnicas entre los distintos capítulos de un libro, con otros lenguajes estructurados como xml, conjunta-
los artículos publicados en un número o volumen mente con modelos conceptuales para la descripción de
específico de una revista, o las existentes entre datos como rdf (Resource Description Framework). El
los artículos publicados en los distintos números esquema de metadatos Dublin Core se convirtió en la
o volúmenes de una revista. norma iso 15836/2003 en febrero de 2003.5
• Metadatos Semánticos. Éstos dotan a la in-
formación sobre los atributos de los recursos El esquema de metadatos Dublín Core se encuentra
de un significado o contexto específico. conformado por 15 elementos básicos, los cuales pue-
den ser ampliados, siendo éstos los siguientes:
BIBLIOTECA UNIVERSITARIA
Volumen 20, número 1, enero-junio 2017
5
El papel de los metadatos en la Web Semántica
específica, y la utilización de este punto de acceso le problemas de interoperabilidad entre las diferentes apli-
permite recuperar en un sistema todos aquellos recur- caciones, existiendo problemas de falta de entendimiento
sos que abordan dicha temática, lo cual demuestra la técnico, sintáctico y semántico entre ellas. Por ejemplo,
importancia que se les debe dar a los metadatos uti- si se efectúa una búsqueda sobre el tema “Revolución
lizados para la descripción del contenido temático de Mexicana” en un buscador como Google, los resultados
los recursos de información. obtenidos son demasiados para que un usuario pueda re-
visarlos (aproximadamente 686 000 resultados), pero
además, una gran mayoría de los recursos recuperados
La Web Sintáctica no tienen que ver con el verdadero significado de la bús-
queda de este tema. Lo anterior se debe a que en la web
Desde que se presentó en forma pública la World Wide actual no se le ha dado un significado, ni un contexto a
Web en 1993 se ha incrementado sustancialmente su los metadatos que representan el contenido de los recur-
contenido, incluyendo diversos tipos de recursos de in- sos que abordan dicha temática.
formación en ella: texto, imagen, video, entre otros; pero
también se ha incrementado la dificultad de los usuarios
para recuperarlos, debido a que los buscadores que se La Web Semántica
encuentran actualmente en la red buscan información sin
normalización y sin interpretación alguna de su signifi- En 1998, Berners-Lee publicó en la página princi-
cado. Adicionalmente, en algunos casos se permite que pal del World Wide Web Consortium su conocido
el usuario sea un participante más en la creación de la artículo “Semantic web road map”.6 En dicho artí-
web, aportando o añadiendo información, muchas veces culo se introdujo por primera vez el término Web
sin un esquema de metadatos estandarizados, utilizando Semántica, destacándose en éste la necesidad de
solamente lenguajes libres para expresar el contenido expresar la información de forma en que ésta fuera
temático de los recursos. Estas características son las procesable por máquinas. El artículo presentaba un
que predominan actualmente en la web actual, la cual ha conjunto de pasos para lograr una web en la que
recibido el nombre de Web Sintáctica. el razonamiento fuera automático, llevado a cabo y
distribuido por las máquinas.
Por otro lado, actualmente en la web se puede encon-
trar un gran conjunto de recursos de información, y En 2001, Berners-Lee conjuntamente con Hendler &
para que un usuario pueda buscar y localizar en esa Lassila publicaron un nuevo artículo: “The Semantic
gran cantidad de información lo que necesita han apa- Web”,7 en el que presentan las principales caracterís-
recido numerosos buscadores de todo tipo, tanto ge- ticas que tendría la futura web, mencionando que las
nerales como especializados, que le permiten recupe- máquinas facilitarán nuevas opciones en la recupe-
rar recursos de información. No obstante lo anterior, ración de la información al mejorar su capacidad de
y a pesar de la gran cantidad de buscadores que exis- procesar y comprender la información dispersa por la
ten, en la mayoría de las ocasiones los resultados de web. Como solución a las limitaciones semánticas de
las búsquedas en ellos no satisfacen adecuadamente la actual web, proponen hacer procesable de forma
las necesidades de los usuarios, recuperando informa- automática el contenido de ésta.
ción que no es acorde con sus búsquedas, lo que se
debe principalmente a tres razones: Berners-Lee, Hendler & Lassila (2001)8 definen a la
Web Semántica como una extensión de la web actual,
1. Las búsquedas en ocasiones arrojan como res- cuyo objetivo es que no sólo los humanos sino tam-
puesta grandes cantidades de recursos de in- bién las máquinas sean capaces de ‘comprender’ el
formación. contenido de los recursos de información. Es decir,
2. Se tienen que actualizar permanentemente
los índices de los buscadores, a través de ro-
6 Berners-Lee, Tim. Semantic web road map. [en línea]. 1998.
bots para que se recupere la totalidad de los <https://www.w3.org/DesignIssues/Semantic.html> [Con-
recursos. sulta 15 enero 2015].
3. Existe dificultad para encontrar los documen-
7 Berners-Lee, Tim.; Hendler, J & Lassila, O. The Semantic
tos que concuerden con las palabras o térmi- Web. [en línea]. 2001. <http://www-sop.inria.fr/acacia/
nos que se utilizan en la búsqueda. cours/essi2006/Scientific%20American_%20Feature%20
Article_%20The%20Semantic%20Web_%20May%202001.
pdf> [Consulta 15 enero 2015].
Asimismo, también es importante señalar que ocurren 8 Ibidem
BIBLIOTECA UNIVERSITARIA
Volumen 20, número 1, enero-junio 2017
6
Filiberto Felipe Martínez Arellano, Miguel Ángel Amaya Ramírez
que la Web Semántica no sería una nueva web sino la otro recurso de información para que éstos tengan un
extensión de la existente, mediante la adición de me- sentido propio, de manera que puedan ser interpre-
tadatos que describan el contexto y la semántica del tados y manejados por una máquina. xml constituye
contenido de los recursos, de forma que éstos puedan un lenguaje de marcado altamente estructurado, a
ser procesables por las máquinas. través del cual “podemos disponer de etiquetas como
<título>, <subtítulo>, <capítulo>, <autor>, <institución>,
Actualmente se tiene una Web Sintáctica, pero al evo- <ciudad>, etc.”, o bien, “si una empresa o institución
lucionar hacia una Web Semántica se podrá tener una necesita almacenar y procesar información sobre los
recuperación más sencilla, fácil y precisa, siendo una currículum vitae de sus empleados, puede desarrollar
condición para lograr esto dotar de mayor significado un Schema xml que le permita crear documentos xml
y contexto a los metadatos usados para describir los bien formados que dispongan de etiquetas como <lu-
atributos de los recursos de información, particular- gar_nacimiento>, <titulación_académica>, <idiomas_ha-
mente los correspondientes a su contenido temático. blados>, <experiencia_laboral>, etcétera.”10
Los métodos, técnicas y herramientas utilizadas en la
Web Semántica también pueden ser aplicables a cual- rdf (Resource Description Framework)
quier otro sistema de recuperación de información
(buscador, base de datos, catálogo, entre otros) con rdf es un método para la descripción conceptual y el
el fin de que sus usuarios puedan encontrar respues- modelado de las relaciones entre la información de
tas precisas a sus búsquedas, mediante una mejor los recursos. Está particularmente indicado para re-
contextualización de los metadatos de contenido. presentar y dar estructura a los metadatos sobre los
recursos web, tales como el título, autor, copyright y
Para dotar de mayor significado y contexto a los me- otras licencias sobre el acceso a los documentos web,
tadatos que expresan los atributos y contenido de los así como la disponibilidad de algunos recursos com-
recursos de información, es imprescindible la utiliza- partidos y, obviamente, para los temas abordados en
ción de las siguientes opciones: lenguajes de marcado un recurso de información.11
como el xml (eXtensible Markup Language), esquemas
para modelado de las relaciones de los recursos de rdf es un modelo para el manejo de los metadatos
información como rdf (Resource Description Fra- de los recursos de información; sin embargo, también
mework) y las ontologías. puede usarse para representar y manejar información
sobre otros objetos que pueden ser identificados en la
Al utilizar estas herramientas se obtienen los siguien- Web, por ejemplo, información sobre artículos dispo-
tes beneficios:9 nibles desde servicios online (como información sobre
especificaciones, precios, disponibilidad, entre otros),
• Se proporciona mayor significado a un documento. o bien para la descripción de las preferencias de los
• Se dota de significado a su contenido. usuarios de la Web para obtener información.12
• Se pueden procesar grandes volúmenes de
contenido. rdf proporciona un marco común de trabajo para ex-
• Se optimiza el tratamiento de dichos contenidos. presar atributos y relaciones de la información y para
• Se pueden efectuar búsquedas inteligentes y intercambiarla entre distintas aplicaciones, mediante
obtener respuestas rápidas y precisas. una serie de herramientas de procesamiento automa-
• La información puede ser interpretada por un tizado. rdf puede utilizarse tanto en diferentes áreas
software, sin necesidad de la intervención hu- como en la recuperación de recursos de información
mana. por los buscadores, robots y agentes inteligentes, pero
también en la organización de la información para des-
cribir el contenido y las relaciones de éste en un sitio
XML (eXtensible Markup Language) web o en una colección de recursos de información.
El estándar xml es uno de los componentes básicos 10 Codina, Lluís & Rovira, Cristòfol. La web semántica. [en línea].
de la Web Semántica y del nuevo entorno de la or- 2006 <http://eprints.rclis.org/8899/1/web_semantica.pdf>
ganización de la información, puesto que permite una [Consulta 15 enero 2015].
codificación “semántica” de cada uno de los atribu- 11 Rdf Working Group. Resource Description Framework (rdf).
tos o elementos de una página web o de cualquier [en línea]. 2014. <http://www.w3.org/RDF/> [Consulta 15
enero 2015].
9 Ibidem 12 Ibidem.
BIBLIOTECA UNIVERSITARIA
Volumen 20, número 1, enero-junio 2017
7
El papel de los metadatos en la Web Semántica
Componentes de una sentencia o una su vez existe otro sujeto que tienen relación con el objeto
proposición en rdf “Mona Lisa”, siendo éste el video “La Joconde a Washin-
gton”, siendo expresada la relación existente entre ellos
por la predicado “is about”. A su vez, la pintura “Mona
Lisa” se convierte en un sujeto, el cual tiene una relación
con su creador “Leonardo Da Vinci”, el cual funge como
sujeto, siendo la relación expresada a través del predica-
do “was created by”, aunque esta relación también po-
dría ser de forma inversa, es decir, “Leonardo Da Vinci”
como sujeto y “Mona Lisa” como el sujeto.
rdf está basado en la idea de identificar y dar contexto
a los recursos de información, describiéndolos en térmi-
nos de propiedades simples y valores. Una descripción Ontologías
rdf es un conjunto de proposiciones simples (también
llamadas sentencias o declaraciones). Una proposición Respecto a las ontologías, existen diferentes definicio-
se conoce también como una “tripleta” porque está com- nes dependiendo del área en donde éstas se utilicen.
puesta de tres elementos: un sujeto, un predicado y un
objeto. Estas sentencias se pueden representar formal- Gruber (1993)14 menciona que en realidad el término onto-
mente usando la tripleta sujeto-predicado-objeto.13 logía, desde el punto de vista de la Filosofía, es una explica-
ción sistemática de la existencia. Desde el punto de vista de
Ejemplo de sentencias o proposiciones rdf las ciencias de la computación, es una representación formal
del conocimiento por un conjunto de conceptos dentro de un
dominio y las relaciones entre estos conceptos. Desde la pers-
pectiva de la Biblioteconomía y la Documentación, las ontolo-
gías son una herramienta para el intercambio y uso del cono-
cimiento, ya que proporcionan una compresión compartida y
consensuada de un dominio del conocimiento, la que puede
ser comunicada entre personas y sistemas heterogéneos.
BIBLIOTECA UNIVERSITARIA
Volumen 20, número 1, enero-junio 2017
8
Filiberto Felipe Martínez Arellano, Miguel Ángel Amaya Ramírez
BIBLIOTECA UNIVERSITARIA
Volumen 20, número 1, enero-junio 2017
9
El papel de los metadatos en la Web Semántica
OBRAS CONSULTADAS
Berners-Lee, Tim. Metadata Architecture. [en línea]. 1997. <http://www.w3.org/DesignIssues/
Metadata.html> [Consulta 15 enero 2015].
Berners-Lee, Tim. Semantic web road map. [en línea]. 1998. <https://www.w3.org/DesignIssues/
Semantic.html> [Consulta 15 enero 2015].
Berners-Lee, Tim.; Hendler, J & Lassila, O. The Semantic Web. [en línea]. 2001. <http://www-
sop.inria.fr/acacia/cours/essi2006/Scientific%20American_%20Feature%20Article_%20
The%20Semantic%20Web_%20May%202001.pdf> [Consulta 15 enero 2015].
Caplan, Priscilla. You call it corn, we call it syntax-independent metadata for document like
objects. the public access computer systems review, 4(69), 19-23. [en línea]. 1995.
<https://journals.tdl.org/pacsr/index.php/pacsr/article/viewFile/5992/5621> [Consulta 15
enero 2015].
Codina, Lluís & Rovira, Cristòfol. La web semántica. [en línea]. 2006. <http://eprints.rclis.
org/8899/1/web_semantica.pdf> [Consulta 15 enero 2015].
Doan, Bich-Lien., Beingbeder, Michel., Girardot, Jean-Jacques. & Jaillon, Philippe. Using
metadata to improve organization and information retrieval on the www. [en línea]. 1998.
<http://files.eric.ed.gov/fulltext/ED427698.pdf> [Consulta 15 enero 2015].
Dublin Core Metadata Initiative. Dublin Core Metadata Element Set, Version 1.1. [en línea]. 2012.
<http://www.dublincore.org/documents/dces/> [Consulta 15 enero 2015].
rdf Working Group. Resource Description Framework (rdf). [en línea]. 2014. <http://www.
w3.org/rdf/> [Consulta 15 enero 2015].
Studer, Rudi, Benjamins, Richard & Fensel, Dieter. Knowledge engineering: principles and
methods. [en línea]. 1998. <http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=51B-
D89B29D495B74B006AB6B19B45FE8?doi=10.1.1.41.1007&rep=rep1&type=pdf> [Con-
sulta 15 enero 2015].
BIBLIOTECA UNIVERSITARIA
Volumen 20, número 1, enero-junio 2017
10