ACTAS DEL
SEMINARIO INTERNACIONAL SOBRE
BIBLIOTECAS DIGITALES Y BASES DE
DATOS ESPECIALIZADAS PARA LA
INVESTIGACIÓN EN LITERATURAS
HISPÁNICAS (BIDESLITE)
Madrid, 4-5 de julio de 2011
Dirección del Seminario
Mercedes Fernández Valladares
Edición de
María Casas del Álamo
Germán Redondo Pérez
Sara Sánchez Bellido
Grupo de Estudios de Prosa Hispánica
Bajomedieval y Renacentista
Instituto Universitario Menéndez Pidal (UCM)
Actas del Seminario Internacional sobre Bibliotecas Digitales y Bases de datos Especializadas para la
investigación en Literaturas Hispánicas (BIDESLITE), Madrid, 4-5 de julio de 2011. Ed. a cargo de María
Casas del Álamo, Germán Redondo Pérez y Sara Sánchez Bellido. Madrid. IUMP (UCM). 2013.
© GRUPO DE ESTUDIOS DE PROSA HISPÁNICA BAJOMEDIEVAL Y RENACENTISTA.
© Los autores de las comunicaciones
ISBN - 978-84-691-8286-4
❧ Dirección del Seminario: Mercedes Fernández Valladares
❧ Edición a cargo de: María Casas del Álamo
Germán Redondo Pérez
Sara Sánchez Bellido
GRUPO DE ESTUDIOS DE PROSA HISPÁNICA BAJOMEDIEVAL Y RENACENTISTA.
❧ Directoras: Consolación Baranda Leturio y Ana Vian Herrero
❧ Secretaria: María Casas del Álamo
❧ Instituto Universitario Menéndez Pidal
Facultad de Filología. Edif. D. Despacho 00.328.0
Universidad Complutense de Madrid (28040 Madrid)
☎ +34 91 3947759 ✉ dialogycabddh@pdi.ucm.es
Este Seminario se ha financiado con una Acción Complementaria del MICINN (Subprograma de Acciones
complementarias a Proyectos de investigación fundamental no orientada. Convocatoria 2011, FFI2011-12620 I.P.:
Mercedes Fernández Valladares) solicitada en el marco del Proyecto de investigación IDEAPROMYR “Inventario,
Descripción, Edición crítica y Análisis de textos de prosa hispánica bajomedieval y renacentista. Línea: Diálogos
(Fase 2)” MICINN/MINECO FFI2009-08070 (2010-2012) I.P.: Ana Vian Herrero. La edición de este documento
se ha llevado a cabo igualmente en el marco de este Proyecto de investigación.
ÍNDICE
1. INTRODUCCIÓN
María Casas del Álamo, Germán Redondo Pérez y Sara Sánchez Bellido
2. PROGRAMA DEL SEMINARIO BIDESLITE
5
7
3. INAUGURACIÓN
El hispanismo, las bibliotecas digitales, y sus adynata
Jesús Antonio Cid Martínez
11
Presentación
Mercedes Fernández Valladares
16
4. RESUMEN DE LA SESIÓN DE COMUNICACIONES
María Casas del Álamo, Germán Redondo Pérez y Sara Sánchez Bellido
18
5. COMUNICACIONES
I. BIESES. Bibliografía
de escritoras españolas
Nieves Baranda Leturio (UNED)
II. BSB.
23
Biblioteca Saavedra Fajardo de Pensamiento Político Hispánico
Miguel Andúgar Miñarro, Antonio Rivera y José Luis Villacañas
III. CLARISEL.
29
Bases de Datos
Juan Manuel Cacho Blecua y María Jesús Lacarra (Univ. de Zaragoza)
41
IV. DIALOGYCA BDDH.
Biblioteca Digital de Diálogo Hispánico
Mercedes Fernández Valladares y Ana Vian Herrero (IUMP, UCM)
V. BIDISO.
53
Biblioteca Digital Siglo de Oro (Contenidos)
Sagrario López Poza (SIELAE, Universidade da Coruña)
VI. BIDISO.
61
Biblioteca Digital Siglo de Oro (Aspectos técnicos)
Ángeles Saavedra Places y Eduardo Rodríguez López (LBD, Univ. da Coruña)
VII. NICANTO.
Obras impresas de escritores del siglo XVIII
Jean-Marc Buiguès (Université de Bordeaux III)
VIII. PHEBO.
74
88
Poesía Hispánica en el Bajo Barroco
Ignacio García Aguilar y Pedro Ruiz Pérez (Universidad de Córdoba)
98
6. RESUMEN DEL COLOQUIO
María Casas del Álamo, Germán Redondo Pérez y Sara Sánchez Bellido
119
7. CONCLUSIONES
María Casas del Álamo, Germán Redondo Pérez y Sara Sánchez Bellido
121
8. ANEXO DE IMÁGENES
I. BSF.
Biblioteca Saavedra Fajardo de Pensamiento político hispánico
Miguel Andúgar Miñarro, Antonio Rivera y José Luis Villacañas
125
II. CANCIONERO VIRTUAL.
An Electronic Library of 15th century
Castilian Cancionero Manuscript Corpus
Fiona Maguire (University of Liverpool)
III. BIDISO.
156
Biblioteca Digital Siglo de Oro (Contenidos)
Sagrario López Poza (SIELAE, Universidade da Coruña)
197
INTRODUCCIÓN
María Casas del Álamo
Germán Redondo Pérez
Sara Sánchez Bellido
(Instituto Universitario Menéndez Pidal, UCM)
LOS días 4 y 5 de julio de 2011 tuvo lugar en Madrid el I Seminario Internacional sobre
Bibliotecas digitales y Bases de datos especializadas para la investigación en Literaturas
Hispánicas (BIDESLITE). Celebrado en la Biblioteca Histórica “Marqués de
Valdecilla” y la Facultad de Filología de la Universidad Complutense de Madrid,
reunió a ocho grupos de investigación de diferentes universidades europeas que
trabajan en herramientas digitales para la difusión de la investigación en Literaturas
hispánicas.
La idea del encuentro nació del contacto mutuo entre los diferentes proyectos
y del reconocimiento de la necesidad de poner en común experiencias, problemas y
soluciones, así como de buscar mecanismos que otorgaran mayor visibilidad al
conjunto. De ahí que los objetivos primordiales que se perseguían fueran
precisamente los de intercambiar ideas y resultados, tanto del camino recorrido
hasta el momento como sobre las perspectivas de futuro. No en vano, la relación
entre las Humanidades y las nuevas tecnologías ha dado un vuelco significativo en
los últimos años. A nadie extrañan ya las ediciones digitales de textos, las bases de
datos bibliográficas en línea y otros recursos que son hoy de uso cotidiano para
investigadores y docentes. Aun así, muchos son los que continúan viendo las
Letras como un campo aislado, radicado solo en métodos tradicionales y al margen
de la revolución tecnológica. Por ello, una actividad de estas características supone
un gran paso en esa andadura ya comenzada, pues del diálogo entre proyectos con
intereses semejantes es de donde nacen los planteamientos e iniciativas destinados
a innovar en los métodos de trabajo y ampliar los horizontes ya abiertos.
El Seminario fue organizado por el Grupo de Estudios de Prosa hispánica
bajomedieval y renacentista de la UCM con financiación del MICINN por medio de una
Acción Complementaria (FFI2011-12620-E) y ayuda del Instituto Universitario
Menéndez Pidal. Se celebró en la Biblioteca Histórica “Marqués de Valdecilla” y en
la Facultad de Filología, entidades que mostraron plenamente su apoyo
participando también activamente en el mismo, tanto en las sesiones de apertura y
clausura, como en el coloquio final.
A él acudieron representantes de diferentes grupos de investigación, la
mayoría con amplia experiencia en el campo de las Bibliotecas digitales y las Bases
de datos especializadas, pero todos con necesidad de buscar respuestas a las
incógnitas propias de quien se enfrenta a un proyecto de este tipo, máxime cuando
5
se proviene de un ámbito de estudio como la literatura, tradicionalmente menos
dependiente de la tecnología, como ya se ha dicho.
Durante la primera jornada se presentaron proyectos como BIESES.
Bibliografía de Escritoras Españolas, de la UNED; la BSF. Biblioteca Saavedra Fajardo de
Pensamiento Político Hispánico, de la Universidad de Murcia; el CANCIONERO
VIRTUAL de la Universidad Liverpool, en el que se recogen ediciones de
cancioneros castellanos del siglo XV; CLARISEL Bases de Datos Bibliográficas, de la
Universidad de Zaragoza y en el que se incluyen los repositorios de AMADÍS
(literatura caballeresca), SENDEBAR (cuentística) y HEREDIA (fondos aragoneses);
DIALOGYCA BDDH. Biblioteca Digital de Diálogo Hispánico, de la Universidad
Complutense de Madrid; BIDISO. Biblioteca Digital del Siglo de Oro, de la Universidad
de A Coruña y que aúna bases de datos de emblemática, polianteas, relaciones de
sucesos e inventarios de bibliotecas; NICANTO, una base de datos de obras
impresas de escritores del siglo XVIII de la Universidad de Burdeos; y PHEBO.
Poesía Hispánica en el Bajo Barroco, de la Universidad de Córdoba.
Con sus intervenciones quedaron expuestos los objetivos de cada uno de los
proyectos, así como los problemas técnicos, metodológicos y de concepción a los
que se habían enfrentado y las soluciones logradas. El proceso y su resultado
fueron diferentes en cada caso, y, sin embargo, pueden apreciarse notables
semejanzas en el conjunto, especialmente en la recurrencia de ciertos campos de
datos, comunes a todos. Así, el Seminario sirvió de punto de encuentro entre todos
ellos, pero también para dar a conocer al público asistente, mayoritariamente
relacionado con la investigación literaria, herramientas que muchos no habían
manejado aún o que ni siquiera estaban disponibles en ese momento.
El resultado de todo ello fue un encuentro de claro éxito, ya que nacieron
acuerdos de colaboración mutua, pero también surgieron ideas para la futura
integración de todos los proyectos en una herramienta única e, incluso, la creación
de una Asociación de Humanidades Digitales que reuniera a todos los
investigadores dedicados al tema. Con ello, no solo se conseguiría una mayor
visibilidad, sino también mostrar al mundo académico que las Humanidades no
han permanecido al margen de las tecnologías de la información y que su trabajo
puede, de este modo, tener una mayor difusión, lo que contribuye, claramente, a la
mejora de los resultados científicos.
Lo que a continuación se presenta es precisamente el resumen de lo
acontecido durante las dos Jornadas, el texto íntegro de las intervenciones y las
conclusiones y acuerdos alcanzados.
o
6
PROGRAMA DEL
SEMINARIO BIDESLITE
INAUGURACIÓN
PHEBO. POESÍA HISPÁNICA EN EL BAJO BARROCO
Ignacio García Aguilar y Pedro Ruiz Pérez
(Universidad de Córdoba)
1. LAS RAÍCES DEL PROYECTO
EL proyecto PHEBO (Poesía Hispánica en el Bajo Barroco) surge a mediados del
2010 en el seno del equipo que desarrollaba el estudio “La poesía de bajo barroco:
repertorio y categorías”, aprobado y financiado por el MICINN para el período 20092011 (FFI2008-03415/FILO). El objetivo que éste se planteaba era sentar las bases para
una cartografía de la poesía de este período, tan poco atendido por la crítica y la
historia literarias, a partir de dos elementos básicos: un repertorio de los impresos
con materia poética entre 1650 y 1750, de un lado, y una revisión de los conceptos y
categorías aplicados al análisis de la poesía áurea, de otro, aunque en estrecha
relación con los datos positivos arrojados por el repertorio. Éste se concibió y
desarrolló a modo de base de datos (infra), con campos que, junto a los datos
estrictamente bibliográficos, incorporara los relativos a temas y formas poéticas, así
como los referentes a la pragmática del impreso (dedicatarios, libreros, participantes
en los paratextos...). Partimos de los repertorios existentes para el siglo XVIII y, a
mitad del proceso, establecimos un convenio de colaboración con el equipo de
Burdeos dirigido por Jean-Marc Buiguès para cruzar nuestros datos con los de la
base NICANTO, que informatiza las noticias procedentes de Aguilar Piñal, así como
otras fuentes de información, principalmente los anuncios de libros insertos de La
Gaceta de Madrid. Nuestra base de datos, aún en elaboración, se mantiene en
intranet, donde es alimentada por un miembro del equipo, mientras todos los
demás, así como algunos investigadores interesados, tienen acceso a la misma en
tiempo real. En paralelo, una serie de estudios, en forma de trabajos individuales,
seminarios y coloquios convocados al efecto, nos permitieron acercarnos a algunas
perspectivas algo diferentes a las que vienen sustentando la valoración positiva de la
lírica entre 1527-1650 y determinando el menosprecio de la del período siguiente. En
el proceso se impuso la necesidad prácticamente ineludible de que los
investigadores y estudiosos ajenos al equipo pudieran disponer de los datos
necesarios para contrastar las propuestas y, en su caso, extender su aplicación.
Inicialmente, el objetivo era ofrecer la base de datos bibliográfica a libre acceso una
vez alcanzara la entidad suficiente para ello, pero el propósito se nos revelaba cada
vez más como insuficiente. No podía limitarse a una información aislada,
restringida prácticamente al ámbito de la bibliografía, por más que incorporara
campos adicionales de carácter literario. De otra parte, estas referencias sin los
textos correspondientes se quedaban en etiquetas vacías.
98
La última fase del proyecto introdujo, así, un cambio en los planteamientos
iniciales, y, mientras se ralentizaba un tanto la elaboración de la base de datos,
trabajamos en el modo en que se podían cumplir los nuevos objetivos,
desembocando en la conveniencia de potenciar la apuesta por los recursos
informáticos y desarrollar la herramienta correspondiente con los contenidos
necesarios en un nuevo proyecto, continuación y proyección del vigente. Es así
como se concibe el proyecto PHEBO, que recientemente ha recibido la aprobación
del MICINN para su desarrollo en el trienio 2012-2014 (FFI2011-24102). Aunque se han
dado los primeros pasos, fruto de la actividad de estos últimos meses, su desarrollo
pleno está previsto en los próximos años, por lo que aquí se expone una mezcla de
planteamientos consolidados y propósitos por desarrollar, además de algunas de las
especificaciones técnicas de la herramienta informática.
2. ALGUNOS PLANTEAMIENTOS
En la denominación del proyecto aprobado para el próximo trienio figuraba
una especificación para el acercamiento a la poesía del bajo barroco: “repertorio,
edición, historia”. El primer término apuntaba a la labor previa, aún por culminar,
y, obviamente, el tercero se planteaba como una perspectiva de futuro, un paso más
a partir de la idea de “categorías”, para avanzar desde una mera cartografía a unas
bases más amplias y consolidadas para la interpretación historiográfica y crítica de
la poesía en el período. Entre ambas, el elemento distintivo y el que constituirá el
eje del proyecto y el núcleo distintivo del portal en construcción lo constituye la
edición, esto es, la práctica fundamental de la filología y la base de todo estudio que
pueda ser compartido. Además de esta consideración, se tuvieron en cuenta
elementos de orden pragmático, pero no menos trascendentes en lo que toca a una
decisión de calado, justamente la que pretende conciliar los valores de una tradición
metodológica con el aggionarmento necesario para, mediante el aprovechamiento de
las nuevas tecnologías, dar respuesta a las demandas y condiciones del momento,
tanto en el orden científico como en el estrictamente académico.
A nadie se le escapa que la opción por vías convencionales era prácticamente
inviable para nuestros fines. En gran medida por su enorme desconocimiento, la
poesía bajobarroca está por completo alejada de las demandas lectoras actuales y,
por consiguiente, de los intereses de las editoriales comerciales. A ello hay que
sumar que, si esta situación es operativa incluso para las figuras señeras del período,
es de peso definitivo en lo que se refiere al conjunto de una producción nada
desdeñable en su volumen y cantidad de títulos, incluyendo, junto a los libros de
poesía sensu stricto, toda una variedad de géneros y formatos, con antologías,
recopilaciones, poemas-libro, pliegos... Un último factor no resultaba desdeñable: el
del tiempo, ya que, sobre todo en casos como éstos, la demora en la aparición de
un texto desde su entrega a la editorial podía extenderse a varios años. En conjunto,
pues, la vía de las editoriales comerciales y el formato papel se planteaba como una
opción por completo descartable, mientras que en los soportes informáticos
encontrábamos todas las respuestas a los problemas planteados. En la red la
99
edición de los textos no tenía que someterse a la ley de la oferta y la demanda, no
encontraba límites de espacio y sí una reducción al mínimo de la dilación en el
tiempo. El reto era (es) mantener en el espacio virtual las mismas exigencias de
rigor filológico que en el del papel, y, si cabe, incrementarlo. No radica en el
soporte la excelencia de la investigación ni la calidad de los resultados, ya que un
buen texto crítico lo es igualmente impreso o en formato pdf. Es más: las ventajas
de la red, al tiempo que permiten acceder a una mayor cantidad de destinatarios,
eliminan muchas de las limitaciones de la edición convencional, ya que la falta de
restricciones presupuestarias permite recuperar para la edición muchos de sus
componentes, generalmente incómodos para las editoriales; la versatilidad de sus
modos de presentación permite acomodar el resultado a diferentes niveles de
lectura o, lo que es lo mismo, a diferentes destinatarios, desde curiosos y
estudiantes a investigadores especializados; la capacidad de sus herramientas,
finalmente, hace posible preparar los materiales para toda una serie de operaciones
filológicas, imposibles desde el formato papel o sólo realizables con un esfuerzo
desmesurado.
Consideraciones de otro orden incidieron en la decisión final y en las
soluciones adoptadas, relacionadas en todo caso con el trabajo en equipo, sus
potencialidades y sus exigencias, pero también con el actual marco académico. El
volumen de la actividad requiere para su resolución en un plazo razonable, al
menos en una parte apreciable de la tarea comprometida, de una aportación
colectiva y con una amplia participación, tanto por los integrantes del equipo en su
dimensión oficial1 y de los estudiantes y doctorandos en torno al mismo, como
incluso por parte de todo aquel investigador que quiera colaborar de acuerdo con
los criterios establecidos. La labor de edición es el núcleo de la práctica filológica y
una actividad formativa de primer orden, por lo que se presenta como un espacio
idóneo para el inicio en las labores investigadoras de los más jóvenes, lo que se hace
especialmente útil, si no imprescindible, en el actual marco de configuración de
equipos científicos y acceso a la docencia universitaria. Por ello, a partir del equipo
1
La composición del equipo para el proyecto 2009-2011 reflejaba la del Grupo PASO y su dinámica
de trabajo, constituyendo la parte más numerosa de los componentes: Begoña López Bueno, Juan
Montero, Ángel Estévez, Inmaculada Osuna, Francisco J. Escobar y Mª José Osuna; a ellos se
sumaron especialistas en la poesía del período, como Elena de Lorenzo, Javier Jiménez Belmonte
y François Lopez, y, más tarde, el personal incorporado como contratado o becario: Elena Cano,
Almudena Marín, Ana Isabel Gómez Puya y Cristina Moya. Parte activa en el desarrollo real del
proyecto, aunque no reflejados, por distintas razones, a la nómina presentada al Ministerio, han
sido y son Javier Álvarez e Ignacio García Aguilar. Para el desarrollo del proyecto de desarrollo
de la página y las ediciones de los textos se han producido algunos cambios: el Grupo PASO se ha
adaptado a la orientación de limitar las dedicaciones compartidas a varios proyectos, centrando su
nómina en Ángel Estévez, Inmaculada Osuna, Mª José Osuna, Elena Cano, Almudena Marín,
Ana Isabel Gómez Puya y Cristina Moya; el fallecimiento de François Lopez nos priva de una
aportación básica y un magisterio de primera línea, que tratamos de compensar con la
permanencia de Elena de Lorenzo y Javier Jiménez Belmonte y la incorporación de Nadine Ly,
Jean-Marc Buiguès y Antonio Sánchez Jiménez. Manteniéndose sus circunstancias
administrativas, también persiste la participación de primer orden de Javier Álvarez e Ignacio
García Aguilar.
100
de investigación, se plantea como una actividad abierta a la colaboración, sin más
condición que el seguimiento de los criterios necesarios para mantener la identidad
del proyecto y preservar el rigor filológico requerido.
Para ello se percibió como imprescindible y se encuentra en un muy
avanzado estado de realización el establecimiento de dichos criterios, en tres planos
diferenciados y complementarios: el filológico, el legal y el científico. A lo largo del
curso 2010-2011, y con la participación de ponentes invitados, se ha mantenido un
seminario con sesiones bastante regulares, en que se han integrado investigadores,
doctorandos y algunos estudiantes de licenciatura, con el doble propósito de ir
fijando una metodología común en el orden filológico y, de manera específica, unos
criterios claros para la edición; éstos se pueden sintetizar en los siguientes:
- centrar, al menos en la primera fase, la edición en los libros de poesía de
autor individual, entendiendo por ello volúmenes autoriales de poemas
(incluidos los sacros), pero también obras de carácter misceláneo
(incluyendo textos en prosa o piezas dramáticas) y recopilaciones de
circunstancia;
- renunciar a la edición crítica en sentido estricto, optando por la fijación
de un texto crítico, a partir de un determinado ejemplar, aunque
señalando en su caso, variantes en otros testimonios o en diferentes
estados de la misma edición;
- modernización del texto;
- criterios uniformes de transcripción;
- breve estudio introductorio, con noticias relativas al estatuto del autor y
su producción, historia del texto y características del testimonio elegido,
así como bibliografía específica o de aplicación directa;
- reproducción de la puesta en página del original (fig. 1);
Fig. 1. Disposición del texto en la edición del Poema trágico de Atalanta y Hipomenes
(ed. Elena Cano Turrión)
101
- reproducción de todos los elementos paratextuales, preliminares y
postliminares; de la portada, grabados y otros elementos icónicos o
plásticos relevantes (figs. 2 y 3);
Fig. 2. Portada del Poema trágico de Atalanta y Hipomenes
(ed. Elena Cano Turrión)
Fig. 3. Preliminares del Poema trágico de Atalanta y Hipomenes
(ed. Elena Cano Turrión)
102
- establecimiento del modelo de anotación (aparato crítico y notas
aclaratorias) e incorporación de sus realizaciones a un repertorio general y
conjunto.
De este modo se pretende integrar la metodología filológica con los criterios
procedentes de la bibliografía material y las posibilidades de la informática, de
forma que la labor de edición genere sin esfuerzos adicionales nuevos modelos de
herramientas para el trabajo crítico.
En el orden legal es preocupación mayor preservar el reconocimiento a
todos los efectos de la autoría de cada edición. En ella figurará siempre el nombre
de la persona responsable de la edición como autora material de la misma, con los
consiguientes trámites legales (depósito) complementarios a los de la página (ISBN,
ISSN), para salvaguardar el derecho de autoría y para facilitar el reconocimiento de la
misma en las instancias académicas. La relación se fijará mediante un modelo de
contrato o acuerdo simplificado en el que se garantice la permanencia del texto en
la página web y la posibilidad del autor de disponer de su texto para otras ediciones
o soportes. Se entendió desde el primer momento como una condición
indispensable para incorporar el trabajo de los jóvenes, quienes se encuentran en las
circunstancias más exigentes para este tipo de reconocimientos.
Por último, en el plano científico se establecen los pertinentes protocolos
para la verificación de la calidad de la edición, con una supervisión de los
investigadores responsables del equipo y la colaboración de un equipo de asesores
externos, que actuarán como verdaderos censores, con capacidad determinante
sobre la decisión final respecto a la edición. Se trata, en definitiva, de dotar (y de
manera efectiva) a la página de las mismas garantías de calidad científica
reconocidas para el trabajo investigador en soportes más convencionales, como las
revistas o las colecciones en papel.
3. UN MARCO, UNA HERRAMIENTA
Al desembocar en la solución editorial se daba respuesta a una cuestión
pendiente en el camino a la elaboración de una historiografía literaria o, al menos,
de las bases necesarias para ello. No era la única consecuencia de la decisión. La
incorporación de los textos a un soporte virtual en la red complementaba el trabajo
de repertorio y elaboración de la base de datos, proyectando sus resultados y dando
entidad a su presencia en línea. Se definían, pues, los elementos sustantivos de un
formato algo más complejo, si no completo, a modo de portal sobre la poesía de
este período y en una perspectiva conceptual y metodológica acorde con los
planteamientos del equipo y la tarea definida en el proyecto.
Así, junto a los elementos habituales en este tipo de páginas (relativas al
grupo, sus componentes y sus proyectos, a novedades sobre la materia y a enlaces a
páginas similares o complementarias), quedaban definidos los componentes
sustanciales y distintivos, en torno a la producción bibliográfica, los modelos
editoriales y las concretas soluciones poéticas, en la intersección más productiva de
103
historia y morfología, en este caso teórica y material. Como planteamiento
identificador de una línea de trabajo, su definición pretende ser válida para el
propósito último de historiar y analizar críticamente esta producción poética a
partir de su propia configuración y formalización en el cauce más extendido para su
difusión, pero también para su conformación. Al mismo tiempo, la definición
instrumental de los elementos ofrecidos, sin menoscabo de su valor intrínseco,
pero desde unos planteamientos netamente (neo)positivistas en su materialismo, se
configurará como un objeto y un instrumento de valor pensamos que importante
para otros investigadores interesados en la materia o en parcelas colaterales o
tangentes con la nuestra.
En esta línea, pretendemos ofrecer un primer elemento de trabajo a partir del
hecho sustantivo que supone la posibilidad de contar con un volumen de cierta
relevancia de materia textual presentada con unos criterios de homogeneización. Se
trata de un corpus de suficiente extensión en el orden cuantitativo y, en particular,
de la relevancia cualitativa de su coherencia genérica, reforzada por la canalización a
través de unas normas estandarizadas de transcripción. A partir de la constitución
del corpus pueden diseñarse unas herramientas básicas de búsqueda y tratamiento
primario de la información al servicio de intereses de investigación más
desarrollados. Uno de ellos queda apuntado con la mención de la propuesta de
solución para la anotación de los textos. Su incorporación a un repertorio
unificado, al que remite cada texto en función de sus requerimientos, no es sólo
una cuestión de economía. Es más, avanza sobre el, por otra parte, deseable
objetivo de la coherencia del trabajo en equipo. Sus ventajas son de doble
naturaleza en lo estrictamente filológico y literario. La economía como concepto
funciona en todas sus direcciones, ya que no sólo se evita la duplicación del trabajo
para el editor y las redundancias para el usuario; al mismo tiempo, se pone al
servicio del lector un volumen de información con mayor amplitud que la
elaborada para el caso de una edición aislada, con independencia de que el editor
haya incorporado o no una llamada específica para el esclarecimiento de un término
o un pasaje.
Por otra parte, este repertorio en construcción creciente, articulado como un
muy dieciochesco diccionario, podrá constituirse en un útil repositorio de
informaciones para trabajos de otro tipo, y, cuando alcance la entidad suficiente,
reflejar de manera sistemática y ordenada el universo de ideas y valores de la época
y sus códigos de funcionamiento, con los matices observables a partir del
funcionamiento de estos términos en contextos (cronológicos, genéricos o tonales)
diferentes. Lejos de ser un corpus cerrado, su crecimiento se realizará por número
de entradas, pero también por la cantidad de información recogida en las mismas,
ya que cada nota elaborada en el proceso de edición hará constar junto a la
definición del término o expresión la localización de la misma y las fuentes usadas
para su esclarecimiento. Al fundirse en el repertorio común podrán ordenarse en
una misma entrada las variaciones registradas en la utilización por los poetas a lo
104
largo de un siglo de las “palabras e ideas”2 constitutivas a la vez de su ideología y de
sus valores poéticos. Como en el caso del conjunto de la labor editorial, se
preservará siempre la autoría individual de cada elemento de la información. Por el
momento, al menos hasta que la información alcance un volumen excesivo para su
manejo o esté a nuestro alcance una herramienta informática idónea, el repertorio
de notas se concibe bajo el formato de un documento de texto, actualizado con
cada nueva edición que se incorpore a la página. De este modo se conjugan las
posibilidades de lectura y de búsqueda de expresiones.
Más compleja es la manipulación en el corpus formado por el conjunto de
los textos editados, menos por razones cuantitativas que cualitativas. Con ser
importante la dificultad inherente a su volumen y a la constitución de textos
diferenciados y separados en archivos distintos, las búsquedas léxicas en esta masa
textual no pueden desvincular sus resultados de la contextualización del término en
cuestión con las consiguientes repercusiones en lo referente a usos, acepciones y
connotaciones. Por ello, uno de los principales problemas técnicos con que nos
encontramos fue la conciliación de la estricta práctica editorial, con sus criterios y
su sistema de trabajo, y la disposición del material resultante para su uso de una
manera como la señalada. Inicialmente, de acuerdo con los presupuestos de partida
y el presupuesto disponible, se optó por considerar la edición lo central y otorgar
carácter accesorio a lo relativo a su disposición para búsquedas, fundamentalmente
léxicas. Y en esa perspectiva se iniciaron los trabajos en lo referente a la ingeniería
de la página y los protocolos de trabajo, de lo que se dará cuenta en los apartados
siguientes.
No obstante, en el camino nos encontramos, junto a las reflexiones
derivadas del trabajo filológico y literario, con la capacidad de respuesta de la
informática (por no hablar de su potencialidad para plantear nuevos problemas,
caminos o retos de investigación) y la progresiva conciencia de los procesos de
convergencia, ya reales o muy posibles, entre una diversidad de equipos trabajando
en materias colindantes y, sobre todo, con herramientas paralelas. El seminario
BIDESLITE da cuenta, al menos sintomática, de ello, a la vez que actúa como
catalizador de nuevas dinámicas y de líneas de confluencia y diálogo, como
corresponde al ámbito de trabajo del equipo promotor y sustentador del encuentro,
al que este guiño retórico sólo aspira a servir de pálido reconocimiento. En el
marco de las sesiones, encontramos la ratificación de algunos de nuestros
planteamientos, la necesidad de revisar e incluso modificar otros y la convicción de
la utilidad de compartir procedimientos, también los técnicos. Y esto no es una
nueva manifestación del interés del seminario y de los beneficios de haber
participado en el mismo; ha de traducirse también en una cierta relativización de
2
La alusión al título de la monumental obra de Pedro Álvarez de Miranda, Palabras e ideas: el léxico
de la Ilustración temprana en España (1680-1760), Madrid, Real Academia Española, 1992, responde
intencionadamente a la voluntad de reconocimiento de una obra fundamental para el estudio del
período y una de las primeras en llamar la atención sobre la continuidad por encima de la barrera
artificial de los siglos. A la vez, es una referencia del modelo de trabajo y, modestamente, de las
conclusiones a las que pensamos se podría llegar a partir de estos materiales.
105
algunas de las soluciones que se exponen a continuación sobre la arquitectura y la
mecánica de la página en construcción.
4. LA WEB PHEBO: UNA OBRA EN PROCESO3
En lo correspondiente al apartado más estrictamente técnico, actualmente se
está trabajando en el desarrollo de un sitio web (http://phebo.es/) que responda con
solvencia a las necesidades del Proyecto PHEBO, optimice los recursos que en su
paulatino desarrollo se vayan alojando en el servidor al efecto y ponga a disposición
del usuario una herramienta eficaz para un mejor estudio y comprensión de la
materia objeto de estudio. Dicha arquitectura web se está construyendo de acuerdo
con el siguiente esquema:
1. IMAGEN Y NOMBRE.
2. PRESENTACIÓN:
a. Presentación.
b. Contacto.
c. Miembros: nombre (foto) y datos.
3. BASE DE DATOS DE IMPRESOS.
4. EDICIÓN DE LOS TEXTOS.
a. Criterios de publicación.
b. Textos.
c. Acceso por un doble listado: por autores y por fechas.
d. Anotación (un documento en pdf).
5. ESTUDIOS.
a. Estudios.
b. Materiales y reseñas.
c. Enlaces
6. MOTORES DE BÚSQUEDA.
a. Índice de primeros versos (puede ser manual).
b. Concordancias: Localización de una palabra repetida entre los textos
transcritos para ofrecer en listado.
Aunque la página de inicio (véase fig. 4) no es definitiva, sí incluye ya desde
su versión más primitiva elementos estructurales que estarán presentes en la versión
última, como por ejemplo la posibilidad de diferenciar distintos tipos de perfiles y
rangos en los usuarios (figs. 4-6), que irán desde la consulta libre de los materiales
hasta la intervención directa en el proceso de creación de materiales. El ejemplo de
3
Optamos por mantener la exposición del presente trabajo en los mismos términos en los que se
expuso en su momento, como un acta de lo dicho en julio de 2011. Debe señalarse, sin embargo,
que la mayor parte de todo lo que aquí se plantea como proyecto está ya puesto en pie en la
página web PHEBO (http://phebo.es/), de modo que el lector puede ahora contrastar el grado de
realización de lo anunciado.
106
la figura 5 muestra la interfaz que permite crear una nueva cuenta de usuario, en
tanto que en la figura 6 se muestran cuatro roles diferenciados de usuario: 1)
Usuario anónimo, 2) Usuario registrado, 3) Administrador y 4) Editor. Estos
perfiles son orientativos, pero no cerrados por completo, pues existe la posibilidad
de definir otros perfiles en función de los permisos que se asignen a los usuarios de
acuerdo con sus grados de responsabilidad y capacidad de intervención en el sitio
web:
Fig. 4. Boceto de pantalla de inicio de PHEBO, a falta de subsanar la errata y revisar y
completar otros pormenores de diseño
Fig. 5. Configuración de cuenta de usuario
107
Fig. 6. Configuración de rol de usuario
Se está trabajando, asimismo, en el desarrollo de una imagen corporativa a
partir de las sugerencias y propuestas de distintos integrantes del grupo (fig. 7).
Aunque no se trata de un elemento estrictamente técnico o de importancia
sustantiva, sí resulta de interés estratégico contar con un icono que tenga una
importante potencialidad representativa, de cara a la posterior visualización e
identificación del proyecto.
Fig. 7. Grifo protector de la literatura
(boceto de Elena Cano Turrión)
De acuerdo con el esquema general expuesto, en el segundo apartado del
bloque inicial se consignarán los datos relativos al objeto del proyecto, su
108
periodización, la hipótesis de trabajo, el diseño de construcción crítica y la
metodología utilizada para su desarrollo (supra), así como también una dirección
electrónica de contacto y los datos relativos a los miembros participantes.
En el tercer bloque se incluye la base de datos que se alojará en el sitio web.
La base de datos, como ya se indicó anteriormente, se origina como conjunción
solidaria de los intereses previos del grupo y del amplio trabajo desarrollado desde
la Universidad de Burdeos por el profesor Jean-Marc Buiguès.
En los primeros compases del proyecto se comenzó trabajando con una base
de datos muy elemental proporcionada como aplicación por la herramienta Moodle.
Si bien es cierto que las carencias y limitaciones de esta aplicación eran importantes,
ofrecía, no obstante, una funcionalidad de gran interés: la posibilidad de trabajar online desde distintos lugares, así como la posibilidad de que el trabajo fuera
consultado por un número amplio de usuarios, una vez que éstos fuesen dados de
alta. Además, la aplicación permitía una consulta libre de la información por
distintos usuarios que no podían acceder a la modificación de los registros, lo que
preservaba el trabajo realizado.
Después de conocer la base de datos NICANTO, desarrollada desde Burdeos
por el profesor Buiguès como continuación de un proyecto de largo recorrido, se
comprobó que muchos de los registros contenidos en ella coincidían con el ámbito
cronológico y genérico de nuestro proyecto; y existían coincidencias, asimismo, en
muchos de los campos elaborados —si bien es cierto que los campos definidos, por
las especiales características del proyecto NICANTO4, eran mucho más amplios que
los definidos para PHEBO (figs. 8-10).
Fig. 8. Base de datos La poesía del barroco tardío (1650-1750) en la plataforma Moodle.
Campos Autor, Editor, Título, Lugar, Impresor, Librero, Fecha, Tomos y Páginas o folios.
4
Para una visión más completa sobre el alcance de NICANTO véase, además de las
consideraciones expuestas en estas páginas, el trabajo de Buiguès en este mismo número
monográfico.
109
Fig. 9. Base de datos La poesía del barroco tardío (1650-1750) en la plataforma Moodle.
Campos Formato, Pliego, Grabados, Paratextos, Localización y Repertorios.
Fig. 10. Base de datos La poesía del barroco tardío (1650-1750) en la plataforma Moodle.
Campos Ediciones modernas, Octosílabo, Moldes petrarquistas, Moldes barrocos, Moldes neoclásicos,
Espiritual, Didáctica, Épica, Tradicional, Romancero y Notas y observaciones.
Ello obligó a delimitar, de entre los más de 24.000 registros existentes en
NICANTO, los que se adecuaban a las necesidades e intereses de nuestro proyecto.
Una vez definidos los registros, se procedió a su exportación y a la adaptación de
los mismos, de acuerdo con los campos definidos en la base de datos de Moodle.
Esta labor se realizó utilizando el mismo software FileMaker usado por NICANTO.
Una vez filtrados los registros y adecuados sus campos a los definidos en la base de
datos PHEBO, se procedió a la exportación de dichos registros a la aplicación de la
plataforma Moodle. Esta labor la realizó el Servicio de Informática de la Universidad
de Córdoba, a través del Aula Virtual, que se encargó, asimismo, de subsanar
ciertos problemas técnicos originados por algunos caracteres (ej. ç), además de las
tildes. Tras ciertas modificaciones, se consiguió subir los registros completos de la
110
base de datos con las tildes y con los caracteres especiales, así como también
permitir el proceso contrario; esto es, pasar los datos de Moodle a un formato tal que
FileMaker lo pudiera procesar sin problemas.
Estas soluciones provisionales resultaron muy útiles para avanzar con la base
de datos. No obstante, la plataforma Moodle tenía carencias elementales derivadas de
su propio diseño como herramienta orientada fundamentalmente hacia la docencia.
Por tanto, una vez que se comenzó a planear el proyecto de elaboración de un sitio
web que alojase, como uno de sus funcionalidades más señeras, una base de datos
de los impresos poéticos entre 1650 y 1750, se presentó la necesidad de exportar los
registros a un sistema más funcional y estable.
La herramienta elegida para el desarrollo del sitio web PHEBO fue el
software de generación de portales Drupal5. Se trata de un programa libre de gestión
de “contenido modular multipropósito” con licencia GNU/GPL, escrito en PHP, que
es muy flexible, dinámico y adaptable, lo que lo hacía especialmente recomendable
para las necesidades de nuestro proyecto.
Sin embargo, para la integración de la base de datos en la web generada por
Drupal se planteaba un problema de compatibilidad similar al producido entre las
base de datos NICANTO, implementada en FileMaker, y la base de datos PHEBO,
de la aplicación Moodle. Para solventar esta dificultad técnica, se consideró que era
necesario recurrir a un archivo de scripts SQL que guardara el esquema y los registros
de la base de datos completa de PHEBO, lo que permitiría adaptarla y utilizarla en
la nueva arquitectura web que se estaba diseñando. Dado que los scripts SQL
contienen la descripción de todas las instrucciones empleadas en la creación de la
base de datos y sus objetos, era necesario generar un fichero de scripts que albergara
todos los datos y permitiera su ejecución en la nueva base de datos construida en
Drupal. Se creó, por tanto, un archivo de scripts SQL con la base de datos completa,
lo que garantizaba la salvaguarda de todos los registros; y posteriormente se hizo
uso del módulo cck de Drupal para la creación de contenido personalizado, lo que
permitió la configuración de los campos que ya estaban definidos en la base de
datos primigenia para el nuevo sitio web.
La base de datos se concibe como una herramienta en la que albergar el
mayor número de noticias y referencias de poesía impresa durante el período
cronológico establecido en el proyecto. No obstante, la edición de los ejemplares
particulares será una labor que no se extenderá a todos los registros contenidos en
la base de datos, sino únicamente a un porcentaje de ellos. Desde el inicio mismo
del proyecto, durante el esbozo de los primeros esquemas y bocetos preparatorios,
se consideró que esta metodología de trabajo, justificada por el alcance y definición
del proyecto (supra), se optimizaría si se pudieran lanzar búsquedas simultáneas en
los textos que se editasen y se fueran colgando en la aplicación web.
5
Las características de la versión Drupal usada en el diseño de PHEBO son las siguientes: Drupal 6
(versión 6.20 o superior) y Módulos Drupal 6: cck, apachesolr, apachesolr_attachments,
apachesolr_autocomplete, views2 (views 3 en dev), search, wysiwyg (+ ckeditor), pathauto,
l10n_update, backup_migrate, image, filefield, taxonomy_list.
111
Aunque el modelo de referencia inicial era el Corpus Diacrónico del Español
(CORDE) de la Real Academia Española (http://corpus.rae.es/cordenet.html), muy
pronto se tuvo que comenzar a reconsiderar la posibilidad de contar con un motor
de búsqueda de esa naturaleza, debido a las dificultades técnicas y económicas que
planteaba una herramienta de tanta complejidad. Un sistema como el CORDE
obligaría, para una operatividad efectiva, a la indexación de todos y cada uno de los
términos introducidos en el servidor. Se planteaba, además, la dificultad añadida de
la sintaxis del lenguaje de consulta, pues CORDE permite un sistema de búsqueda
doble: mediante la utilización de palabras del “lenguaje natural” y también mediante
la composición de “expresiones lógicas”, con operadores lógicos (Y, O, NO) y
expresiones de distancia (DIST/).
Por otra parte, una vez analizadas las necesidades del proyecto y las opciones
técnicas asumibles, se comprobó que la cantidad de datos gestionados por PHEBO
en su etapa conclusiva representaría una parte mínima de toda la información
gestionada por un sistema como el CORDE, y por lo tanto no era estrictamente
necesario contar con una herramienta de indexación tan eficaz, pero de tanta
complejidad técnica y coste económico.
Como alternativa viable y muy funcional se optó por una indexación más
limitada, mediante el software de indexación Apache (figs. 11-12). Esta opción se
reveló muy efectiva considerando las características y extensión de los archivos en
formato pdf utilizados en el sitio web, así como también en relación al
(relativamente) limitado corpus documental que albergará PHEBO6.
Fig. 11. Software de indexación Apache usado por Drupal
en el lanzamiento de búsquedas
6
Todo lo relativo a los criterios y herramientas de indexación refleja el actual estado de
elaboración de la página, a la espera de avanzar en un sistema más homogéneo e integrador, tal
como se planteó en el Seminario en el que se presentó el proyecto.
112
Fig. 12: Configuración de Apache mediante Drupal en el lanzamiento de búsqueda
Fig. 12. Configuración de Apache mediante Drupal
en el lanzamiento de búsquedas.
Con este sistema de búsquedas no se recuperan todas y cada una de las
recurrencias del término o términos invocados, aunque sí una gran parte de ellos.
Pero al margen de esto, lo más importante para nuestro propósito es que mediante
esta herramienta se pueden localizar el fichero o ficheros pdf en el que se encuentra
el término solicitado. Ello permite que el usuario interesado pueda realizar
posteriormente búsquedas más precisas sobre los propios ficheros, toda vez que a
partir del software de indexación y búsqueda se pueden delimitar de manera precisa
los archivos en los que se encuentran los términos requeridos.
Se propone a modo de ejemplo ilustrativo de la funcionalidad de PHEBO una
misma búsqueda realizada en CORDE y en PHEBO a partir de la secuencia “flores de
poetas ilustres”, por escoger el título de una célebre antología, aun fuera de la
cronología de referencia. En el ejemplo de CORDE (fig. 13) el potente sistema de
indexación genera cadenas de texto absolutamente homogéneas con el hipervínculo
correspondiente a un fragmento más amplio. Sin embargo, y ello no carece de
importancia, ninguno de los 5 resultados remite de manera directa a la edición de
1605:
113
Fig. 13. Búsqueda en CORDE de “Flores de poetas ilustres”
Fig. 14. Búsqueda en PHEBO de “Flores de poetas ilustres”
La búsqueda realizada en PHEBO (fig. 14) no genera cadenas de texto
homogéneas ni ofrece todas las recurrencias de la búsqueda requerida, como hace
114
CORDE, pero ofrece claramente los dos ficheros en los que se encuentran los
términos invocados (Flores y Espinosa.pdf), además de proporcionar la posibilidad de
extraer la información a partir de un testimonio de 1605.
Otra característica del sistema que puede resultar útil a efectos de conocer
los intereses de los usuarios o pautas de trabajo es el historial de las búsquedas
realizadas, que puede quedar registrado por Drupal y consultarse en cualquier
momento por los usuarios autorizados (fig. 15).
Fig. 15. Historial de búsquedas realizadas en PHEBO
A medida que se incremente el número de textos editados y puestos a
disposición de los usuarios las búsquedas arrojarán resultados más ricos y
heterogéneos, y ello permitirá poner a disposición de los especialistas un
instrumento que no sólo facilitará el estudio de los textos poéticos, sino también el
desarrollo de otros trabajos no estrictamente literarios, como por ejemplo los de
carácter lingüístico u otro tipo de análisis específicos sobre aspectos relativos al uso
de los tópicos, la mitología, las metáforas o las imágenes empleadas en la poesía
española del Bajo Barroco, pongamos por caso.
115
El procedimiento que permite la inclusión de nuevos textos, una vez que se
hayan validado por el equipo de asesores externos de PHEBO (supra), es tan simple
que únicamente requiere que el administrador u otro usuario autorizador adjunte el
archivo y lo aloje en el servidor (fig. 16).
Fig. 16. Fichero pdf con la edición del Poema trágico de Atalanta e Hipomenes
Una vez que se adjunte y se suba, el archivo pasará al servidor de indexación
para posteriores búsquedas en un plazo de tiempo relativamente corto. La subida
del archivo y su consulta, tanto para lectura como para procesos de búsqueda, no
son procesos simultáneos, pues la indexación de dichos ficheros depende de un cron
o administrador de procesos periódicos que se ejecutan en segundo plano en
intervalos regulares de tiempo. En Drupal esta tarea se configura mediante el
archivo cron.php, lo que permite que el fichero pdf esté disponible en el servidor
para búsquedas escasos minutos después de procesarse dicho ejecutable.
Cuando el administrador, o el usuario autorizado, marcan el documento con
el atributo “publicado”, dicho archivo se pone en la cola de espera para ser
indexado junto con el resto de los documentos alojados en la aplicación web (fig.
17).
116
Fig. 17. Marca de la edición pdf con el atributo Publicado
La indexación periódica y regular de todos los archivos residentes en la
aplicación web no sólo es útil para el alojamiento de nuevos textos editados, sino
fundamentalmente como tarea de actualización de todo el material disponible. Esta
tarea es de relevante utilidad en el caso de PHEBO por su vocación colaborativa y
de transferencia de los resultados, ya señalada, y que está muy presente en ciertos
elementos del diseño de la web, como por ejemplo la posibilidad de la
comunicación inmediata o feedback que permite establecer la interfaz con los
potenciales usuarios de la misma a través de los comentarios (fig. 18).
Fig. 18. Ejemplo de comentario de un usuario anónimo advirtiendo de una errata
117
Será posteriormente el administrador u otro usuario autorizado quien se
encargue de corregir el fichero y alojarlo nuevamente en el servidor, así como de la
respuesta o eliminación del comentario.
Además de los textos poéticos, la aplicación web ofrecerá un apartado en
donde se ponga a disposición de los usuarios un listado bibliográfico en continuo
proceso de revisión y ampliación sobre el tema objeto de estudio del proyecto, así
como también materiales críticos (artículos y ensayos), reseñas y enlaces a webs de
interés.
De este modo, y en suma, la web PHEBO supone el proyecto (en proceso de
creación) de una herramienta —si no integral, sí al menos integradora— que permita el acceso a la noticia de los textos (mediante su base de datos), la lectura
de una edición fiable de muchos de ellos, así como también
una plataforma de generación y difusión
de la construcción crítica
en torno a éstos.
o
118