Papers by Sánchez-Prieto Borja, Pedro
CHIMERA: Revista de Corpus de Lenguas Romances y Estudios Lingüísticos, 2018
Bookmarks Related papers MentionsView impact
espanolLas fuentes documentales presentan la ventaja de hacer explicito el lugar de emision. Este... more espanolLas fuentes documentales presentan la ventaja de hacer explicito el lugar de emision. Este fue uno de los motivos para elaborar el CODEA 2011, un corpus de fuentes documentales primario y con una triple presentacion. Ello ha permitido configurar la nueva version CODEA+ 2015 como un verdadero atlas diacronico del espanol, pues integra herramientas que hacen posible proyectar los resultados de las busquedas sobre un mapa, y proporciona asi una pista acerca del peso del factor geografico en la variacion linguistica historica de la Peninsula desde la epoca de origenes a 1800, si bien hay que tener en cuenta que el documento nunca es trasunto inmediato y directo de la realidad dialectal, pues sus usos graficos estan mediatizados por las scriptae o tradiciones de escritura en las que se inserta el escribano. En este trabajo pretendemos ejemplificar el valor que CODEA+ 2015 tiene para la distribucion espacial de las variantes. EnglishArchival documents have the advantage of containi...
Bookmarks Related papers MentionsView impact
Revista de Historia de la Lengua Española, 2023
https://rhle.es/index.php/revista/article/view/429/300
El presente estudio es un acercamiento cua... more https://rhle.es/index.php/revista/article/view/429/300
El presente estudio es un acercamiento cuantitativo a la puntuación de los códices de las partes Primera y Cuarta de la General estoria, Estoria de España, Lapidario, Cruzes y Ajedrez, pero interpretando los datos a la luz de una visión amplia sobre el libro en el s. XIII, su proceso elaborativo y su función en la génesis, transmisión y recepción del conocimiento. En el caso de la producción textual alfonsí, han de distinguirse códices y diplomas, con diferencias entre sí en lo paleográfico, gráfico, fonético, morfosintáctico y léxico, así como en la conformación del discurso. La puntuación no podía escapar a esta doble manifestación de la escritura alfonsí. Además, se observan diferencias significativas entre los diferentes códices, lo que puede apuntar a la singularidad de algunos de ellos, como los del Lapidario y el Ajedrez, mientras que entre los códices historiográficos las diferencias son menores. Todo ello podría hacer de la puntuación una marca de escuela, dentro de la producción libraria alfonsí y, tal vez, un reflejo de la cronología y lugar de elaboración de los códices regios.
The present study is a quantitative approach to the punctuation of the First and Fourth parts of General estoria, Estoria de España, Lapidario, Cruzes and Ajedrez codices, but interpreting the data in the light of a broad vision of the 13th century manuscripts, its elaboration process and its function in the genesis, diffusion and reception of knowledge. In the case of Alfonsine textual production, codices and documents must be distinguished, with differences between them in the paleographic, graphic, phonetic, morphosyntactic and lexical aspects, as well as in the conformation of the discourse. Punctuation could not escape this double manifestation of Alfonsine writing. In addition, significant differences are observed between the different codices, which may point to the uniqueness of some of them, such as Lapidario and Ajedrez, while the differences between the historiographical codices are minor. All of this could make punctuation a school mark, within the Alfonsine book production and, perhaps, a reflection of the chronology and place of elaboration of the royal manuscripts.
Bookmarks Related papers MentionsView impact
Bookmarks Related papers MentionsView impact
La Lengua Lugar De Encuentro Recurso Electronico Actas Del Xvi Congreso Internacional De La Alfal 2011 Isbn 978 84 8138 771 1 Pags 2629 2638, 2011
Bookmarks Related papers MentionsView impact
Bookmarks Related papers MentionsView impact
M. Agujetas Ortiz y P. Sánchez-Prieto Borja, "Nuevas vías para la recuperación de información en corpus históricos: clasificación del vocabulario en CODEA", Scriptum Digital, 11, 2022, pp. 5-54, 2022
El objetivo de este artículo es explorar la aplicación de modelos ontológicos en corpus diacronic... more El objetivo de este artículo es explorar la aplicación de modelos ontológicos en corpus diacronicos, ensayada en el subcorpus CN de CODEA; para ello, se ha procedido a la lematización interactiva y los lemas resultantes se han clasificado en una estructura jerárquica de tres niveles, próxima a las de las taxonomías. Los vínculos semánticos entre palabras vienen reforzados por su presencia, a veces, en más de un campo nocional. Se ha explorado también la navegación por raíces léxicas, estableciendo así asociaciones inmediatas entre palabras formalmente relacionadas. De esta manera, será posible la recuperación de información semántica, lo que constituirá un avance significativo respecto de las búsquedas meramente formales.
PALABRAS CLAVE: Historia de la lengua española, corpus lingüísticos, humanidades digitales, ontología, taxonomía, lexicología
The aim of this paper is to explore the application of ontological models in diachronic corpora. It has been tested in the CN subcorpora of CODEA. First of all, interactive lemmatisation has been carried out; the resulting lemmas have then been classified in a three-level hierarchical structure, similar to taxonomies. The semantic links between words are reinforced by their presence in more than one notional field. Navigation through lexical roots has also been explored, allowing the immediate associations are established between formally related words. In this way, the retrieval of semantic information will be possible, which will constitute significant progress compared with purely formal searches.
KEY WORDS: History of the Spanish language, linguistic corpora, digital Humanities, ontology, taxonomy, lexicology
Bookmarks Related papers MentionsView impact
Revista de Historia de la Lengua Española, 2015
La cronología de la confusión entre sibilantes alveolares y dentales es objeto de discusión en el... more La cronología de la confusión entre sibilantes alveolares y dentales es objeto de discusión en el estudio histórico de la lengua española; en cuanto a la geografía, en cambio, se ha considerado que, en el dominio del castellano, esta indistinción se generalizo solo en la zona meridional de la Península, donde dio lugar a los fenómenos de seseo y ceceo. En las dos Castillas, el carácter esporádico de estas confusiones hace que suelan considerarse irrelevantes desde el punto de vista fonético. Sin embargo, resulta sorprendente que en Madrid y Toledo menudeen, entre los siglos XVI y XVIII, los testimonios de s por c-ç-z y viceversa (bautisado, ce llama) en notas y cartas particulares a menudo escritas por personas poco formadas en la escritura, y que podrían apuntar a un seseo en el centro peninsular que no se consolidó. Aquí examinamos, sobre todo, los fondos de la Inclusa de Madrid, que atestiguan usos de los sociolectos más bajos, raramente representados en la escritura.
Bookmarks Related papers MentionsView impact
Verba: Anuario Galego de Filoloxía, 2020
Para explicar la historia del consonantismo madrileño, es necesario considerar también el estado ... more Para explicar la historia del consonantismo madrileño, es necesario considerar también el estado actual del español. Suele atribuirse a la inmigración meridional del s. xx el carácter innovador en muchos rasgos en los sociolectos medios y bajos de la ciudad. Por tanto, hay que rastrear en la documentación archivística para determinar si tales usos son relativamente recientes o tienen sus raíces en el habla madrileña de siglos anteriores. Esto es posible gracias al uso de fuentes que atestigüen los empleos de las clases populares: peticiones a las instituciones benéficas y otros escritos. Entre los rasgos encontrados en el consonantismo, el más sorprendente es el indicio gráfico de seseo, documentado en los ss. xvi-xix. La documentación de estos y otros fenómenos avanzados en la escritura del estrato popular y medio, y no solo en la localidad de Madrid, sino incluso en zonas rurales, obliga a replantear la posición histórica del consonantismo madrileño.
Bookmarks Related papers MentionsView impact
A diferencia de los rasgos lingüísticos propios de otras regiones españolas, que han sido objeto ... more A diferencia de los rasgos lingüísticos propios de otras regiones españolas, que han sido objeto de atención preferente dentro de la Filología española, son pocos los trabajos centrados en la situación histórica del habla de Madrid. No obstante, no es posible entender cómo es el español de hoy, su variedad registral, social y geográfica sin su estudio. Los trabajos que se recogen en este volumen pretenden no solo dar cuenta de las posibilidades que para la investigación de la historia del habla de Madrid tienen los archivos madrileños, sino presentar una descripción amplia y detallada, que parte en ocasiones de fuentes inéditas. Para ello, se han seleccionado tipos textuales distintos, que abarcan desde la Edad Media hasta el siglo XIX: procesos judiciales, inventarios de bienes, cartas, escritos de personas de nivel sociocultural bajo, registros de grado medio de instituciones como la Hermandad del Refugio, nombramientos, deslindes, acuerdos económicos, etc. De este modo, se ha pro...
Bookmarks Related papers MentionsView impact
Los estudios sobre el espanol han senalado la importancia historica del habla de Madrid; sin emba... more Los estudios sobre el espanol han senalado la importancia historica del habla de Madrid; sin embargo, la mayoria de los trabajos atienden solamente a los testimonios literarios. Esta obra presenta la documentacion de beneficencia del Archivo Regional de la Comunidad de Madrid, Hermandad del Refugio y Archivo de Villa. Las instituciones estudiadas son, sobre todo, la Inclusa de Madrid, la Hermandad del Refugio y el Colegio de San Ildefonso, entre otros. Con el examen de notas de abandono y entrega de ninos a la Inclusa y Refugio, solicitudes de ayuda, registro de ninos expositos, etc., se reconstruye la lengua madrilena en su diversidad sociolinguistica, para los siglos XVI al XIX Ademas, esta documentacion resulta de gran valor historico.
Bookmarks Related papers MentionsView impact
Bookmarks Related papers MentionsView impact
El propósito de este trabajo es examinar la documentación conservada en los archivos madrileños e... more El propósito de este trabajo es examinar la documentación conservada en los archivos madrileños entre los siglos XVI y XIX para obtener el léxico de la vida cotidiana más significativo. De este modo es posible la comparación interna del vocabulario en la Comunidad de Madrid y también con las zonas geográficas próximas a través de documentos de esta época. Por otro lado, analizamos la pervivencia de este léxico por la comparación con los atlas lingüísticos sincrónicos de Madrid y Castilla-La Mancha. Esta labor se lleva acabo en el proyecto ALDICAM-CM, cuya finalidad principal es elaborar un atlas lingüístico diacrónico de la Comunidad de Madrid.
Bookmarks Related papers MentionsView impact
Bookmarks Related papers MentionsView impact
Bookmarks Related papers MentionsView impact
Bookmarks Related papers MentionsView impact
Actas Do Xix Congreso Internacional De Linguistica E Filoloxia Romanicas Vol 7 1994 Isbn 84 87819 22 2 Pags 221 236, 1994
Bookmarks Related papers MentionsView impact
Studia in Honorem German Orduna 2001 Isbn 84 8138 439 9 Pags 571 582, 2001
Bookmarks Related papers MentionsView impact
Archivo De Filologia Aragonesa, 1983
Fecha de publicación: 1984 Lugar de publicación: Archivo de Filología Aragonesa, 32-33, 179-203.
Bookmarks Related papers MentionsView impact
Bookmarks Related papers MentionsView impact
Uploads
Papers by Sánchez-Prieto Borja, Pedro
El presente estudio es un acercamiento cuantitativo a la puntuación de los códices de las partes Primera y Cuarta de la General estoria, Estoria de España, Lapidario, Cruzes y Ajedrez, pero interpretando los datos a la luz de una visión amplia sobre el libro en el s. XIII, su proceso elaborativo y su función en la génesis, transmisión y recepción del conocimiento. En el caso de la producción textual alfonsí, han de distinguirse códices y diplomas, con diferencias entre sí en lo paleográfico, gráfico, fonético, morfosintáctico y léxico, así como en la conformación del discurso. La puntuación no podía escapar a esta doble manifestación de la escritura alfonsí. Además, se observan diferencias significativas entre los diferentes códices, lo que puede apuntar a la singularidad de algunos de ellos, como los del Lapidario y el Ajedrez, mientras que entre los códices historiográficos las diferencias son menores. Todo ello podría hacer de la puntuación una marca de escuela, dentro de la producción libraria alfonsí y, tal vez, un reflejo de la cronología y lugar de elaboración de los códices regios.
The present study is a quantitative approach to the punctuation of the First and Fourth parts of General estoria, Estoria de España, Lapidario, Cruzes and Ajedrez codices, but interpreting the data in the light of a broad vision of the 13th century manuscripts, its elaboration process and its function in the genesis, diffusion and reception of knowledge. In the case of Alfonsine textual production, codices and documents must be distinguished, with differences between them in the paleographic, graphic, phonetic, morphosyntactic and lexical aspects, as well as in the conformation of the discourse. Punctuation could not escape this double manifestation of Alfonsine writing. In addition, significant differences are observed between the different codices, which may point to the uniqueness of some of them, such as Lapidario and Ajedrez, while the differences between the historiographical codices are minor. All of this could make punctuation a school mark, within the Alfonsine book production and, perhaps, a reflection of the chronology and place of elaboration of the royal manuscripts.
PALABRAS CLAVE: Historia de la lengua española, corpus lingüísticos, humanidades digitales, ontología, taxonomía, lexicología
The aim of this paper is to explore the application of ontological models in diachronic corpora. It has been tested in the CN subcorpora of CODEA. First of all, interactive lemmatisation has been carried out; the resulting lemmas have then been classified in a three-level hierarchical structure, similar to taxonomies. The semantic links between words are reinforced by their presence in more than one notional field. Navigation through lexical roots has also been explored, allowing the immediate associations are established between formally related words. In this way, the retrieval of semantic information will be possible, which will constitute significant progress compared with purely formal searches.
KEY WORDS: History of the Spanish language, linguistic corpora, digital Humanities, ontology, taxonomy, lexicology
El presente estudio es un acercamiento cuantitativo a la puntuación de los códices de las partes Primera y Cuarta de la General estoria, Estoria de España, Lapidario, Cruzes y Ajedrez, pero interpretando los datos a la luz de una visión amplia sobre el libro en el s. XIII, su proceso elaborativo y su función en la génesis, transmisión y recepción del conocimiento. En el caso de la producción textual alfonsí, han de distinguirse códices y diplomas, con diferencias entre sí en lo paleográfico, gráfico, fonético, morfosintáctico y léxico, así como en la conformación del discurso. La puntuación no podía escapar a esta doble manifestación de la escritura alfonsí. Además, se observan diferencias significativas entre los diferentes códices, lo que puede apuntar a la singularidad de algunos de ellos, como los del Lapidario y el Ajedrez, mientras que entre los códices historiográficos las diferencias son menores. Todo ello podría hacer de la puntuación una marca de escuela, dentro de la producción libraria alfonsí y, tal vez, un reflejo de la cronología y lugar de elaboración de los códices regios.
The present study is a quantitative approach to the punctuation of the First and Fourth parts of General estoria, Estoria de España, Lapidario, Cruzes and Ajedrez codices, but interpreting the data in the light of a broad vision of the 13th century manuscripts, its elaboration process and its function in the genesis, diffusion and reception of knowledge. In the case of Alfonsine textual production, codices and documents must be distinguished, with differences between them in the paleographic, graphic, phonetic, morphosyntactic and lexical aspects, as well as in the conformation of the discourse. Punctuation could not escape this double manifestation of Alfonsine writing. In addition, significant differences are observed between the different codices, which may point to the uniqueness of some of them, such as Lapidario and Ajedrez, while the differences between the historiographical codices are minor. All of this could make punctuation a school mark, within the Alfonsine book production and, perhaps, a reflection of the chronology and place of elaboration of the royal manuscripts.
PALABRAS CLAVE: Historia de la lengua española, corpus lingüísticos, humanidades digitales, ontología, taxonomía, lexicología
The aim of this paper is to explore the application of ontological models in diachronic corpora. It has been tested in the CN subcorpora of CODEA. First of all, interactive lemmatisation has been carried out; the resulting lemmas have then been classified in a three-level hierarchical structure, similar to taxonomies. The semantic links between words are reinforced by their presence in more than one notional field. Navigation through lexical roots has also been explored, allowing the immediate associations are established between formally related words. In this way, the retrieval of semantic information will be possible, which will constitute significant progress compared with purely formal searches.
KEY WORDS: History of the Spanish language, linguistic corpora, digital Humanities, ontology, taxonomy, lexicology
El Inventario léxico de Andalucía. Corpus CODEA se publica bajo licencia de Creative Commons by-nc-nd- (Reconocimiento – No Comercial – Sin Obra Derivada), lo que significa que no se permite un uso comercial de la obra original ni la generación de obras derivadas. Los materiales del Inventario léxico de Andalucía podrán ser citados, pero no reutilizados.
Presentamos la lematización interactiva completa de los documentos emitidos en Andalucía incluidos en el corpus CODEA+ 2015 < https://www.corpuscodea.es/>, elaborada por Hiroto Ueda, Pedro Sánchez-Prieto Borja y María Agujetas Ortiz. En el inventario léxico, el lema va seguido de la indicación de categoría gramatical y esta, de las formas normalizadas, que se han utilizado para asignar las formas de los documentos a un lema). Tras las formas normalizadas se incluyen las formas formas críticas de CODEA, de acuerdo con la presentación crítica de los documentos en este corpus); a continuación se señala el siglo, que va representado por su año de inicio o cierre del siglo anterior (1200 representa al s. XIII; 1300, al XIV, y así sucesivamente). Sigue la frecuencia absoluta, y a esta la frecuencia normalizada por diez mil palabras.
Ejemplo:
abaratar (v) abarate embarate 1700: 1 (0.6).
abaratar: Lema
(v): CG (Categoría gramatical)
abarate: Forma normalizada
embarate: Forma crítica
1700: Año:
1: Frecuencia absoluta
(0.6): Frecuencia normalizada por diez mil palabras
La utilidad de un trabajo como este se presenta por sí al poder localizar, en este caso, las variantes paleográficas de cualquier lema, con lo que el interés se extiende, además de al léxico y morfología, al sistema gráfico. En otro plano, la integración del buscador por lemas en la nueva versión del corpus CODEA multiplica su funcionalidad, pues es la base de desarrollos ulteriores, como la elaboración de una ontología. Por otra parte, la capacidad de recuperación de información aumenta enormemente al combinar la búsqueda por lemas y categorías gramaticales.
El Inventario léxico de ALDICAM está constituido de tres partes divididos en ocho libros de la siguiente manera:
Primera parte: Lemas
Segunda parte: Formas críticas
Tercera parte: Formas paleográficas
Una vez conseguida la lista "Forma modernizada", el programa LEMMATIZE lematiza automáticamente la misma forma en lema y al mismo tiempo el programa devuelve la categoría gramatical <http://shimoda.lllf.uam.es/ueda/lyneal/etc/lemma.htm>.
ACCESO AL INVENTARIO LÉXICO:
http://shimoda.lllf.uam.es/ueda/lyneal/il/aldicam/
ABSTRACT: The aim of this work is to find the origin of the place name Barataria used by Cervantes in the Quixote to refer to the ínsula or island of which Sancho is appointed governor. Surprisingly, it is quite probable that in the ancient texts of Alphonso X, spread in the time of Cervantes, the final origin for Barataria can be found.
Una de las mayores aportaciones de este libro consiste en sacar a la luz la lengua de las clases populares en los siglos XVI-XIX, con testimonios sorprendentes, muestra de grupos sociales poco habituados a tomar la pluma. Con ser el objeto principal, el interés de este libro no se detiene en la lengua de los madrileños, sino que, a través de esta, nos acerca a un variado elenco de tipos humanos de los más diversos oficios, condición y carácter. Marqueses, carreteros, carboneros, leñadores, cazadores furtivos, hortelanos, médicos, pobres de solemnidad, funcionarios, monjas y tantos otros se dan cita en estas páginas a través de los documentos, testigos elocuentes del tiempo que fue, pero que, sin duda, conformó el Madrid de hoy.
Para el ámbito de la escritura, es llamativa la profusión de formas no documentadas, como buama ‘un ama’, nanutural ‘natural’, se cheó ‘se echó’, entre otras. Se transparentan usos fonéticos de rango sociolingüístico bajo de una manera constante en diferentes épocas: butismo ‘bautismo’ (1738), guerfanito ‘huerfanito’ (1756), ahuelos ‘abuelos’ (1817), poberes ‘pobres’ (1741) y paderes (1816), enclusa (1715), marillas ‘amarillas’ (1841), ceula ‘cédula’ (1715), Madriz (1741). En la fonética destacan los numerosos testimonios de un hipotético seseo madrileño: saguán (1738), bautisado (1738), dose (1755), nasió (1839). Novedoso es también el registro de la confusión gráfica que revela un posible yeísmo: yamar, apeyido (1817), balleta ‘bayeta’ (1839). Para la morfosintaxis, llamamos la atención sobre la marca morfológica de femenino en el sufijo -nte, como suplicanta (1755), y la falta de preposición en expresiones locativas (“Vive calle Tudescos”). El léxico muestra ejemplos propios de la asistencia social: pesebrón ‘cuna’, sin rayo de leche ‘sin leche materna’, echar ‘dejar el niño en la Inclusa’. Asimismo se encuentra algún coloquialismo como teta o posibles ‘medios económicos’. En cuanto al plano discursivo, sobresale la expresividad popular, con concesiones al humor: “su padre se llama Chite y Calla y su madre María Búscala” (1594); “Celestino Antonio Fernández me llamo. / Búsquenme un ama / y verán cómo mamo” (1741). Algunos reflejan el habla y la mentalidad popular: “Nuestra Señora de la Soledad te guarde, niño hermosso, y te defienda de bruxas y echiceras, amén” (1740), o el dramatismo de la escena (“Su madre murió parto”, 1695). Además, esta documentación resulta de gran valor histórico para comprender la vida de la capital en uno de sus aspectos menos conocidos.