Por un análisis distante y profundo: un corpus piloto de la poesía lírica castellana del Siglo de Oro
DOI:
https://doi.org/10.37536/RPM.2019.33.0.69109Palabras clave:
Análisis distante, Poesía lírica, Siglo de Oro, Métrica., Procesamiento del Lenguaje Natural, Anotación de corpusResumen
En este trabajo se plantea la necesidad de combinar el análisis llamado «distante» (análisis panorámico de gran cantidad de texto literario) con el análisis profundo (análisis en detalle de diferentes aspectos lingüísticos o literarios). Para ello se propone la creación de amplios corpus literarios de referencia en los que, aprovechando los actuales avances en procesamiento del lenguaje natural, la información implícita del texto (tanto de tipo lingüístico como literario) esté marcada de manera explícita y formal. La propuesta se concreta en el diseño y desarrollo de un corpus piloto de la poesía lírica del Siglo de Oro que incluye poemas con diferentes modelos métrico-estróficos (sonetos, romances, liras, églogas, etc.) así como diversidad de autores. Actualmente consta de más de 52.000 versos anotados con información lingüística (palabras, lemas, categorías gramaticales y morfología) y literaria (tipo de poema o estrofa y métrica). Si bien la anotación general del corpus ha sido realizada de manera automática, un 10% de esa anotación (5069 versos) ha sido revisada, validada o, en su caso, corregida por expertos. Este 10%, en tanto que Gold Standard, es ya un primer paso tanto para el análisis distante y profundo de la poesía castellana como para el desarrollo de sistemas de procesamiento del lenguaje natural específicos para el texto literario y poético.
Descargas
Métricas alternativas
Descargas
Archivos adicionales
Publicado
Cómo citar
Número
Sección
Licencia
Las opiniones y hechos consignados en cada artículo son de exclusiva responsabilidad de sus autores. La Universidad de Alcalá no se hace responsable, en ningún caso, de la credibilidad y autenticidad de los trabajos.
Los autores conservan los derechos sobre sus trabajos, aunque ceden de forma no exclusiva los derechos de explotación (reproducción, edición, distribución, comunicación pública y exhibición) a la revista. Los autores son, por lo tanto, libres de hacer acuerdos contractuales adicionales independientes para la distribución no exclusiva de la versión de la obra publicada en la revista (por ejemplo, alojarlo en un repositorio institucional o publicarlo en un libro), siempre que medie un reconocimiento de su publicación inicial en esta revista.
Los trabajos se publican bajo los términos estipulados en la Licencia de Atribución-NoComercial-CompartirIgual 4.0 Internacional Creative Commons (CC BY-NC-SA 4.0) que permite a terceros compartir la obra bajo las siguientes condiciones:
Atribución — Usted debe dar crédito de manera adecuada, brindar un enlace a la licencia, e indicar si se han realizado cambios. Puede hacerlo en cualquier forma razonable, pero no de forma tal que sugiera que usted o su uso tienen el apoyo de la licenciante.
NoComercial — Usted no puede hacer uso del material con propósitos comerciales.
CompartirIgual — Si remezcla, transforma o crea a partir del material, debe distribuir su contribución bajo la misma licencia del original.