The 2022 Christmas speech of the King of Spain through Analhitza
DOI:
https://doi.org/10.24215/27187470e060Keywords:
computational lingüistics, multilingualism, natural language processing, text analysis, AnalhitzaAbstract
This study examines the ITXA platform and its Analhitza tool, an initiative developed by the University of the Basque Country. ITXA provides computational linguistics resources for Basque, Spanish and English, facilitating the analysis of texts using tools such as Xuxen.
Analhitza allows the automatic extraction of linguistic information, being useful for areas such as research or teaching. In order to understand the capabilities and limitations of the tool, an analysis of the King of Spain's Christmas speech in 2022 has been carried out. In its evaluation, the tool demonstrates its effectiveness in semantic and morphological analysis, as well as detecting certain areas for improvement.
Downloads
References
Agerri, R., Bermudez, J. y Rigau, G. (2014). IXA pipeline: Efficient and Ready to Use Multilingual NLP tools. En N. Calzolari, K. Choukri, T. Declerck, H. Loftsson, B. Maegaard, J. Mariani, A. Moreno, J. Odijk y S. Piperidis (Eds.), Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC’14) (pp. 3823-3828). European Language Resources Association.
Alonso Sáenz de Oger, S., Volkens, A. y Gómez Fortes, B. (2012). Content-analyzing political texts: A quantitative approach. Centro de Investigaciones Sociológicas.
Fokkens, A., Etxabe, A. S., Beloki, Z., Ockeloen, C., Rigau, G., van Hage, W. R. y Vossen, P. (2014). NAF and GAF: Linking linguistic annotations [Conferencia]. 10th Joint ISO-ACL SIGSEM Workshop on Interoperable Semantic Annotation. Portorož, Slovenia.
Fradejas Rueda, J.M. (2023). Cuentapalabras. Estilometría y análisis de texto con R para filólogos. Universidad de Valladolid. https://aic.uva.es/cuentapalabras/
Otegi, A., Imaz, O., Díaz de Ilarraza, A., Iruskieta, M. y Uria, L. (2024). ANALHITZA: A tool to extract linguistic information from large corpora in Humanities research [Software]. University of the Basque Country. http://ixa.si.ehu.es/node/8862
Ruiz Fabo, P. y Bermúdez Sabel, H. (2019). Navegación de corpus a través de anotaciones lingüísticas automáticas obtenidas por Procesamiento del Lenguaje Natural: de anecdótico a ecdótico. Revista de Humanidades Digitales, 4, 136-161. https://doi.org/10.5944/rhd.vol.4.2019.25186
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2024 Julia Muñoz Moreno de Vega
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Los autores que publican en esta revista están de acuerdo con los siguientes términos:
- Los artículos publicados en la revista se encuentran disponibles en acceso abierto.
- Los autores conservan los derechos de autor y garantizan a la revista el derecho de ser la primera publicación del trabajo al igual que licenciarlo bajo una Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional (CC BY-SA 4.0), que permite copiar y redistribuir el material en cualquier medio o formato y remezclar, transformar y construir a partir del material bajo los siguientes términos: debe dar crédito de manera adecuada, brindar un enlace a la licencia, e indicar si se han realizado cambios.
- Los autores pueden depositar el trabajo en un repositorio de preprints, postprints, establecer por separado acuerdos adicionales para la distribución no exclusiva de la versión de la obra publicada en la revista (por ejemplo, situarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en esta revista.
- Se alienta a los/as autores/as a realizar el depósito de datos en SEDICI, o en cualquier otro repositorio de datos de investigación (como Zenodo, donde la AAHD ha creado un repositorio temático para HUMANIDADES DIGITALES), de manera previa a realizar el envío de la contribución a la revista. De este modo, al remitir el artículo solo se deberá indicar la URL donde se encuentran los datos de investigación.