BibLex
aplicación práctica de IA y PLN para la asignación de palabras clave en registros de Biblat
DOI:
https://doi.org/10.54886/scire.v31i1/2.5084Palabras clave:
Indización automatizada, BibLex, Procesamiento de lenguaje natural (PLN), Inteligencia artificial generativa (GenIA), BIBLAT, CLASE, PeriódicaResumen
Estudio aplicado de inteligencia artificial que describe la integración del algoritmo BibLex al proceso de indización de artículos científicos, publicados en revistas latinoamericanas de acceso abierto indizadas en el portal Biblat. BibLex es un algoritmo diseñado para automatizar la asignación de palabras clave, combina técnicas clásicas de procesamiento de lenguaje natural (PLN), a través de la librería NLTK, con el modelo de inteligencia artificial generativa (GenIA) Gemini de Google. Ambos enfoques permiten analizar corpus lingüístico y semántico de los documentos, generando un conjunto de términos contextualizados. Los resultados sugieren que la integración de PLN con GenIA es técnicamente viable, asequible y oportuna para responder a los desafíos de la indización bibliotecológica de manera eficiente y sin comprometer la calidad terminológica. El enfoque híbrido adoptado abre posibilidades para la automatización de procesos técnicos en los entornos bibliotecarios.
Descargas
Citas
Alonso Gamboa, José Octavio; Arana Mendoza, Celia; Reyna Espinosa, Felipe Rafael; Sánchez Pereyra, Antonio (2012). Manual de indización para las bases de datos Clase y Periódica. México, D.F.: Universidad Nacional Autónoma de México, Dirección General de Bibliotecas. https://biblat.unam.mx/archivos/manual_indizacion.pdf
Bird, Steven; Klein, Ewan y Loper Edward (2009). Natural Language Processing with Python. O'Reilly.
Bouzid, Sara y Piron, Loïs (2024). Leveraging Generative AI in Short Document Indexing. // Electronics. 13:17 3563. https://doi.org/10.3390/electronics13173563
Blei, D. M.; Ng, A. Y.; Jordan, M. I. (2003). Latent Dirichlet Allocation. // Journal of Machine Learning Research, 3(Jan), 993–1022. https://www.jmlr.org/papers/volume3/blei03a/blei03a.pdf
Contreras Barrera, Marcial (2018). Aplicación del algoritmo RAKE en la indización de documentos digitales. // Investigación Bibliotecológica. 32:75 (abril/mayo) 109-123. https://doi.org/10.22201/iibi.24488321xe.2018.75.57951
Creative Commons (2025). Using CC-Licensed Works for AI Training. https://creativecommons.org/using-cc-licensed-works-for-ai-training-2
Cuéllar Hidalgo, Rodrigo (2025). Reconocimiento de Entidades Nombradas (NER): una técnica para agilizar el procesamiento de colecciones digitales. // Amontonamos las palabras: Blog de la Biblioteca de El Colegio de México. https://doi.org/10.58079/13dqq
Feuerriegel, Stefan; Hartmann, Jochen; Janiesch, Christian y Zschech, Patrick (2023). Generative AI. // arXiv. https://doi.org/10.48550/arXiv.2309.07930
Feyisa, Degaga Wolde; Berihun, Haylemicheal; Zewdu, Amanuel; Najimoghadam, Mahsa y Zare, Marzieh (2024). The Future of Document Indexing: GPT and Donut Revolutionize Table of Content Processing. // arXiv. https://doi.org/10.48550/arXiv.2403.07553
Gatti, Alberto (2024). Alfabetización e inteligencia artificial. // Journal of Neuroeducation. 5:1 (julio) 52–58. https://doi.org/10.1344/joned.v5i1.46108
Google (2025). Límites de frecuencia. // Google AI for Developers. https://ai.google.dev/gemini-api/docs/rate-limits?hl=es-419
Indurkhya, N.; Damerau, F. J. (Eds.). (2010). Handbook of Natural Language Processing. Chapman and Hall/CRC. https://doi.org/10.1201/9781420085938
Kok, Joost N.; Boers, Egbert. J. W.; Kosters, Walter A.; Van der Putten, Peter; Poel, Mannes (2009). Artificial intelligence: definition, trends, techniques, and cases. // Artificial intelligence. 1, 270-299.
Klein, E.; Bird, S.; Loper, E. (2009). Natural Language Processing with Python. O'Reilly Media, Incorporated.
Martínez Albarrán, Alí (2024). La inteligencia artificial en los estudios de la información y la bibliotecología. // e-Ciencias de la información. 14:2. https://doi.org/10.15517/eci.v14i2.57949
Miner, Gary; Delen, Dursun; Elder, John; Thomas Hill; Nisbet, Robert A. (Eds) (2012). Practical Text Mining and Statistical Analysis for Non-Structured Text Data Applications. // Elsevier Science & Technology. https://doi.org/10.1016/C2010-0-66188-8
Polo Bautista, Luis Roberto y Martínez Acevedo, Karen Vanessa (2021). Algoritmo para el análisis temático de documentos digitales. // Investigación Bibliotecológica.35:89 (octubre/diciembre) 13-31. https://doi.org/10.22201/iibi.24488321xe.2021.89.58419
Reyna Espinosa, Felipe Rafael (2015). CLASE. Perfil de una base de datos bibliográfica. // Biblioteca Universitaria 18:2. https://biblat.unam.mx/hevila/e-BIBLAT/Biblio/ReynaEspinosa_2015%282%29.pdf
Sengar, Sandeep Singh; Hasan, Affan Bin; Kumar, Sanhay y Carroll, Fiona (2024). Generative Artificial Intelligence: A Systematic Review and Applications. // arXiv. https://doi.org/10.48550/arXiv.2405
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2025 Los autores y autoras conservan sus derechos de autor, aunque ceden a la revista de forma no exclusiva los derechos de explotación (reproducción, distribución, comunicación pública y transformación) y garantizan a esta el derecho de primera publicación de su trabajo, el cual estará simultáneamente sujeto a la licencia CC BY-NC-ND. Los autores aceptan la responsabilidad legal de cumplir plenamente con los códigos éticos y leyes apropiadas, y de obtener todos los permisos de derecho de autor debidos. Se permite y se anima a los autores y autoras a difundir electrónicamente la versión editorial (versión publicada por la editorial) en la página web personal del autor y en el repositorio de la institución a la que pertenece.

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
© 1996- . Los autores y autoras conservan sus derechos de autor, aunque ceden a la revista de forma no exclusiva los derechos de explotación (reproducción, distribución, comunicación pública y transformación) y garantizan a esta el derecho de primera publicación de su trabajo, el cual estará simultáneamente sujeto a la licencia CC BY-NC-ND. Los autores aceptan la responsabilidad legal de cumplir plenamente con los códigos éticos y leyes apropiadas, y de obtener todos los permisos de derecho de autor debidos. Se permite y se anima a los autores y autoras a difundir electrónicamente la versión editorial (versión publicada por la editorial) en la página web personal del autor y en el repositorio de la institución a la que pertenece.