Enriquecimiento automático de portales culturales mediante modelos de organización del conocimiento

  • Dayany Díaz-Corona Instituto de Investigación en Ingeniería de Aragón (I3A), Universidad de Zaragoza
  • Javier Lacasta Instituto de Investigación en Ingeniería de Aragón (I3A), Universidad de Zaragoza
  • Javier Nogueras Iso Universidad de Zaragoza
Palabras clave: Modelos de Organización del Conocimiento, SKOS, Web Semántica, Metadatos, Sistemas de Recomendación

Resumen

Durante las últimas décadas se han ido creando numerosos portales web para diseminar el patrimonio cultural. La mayoría de estos portales se crearon en tiempos de la web sintáctica generando páginas HTML con texto plano indexable por buscadores, pero sin metadatos añadidos y anotaciones de conceptos pertenecientes a modelos de organización del conocimiento que facilitarían la labor de buscadores temáticos especializados. Este artículo propone un método para recomendar los modelos de organización del conocimiento que mejor se ajusten a los contenidos de un portal web, y utilizar esos modelos para anotar semánticamente los contenidos. Para verificar la viabilidad del método propuesto se ha aplicado en el enriquecimiento de un portal creado a mediados de los años 90 y que aloja un catálogo virtual de las obras del pintor Goya. Gracias al método propuesto, se ha recomendado el modelo de organización del conocimiento denominado Lista de Encabezamientos de Materias para las Bibliotecas Públicas por su cercanía con el contenido del portal. Además, se han conseguido anotar semánticamente dos tercios de las páginas en castellano del portal con conceptos de este modelo. Aunque la exactitud de los emparejamientos entre las entidades detectadas en el texto y los conceptos del modelo no es perfecta, la anotación realizada constituye una buena base para que los administradores del portal puedan refinar posteriormente esta anotación.

Citas

Albertoni, R.; De Martino, M.; Quarati, A. (2016). Integrated quality assessment of linked thesauri for the environment. // International Conference on Electronic Government and the Information Systems Perspective. 221–235.

Apache (2017). The Apache Software Foundation. Apache OpenNLP web site. https://opennlp.apache.org/ (2021-03-24)

Comisión Europea (2021). Portal de Europeana. https://www.europeana.eu/ (2021-03-24)

da Silva Lemos, D.L.; Souza, R.R. (2020). Knowledge Organiza-tion Systems for the Representation of Multimedia Resour-ces on the Web: A Comparative Analysis. // Knowledge Or-ganization. 47:4, 300-319.

Daiber, J.; Jakob, M.; Hokamp, C.; Mendes, P. N. (2013). Improving efficiency and accuracy in multilingual entity ex-traction. // Proceedings of the 9th International Conference on Semantic Systems. 121-124.

Díaz-Corona, D.; Lacasta, J.; Latre, M.Á.; Zarazaga-Soria, F.J.; Nogueras-Iso J. (2019). Profiling of knowledge organisation systems for the annotation of Linked Data cultural resour-ces. // Information Systems. 84, 17-28.

DPLA (2021). Portal de la Digital Public Library of America. https://dp.la/ (2021-03-24)

Khalili, A., Auer, S. (2015). WYSIWYM–Integrated visualization, exploration and authoring of semantically enriched un-structured content. // Semantic Web. 6:3, 259-275.

Lacasta, J.; Falquet, G.; Zarazaga-Soria, F.J.; Nogueras-Iso, J. (2016). An automatic method for reporting the quality of the-sauri. // Data & Knowledge Engineering. 104, 1-14.

Lacasta, J.; Nogueras-Iso, J.; Zarazaga-Soria, F. J. (2010). Terminological Ontologies: Design, Management and Prac-tical Applications. Springer.

Miles, A.; Brickley, D. (2005) SKOS Core Guide. http://www.w3.org/TR/swbp-skos-core-guide (2021-03-24).

Rodriguez Rocha, O.; Vagliano, I.; Figueroa, C.; Cairo, F.; Futia, G.; Licciardi, C. A.; Marengo, M.; Morando, F. (2015). Se-mantic annotation and classification in practice. // IT Profes-sional. 17:2, 33-39.

Savoy J. (2002) Report on CLEF-2001 Experiments: Effective Combined Query-Translation Approach. // Peters, C.; Bras-chler, M.; Gonzalo, J.; Kluck, M. (eds). Evaluation of Cross-Language Information Retrieval Systems. CLEF 2001. Lec-ture Notes in Computer Science. 2406, 27-43.

Suominen, O.; Mader, C. (2014). Assessing and improving the quality of SKOS vocabularies. // Journal of Data Semantics. 3:1, 47–73.

Tchechmedjiev, A.; Abdaoui, A.; Emonet, V.; Melzi, S., Jonna-gaddala, J.; Jonquet, C. (2018). Enhanced functionalities for annotating and indexing clinical text with the NCBO Annota-tor+. // Bioinformatics. 34:11, 1962-1965.

Thessen, A.E.; Parr, C.S. (2014). Knowledge extraction and semantic annotation of text from the encyclopedia of life. // PloS one. 9:3, e89550.

Universidad de Zaragoza (1996). Exposición Virtual InfoGoya ’96. http://goya.unizar.es/ (2021-03-24)

Verbundzentrale des GBV (2021). Basic Register of Thesauri, Ontologies & Classifications (BARTOC). https://bartoc.org/ (2021-06-08).

Whaley, P.; Edwards, S.W.; Kraft, A.; Nyhan, K.; Shapiro, A.; Watford, S.; Wattam S.; Wolffe, T.; Angrish, M. (2020). Knowledge Organization Systems for Systematic Chemical Assessments. // Environmental Health Perspectives. 128:12, 125001.

Publicado
2021-06-22
Cómo citar
Díaz-Corona, D., Lacasta, J., & Nogueras Iso, J. (2021). Enriquecimiento automático de portales culturales mediante modelos de organización del conocimiento. Scire: Representación Y Organización Del Conocimiento (ISSNe 2340-7042; ISSN 1135-3716), 27(1), 23-29. Recuperado a partir de https://www.ibersid.eu/ojs/index.php/scire/article/view/4740
Sección
Artículos