Estructura, semántica, extracción de información y XML legislativo: experiencias en la Universidad de Valladolid

Mercedes Martínez González, Dámaso F. Javier Vicente Blanco, Joaquín Adiego Rodríguez, Alma M. Pisabarro Marrón, José Manuel Sánchez Felipe

Resumen


La extracción de la estructura implícita en el contenido de los textos legislativos y su posterior representación de forma explícita a través del marcado XML es uno de los pilares del trabajo desarrollado en la Universidad de Valladolid por el grupo de investigación que se ocupa de la manipulación electrónica de textos legislativos. Esta solución permite abordar una serie de tratamientos adicionales de extracción de información, manipulación, navegación, y búsquedas semánticas en los que la estructura juega un papel relevante. En este artículo se ofrece una perspectiva general del trabajo realizado por el grupo hasta el momento.

Texto completo:

PDF