Marcado semántico automático en gestores de contenidos: integración y cuantificación

Juan Antonio Pastor-Sánchez, Enrique Orduña-Malea, Tomás Saorín

Resumen


Se ofrece en primer lugar una visión general de los diferentes formatos de marcado semántico así como de las tecnologías existentes para incorporar información semántica explícita (microformatos, microdatos y RDFa). Posteriormente se descri ben algunos servicios que permiten automatizar los procesos de anotación semántica (Sindice, Calais, AlchemyAPI y DBPedia Spotlight ) al tiempo que se caracteriza el ciclo completo de este proceso en un CMS concreto (Wordpress) mediante un plugin especializado (RDFaCE-Lite). Finalmente, con el propósito de cuantificar la creación y la conectividad del contenido marcado semánticamente en la Web, se analiza el conjunto de universidades españolas (y una selección de 25 universidades internacionales) mediante Sindice. Para ello se calculan indicadores de tamaño semántico y de enlaces entrantes, salientes, internos y de terceros (third party links) en los datasets de las universidades de la muestra. Los resultados indican la todavía escasa presencia de contenido marcado semánticamente en las universidades, así como el alto aislamiento en visibilidad web de estos contenidos.


Palabras clave


Web semántica; Linked data; Marcado semántico; Gestores de contenidos; Wordpress; RDFaCE-Lite; Sindice; Universidades; Webometría.

Texto completo:

PDF


DOI: https://doi.org/10.3145/epi.2013.sep.02

Copyright (c)