Acceso abierto Acceso abierto  Acceso restringido Suscripción o acceso de pago

Técnicas big data: análisis de textos a gran escala para la investigación científica y periodística

Carlos Arcila-Calderón, Eduar Barbosa-Caro, Francisco Cabezuelo-Lorenzo

Resumen


Este trabajo conceptualiza el término big data y describe su importancia en el campo de la investigación científica en ciencias sociales y en las prácticas periodísticas. Se explican técnicas de análisis de datos textuales a gran escala como el análisis automatizado de contenidos, la minería de datos (data mining), el aprendizaje automatizado (machine learning), el modelamiento de temas (topic modeling) y el análisis de sentimientos (sentiment analysis), que pueden servir para la generación de conocimiento en ciencias sociales y de noticias en periodismo. Se expone cuál es la infraestructura necesaria para el análisis de big data a través del despliegue de centros de cómputo distribuido y se valora el uso de las principales herramientas para la obtención de información a través de software comerciales y de paquetes de programación como Python o R.


Palabras clave


Datos; Big data; Minería de datos; Aprendizaje automático; Modelamiento de temas; Análisis de sentimientos

Texto completo:

PDF


DOI: https://doi.org/10.3145/epi.2016.jul.12