Técnicas big data: análisis de textos a gran escala para la investigación científica y periodística

  • Carlos Arcila-Calderón El profesional de la información
  • Eduar Barbosa-Caro
  • Francisco Cabezuelo-Lorenzo
Palabras clave: Datos, Big data, Minería de datos, Aprendizaje automático, Modelamiento de temas, Análisis de sentimientos

Resumen

Este trabajo conceptualiza el término big data y describe su importancia en el campo de la investigación científica en ciencias sociales y en las prácticas periodísticas. Se explican técnicas de análisis de datos textuales a gran escala como el análisis automatizado de contenidos, la minería de datos (data mining), el aprendizaje automatizado (machine learning), el modelamiento de temas (topic modeling) y el análisis de sentimientos (sentiment analysis), que pueden servir para la generación de conocimiento en ciencias sociales y de noticias en periodismo. Se expone cuál es la infraestructura necesaria para el análisis de big data a través del despliegue de centros de cómputo distribuido y se valora el uso de las principales herramientas para la obtención de información a través de software comerciales y de paquetes de programación como Python o R.

Publicado
2016-07-29
Sección
Análisis / Analysis