Categorización de usuarios de Twitter

Autores/as

  • Francisco Luengo Universidad del Zulia
  • Carla Morillo Universidad del Zulia
  • Yaskelly Yedra Universidad del Zulia

Palabras clave:

Twitter, clasificación

Resumen

Según estudios, se estima que el conjunto de todos los datos digitales creados, replicados y consumidos por año, pasará de 130 exabytes en 2005 a 40 zettabytes en 2020. Tan solo en la red social Twitter se publicó un promedio de 433 mil tuits por minuto durante el año 2014. Estas inmensas cantidades de datos han dado origen al surgimiento de técnicas y herramientas de análisis que han cobrado gran importancia en el ámbito de los negocios, aunque también encuentran aplicación en estudios tan diversos como los antropológicos, de seguridad nacional, seguimiento de enfermedades, entre otros. Este trabajo tiene como objetivo la implementación de técnicas para establecer categorías de usuarios de Twitter. Tales categorías quedan definidas por el comportamiento de dichos usuarios dentro de esta red social, lo cual provee un conocimiento valioso para estudios como los comentados. Adicionalmente, se presenta una breve descripción del estado del arte de las aplicaciones para análisis de tuits y sus usos, lo cual sirve de soporte a la presente investigación. El trabajo abarca conexión, captura, organización, y análisisde tuitsa través de técnicas de clasificación y agrupamiento.Los resultados muestran lo efectivo de las técnicas empleadas y su potencial para resultados mas ambiciosos.

 

Descargas

Los datos de descarga aún no están disponibles.

Referencias

Martin Hilbert, Priscila López. “The World’s Technological Capacity to Store, Communicate, and Compute Information”. Science.Vol. 332 no. 6025 pp. 60-65.Abril 2011.

EMC Corporation. http://www.emc.com/leadership/digital-universe/index.htm. “THE DIGITAL UNIVERSE IN 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East”. Diciembre 2012.

Qmee. “Lo que sucede en línea en 60 segundos”.http://blog.qmee.com/online-in-60-seconds-infographic-a-year-later/

Internet World Stats. http://www.internetworldstats.com/

Global Web Index. https://www.globalwebindex.net/

Eaton, C., Deroos, D., Deutsch, T., Lapis, G., Zikopoulos, P. “Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming data.” McGraw-Hill. 2012.

Rui Han, Zhen Jia, WanlingGao, XinhuiTian, and Lei Wang. “Benchmarking Big Data Systems: State-of-the-Art and Future Directions”.TECHNICAL REPORT. ICT, ACS. 4 Jan 2015.

HaewoonKwak, Changhyun Lee, Hosung Park, and Sue Moon. “What is Twitter, a social network or a news media?”.Proceedings of the 19th International Conference on World Wide Web.Pp 591-600. 2010.

Stefano Rizzi. “New Frontiers in Business Intelligence: Distribution and Personalization”. ADBIS 2010, LNCS 6295, pp. 23–30, 2010.

MihaelaMuntean. “Theory and Practice in Business Intelligence”. MPRA Paper No. 41359, posted 16. September 2012.

William Ribarsky, Xiaoyu Wang, and Wenwen Dou.“Social Media Analytics for Competitive Advantage”.EuroVis Workshop on Visual Analytics (2013), pp. 1–5. 2013.

ChristophBoden , Volker Markl , Tu Berlin , Marcel Karnstedt , and Miriam Fernandez. “Large-Scale Social-Media Analytics on Stratosphere”. International World Wide Web Conference Committee (IW3C2), pp 257-260. 2013

Dror Y. Kenett , Fred Morstatter , H. Eugene Stanley , Huan Liu. “Discovering Social Events through Online Attention”.PLoS ONE 9(7). 2014.

Kent, P. “Viewpoint: Big data and big analytics means better business”, BBC News, Oct 2012, http://www.bbc.co.uk/news/business-19969588

Moore, M.T. “Twitter index tracks sentiment on Obama, Romney”, USA Today, Jan 2012, http://usatoday30.usatoday.com/news/politics/story/2012-08-01/twitter-political-index/56649678/1

Haibin Liu. “EXPLOITING USER-GENERATED DATA FOR KNOWLEDGE DISCOVERY AND RECOMMENDATION”.Dissertation in Information Sciences and Technology for the Degree of Doctor of Philosophy.The Pennsylvania State University. August 2014.

Haibin Liu and Dongwon Lee.“Quantifying Political Legitimacy from Twitter”.LNCS 8393, pp. 108–115, 2014.

True Social Metrics. https://www.truesocialmetrics.com

Sentimentalytics . https://sentimentalytics.com/

SEMrush. Competitive Data. http://www.semrush.com/

WordStat. http://provalisresearch.com/

Attensity. http://www.attensity.com

Twitter Documentation. https://dev.twitter.com/overview/documentation

OAuth. http://oauth.net

Twitter4J. http://twitter4j.org/en/index.html

P. Berkhin. “A Survey of Clustering Data Mining Techniques”.Chapter of Grouping Multidimensional Data, pp 25-71.Springer Berlin Heidelberg. 2006.

Eibe Frank, Mark Hall, and Bernhard Pfahringer. “Locally Weighted Naive Bayes”. Proceedings of the Conference on Uncertainty in Artificial Intelligence, pp 249-256. 2003.

Villagra, A., Guzmán, A., Pandolfi, D. y Leguizamón, G. “Análisis de medidas no-supervisadas de calidad en clusters obtenidos por K-means y ParticleSwarmOptimization”. Trabajo presentado en el Congreso de Inteligencia Computacional Aplicada (CICA), realizado en Buenos Aires del 23 al 24 de julio de 2009.

Descargas

Publicado

2016-07-01

Número

Sección

Artículos de investigación