Káñina ISSN Impreso: 0378-0473 ISSN electrónico: 2215-2636

OAI: https://www.revistas.ucr.ac.cr/index.php/kanina/oai
Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
PDF

Palabras clave

Temas emergentes
modelos de temas
detección de tendencias
redes sociales
procesamiento de leguaje temporal

Cómo citar

Quesada Grosso, M., Casasola Murillo, E., & Leoni de León, A. (2017). Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos. Káñina, 40(4), 33–47. https://doi.org/10.15517/rk.v40i4.30224

Resumen

La minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuer- zos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad. Concretamente, el contenido de los textos publicados regularmente, en los sitios de microblogs (por ejemplo, en Twitter.com) puede ser utilizado para analizar tendencias. Estas últimas son marcadas por temas emergen- tes que se distinguen de los demás por un súbito y acelerado aumento de popularidad en periodos relativamen- te cortos, de un día o de unas cuantas horas. De este modo, el problema es extraer los temas sobre los cuáles se escribe e identificar cuáles de ellos son emergentes. Una solución reciente, conocida como Bursty Biterm Topic Model (BBTM) es un algoritmo que utiliza coocurrencias de palabras (bitérminos) para la identificación de temas emergentes y cuenta con un buen nivel de resultados en Twitter. Sin embargo, toma en cuenta todas las palabras, aún aquellas que no representan temas emergentes y por lo tanto, son menos útiles para identificar- los. De ahí, que esta investigación busca hacer una exploración inicial de la aplicación de una discriminación de los bitérminos utilizados por BBTM para modelar los temas emergentes. 

https://doi.org/10.15517/rk.v40i4.30224
PDF

Citas

Blei, D. M. et al. 2003. «Latent Dirichlet Allocation». En Journal of machine Learning research III (Jan): 993–1022.

Cataldi, M. et al. 2010. “Emerging Topic Detection on Twitter Based on Temporal and Social Terms Evaluation”. En Proceedings of the Tenth International Workshop on Multimedia Data Mining :4. New York, NY, USA: ACM.

Cheng, X. et al. 2014. “BTM: Topic Modeling over Short Texts”. En IEEE Transactions on Knowledge and Data Engineering XXVI (12): 2928-2941.

Jin, O. et al. 2011. “Transferring Topical Knowledge from Auxiliary Long Texts for Short Text Clustering”. En Proceedings of the 20th ACM International Conference on Information and Knowledge Management: 775–784. New York, NY, USA: ACM.

Li, C. et al. 2012. “Twevent: Segment-based Event Detection from Tweets”. En Proceedings of the 21st ACM interna- tional conference on Information and knowledge management: 155–164. http:// doi.org/10.1145/2396761.2396785

Liu, B. 2012. “Sentiment Analysis and Opinion Mining”. En Synthesis Lectures on Human Language Technologies V (1): 1–167. http://doi.org/10.2200/ S00416ED1V01Y201204HLT016

Liu, B. y Zhang, L. 2012. “A survey of opi- nion mining and sentiment analysis”. En Mining text data: 415–463. Springer US. http://doi.org/10.1007/978-1-4614-3223-4

Mathioudakis, M. y Koudas, N. 2010. “Twittermonitor: trend detection over the twitter stream”. En Proceedings of the 2010 ACM SIGMOD International Conference on Management of data: 1155–1158.

Navigli, R., y Lapata, M. 2007. “Graph con- nectivity measures for unsupervised word sense disambiguation”. IJCAI International Joint Conference on Artificial Intelligence: 1683–1688.

Phan, X. H. et al. 2008. “Learning to Classify Short and Sparse Text & Web with Hidden Topics from Large-scale Data Collections”. En Proceeding of the 17th international conference on World Wide Web - WWW :91–100. http://doi. org/10.1145/1367497.1367510

Shetty, Jitesh. y Adibi Jafar. 2005. “Discovering Important Nodes through Graph Entropy The Case of Enron Email Database”. En Proceedings of the 3rd international workshop on Link Discovery 2005: 74–81.

Wanner, F. et al. 2014. “State-of-the-Art Report of Visual Analysis for Event Detection in Text Data Streams”. En Computer Graphics Forum XXXIII (3) 1–15. http:// doi.org/10.2312/eurovisstar.20141176

Xia, Y. et al. 2015. “Discriminative Bi-Term Topic Model for Headline-Based Social News Clustering”. En Florida Artificial Intelligence Research Society Conference:311–316. Recuperado a par- tir de http://www.aaai.org/ocs/index.php/ FLAIRS/FLAIRS15/paper/view/10428

Yan, X. et al. 2015. “A Probabilistic Model for Bursty Topic Discovery in Microblogs”. En Twenty-Ninth AAAI Conference on Artificial Intelligence : 353–359.

Zhu, J. et al. 2015. “Coherent Topic Hierarchy: A Strategy for Topic Evolutionary Analysis on Microblog Feeds”. En Web-Age Information Management IXXCVIII 2015: 70–82. Springer International Publishing. http://doi.org/10.1007/978-3-319-21042-1

Comentarios

Descargas

Los datos de descargas todavía no están disponibles.