Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos

Minor Quesada Grosso; Édgar Casasola Murillo; Antonio Leoni de León

doi:10.15517/rk.v40i4.30224

Vol. 40 Núm. 4 (2016), Artículos

Vol. 40 Núm. 4 (2016)

Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos

Artículos

https://doi.org/10.15517/rk.v40i4.30224

Publicado August 16, 2017

Minor Quesada Grosso⁺⁻
Édgar Casasola Murillo⁺⁻
Antonio Leoni de León⁺⁻

Minor Quesada Grosso

Universidad de Costa Rica

Édgar Casasola Murillo

Universidad de Costa Rica. Escuela de Ciencias de la Computación, Programa de Posgrado en Computación e Informática y Centro de Investigaciones en Tecnologías de la Información y Comunicación (CITIC).

Antonio Leoni de León

Universidad de Costa Rica.

PDF

Palabras clave

Temas emergentes
modelos de temas
detección de tendencias
redes sociales
procesamiento de leguaje temporal

Cómo citar

Quesada Grosso, M., Casasola Murillo, E., & Leoni de León, A. (2017). Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos. Káñina, 40(4), 33–47. https://doi.org/10.15517/rk.v40i4.30224

Resumen

La minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuer- zos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad. Concretamente, el contenido de los textos publicados regularmente, en los sitios de microblogs (por ejemplo, en Twitter.com) puede ser utilizado para analizar tendencias. Estas últimas son marcadas por temas emergen- tes que se distinguen de los demás por un súbito y acelerado aumento de popularidad en periodos relativamen- te cortos, de un día o de unas cuantas horas. De este modo, el problema es extraer los temas sobre los cuáles se escribe e identificar cuáles de ellos son emergentes. Una solución reciente, conocida como Bursty Biterm Topic Model (BBTM) es un algoritmo que utiliza coocurrencias de palabras (bitérminos) para la identificación de temas emergentes y cuenta con un buen nivel de resultados en Twitter. Sin embargo, toma en cuenta todas las palabras, aún aquellas que no representan temas emergentes y por lo tanto, son menos útiles para identificar- los. De ahí, que esta investigación busca hacer una exploración inicial de la aplicación de una discriminación de los bitérminos utilizados por BBTM para modelar los temas emergentes.

https://doi.org/10.15517/rk.v40i4.30224

PDF

Citas

Blei, D. M. et al. 2003. «Latent Dirichlet Allocation». En Journal of machine Learning research III (Jan): 993–1022.

Cataldi, M. et al. 2010. “Emerging Topic Detection on Twitter Based on Temporal and Social Terms Evaluation”. En Proceedings of the Tenth International Workshop on Multimedia Data Mining :4. New York, NY, USA: ACM.

Cheng, X. et al. 2014. “BTM: Topic Modeling over Short Texts”. En IEEE Transactions on Knowledge and Data Engineering XXVI (12): 2928-2941.

Jin, O. et al. 2011. “Transferring Topical Knowledge from Auxiliary Long Texts for Short Text Clustering”. En Proceedings of the 20th ACM International Conference on Information and Knowledge Management: 775–784. New York, NY, USA: ACM.

Li, C. et al. 2012. “Twevent: Segment-based Event Detection from Tweets”. En Proceedings of the 21st ACM interna- tional conference on Information and knowledge management: 155–164. http:// doi.org/10.1145/2396761.2396785

Liu, B. 2012. “Sentiment Analysis and Opinion Mining”. En Synthesis Lectures on Human Language Technologies V (1): 1–167. http://doi.org/10.2200/ S00416ED1V01Y201204HLT016

Liu, B. y Zhang, L. 2012. “A survey of opi- nion mining and sentiment analysis”. En Mining text data: 415–463. Springer US. http://doi.org/10.1007/978-1-4614-3223-4

Mathioudakis, M. y Koudas, N. 2010. “Twittermonitor: trend detection over the twitter stream”. En Proceedings of the 2010 ACM SIGMOD International Conference on Management of data: 1155–1158.

Navigli, R., y Lapata, M. 2007. “Graph con- nectivity measures for unsupervised word sense disambiguation”. IJCAI International Joint Conference on Artificial Intelligence: 1683–1688.

Phan, X. H. et al. 2008. “Learning to Classify Short and Sparse Text & Web with Hidden Topics from Large-scale Data Collections”. En Proceeding of the 17th international conference on World Wide Web - WWW :91–100. http://doi. org/10.1145/1367497.1367510

Shetty, Jitesh. y Adibi Jafar. 2005. “Discovering Important Nodes through Graph Entropy The Case of Enron Email Database”. En Proceedings of the 3rd international workshop on Link Discovery 2005: 74–81.

Wanner, F. et al. 2014. “State-of-the-Art Report of Visual Analysis for Event Detection in Text Data Streams”. En Computer Graphics Forum XXXIII (3) 1–15. http:// doi.org/10.2312/eurovisstar.20141176

Xia, Y. et al. 2015. “Discriminative Bi-Term Topic Model for Headline-Based Social News Clustering”. En Florida Artificial Intelligence Research Society Conference:311–316. Recuperado a par- tir de http://www.aaai.org/ocs/index.php/ FLAIRS/FLAIRS15/paper/view/10428

Yan, X. et al. 2015. “A Probabilistic Model for Bursty Topic Discovery in Microblogs”. En Twenty-Ninth AAAI Conference on Artificial Intelligence : 353–359.

Zhu, J. et al. 2015. “Coherent Topic Hierarchy: A Strategy for Topic Evolutionary Analysis on Microblog Feeds”. En Web-Age Information Management IXXCVIII 2015: 70–82. Springer International Publishing. http://doi.org/10.1007/978-3-319-21042-1

Comentarios

Descargas

Los datos de descargas todavía no están disponibles.

Artículos más leídos del mismo autor/a

Édgar Casasola Murillo, Antonio Leoni de León, Gabriela Marín Raventós, Evaluation of potential features present in short texts in spanish in order to classify them by polarity , Káñina: Vol. 40 Núm. 4 (2016): Káñina número extraordinario

Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos

Palabras clave

Cómo citar

Descargar cita

Resumen

Citas

Comentarios

Descargas

Artículos más leídos del mismo autor/a