• No results found

Chapter 1 Introduction: Locating and undertaking the study

4 Undertaking the research

4.4 Ethical issues, disclosures and positionalities

Los medios sociales (Social media como son conocidos en inglés), son herramientas y servicios que instalados sobre la plataforma de Internet permiten que los individuos, comunidades y empresas se reúnan, comuniquen, compartan, y en algunos casos colaboren y jueguen (Boyd, 2009). “Medios sociales” es un término de moda que incluye servicios tales como Web blogs, microblogs, sitios de redes sociales, plataformas para compartir (archivos, imágenes y videos) y wikis y que son impulsados por otro concepto moderno: el contenido generado por el usuario (user-generated content –UGC- como se conoce en inglés) (Fuchs, 2013).

Los contenidos generados por los usuarios son una fuente potencialmente importante para el análisis de sentimientos. Los más utilizados para los distintos experimentos de esta disciplina han sido: críticas a productos y servicios, microblogging (especialmente Twitter), publicaciones en blogs y noticias (Medhat, Hassan, & Korashy, 2014; Vinodhini & Chandrasekaran, 2012; Tsytsarau & Palpanas, 2012).

3.5.1 Críticas de productos

Las críticas de productos son el contenido generado por el usuario más utilizado en la investigación del análisis de sentimientos. Existen diversos sitios Web dedicados a la recepción de opiniones de clientes de productos y servicios, tales como TripAdvisor y Epinion. Las críticas y comentarios también pueden compartirse en blogs o centros de noticias.

Algunos ejemplos de investigadores que usaron las críticas recolectadas desde sitios dedicados a la recepción de opiniones son: (Bai, 2011; Goldberg & Zhu, 2006; Ganu, Elhadad, & Marian, 2009).

Un conjunto de datos muy utilizado a través de los años es el presentado por (Pang, Lee, & Vaithyanathan, 2002) que consiste en críticas de películas descargadas de IMDB[13]. En la sección 3.7 puede apreciarse con más detalle las propuestas que utilizan este y otros corpus de crítica de producto.

63

3.5.2 Weblogs y Noticias

Los Weblogs o blogs son también uno de los medios sociales más utilizado por los investigadores para el análisis de sentimientos (Mishne, 2005; Medhat, Hassan, & Korashy, 2014; Tsytsarau & Palpanas, 2012)

Los blogs (diminutivo de Web logs) son sitios Web cuyo autor o autores publican de forma regular nuevos contenidos y que permiten retroalimentación de los usuarios. Esta retroalimentación consiste en mensajes conocidos como posts cuyo tamaño es normalmente pequeño, con tendencia conversacional y son presentados en orden cronológico inverso (Kabani, 20103; Fuchs, 2013).

Una característica de los blog que lo convierte en ideal para el análisis de sentimientos es la oportunidad de los usuarios individuales de compartir comentarios relacionados con los productos y sus características, servicios, marcas y las organizaciones mismas (Melville, Gryc, & Lawrence, Sentiment analysis of blogs by combining lexical knowledge with text classification, 2009). Algunos de los investigadores cuyo corpus proviene de los blogs son: (He, Macdonald, & Ounis, 2008; Melville, Gryc, & Lawrence, 2009; Mishne, 2005) para la lista completa véase la sección 3.7.

Los artículos publicados como noticias también son fuente de corpus para el análisis de sentimientos. Los usuarios de estos medios sociales, comparten comentarios que involucran frecuentemente una actitud positiva o negativa hacia el evento del que se está informando en los artículos. Algunos de los trabajos de investigación identificados en este estudio que han usado estos servicios para el análisis de sentimientos son: (Soo- Guan Khoo, Nourbakhsh, & Na, 2012; Yu, Wu, Chang, & Chu, 2013). Véase lista completa en la sección 3.7.

3.5.3 Twitter

Twitter es un servicio de redes sociales en Internet que permite a los usuarios compartir y leer mensajes cortos (con una longitud máxima de 140 caracteres) llamados tweets. Como medio social, Twitter tiene una cantidad masiva de mensajes disponibles que expresan ideas, opiniones, juicios, valoraciones, actitudes y sentimientos hacia otras personas, eventos (políticos, comerciales, naturales) u objetos tales como bienes y productos (Prentice & Huffman, 2008). El análisis de sentimientos es potencialmente

64

una herramienta de aprovechamiento de ese banco de opiniones no estructurado (Pak & Paroubek, 2010).

Los tweets representan un reto importante para los investigadores de análisis de sentimientos que utilizan Twitter como fuentes de corpus. La restricción de la longitud de los tweets a 140 caracteres y las distintas prácticas de deformación del lenguaje utilizadas por los usuarios, convierten este servicio de redes sociales en una fuente de textos a menudo difíciles de procesar. En general la calidad de datos preveniente Twitter es pobre (podríamos denominarla informalmente “ruidosa”) y por tanto requiere de limpieza y de corrección antes de que se pueda realizar un trabajo simple y directo de análisis de sentimientos (Bell, 2014). Los hábitos de redacción desarrollados por los usuarios de Twitter para superar la limitación del tamaño de los mensajes incluyen la síncopa, el apócope, la abreviación de palabras o de URLs, el uso de jerga y acrónimos, entre otros. Sin embargo, la disponibilidad publica de los tweets y su utilidad potencial en distintos ámbitos, ha motivado varias investigaciones con Twitter como fuente de corpus (Go, Bhayani, & Huang, 2009). (Pak & Paroubek, 2010; Thelwall, Buckley, & Paltoglou, 2011) de forma explícita sostienen que Twitter es adecuado para el análisis de sentimientos y que es posible asociar sentimientos y actitudes globales detectados en Twitter con eventos importantes. Hay otros investigadores que al emplearlo en sus experimentos y reportar buenos resultados, lo aceptan de forma tácita como adecuado para esta disciplina (Jiang, Yu, Zhou, Liu, & Zhao, 2011; Zhang, Ghosh, Dekhil, Hsu, & Liu, 2011).

La mayoría de las herramientas Web de análisis de sentimientos que trabajan con tweets y que están disponibles públicamente, resumen las opiniones de un conjunto de tweets en los que se menciona una entidad concreta (por ejemplo una producto, una persona o un servicio) en un porcentaje positivo y otro negativo (incluyendo algunas veces otro porcentaje de objetividad o neutralidad). Véase Capítulo 4 para ejemplos concretos. Algunas características de Twitter, tales como los emoticonos, los hashtags y los acrónimos han sido aprovechadas en distintas investigaciones relacionadas con el análisis de sentimientos. (Pak & Paroubek, 2010; Go, Bhayani, & Huang, 2009; Read, 2005) Dichas investigaciones consideraron los emoticonos como indicadores especiales de actitud en los mensajes y los utilizaron como etiquetas en datos de entrenamiento. Además de los emoticonos, (Kouloumpis, Wilson, & Moore, 2011) utilizó los hashtags

65

como datos de entrenamiento y los acrónimos como intensificadores para la detección de sentimientos.

La API de Twitter es el mecanismo más utilizado para la obtención de tweets (mensajes enviados por Twitter), de hecho Twitter en su segundo reporte de ganancias trimestral del 2014[43] (Erdmann, 2014) ha reconocido que aproximadamente un 8.5% de los agentes (usuarios) que hacen solicitudes de tweets son programas automatizados recuperando información de forma continua para futuros usos (About Twitter, 2014). Con el actual número de usuarios, eso representa casi 24.5 millones mensuales de usuarios no humanos que hacen peticiones a Twitter.

Related documents