Inteligencia de Negocios

La API de Twitter es excelente para analizar datos de redes sociales.

single-image


Hace aproximadamente un año, Nicole Ricora escribió un artículo asombroso en Medium hablando sobre el profundo impacto del big data en las redes sociales. Ella hace algunos puntos excelentes sobre cuán estrechamente están relacionados las redes sociales y los macrodatos.

Muchas marcas de todo el mundo están buscando formas de aprovechar los macrodatos generados a través de las redes sociales. Twitter, en particular, puede ser un gran recurso para extraer datos valiosos.

La API de Twitter es excepcional para minar y analizar big data

Las redes sociales se han convertido en un medio importante que ha influido en la sociedad moderna. Aquí los usuarios pueden expresar e intercambiar opiniones para ponerse al día con las últimas tendencias. ¿Cómo puede aprovechar la información y los macrodatos de Twitter? Esta es una de las cosas más importantes que debemos entender si queremos capturar el impacto del big data en las redes sociales.

Una contribución de un solo usuario es la información en sí misma, pero no refleja una tendencia más amplia en el contenido de las redes sociales, ya que debe compararse con algún otro punto de referencia. Sin embargo, cuando se publican millones de publicaciones todos los días, esa información se convierte en big data que se puede analizar de diferentes formas. Mediante el análisis por computadora, las marcas pueden encontrar relaciones no obvias entre grupos de tweets que un humano nunca encontraría. Esto permite una mejor comprensión de las actitudes de los usuarios hacia diversos fenómenos, personas, empresas y productos. Twitter habló de eso Uso de aprendizaje automático y otras herramientas de big data para aprovechar al máximo su interfaz. Sus usuarios siguen su ejemplo.

Twitter es uno de los medios de comunicación social más populares del mundo y produce entre 350 y 400 millones de tweets al día. Para un investigador con un propósito, Twitter puede ser una verdadera mina de oro, ya que brinda información útil sobre los sentimientos, las actitudes e incluso el comportamiento de las personas. Los datos recopilados por Twitter se pueden analizar en las dimensiones económica, política, social e industrial.

Además de los temas de los tweets, el análisis puede tener en cuenta diversas características de los usuarios, a saber, características demográficas como género, edad y lengua materna, características espaciales como la ubicación del tweet y el tipo de tweet como público o personal. tweets.

API, abreviatura de Application Programming Interface, es un software especial que permite que dos programas interactúen entre sí intercambiando datos y comandos. Hay dos tipos diferentes de API para recuperar datos de Twitter.

Resto de API

El primer tipo son las API REST, actualmente una arquitectura popular para aplicaciones web. Estas API se utilizan para recuperar datos previamente registrados en un recurso web o base de datos. Para obtener datos de estas API, se debe realizar una solicitud directa en una base de datos. Una base de datos proporciona los datos durante un período solicitado con los parámetros adecuados.

API de transmisión

El segundo tipo son las API de transmisión, que proporcionan un flujo de datos de Twitter en tiempo real. Tan pronto como se realiza una solicitud para recuperar dichos datos, las API de transmisión entregan información con ciertos parámetros de Twitter a su aplicación. Las API de vaporización están limitadas por sus funciones según el tipo de información y la cantidad de usuarios. Las API de transmisión se pueden dividir en tres grupos según el tipo de punto final:

  • Flujos públicos que consisten en tweets públicos
  • Flujos de usuarios que incluyen tweets de un usuario específico
  • Flujos de sitios diseñados para aplicaciones que agregan tweets de diferentes usuarios en función de unos pocos parámetros.

El análisis de Twitter Big Data se puede realizar con diferentes lenguajes de programación. Python o R se pueden usar como ejemplo. La secuencia general de pasos es la siguiente.

1. Descarga y almacena en caché el diccionario de categorización de palabras.

Este es un punto de referencia con el que se compararán sus tweets. Necesita una base de palabras para categorizar aún más las palabras de la muestra.

2. Descarga los Tweets que quieras explorar.

Para hacer esto, se deben completar dos operaciones. Este ejemplo describe cómo trabajar con Python y sus herramientas listas para usar.

preparación

Para utilizar la API de Twitter, debe crear una cuenta de desarrollador en el sitio web de la aplicación de Twitter. Para hacer esto, es necesario crear una cuenta o iniciar sesión en https://app.twitter.com y crea una nueva aplicación. Después de ingresar la información sobre su proyecto, debe solicitar el token de acceso y el secreto del token de acceso.

Acceso a la API de Twitter

Solo puede acceder a las API de Twitter a través de solicitudes autenticadas. Twitter utiliza la autenticación abierta, por lo que cada solicitud debe estar firmada con datos de usuario de Twitter relevantes. También es digno de mención que el acceso a las API de Twitter está limitado al límite de velocidad, es decir, a una cierta cantidad de solicitudes durante un cierto período de tiempo. Estas restricciones se establecen tanto a nivel de usuario como de aplicación. Se establece un intervalo de límite de frecuencia para actualizar la cuota de llamadas API permitidas.

Se puede acceder a la API de Twitter utilizando una variedad de herramientas, incluido Tweepy. Antes de crear el objeto API, debe autenticarse con sus datos de desarrollador. Una vez autenticado, puede crear su objeto API.

3. Limpiar los tweets

En la mayoría de los casos, limpiar los tweets significa dos cosas. Algunos tweets contienen hashtags que pueden interesarle, mientras que el tweet en sí no contiene ninguna información sobre el objeto mencionado. Estos tweets deben eliminarse de la muestra analizada.

Además, los tweets de muchas personas pueden contener errores tipográficos, abreviaturas, parábolas y jergas que son relevantes para nuestro ejemplo. Dicho esto, debe asegurarse de que también tenga en cuenta las diferentes palabras que se usan en formas modificadas pero que tienen un significado relevante.

4. Haga coincidir cada palabra de los tweets con las palabras del diccionario.

Tenga en cuenta que las palabras escritas en diferentes variaciones pueden tener el mismo significado o estar relacionadas con el tema. Por lo tanto, debe asegurarse de hacer coincidir estas palabras y abreviaturas transformadas con las palabras del diccionario también. De lo contrario, es posible que se pierda una parte importante de los Tweets relevantes para su análisis.

5. Categoriza las palabras

Una vez que haya hecho coincidir las palabras de los Tweets y el diccionario, debe categorizarlas, es decir, dividirlas en grupos. Si está haciendo un análisis de sentimiento para ver las actitudes de los usuarios hacia un evento, persona o empresa, es probable que tenga algunas categorías como «positivo», «negativo» y «neutral». Debe determinar a qué grupo se refiere cada palabra de la muestra.

6. Sacar conclusiones

Puede contar el número de palabras en cada categoría para sacar una conclusión sobre la actitud general hacia el objeto en estudio. Además de la configuración, puede tener varias categorías que incluyen región, hombre, edad y muchas otras. Al analizar las relaciones entre estas subcategorías, puede determinar qué piensan las personas con diferentes parámetros del objeto.



También te gustará