Analizar datos de twitter con R

R ^[1] es una herramienta poderosa para crear una gran diversidad de análisis, en este "How to" la usaremos para hacer una análisis de datos de Twitter ^[2].

Requisitos

Tener Instalado el paquete R y la librería:

rtweet

Contar una cuenta en la appi de twitter ^[3].

Pasos

El primer paso es dar de alta como una variable nuestra datos de acceso en la appi de twitter.

> Token <- create_token(
 app = "usuaria",
 consumer_key = "tus datos",
 consumer_secret = "tus datos",
 access_token = "tus datos",
 access_secret = "tus datos"
)

Todos estos datos se encuentran cuando accedes a tu cuenta en ^[4]

En caso que el programa señale algún error sólo corrobora los datos que has dado de alta.

Ahora puedes elegir una cuenta sobre la cual quieres información y puedes:

Colectar su línea de tiempo

> get_timeline

Buscar los tweets de los últimos 9 días

> search_tweets

Ver sos seguidores

> get_followers

Conocer sus amigos:

> get_friends

Puedes ver la lista completa de en rtweet

Un ejemplo

Vamos a hacer un análisis de la cuenta "AbortoLegalCL". Desde la terminal vamos a ingresar al programa R

$ R

Una vez que ingresamos vamos a cargar la librería rtweet (que debe estar previamente instalada).

> require(rtweet)

Ahora daremos de alta como variable nuestro token:

> Token <- create_token(

 app = "Anamhoo",
 consumer_key = "___",
 consumer_secret = "___",
 access_token = "___",
 access_secret = "___"

)

Ahora podemos iniciar la búsqueda de datos:

> ABLCL_timeline <- get_timeline("AbortoLegalCL", n = 4000, include_rts = TRUE)

> ABLCL_search <- search_tweets(

+ "AbortoLegalCL", n = 18000, include_rts = TRUE + )

> ABLCL_followers <-get_followers("AbortoLegalCL", n = 10000)

 > ABLCL_friends <-get_friends("AbortoLegalCL", n = 10000)

> write_as_csv(ABLCL_timeline, "~/ABLCL_timeline.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")

> write_as_csv(ABLCL_search, "/~/ABLCL_search.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")

> write_as_csv(ABLCL_followers, "~/ABLCL_followers.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")

> write_as_csv(ABLCL_friends, "~/ABLCL_friends.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")

Con esta información tu puedes ahora hacer una análisis con programas como Gephi.

En nuestro ejemplo una cosa que nos llamó la atención es que uno de los primeros tweets hechos por éste usuario/a hacía un llamado a seguir a otras cuentas:

Apoyen la red latinoamericana pro aborto. #SeVaACaer 
Sigan estas cuentas en Twitter:
@AbortoLegalMX (México)
@ProAbortoCol (Colombia)
@abortolegalperu (Perú)
@AbortoLegalCL (Chile)
@CampaaAbortoLeg (Argentina)

Con esta información repetimos el ejercicio para @abortolegalperu y @AbortoLegalMX.

Para el caso de @AbortoLegalMX encontramos un llamado a usar una serie de hashtag que conectan hacia las mismas cuentas:

PORQUE NUESTRO DERECHO ES ESCOGER! // ARTISTA: @styIinsonpure
#AbortoLegalArgentina
#AborteLegalMexico
#AbortoLegalColombia
#AbortoLegalPeru
#AbortoLegalChile

Y en el caso de @abortolegalperu hay un comportamiento semejante

Sigan a estas cuentas de los países que se están movilizando para que el  aborto sea ley.
@AbortoLegalMX (México)
@ProAbortoCol (Colombia)
@abortolegalperu (Perú)
@AbortoLegalCL (Chile)
@CampaaAbortoLeg (Argentina)
Y de paso den RT para difundir

Ahora a partir de los tweets colectados hicimos un análisis de texto (ver How to "Hacer un análisis de texto") Aquí los resultados:

[1] ttps://www.r-project.org/

[2] ttps://www.twitter.com/

[3] ttps://apps.twitter.com/

[4] ttps://apps.twitter.com/

[1]