Analizar datos de twitter con R
From Gender and Tech Resources
R [1] es una herramienta poderosa para crear una gran diversidad de análisis, en este "How to" la usaremos para hacer una análisis de datos de Twitter [2].
Requisitos
Tener Instalado el paquete R y la librería:
rtweet
Contar una cuenta en la appi de twitter [3].
Pasos
El primer paso es dar de alta como una variable nuestra datos de acceso en la appi de twitter.
> Token <- create_token( app = "usuaria", consumer_key = "tus datos", consumer_secret = "tus datos", access_token = "tus datos", access_secret = "tus datos" )
Todos estos datos se encuentran cuando accedes a tu cuenta en [4]
En caso que el programa señale algún error sólo corrobora los datos que has dado de alta.
Ahora puedes elegir una cuenta sobre la cual quieres información y puedes:
Colectar su línea de tiempo
> get_timeline
Buscar los tweets de los últimos 9 días
> search_tweets
Ver sos seguidores
> get_followers
Conocer sus amigos:
> get_friends
Puedes ver la lista completa de en rtweet
Un ejemplo
Vamos a hacer un análisis de la cuenta "AbortoLegalCL". Desde la terminal vamos a ingresar al programa R
$ R
Una vez que ingresamos vamos a cargar la librería rtweet (que debe estar previamente instalada).
> require(rtweet)
Ahora daremos de alta como variable nuestro token:
> Token <- create_token(
app = "Anamhoo", consumer_key = "___", consumer_secret = "___", access_token = "___", access_secret = "___"
)
Ahora podemos iniciar la búsqueda de datos:
> ABLCL_timeline <- get_timeline("AbortoLegalCL", n = 4000, include_rts = TRUE)
> ABLCL_search <- search_tweets(
+ "AbortoLegalCL", n = 18000, include_rts = TRUE + )
> ABLCL_followers <-get_followers("AbortoLegalCL", n = 10000)
> ABLCL_friends <-get_friends("AbortoLegalCL", n = 10000)
> write_as_csv(ABLCL_timeline, "~/ABLCL_timeline.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")
> write_as_csv(ABLCL_search, "/~/ABLCL_search.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")
> write_as_csv(ABLCL_followers, "~/ABLCL_followers.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")
> write_as_csv(ABLCL_friends, "~/ABLCL_friends.csv", prepend_ids = TRUE, na = "", fileEncoding = "UTF-8")
Con esta información tu puedes ahora hacer una análisis con programas como Gephi.
En nuestro ejemplo una cosa que nos llamó la atención es que uno de los primeros tweets hechos por éste usuario/a hacía un llamado a seguir a otras cuentas:
Apoyen la red latinoamericana pro aborto. #SeVaACaer Sigan estas cuentas en Twitter: @AbortoLegalMX (México) @ProAbortoCol (Colombia) @abortolegalperu (Perú) @AbortoLegalCL (Chile) @CampaaAbortoLeg (Argentina)
Con esta información repetimos el ejercicio para @abortolegalperu y @AbortoLegalMX.
Para el caso de @AbortoLegalMX encontramos un llamado a usar una serie de hashtag que conectan hacia las mismas cuentas:
PORQUE NUESTRO DERECHO ES ESCOGER! // ARTISTA: @styIinsonpure #AbortoLegalArgentina #AborteLegalMexico #AbortoLegalColombia #AbortoLegalPeru #AbortoLegalChile
Y en el caso de @abortolegalperu hay un comportamiento semejante
Sigan a estas cuentas de los países que se están movilizando para que el aborto sea ley. @AbortoLegalMX (México) @ProAbortoCol (Colombia) @abortolegalperu (Perú) @AbortoLegalCL (Chile) @CampaaAbortoLeg (Argentina) Y de paso den RT para difundir
Ahora a partir de los tweets colectados hicimos un análisis de texto (ver How to "Hacer un análisis de texto")
Aquí los resultados: