Big Data e codice: così due studenti della Sapienza hanno analizzato le elezioni su Twitter

Monitorare le conversazioni social attraverso big data e codice: l’esperimento di due studenti della Sapienza

I social media sono indicatori credibili dell’andamento di una campagna elettorale? Ci siamo interrogati in tanti a tal riguardo. E la misurabilità, l’ascolto, i risultati dei profili social sono stati oggetto di indagini molteplici e dense, negli ultimi mesi: me ne sono occupato io su questo blog, ma anche molti altri, ognuno con un taglio diverso.

Qualcuno si è affidato a tool molto conosciuti in ambito social, altri hanno allestito dei veri e propri team multidisciplinari di sviluppatori e analisti.

Altri ancora hanno invece approfittato delle elezioni politiche per costruire, silenziosamente, un proprio modello di monitoraggio e mettere in pratica quanto avevano appreso in aula qualche settimana prima: è il caso di Davide Aureli e Valerio Guarrasi, due studenti di 23 anni iscritti al corso di laurea in Data Science della facoltà di Scienze Statistiche dell’Università La Sapienza di Roma.

Dopo la prima messa in onda de “Lo Stato Social”, mi hanno contattato per condividere i loro rilievi e farmi sapere come hanno lavorato: risultati e metodo che hanno messo a disposizione di tutti su Github, una piattaforma social per la programmazione condivisa.

Il metodo

Aureli e Guarrasi hanno analizzato i dati provenienti da Twitter negli ultimi otto giorni di campagna elettorale, prendendo in esame un bacino complessivo di 980 profili Twitter in tutto e 8375 tweet.

“Siamo partiti selezionando alcuni profili di partito e avviando lo ‘streamer’, un programma che osserva questi profili” mi hanno spiegato. “Appena uno di questi profili pubblicava un tweet, questo veniva raccolto nei nostri database. Lo streamer poi ha continuato a girare per tutta la settimana”.

La quantità dei profili monitorati e dei post ottenuti ha infatti richiesto che un computer restasse acceso per tutta la settimana soltanto per raccogliere i dati. “Non volevamo concentrarci solamente sui leader di ogni partito ma raccogliere i tweet di tutti i candidati delle elezioni del 4 marzo e anche delle pagine dei loro partiti: in un secondo momento, ci siamo concentrati su tutti i tweet che avessero ottenuto come minimo 5 favoriti e 5 RT”.

I risultati

A tutti gli effetti, Aureli e Guarrasi hanno allestito in autonomia un tool in-house di social listening e monitoring, con un proprio metodo e funzionamento, in grado di analizzare metriche quantitative dei post come RT e favorites ma anche di dare indicazioni chiare sui temi chiave dell’ultima settimana di campagna elettorale. E nei loro rilievi finali ci sono molti elementi su cui convergono anche altre analisi.

Ad esempio, il fatto che la coalizione più attiva su Twitter sia stata quella di centrodestra (anche, aggiungono, a fronte di un numero complessivo di profili monitorati inferiore a quello di altri).

Il partito più performante nelle loro analisi è risultato il Movimento 5 Stelle: i profili legati ai candidati e al movimento grillino sono stati infatti quelli che, mediamente, hanno ottenuto il maggior numero di RT e favorites.

Inoltre, osservano Aureli e Guarrasi, “abbiamo notato che i rappresentanti dei partiti hanno ricevuto su Twitter più attenzione ogni qual volta che hanno offeso o criticato i loro rivali, piuttosto che esposto idee e proposte”. “Gli utenti Twitter”, dicono nelle loro conclusioni, “sono altamente motivati, più giovani della media e più spesso uomini quando coinvolti in thread di dibattito politico: analizzare questa piattaforma può dunque aiutarci a comprendere dove si posizionano individualmente le persone altamente motivate in relazione al discorso pubblico”.

Marco Borraccino

@borraccinomarco

Please follow and like us:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *