JEKYLLPODCAST

Analisi e sentimento

conclave-tweets

ASCOLTA IL PODCAST! Intervista a Luigi Curini, di Voices from the Blogs, sulla Sentiment Analysis

JEKYLL – Habemus @Pontifex. Un’immagine, più di altre, ha segnato il recente conclave. I presenti in piazza San Pietro hanno immortalato il nuovo Papa con migliaia di telefonini, tablet e smartphone. Lo scorso 13 marzo l’hashtag #conclave è stato a lungo tra i primi dieci Twitter trends in Italia, raggiungendo la prima posizione intorno alle ore 12: un chiaro segnale della grande attesa, non solo tra i fedeli. Un bel salto in avanti rispetto al 2005, anno del precedente conclave, quando Twitter non esisteva ancora e nessuno di noi cinguettava.

Ma cosa hanno scritto le persone in quelle ore prima e dopo la fumata bianca? Cosa si può dire di così importante in soli 140 caratteri? Sembra complicato, ma in realtà è possibile analizzare un flusso così grande di informazioni. La sentiment analysis è quella tecnica che permette di studiare le conversazioni online su un determinato argomento in modo da stabilire l’umore degli utenti di Twitter, dei blogger o di chi usa i social media. Il fatto positivo di questo approccio è che le opinioni vengono espresse liberamente su ciò che si vuole. Decisamente un vantaggio rispetto ai sondaggi tradizionali, più invasivi, che hanno fallito in diverse occasioni. Questi ultimi forniscono solo la fotografia di un determinato momento, di fatto già passato. Oggi siamo invece di fronte a un flusso di dati continuo decisamente più simile a un treno in corsa.

Le foto dunque non bastano più. La sentiment analysis potrebbe essere la chiave per descrivere il sentimento e la percezione di chi scrive. Ma di cosa si tratta esattamente? Come funziona? Ne abbiamo discusso con Luigi Curini, professore associato di Scienza politica presso l’Università degli Studi di Milano. Insieme ad alcuni colleghi, Curini sta portando avanti il progetto Voices from the blogs, un osservatorio permanente sulle opinioni espresse in rete. I ricercatori utilizzano un approccio basato sull’intervento di un gruppo qualificato di codificatori che analizzano un campione statisticamente rappresentativo dei dati a disposizione prima di estendere globalmente i risultati attraverso appositi algoritmi statistici.

Secondo Curini si tratta di un metodo altamente affidabile: “Finora possiamo dire di aver sempre azzeccato le previsioni  nelle situazioni in cui era possibile farlo. Le elezioni americane, quelle francesi, le primarie del centrosinistra, il podio di Sanremo o il tema della maturità. In alcuni casi, come nel caso del Conclave, non è stato possibile fare delle previsioni adeguate, ma si trattava di un’informazione privata e interna per definizione. Noi abbiamo raccolto i rumors della rete, che sono stati influenzati dai media che parlavano di altri cardinali rispetto a Bergoglio.”

La sentiment analysis sembra ormai essere un fenomeno consolidato: “Le società che analizzano la rete e i social media sono ormai tantissime. C’è una forte competizione, soprattutto negli Stati Uniti, ma ormai anche in Italia perché sono disponibili grandi quantità di dati da analizzare e costa decisamente meno analizzare la rete piuttosto che fare un sondaggio. La sentiment analysis si può fare in tempi molto più brevi con un’informazione in molti casi migliore e più completa.”

Anche noi di Jekyll abbiamo provato a cimentarci nella sentiment analysis. Abbiamo quindi analizzato il flusso di tweet scritti in italiano con l’hashtag #conclave in alcuni momenti chiave tra il 12 e il 14 marzo. Ecco il risultato, basato sulla semplice ricorrenza delle parole e quindi decisamente più artigianale rispetto alle analisi di Voices from the Blogs:

Word cloud dei tweets scritti con l'hashtag #conclave subito dopo la prima fumata nera di martedì 12 marzo.
Word cloud dei tweets con l’hashtag #conclave scritti subito dopo la prima fumata nera di martedì 12.03
Le prime reazioni subito dopo la fumata bianca del 13 marzo (7.08pm - 8:09pm). Per comodità di lettura sono stati rimossi i termini Papa, Conclave, Fumatabianca, Habemuspapam. Tutto in minuscolo per evitare ripetizioni. Alcuni temi: Scola, gabbiano, piazza, nero (profezia?), nuovo.
Le prime reazioni subito dopo la fumata bianca del 13.03 (7.08pm – 8:09pm). Per comodità di lettura sono stati rimossi i termini Papa, Conclave, Fumatabianca, Habemuspapam. Tutto in minuscolo per evitare ripetizioni. Alcuni temi: Scola, gabbiano, piazza, nero (profezia?), nuovo.

Questo il commento di Curini: “Fare la tag cloud è sicuramente un aspetto interessante e utile perché ti dice la relativa frequenza dell’occorrenza delle singole parole e questo ti dice qualcosa su quello che sta succedendo. Il problema di questo tipo di analisi è che non ti danno un’interpretazione sulla distribuzione dell’opinione su un determinato tema. Nella seconda immagine, per esempio, la parola più grande è nuovo, ma come viene valutata? In positivo o in negativo? Si tratta di una novità nella Chiesa per cui dobbiamo essere contenti o qualcosa che non ci piace? Con questo tipo di approccio l’interpretazione potrebbe essere sbagliata.”

L’intervento qualificato dei codificatori e l’interpretazione umana dei risultati costituiscono dunque il fattore determinante per capire il reale umore della rete. I processi automatici, come visto, da soli non bastano. Non abbiamo mai avuto così tanti mezzi a disposizione per comunicare, ma abbiamo veramente qualcosa di interessante da dire? La sentiment analysis, se ben applicata, probabilmente potrà darci la risposta.

Condividi su
Antonio Pilello
Science Communicator