Quante cose possiamo scoprire sulla diffusione dei virus osservando le dinamiche dei social network?
NOTIZIE – Il fattaccio di ieri su Twitter mi ha costretto a notare la coincidenza con la pubblicazione pochi giorni fa su PLoS one di uno studio il cui oggetto è “come i social network predicono le epidemie”. Andiamo con ordine (per chi non fosse del tutto informato sui fatti): ieri Twitter, il social network di microblogging, diffusissimo da noi ma soprattutto nel mondo anglosassone, è andato in tilt. In un esauriente articolo sul Guardian – che vi consiglio di leggere -, Martin Robbins paragona l’evento a una pandemia (“una nuova forma di vita artificiale di tipo sfuggente è nata” scrive sulle pagine del quotidiano anglosassone). Vi riassumo brevemente la spiegazione di Robbins: qualche astuto hacker ha trovato un baco nel codice del sito e ci ha inserito poche righe di JavaScript (un linguaggio di programmazione). I pezzetti di codice inserito facevano in modo che ogni volta che un utente passava col mouse in certe aree dello schermo (inizialmente le semplici parole scritte dei “tweet” – i post di Twitter) partiva automaticamente un “retweet”, cioè il link veniva automaticamente ripostato. Questa azione replicava i pezzetti di codice pirata, diffondendoli nelle varie (milioni?) pagine del servizio (quelle dei singoli utenti). L’analogia con la diffusione virale non si ferma qui, perché i pezzetti di codice, proprio come i virus reali, evolvevano (tendenzialmente allargando l’area di schermo in grado di provocare il retweet).
Robbins, che ha anche seguito l’andamento geografico e temporale dell’espansione di quello che tecnicamente gli informatici chiamano “worm”, nell’articolo chiude con un’idea ambiziosa: i dati dettagliati relativi a questo episodio, se diffusi dai responsabili di Twitter, potrebbero essere preziosi per comprendere altri tipi di diffusione virale, pandemie (reali) comprese.
Negli ultimi tempi più di qualcuno ha pensato che i social network potrebbero essere usati come modelli per comprendere la diffusione di virus globali (per esempio l’influenza stagionale, ma anche cose peggiori), e pian piano sulla stampa specializzata sono iniziati a uscire lavori di questo tipo. Uno dei più interessanti e innovativi è proprio quello a opera di Nicholas Christakis e James Fowler.
Va sottolineato che i social network a cui si riferiscono gli autori non sono semplicemente i servizi partecipativi del web 2.0 (Twitter, Facebook, Yuotube, ecc…) ma sono intesi in un senso più generale di relazioni fra individui, relazioni basate su un qualche legame (che in maniera astratta viene chiamato “amicizia” o connessione) che mette in comunicazione i nodi (in genere persone) in una rete sociale.
Come dicevo il lavoro di Christakis e Fowler parte dall’idea non originalissima di studiare le dinamiche in una rete sociale per comprendere (e soprattutto prevedere) l’insorgenza e l’andamento di un contagio. Nella categoria “contagio” ovviamente si possono mettere le malattie come l’influenza, ma anche la diffusione di un prodotto sul mercato, di una tendenza della moda, di un’idea e così via, e dunque un modello del genere potrebbe essere appetibile in diversi settori. La cosa davvero innovativa introdotta dai due scienziati è la strategia di monitoraggio usata: anziché scegliere a caso un individuo e analizzarne i contatti, hanno preferito scegliere un soggetto e poi analizzare i contatti dei suoi amici. Sembra una differenza minima, ma in realtà si tratta di un accorgimento davvero “furbo”.
Come spiegano i due scienziati è noto che gli individui che sono al centro di una rete sociale si “infettano” prima di quelli che stanno ai margini, e sono perciò i marker migliori. Individuare i soggetti più centrali è però tutt’altro che facile; bisognerebbe fare innanzitutto un’analisi globale della rete, analisi costosa (dal punto di vista computazionale) e a volte impossibile nella pratica.
Come spiega Chistakis invece, in maniera molto più “economica”, si può scegliere un individuo qualsiasi e poi scegliere di nuovo uno fra i suoi amici. Il “paradosso dell’amicizia” è un fatto noto da anni per chi studia le reti sociali: “i tuoi amici hanno più amici di te”. Provate a immaginare una rete sociale (un gruppo di persone collegate in qualche modo). Adesso immaginate un individuo particolarmente misantropo (dunque ai margini della rete) e uno invece molto popolare (al centro). Ora immaginate di scegliere a caso un individuo all’interno della stessa rete: è più probabile che fra i suoi amici ci sia il misantropo o quello popolare? Ovviamente il secondo. Questo significa che, statisticamente, scegliendo fra gli amici di qualcuno è probabile individuare una persona popolare (per i dettagli consiglio di leggere l’articolo originale, o ancora meglio di guardare l’eccellente video su TEDtv, qui sottonella versione di youtube, ma se andate sull’originale avete anche i sottotitoli).
Nel lavoro Christakis e Fowler dimostrano che il monitoraggio degli amici degli amici, permette un previsione della diffusione del contagio significativamente più rapida che il monitoraggio di individui scelti a caso (nella ricerca i due hanno monitorato la diffusione dell’influenza in un campus universitario e nel gruppo di individui scelti con il loro modello hanno osservato il picco del contagio diversi giorni prima che nel gruppo random).
Interessante vero? Inutile dire che metodologie come queste sono assolutamente preziose per prevenire e contrastare la diffusione di pericolose pandemie (per esempio per vaccinare gli individui centrale di una rete prima di tutti gli altri). Tornando sul caso Twitter: credete che i dati del contagio di ieri potrebbero essere preziosi per confermare empiricamente il modello di Fowler e Christakis? Io credo di siì anche perché l’architettura di questo social network permette di tracciare facilmente le amicizie , e soprattutto le amicizie degli amici…