Culturomica, il nuovo gioco di società

table livre (Crediti: Atelier du recyclage artistique)ARTE, MUSICA & SPETTACOLI – Science ha anticipato on-line la ricerca di Jean-Baptiste Michel, Martin Nowak, Steve Pinker di Harvard, altra bella gente e il gruppo Google Books, “Analisi quantitativa della cultura usando milioni di libri digitalizzati”. È un regalo di Natale per le scienze umane, certo, ma anche per internauti curiosi dai 7 ai 107 anni.

Si tratta di una forma avanzata di data-mining in 5,2 milioni dei 13 milioni di libri digitalizzati da Google, il 72% dei quali in inglese, il resto in francese, spagnolo, tedesco, cinese, ebraico e russo.  Sono stati scelti quelli usciti tra il 1800 e il 2000 perché serviva una documentazione bibliografica certa, come la data e il luogo di pubblicazione, e ne sono stati ricavati 500 miliardi di “grammi” (dal greco per traccia, come nella parola “engramma”): parole, acronimi, date, misure. Grammi singoli per esempio “scienza” e “oggi” o a gruppi, “Oggi Scienza” o “teoria della relatività ristretta”, messi in ordine cronologico e macinati dagli algoritmi di un motore di ricerca figlio del “topo di biblioteca” pubblicato nel 2007 su Nature.

Dal macinato culturale sono uscite conferme e sorprese. I vocaboli della lingua inglese sono circa un milione, il doppio di quelli censiti nei vocabolari di riferimento e dagli anni Cinquanta aumentano di  8.5000 all’anno. La ricerca cronologica mostra anche le censure: il nome del pittore ebreo Marc Chagall che  scompare dalle pubblicazioni tedesche e Piazza Tienanmen da quelle cinesi. La cosa più interessante sono le “traiettorie”, tendenze sociali e culturali come la maggiore rapidità con la quale dal Novecento si diffondono le innovazioni e scompaiono i riferimenti al passato.

È un primo saggio della “culturomica” dalla quale emergeranno, scrivono entusiasti gli autori, “conoscenze in lessicografia, evoluzione della grammatica, memoria collettiva, adozione delle tecnologie, ricerca della fama ed epidemiologia storica”.  In conclusione, definiscono la nuova disciplina e le sue ambizioni, e indicano alcuni filoni di ricerca:

La culturomica è l’applicazione allo studio della cultura umana della raccolta e dell’analisi high-throughput (ad alta velocità e densità) dei dati. I libri sono l’inizio, ma dobbiamo incorporare anche giornali, manoscritti, mappe, opere d’arte e miriadi di creazioni umane. Ovviamente molte voci si sono perse nel tempo e sono per sempre fuori dalla nostra portata. Per le scienze umane, i risultati della culturomica sono evidenze di un tipo nuovo e, come per i fossili di antiche creature, la sfida sta nella loro interpretazione. Per motivi di spazio ci limitiamo a una brevissima rassegna: a una manciata di traiettorie e alle nostre interpretazioni preliminari. Numerosi altri fossili, dalle forme non meno intriganti, ci aspettano:

(i) Picchi di “influenza” coincidono con le date di pandemie note, a suggerire che i metodi culturomici hanno un valore per l’epidemiologia storica;

(ii) Traiettorie per “il Nord”, “il Sud” e infine “il nemico” mostrano come la polarizzazione degli stati abbia preceduto la guerra;

(iii) Nella battaglia dei sessi le “donne” stanno conquistando terreno rispetto agli “uomini”;

(iv) “féminisme” si è fatto strada inizialmente in Francia, ma a lungo termine gli Stati Uniti si sono dimostrati un ambiente più fecondo;

(v) “Galileo”, “Darwin” e  “Einstein” saranno scienziati ben noti, ma “Freud” è più profondamente radicato nel nostro inconscio collettivo:

(vi) Quando arrivò “DNA” stava scemando l’interesse per “evoluzione”;

(vii) La storia della dieta americana offre  molte e appetibili opportunità per future ricerche, il menu comprende “steak”, “sausage”, “ice cream”, “hamburger”, “pizza”, “pasta”e “sushi”;

(viii) “God” non è morto, ma ha bisogno di un nuovo pubblicitario;

Queste, insieme ai miliardi di altre traiettorie che le accompagnano, forniranno ricche scorte di ossa con le quali ricostruire lo scheletro di una nuova scienza.

Per i dilettanti, i dati grezzi sono on line insieme al programma per esplorarli. Basta digitare nella casella due o più fatti, luoghi, personaggi, concetti per vedere quali sono più presenti nella cultura libresca dall’Ottocento in poi. Si può giocare in parecchi. Ciascuno sceglie il “gramma” che ritiene di maggior successo e ci punta un cioccolatino:  la Kakania o il Pontevedro? Emma Bovary, Oliver Twist, Anna Karenina o Huckleberry Finn? Niels Bohr, Marie Curie, Enrico Fermi, Lise Meitner, Richard Feynman o il gatto di Schroedinger?

Buon divertimento.

Foto: Atelier du recyclage artistique

1 Commento

Rispondi

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

%d blogger hanno fatto clic su Mi Piace per questo: