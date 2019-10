Dei numeri, certo, bisogna continuare a fidarsi, ma per poterlo fare serve capirli bene e analizzarli sotto tutti i punti di vista. È quello che suggerisce David J. Hand nel suo libro Il tradimento dei numeri (Rizzoli, € 19,90) dove Hand racconta 15 tipi di dati mancanti, fraudolenti, sbagliati: i dark data. È un libro che parla di informazioni taciute, elementi non considerati e oscuri, numeri non compresi, errori di interpretazione. L’autore è uno statistico inglese, saggista, professore a Oxford, insignito nel 2013 del titolo di Ufficiale dell’Ordine dell’Impero britannico. In questa sua ultima opera Hand utilizza molti esempi pratici per spiegare al lettore il fenomeno dei dati mancanti.

Quando il dato è elitario

Uno degli esempi più chiari sui dark data è legato a un tipo di dati mancanti di cui non si conosceva l’esistenza.

La città di Boston ha implementato l’utilizzo di una app per smartphone collegata al GPS delle auto per la segnalazione delle buche su strada. I cittadini, tramite questa app, potevano comunicare automaticamente alle autorità, semplicemente guidando la loro auto, dove si trovavano le buche in città. Ciò ha portato a interventi di manutenzione su strada, rendendo la viabilità più sicura. Ma quali cittadini possono permettersi cellulari di nuova generazione e automobili con GPS? La risposta è: quelli più ricchi, che vivono e frequentano quartieri più agiati e tendenzialmente meglio manutenuti.

L’utilizzo di questa app ha portato sicuramente a qualcosa di positivo, ovvero la minor presenza di buche su strada nei quartieri dove le stesse venivano segnalate, ma anche a una disparità di trattamento tra questi quartieri e le zone più povere della città, dove le persone in possesso di smartphone e automobili con GPS erano presenti in numero minore, e hanno quindi segnalato in quantità molto minore la presenza di buche. In questo caso i dark data sono le mancate mappature delle buche dei quartieri più poveri: questi dati mancano non perché l’app abbia in qualche modo mostrato limiti tecnici, ma perché nel meccanismo delle segnalazioni non si è pensato agli aspetti socio-culturali legati all’utilizzo della tecnologia in campo.

Una tragica sottovalutazione

Un altro esempio di dark data, purtroppo molto più tragico, riguarda un tipo di dato nascosto diverso. Mentre per l’app di Boston i numeri erano effettivamente mancanti, in questo caso i dati esistevano, ma non sono stati presi in considerazione, e ciò ha provocato una tragedia.

Il 28 gennaio 1986 lo space shuttle Challenger prese fuoco a quattordici chilometri da terra e a soli settantatré secondi dalla partenza, provocando la morte di tutti e sette i membri dell’equipaggio. Le cause dell’incendio sono state individuate in una serie dati che è stata ignorata nella fase dei test. Nello specifico, gli ingegneri, gli scienziati e i tecnici avrebbero sottovalutato il ruolo nel decollo della temperatura atmosferica durante il lancio. Nei lanci di prova effettuati erano stati registrati problemi solo in tre casi con temperatura bassa e in due casi con temperatura alta. Una quantità paragonabile, insomma.

Se invece prendiamo in considerazione tutti i lanci, anche quelli che non hanno evidenziato problemi, si nota che nella totalità dei lanci effettuati quando la temperatura era al di sotto dei 65°F c’erano stati problemi di stress degli O-ring (componenti in elastomero che dovevano sigillare i segmenti dei razzi) mentre in nessun caso si era verificato stress negli O-ring in casi di temperatura più elevata. In caso di bassa temperatura, gli O-ring si indurivano e ciò ne impediva il corretto funzionamento. Il giorno del lancio, il 28 gennaio 1986, la temperatura atmosferica era, purtroppo, ben al di sotto dei 65° F e ciò ha portato al collasso dello shuttle e alla morte dell’equipaggio.

I dark data e la crisi finanziaria del 2008

Hand nel suo Il tradimento dei numeri ci mette in guardia anche dall’utilizzo fraudolento dei dark data. Per esempio, prima della crisi finanziaria del 2008 Howard Hubler III effettuò rischiosi scambi di mutui subprime negli Stati Uniti; invece di informare i suoi colleghi che i mutui che aveva acquistato erano spazzatura, Hubler nascose le informazioni (dark data) facendo perdere alla Morgan Stanley circa 9 miliardi di dollari. Non solo i dark data quindi sono frutto di errori o scelte sbagliate, ma possono essere esclusi dalle analisi anche in modo intenzionale. Oppure, ciò che dovrebbe essere nascosto viene utilizzato in maniera scorretta o illegale (come nel caso del phishing online).

Perché quello che non sappiamo è importante come quello che sappiamo

La medicina, le politiche pubbliche e sociali, la finanza: i dark data sono ovunque, soprattutto nell’era di internet. Ciò che fa Hand in questo testo è metterci in guardia su ciò che crediamo di sapere ma in realtà non sappiamo. La grande quantità di informazioni a cui possiamo accedere, noi come le istituzioni, non è necessariamente completa. La parte oscura della luna, i dati nascosti nell’ombra raccontati da Hand appaiono in questo libro più interessanti delle zone di luce.

