Intelligenza Artificiale, Alan Turing, antispam, poste, smart rooms, libri, giornali, radio e social network: tutte quello che non sapevate di dover saper sui CAPTCHA
FUTURO – Ormai ci viene automatico e non ci facciamo più caso: molto spesso ci viene chiesto di digitare qualche carattere per poter inserire un contenuto su Internet, ricopiandoli da un’immagine.
Lettere e numeri possono essere casuali o avere un senso compiuto, ma in tutti i casi non somigliano a nessun carattere che di solito esce da un qualsiasi word-processor. Le lettere sono distorte e spesso sono presenti linee e colori fatti apposta per ostacolarne la lettura.
Di norma non è necessario più di qualche secondo perché siamo in grado di riconoscere lettere e numeri, ma quello che stiamo facendo è in realtà un vero e proprio test, nella fattispecie è una forma di Test di Turing, immaginato appunto da uno dei padri della moderna informatica: CAPTCHA, Completely Automated Public Turing test to tell Computers and Humans Apart. Letteralmente, Test di Turing completamente pubblico e automatico per distinguere esseri umani e computer.
Come sappiamo, si tratta di una delle più familiari procedure antispam, che sfrutta una delle peculiarità proprie del cervello umano, ovvero riconoscere istantaneamente i simboli. Se, infatti, nessuno di noi ha particolari difficoltà a leggere tanto da un libro, quanto da una pagina web o da un quaderno, lo stesso non è per un computer, che per farlo ha bisogno di un software OCR.
Questo ostacola quegli spambot che scandagliano autonomamente la Rete alla ricerca di moduli di immissione, come quello utilizzato in questo sito per l’inserimento dei commenti, che sono poi compilati fino a ottenere un messaggio pubblicitario ben visibile agli utenti (nel caso di OS invece si ricorre a un apposito filtro antispam).
Con un CAPTCHA molti bot sono semplicemente impotenti, poiché non possiedono una programmazione abbastanza sofisticata da includere un OCR che risolva caratteri così complessi, che invece per noi sono solo un modesto contrattempo. Il CAPTCHA, concettualmente, non è un ostacolo per non vedenti, ipovedenti e daltonici, poiché possono essere concepiti in modo che un file audio esegua lo spelling dei caratteri generati casualmente, ma purtroppo al momento il sistema ha poca diffusione.
In ogni caso, questa operazione all’apparenza senza alcun costrutto, oltre a porre problemi “filosofici” (un test di Turing, che distingue tra uomini e computer, può essere considerato tale anche quando, come in questo caso, è una macchina che lo crea e che fa la scelta?) ha in realtà applicazioni scientifiche e tecnologiche.
L’Università di Buffalo (CUBS, Center for Unified Biometrics and Sensors) da tempo studia i CAPTCHA partendo dal presupposto che il riconoscimento dei caratteri testuali è una questione di identificazione di pattern e dal fatto che insegnare a una macchina a farlo non deve essere considerata, a priori, un’impresa disperata. Altrimenti dovremmo abbandonare seduta stante ogni studio sull’Intelligenza Artificiale: il test formulato da Turing voleva appunto essere una prova in grado di riconoscere, un giorno, una macchina pensante.
Per pattern, in questo caso, si intendono degli “oggetti” standardizzati che in numero discreto e opportunamente combinati possono essere tradotti in un significato.
Il team di Buffalo ha già dimostrato nei primi anni ’90, prima dell’avvento dei primi CAPTCHA (1997), che anche i caratteri scritti a mano potevano essere letti con un opportuno software. Infatti, dopo qualche anno di studi, nel 1996 il Servizio Postale Statunitense (USPS) ha iniziato a usare le prime macchine in grado di leggere automaticamente gli indirizzi sopra lettere e pacchi, con un incremento di efficienza del servizio quantificabile in un risparmio per milioni di dollari.
Parole, quindi, scritte e pronunciate, ma non solo.
Insegnare a un computer a riconoscere (e generare) un simbolo è stato infatti però solo un primo passo, ora la sfida da raccogliere è riuscire a insegnare alle macchine a riconoscere anche il linguaggio del corpo. I gesti che usiamo per comunicare sono anch’essi standardizzati, pertanto se prima si chiedeva a un software di riconoscere la lettera A, ora gli si chiede di riconoscere gesti che ci permetterebbero di manipolare oggetti virtuali senza bisogno di altri dispositivi di imput che non non siano i nostri stessi movimenti, catturati da telecamere. Il team di Buffalo sta appunto usando il know-how maturato nello studio dei CAPTCHA per trasportarlo riversarlo nella progettazione delle “smart rooms”.
In linea di principio, una smart room è uno spazio chiuso attrezzato con vari sensori (telecamere, micrfoni, ecc…) che integrati in un sistema informatico permettono agli occupanti di interagire con la stanza, e viceversa. Possono essere usate a scopo ludico come estensione del concetto di realtà virtuale, ma anche come ambienti di discussione o per un’assistenza (e autoassistenza) dei malati altamente automatizzata e personalizzabile.
Saremo noi, in questo caso, sotto l’esame delle macchine, a dover dimostrare di essere abbastanza umani da insegnare loro un nuovo alfabeto basato sui movimenti del corpo, o almeno questo è ciò che sta tentando di fare il team di Buffalo, guidato dal Dr. Venu Govindaraju.
Senza arrivare agli scenari fantascientifici di qui sopra, i CAPTCHA dal 2007 sono stati messi al servizio della conoscenza umana.
Il miglior OCR del mondo, al momento è e rimane il cervello umano: chiunque abbia provato a digitalizzare un testo con lo scanner, sa bene che ben difficilmente il risultato sarà utilizzabile senza una revisione manuale che corregga caratteri/parole non riconosciute.
Come fare allora per ottimizzare la digitalizzazione dei testi, specialmente quelli antichi, che di certo non sono stati stampati in Times New Roman?
La risposta è reCAPTCHA.
L’idea è stata sviluppata alla Carnegie Mellon University, dove per la prima volta è stato coniato il termine stesso CAPTCHA nel 2000, ed è semplice e geniale al tempo stesso.
In un reCAPTCHA ci sono due parole da trascrivere. Di una il programma è certo della trascrizione esatta, ma l’altra è una che l’OCR non è riuscito a decifrare. Quando l’utente risolve il CAPTCHA, si assume che anche la parola ignota sia stata decifrata correttamente.
I dettagli del funzionamento di reCAPTCHA sono stati pubblicati sulla rivista Science a settembre 2008.
Tenuto conto che ogni giorno nel mondo gli esseri umani risolvono facilmente circa 200 milioni di CAPTCHA, la “forza lavoro” non manca di certo.
Il codice di reCAPTCHA può essere preso e inserito in qualunque sito web, ottenendo un duplice risultato: un buon antispam gratuito e un aiuto fattivo nella digitalizzazione di importanti testi: i risultati di reCAPTCHA sono infatti utilizzati da Google Books (la Google Inc. ha acquistato reCAPTCHA nel 2009) e per trascrivere in digitale le vecchie edizioni di The New York Times.
reCAPTCHA ha anche una versione audio, e in questo caso viene chiesto, con lo stesso principio, di identificare parole pronunciate da vecchie registrazioni radio, impossibili da restaurare con un semplice software di pulizia del suono.
reCAPTCHA è utilizzato da oltre 120.000 siti web di ampia consultazione, a partire da Facebook.
Se qualche volta avete pensato che qualcuno dietro il più diffuso social network vi stesse inviando dei messaggi inquietanti, tranquillizzatevi: era solo reCAPTCHA