Risposta esatta, Mr. Watson!

24 Maggio 2011

La rivoluzione del search in linguaggio naturale. Dopo gli scacchi da campionato del mondo di DeepBlue e la mappatura del genoma umano di Blue Gene, un altro sistema computazionale “estremo” di IBM si cimenta – con l’aiuto di un ricercatore italiano – in una grande sfida: gareggiare e vincere al più popolare e difficile telequiz degli Stati Uniti

Anche nell’immaginario collettivo, un computer in grado di rispondere nello stesso modo a ordini e richieste formulate nel linguaggio di tutti i giorni rappresenta il vero punto di arrivo di un percorso tecnologico iniziato ormai più di mezzo secolo fa. Anche riducendo questo intervallo evolutivo alla finestra ultratrentennale che inizia con l’avvento dei primi sistemi di elaborazione basati su microprocessore, il computer parlante è un sogno coltivato da sempre. In 2001 Odissea nello spazio, il computer Hal 9000 non solo parla, ma si permette anche la debolezza di avere paura all’idea dell’imminente spegnimento. Nel 2001 la profezia formulata dal geniale regista Stanely Kubrick non si era ancora avverata, ma a un decennio di distanza dalla data indicata dall’indimenticabile capolavoro di fantascienza (la trama era stata inventata da Arthur C. Clarke, il futurologo, archeosubacqueo e scrittore che aveva proposto i satelliti per telecomunicazione diversi anni prima dello Sputnik) il computer che capisce e parla ha partecipato e vinto a un quiz televisivo che, come il nostro Rischiatutto, ha il pericolo, il rischio, direttamente nel titolo: Jeopardy!

Watson Project

La storia di DeepQA, Question Answering, meglio conosciuto al grande pubblico come “Watson Project”, è stata raccontata in un’aula del Dipartimento di Elettronica del Politecnico di Milano da Roberto Sicconi, uno dei program director del centro di ricerche IBM T. J. Watson di Hawthorne, New York, dove ha lavorato in questi anni il team – arrivato a impegnare una quarantina di ricercatori – che ha messo a punto la macchina. Un gruppo coordinato da un altro ricercatore con il cognome “italiano”, David Ferrucci. Dopo trent’anni Sicconi tornava nella stessa università da cui era partito per occuparsi di multimedialità in IBM Italia. Nel 1990 era diventato direttore del Multimedia Deveolpment Lab di Vimercate. Poi, alla fine degli anni Novanta anche questo cervello ha preso il volo verso gli Stati Uniti, inizialmente per lavorare sui microprocessori. Nel 2000 Sicconi, che nel corso della sua carriera ha sempre avuto a che fare con gli aspetti informatici del linguaggio, comincia a lavorare in modo più specifico sulle interfacce in linguaggio naturale, la comprensione e la conversazione automatiche.

«L’idea del computer parlante che era alla base della cosiddetta intelligenza artificiale finora non si è concretizzata», esordisce Sicconi. Quello che il team del progetto Watson – il nome con cui è stata battezzata l’architettura computazionale di DeepQA in onore del fondatore di IBM e del suo omonimo successore Tom Watson Jr – ha cercato di fare è interpretare questo sogno in una chiave più specifica, quella del superamento della consultazione di database attraverso le keyword. «L’obiettivo era di arrivare a estrarre dati significativi da una massa di informazioni non strutturate, attraverso un’interfaccia di comunicazione in linguaggio completamente naturale, sapendo che il linguaggio è un artefatto che ci rimanda al nostro modo di pensare. Non abbiamo costruito Watson per vincere al quiz televisivo, ma per andare oltre ciò che abbiamo imparato finora sull’intelligenza umana». In realtà, a parte il risvolto spettacolare e mediatico del software che diventa campione di un telequiz, i risultati ottenuti in termini di capacità di selezione e validazione dei database, algoritmi di estrazione delle informazioni, velocità di accesso, elaborazione e presentazione delle risposte, sono enormemente promettenti e hanno già trovato diverse possibili applicazioni commerciali.

Great Challenge

DeepQA, ha spiegato ancora Sicconi, rientra nel quadro di analoghe iniziative “Great Challenge”, le grandi sfide informatiche che hanno permesso alla ricerca IBM di raggiungere in questi anni obiettivi che sembravano impossibili sul piano computazionale. Nel 1997 fu la volta di DeepBlue, la macchina che sconfisse il campione mondiale di scacchi Garry Kasparov (dopo che nel 1996 il giocatore umano ebbe la meglio su una versione meno evoluta di DeepBlue). Poi arrivò il progetto BlueGene, un computer a parallelismo massivo utilizzato per “crakkare” il codice del genoma umano. Il nuovo DeepQA, destinato ad avere un impatto stravolgente sul mondo della cosiddetta ricerca per parole chiave, mosse i suoi primi passi nel 2004. Tre anni dopo, nel 2007, venne costituito il primo gruppo di lavoro. «Siamo partiti con un team di sei persone – racconta Sicconi -, un gruppo che si è allargato nel tempo, fino a impegnare continuativamente una media di 25 ricercatori».

La sfida del telequiz

La scelta di costruire un concorrente vincente per telequiz non era improntata semplicemente alla voglia di raggiungere un pubblico molto vasto e rappresentativo. Jeopardy! ha diversi elementi di unicità che lo rendono un terreno sperimentale ideale. «Nel corso di 27 anni di storia ha attirato l’attenzione di milioni di telespettatori su un’amplissima gamma di tematiche eterogenee, accumulando un archivio di centinaia di milioni di risposte». Esattamente il tipo di massa di informazioni di cui avevano necessità i ricercatori del progetto Watson per verificare la precisione dei loro algoritmi di comprensione e risoluzione dei quiz. Il linguaggio naturale, sottolinea Sacconi, «è esposto a livelli di ambiguità che il computer ignora del tutto». Una prima parte del lavoro, per il “concorrente artificiale”, consiste quindi nel capire la domanda, nell’estrarre i singoli concetti o parole chiave che gli consentono poi di buttarsi nel grande oceano di informazioni sparpagliate per Internet e in una serie di database commerciali. L’altra parte del lavoro riguarda invece la capacità di valutare i risultati ottenuti sulla base di complessi algoritmi di sovrapposizione. «Riuscire a vincere a Jeopardy! implicava soglie di confidenza molto elevate», conclude Sicconi.

Lo scontro con i due migliori concorrenti storici di Jeopardy! si è concluso con una vittoria («forse ha giovato anche la competizione tra i due, contro un solo concorrente forse DeepQA non avrebbe prevalso», ha ammesso l’esperto italiano in semantica computazionale). Al computer “saputello” è andato il primo premio di un milione di dollari, finito subito in beneficenza, insieme al mezzo milione vinto da Brad Rutter e Ken Jennings. Ma i ricercatori che hanno contribuito a questo successo non si sono fermati. Tra le aree più promettenti ci sono il riconoscimento di immagini, la consulenza “esperta” in campo finanziario e assicurativo, i sistemi di help desk. Ma in questo momento, ha precisato Sicconi, si lavora soprattutto per mettere a punto un sistema esperto capace di affiancare il medico nel difficile compito della diagnosi e in un prossimo futuro del trattamento delle malattie, basandosi sulla capacità di una macchina di accedere a una letteratura scientifica praticamente infinita.

Alla fine della presentazione di Roberto Sicconi è emerso un dato confortante. A fronte della fuga di un cervello, IBM Italia e diverse università italiane – Trento, la Sapienza di Roma, lo stesso Politecnico di Milano con il progetto Search Computing – stanno portando avanti diverse iniziative molto interessanti nel campo della ricerca basata sulla nostra lingua naturale.

Risposta esatta, Mr. Watson!

TI PIACE QUESTO ARTICOLO?

TOP 100 DELL'ICT SOSTENIBILE

WEB COVER

CSI Lifecycle Services, l’equilibrio tra innovazione e sostenibilità

NovaNext, l’innovazione che connette il futuro