Raccolta e analisi dei dati, costruzione dei modelli e previsioni di business. Che cos’è esattamente il machine learning? Quali problemi risolve e quale dovrebbe essere l’approccio giusto alla sua adozione da parte delle aziende?
In questi ultimi tempi, il machine learning (ML) sembra essere dappertutto. Indubbiamente le big company del cloud e di Internet hanno recentemente reso molto famoso l’apprendimento automatico, con storie di successo su come il ML ha notevolmente migliorato i loro prodotti e servizi. Molte aziende hanno notato questa tendenza e intravedono non pochi possibili vantaggi per le loro attività. Ma cos’è esattamente il ML, quali problemi risolve per le aziende e quale dovrebbe essere l’approccio giusto al ML?
Si può partire dai motivi per i quali bisogna prevedere il futuro. Una previsione accurata è fondamentale per tutte le aziende. Senza un certo grado di fiducia nel business forecasting, le aziende avrebbero difficoltà a fornire prodotti e servizi di successo in modo economicamente vantaggioso. Negli ultimi decenni, molte aziende in un’ampia gamma di settori industriali hanno dovuto fare affidamento sull’analisi dei dati per le previsioni. Abbiamo tutti sentito parlare di business intelligence, data mining, big data, analisi predittive, e così via. Tutti questi strumenti e tecniche analizzano i dati aziendali storici e aiutano a fare previsioni sul futuro per aumentare i ricavi e le performance di business.
Le previsioni col machine learning
Il ML è un approccio radicalmente diverso rispetto al business forecasting svolto fino a oggi, ma non si tratta di un nuovo concetto. Il ML trae infatti le sue origini nell’intelligenza artificiale (AI) di molti decenni fa: la prima conferenza AI è stata nel 1955 a Dartmouth negli Stati Uniti, cioè molto prima che venissero inventate le schede perforate. Duplicare l’intelligenza umana usando una macchina per simulare la rete neurale del nostro cervello era un obiettivo ambizioso ed entusiasmante. Tuttavia, non c’erano abbastanza risorse di calcolo né algoritmi sufficientemente sofisticati per realizzare questa idea. L’AI e il suo sottoinsieme ML hanno visto qualche progresso minore alla fine degli anni 80 e 90, ma nel complesso, e nonostante le grandi possibilità, il successo è stato molto limitato.
Circa dieci anni fa – però – ci sono stati alcuni passi avanti, con nuovi algoritmi scalabili di riconoscimento dei pattern che utilizzano nuovi tipi di reti neurali artificiali. E con l’avvento del cloud computing, in grado di fornire enormi risorse di computing on-demand, unitamente alla grande quantità di dati disponibili, la forza del machine learning è stata ampliata in modo esponenziale. Questa nuova forma di ML era originariamente chiamata “Belief networks” dai ricercatori di AI, ma veniva comunemente chiamata “Deep learning”. Questa nuova forma più potente di ML stava fornendo previsioni accurate a livelli senza precedenti. Che si chiami deep learning o si continui a etichettarlo machine learning, questo tipo di analisi e previsione è un enorme trend tecnologico e di business per molte aziende e continuerà a esserlo nel prossimo futuro.
Il processo complessivo
Essenzialmente, visto da un alto livello, un sistema di machine learning è abbastanza semplice. All’inizio si analizzano grandi quantità di dati validi alla ricerca di pattern statistici. Questi pattern sono codificati in un modello e testati accuratamente. Una volta che l’azienda è soddisfatta, il modello può fornire risultati coerenti, viene messo in produzione e fa previsioni basate su nuovi input. E dal momento che viviamo in un mondo dinamico di modifica dei dati e di ambienti in evoluzione, i dati e i modelli di produzione sono continuamente ottimizzati dai data scientist per produrre risultati sempre imparziali. Il fulcro dell’ML consiste quindi nel riconoscere i pattern nei dati e fare previsioni su tali dati.
La qualità dei dati è essenziale
È importante assicurarsi che il sistema ML stia leggendo grandi serie di dati “puliti” e di alta qualità. Come nel data mining e in altri sistemi di analisi tradizionali, è fondamentale disporre di dati accurati e completi che rappresentino realmente il business. Più dati sono disponibili, più accurate sono le previsioni. E poiché le grandi imprese hanno proporzionalmente più dati rispetto alle organizzazioni più piccole, le grandi imprese sono perfettamente adatte a trarre il massimo beneficio dai sistemi di ML. Ricavare raccolte di regole complete da questa massa crescente di dati – provenienti da vendite, supporto utenti, analisi del sentiment, traffico Web, tracciamento delle risorse IoT, monitoraggio dei microservizi, attività di rete – diventa rapidamente ingestibile. Invece di sistemi di regole complesse, è necessario utilizzare metodi statistici per rilevare i modelli.
In maniera simile alle analisi quantitative dei “quant”, con le quali si analizzano i dati in azienda utilizzando metodi statistici e creando modelli, anche i sistemi di machine learning creano modelli. Quando ero consulente senior per una banca d’investimento, ho collaborato regolarmente con un team di economisti. Sono sempre stato colpito dal modo in cui questi esperti di statistiche (e di eventi mondiali) analizzano grandi quantità di dati economici con strumenti come “S-Plus” e “R”, che tracciano i loro risultati con GNUplot, ricavandone modelli dettagliati di rischio finanziario. Tuttavia, le macchine odierne possono creare questi modelli in modo notevolmente più rapido e preciso. Un “quant” umano potrebbe probabilmente creare alcuni modelli a settimana, mentre un insieme di macchine nel cloud può probabilmente creare alcune centinaia di modelli in un giorno. Ma questi modelli costruiti al computer dovrebbero essere controllati e verificati con la guida umana.
Apprendimento supervisionato o no?
Attualmente, ci sono due tipi fondamentali di algoritmi di apprendimento automatico: supervisionati e non supervisionati. L’apprendimento supervisionato, come suggerisce il nome, è una raccolta di algoritmi che apprendono con l’aiuto della guida umana fornendo gli input e gli output attesi. Con l’apprendimento supervisionato, un modello viene creato da grandi volumi di dati e ripetutamente modificato e testato da esperti di statistiche o data scientist in modo da fornire risultati accurati. Negli ultimi dieci anni, vi sono stati significativi progressi nell’apprendimento supervisionato grazie a innovativi algoritmi di rete neurale. Questi nuovi algoritmi di ML utilizzano reti neurali più complesse e richiedono molte più risorse di calcolo. Grazie a ricercatori dell’AI di grandi aziende cloud come Google, Facebook, Amazon, Apple, Microsoft e di una serie di nuove startup, questo tipo di deep learning più intenso sta producendo risultati sorprendenti nell’analisi predittiva. L’altro tipo base di algoritmi di apprendimento è chiamato apprendimento non supervisionato. Questo tipo di apprendimento offre la promessa che le macchine scopriranno i modelli nei dati con una minima assistenza da parte dei data scientist. Con l’evoluzione e la maturazione del ML, l’apprendimento senza supervisione rappresenta una nuova entusiasmante area nella ricerca ML dall’enorme potenziale.
Ma le aziende dove possono utilizzare il ML?
Al momento di decidere dove utilizzare il ML in azienda, vi sono molti tipi di sistemi che potrebbero trarre vantaggio dal machine learning. Un sistema molto ripetitivo che richiede che le decisioni siano prese sulla base di dati passati sarebbe un ambito ovvio, ma vi sono molte aree che potrebbero potenzialmente utilizzare le soluzioni ML: vendite, assistenza clienti, tracciamento spese di back office, manutenzione predittiva, logistica, traduzioni, costi assicurativi, programmi fedeltà, intrusioni nelle reti, frodi, e tante altre aree. Alcuni casi d’uso devono ancora essere scoperti poiché la profondità dei problemi che il ML può risolvere aumenta in modo significativo insieme alle innovazioni negli algoritmi di apprendimento e nelle infrastrutture scalabili. Siamo all’inizio di una nuova entusiasmante era nell’analisi predittiva delle imprese con il machine learning.
Frank Greco
CEO di Crossroads Technologies e con una vasta esperienza in progetti IT, Frank Greco – oltre a essere blogger e autore – ha una notevole esperienza nella strategia cloud e mobile, nella partnership strategica fra tecnologia e business, nelle infrastrutture di tipo enterprise e nelle tecnologie emergenti, in particolar modo per sistemi finanziari e per le grandi aziende.
Frank Greco sarà il chairman della Conferenza di Technology Transfer “Machine Learning for the Enterprise – International Conference” che si terrà a Roma il 29-30 ottobre 2018.