Predictive Analytics: una leva fondamentale per ridurre l’incertezza del Business

Siamo alle porte degli anni ’20 del nuovo millennio e già in modo piuttosto deciso e pervasivo, le tecnologie connesse all’Intelligenza Artificiale pervadono le nostre vite. Abbiamo smartphone che ci informano sul traffico prima ancora che abbiamo l’intenzione di uscire di casa, con cui parliamo in linguaggio naturale, capaci di interazioni complesse.

Quando ai tempi dell’università mi occupavo di classificazione del significato dei termini del linguaggio naturale, correva l’anno 1994, non avrei mai immaginato che quelle metodologie – all’epoca per visionari – sarebbero diventate oggi delle tecnologie e, per di più, a disposizione di tutti.

All’epoca si parlava di Data Mining, Information Extraction, Information Retrieval, Word Sense Disambiguation: si trattava di metodologie matematiche per estrarre informazione da dati strutturati (cioè estratti da database) e non strutturati (ovvero da testo grezzo).

C’è voluto esattamente un quarto di secolo per vedere il boom di questi temi, all’inizio di questo decennio, proprio quando è nato LidiMatematici. Oggi si parla di Predictive Analytics, un nome collettivo ad indicare una suite di metodologie atte a proiettare nel futuro informazioni estratte dal passato, e Cognitive Computing o AI essenzialmente le stesse metodologie applicate alla comprensione del linguaggio naturale.

L’impatto di queste metodologie per privati ed aziende è talmente grande da essere persino complesso da prevedere: da un lato ognuno di noi, nella vita di tutti i giorni, è in grado di sfruttare tecnologie – con un semplice smartphone – che gli consentono di effettuare operazioni complesse con un semplice comando vocale, dall’altro le aziende sono in grado di prendere decisioni strategiche riducendo in modo drammatico l’incertezza caratteristica di ogni business. E sappiamo, oggi, quanto sia sfidante e difficile tenere il timone nel mare del mercato.

In questo processo di trasformazione, oggi praticamente all’inizio, la figura del Data Scientist è centrale. Il Data Scientist è un professionista con una formazione scientifico-matematica fortemente orientata verso la statistica, in grado di dialogare contemporanemente con tre mondi solo parzialmente sovrapposti. Da un lato deve essere in grado di comprendere le necessità del mondo business, ovvero delle aziende, dall’altro deve essere capace di identificare le informazioni alla base delle necessità di business e di districarsi tra le fonti dati più rilevanti e, infine, deve saper costruire modelli matematici, conoscendone un portafogio piuttosto variegato, adattandoli allo specifico contesto aziendale ed affinandoli rispetto ai dati a disposizione. Spesso il Data Scientist si avvale di strumenti Open Source, caratterizzati quindi da un costo basso, se non nullo.

Il Data Scientist non va a braccio, ma segue metodologie di standard industriale (CRISPDM, per dirne una) e, attraverso un processo iterativo diviso in fasi che va dalla comprensione degli obiettivi di business, alla identificazione delle fonti dati, alla preparazione dei dati per l’alimentazione dei modelli, alla costruzione dei modelli e, infine, alla loro applicazione per ottenere previsioni sul futuro e ridurre così l’incertezza del business che ha dato origine alla iniziativa di Predcitive Analytics in cui è coinvolto.

In tutti questi anni ci siamo occupati nelle pagine di questo blog di vari esempi di Predictive Analytics. E’ una buona occasione per tracciarne un filo conduttore, per avere il polso dell’importanza, dal punto di vista delle aziende, degli strumenti analitici.

E’ importante tenere a mente che il valore dei modelli predittivi, oggi, è dato dai benefici in termini di business che possono portare alle aziende. Si pensi, ad esempio, alla Segmentazione dei Clienti, ovvero la suddivisione dei clienti in gruppi socio-economici e per stile di consumo omogenei. A questa necessità il Data Scientist risponde con i modelli di Clustering che consentono, talvolta con estrema precisione, di suddividere il portafoglio clienti in modo talmente preciso da consentire azioni di Marketing mirate, il cui ritorno di investimenti è calcolabile con precisione.

Le aziende sono particolarmente interessate a comprendere le proprie capacità di erogare prodotti e servizi, stando contemporaneamente sul mercato, valutando quindi il proprio sforzo potenzialmente erogabile e i risultati ottenibili. Si pensi ad esempio agli sport competitivi: qual’è il limite strutturale di performance ottenibile allo stato attuale? Una volta risposto a questa domanda, decidere gli investimenti necessari e le relative aree di miglioramento è sicuramente più agevole. Di questo abbiamo un esempio precedentemente trattato sul blog, quando abbiamo previsto il limite teorico raggiungibile da Usain Bolt nel correre i 100 metri piani. I risultati della analisi furono molteplici, intanto il limite previsto è di 9’’46 più o meno 4 centesimi disecondo, ma soprattutto che quella di Bolt è una vera e propria era, ovvero che questo limite impiegherà un tempo non breve ad essere superato, nell’ordine del decennio.

Le aziende sono estremamente interessate alla valutazione dei fenomeni di mercato dotati di meccanismo a diffusione, come ad esempio le mode o, nel caso delle farmaceutiche, i virus. A questa esigenza il Data Scientist risponde con i modelli della famiglia della regressione: ricordate la vicenda Ebola? Era il 2015 e tutti i
giornali si affannavano a riempire le pagine di paroloni come esponenziale. Ad una analisi dei dati osservammo, invece, che il fenomeno era si importante ma contenuto, e che si sarebbe stabilizzato rapidamente nei mesi a venire dopo un leggero, ulteriore, incremento che all’epoca stimammo a 8700 unità. Fu così.

Quando il business ha a che fare con eventi che si svolgono in modo diluito nel tempo, come ad esempio gli enti fieristici, devono saper stimare in anticipo l’interesse del pubblico e prendere decisioni strategiche non banali, come gli investimenti sulle strutture, il costo dei biglietti di ingresso, e così via. Questo è solo un esempio di applicazione delle Serie Storiche, ce ne occupammo qualche anno fa a proposito della previsione degli ingressi alla manifestazione Lucca Comics & Games, quando fu presa la decisione strategica di limitare gli ingressi, il risultato della previsione è che il trend di vendita, a seguito dell’aumento dei prezzi e dell’introduzione del tetto alla vendita suggeriva che la soglia massima non sarebbe stata raggiunta, a causa di una flessione delle vendite.

Ci sono poi altri esempi assolutamente notevoli di applicazione delle tecniche di Predictive Analytics, come gli algoritmi di classificazione, veri e propri cavalli di battaglia del Data Scientist, che consentono alle aziende di prevedere fenomei assegnando potenziali categorie ai clienti di interesse. Esempi notevoli sono quello del churn, ovvero dell’abbandono del cliente che se ne va per altro operatore, o della previsione e contrasto alle frodi.

Queste tematiche non possono ovviamente essere esaurite in un singolo articolo, che non può certamente neanche elencare con esuastività. che verranno approfonfite sicuramente in vari post. Per i più curiosi, sono disponibil vari link di approfondimento.

-> Vai al link di approfonimento sul mestiere del Data Scientist

-> Vai al link di approfondimento generale sul mining 

-> Vai al link di apprendimento sull’Open Source

-> Vai al link di approfondimento sul Deep Learning

-> Vai al modello di Ebola 

-> Vai allo Use Case di Lucca Comics

-> Vai al calcolo del limite teorico del record del mondo dei 100 metri piani

Share
Questa voce è stata pubblicata in Scienza oggi e contrassegnata con , , , , , , , , , , , , , . Contrassegna il permalink.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *