Il Data Scientist, mestiere del terzo millennio

datamining2Tra le parole che ricorrono negli ultimi anni ce ne sono diverse che suonano parecchio misteriose, come Data Mining, Cognitive, Predictive Analytics. Sono termini che non trovano adeguato riscontro nel lessico italiano e, quindi, intraducibili. Ma dovremo sempre più spesso fare i conti con la realtà che sta dietro questa nuova terminologia, perché è una realtà importante che avrà un grosso impatto nelle nostre vite. Oggi vi parliamo di un mestiere che sarà sempre più in voga nel prossimo futuro, fortemente richiesto e decentemente remunerato: il Data Scientist.

Ormai parlare con il nostro telefonino è la normalità, eppure lo sviluppo di applicazioni basate su tecnologia Cognitive è frutto di un lungo e complesso processo di evoluzione basato su solidissimi modelli matematici. Modelli di cui ci siamo occupati a più riprese in questi anni e che richiedono figure professionali dedicate.

I modelli cognitivi sono infatti basati su sofisticate tecniche statistiche consolidate in vasti terreni di applicazione, quali il Predictive Analytics e il Data Mining. Si tratta di modelli che rendono le macchine “intelligenti”, nello specifico, in grado di identificare schemi ricorrenti in grandi quantità di dati e di formulare ipotesi e deduzioni su di esse.

Le aziende sono molto interessate alle tematiche di Data Mining, Analytics e Cognitive perché consentono loro da un lato di ridurre il costo dell’intervento umano in compiti relativamente semplici, come il risolvere un problema tecnico parlando con il cliente, e di ridurre l’incertezza del futuro formulando previsioni ad alto tasso di affidabilità.

7a63d225a85892e986a90602a4d8f641

In questo grafico Gartner illustra come il Predictive Analytics non solo concorra a ridurre l’impatto del lavoro umano nel lasso operativo che intercorre tra il reperimento dei dati, la loro analisi e le relative decisioni con conseguenti azioni di business, ma anche di rispondere a tutte le domande più spinose (o pain-point) del business. Cosa è accaduto? Perché è accaduto? Cosa accadrà? Cosa bisogna fare?

Cognitive ed Analytics possono sembrare due mondi distinti, e così appaiono ancora a molti ma, in realtà, sono basati entrambi sugli stessi processi, modelli e algoritmi matematici. Le aziende sono particolarmente interessate alle tematiche di Analytics perché consentono di centrare tre obiettivi. Il primo è di comprendere la natura e le relazioni interne ai dati aziendali, ormai disponibili in grande quantità. In questo modo si svelano relazioni che prima passavano inosservate e si ha la possibilità di osservare le misure caratteristiche del business, ovvero della modalità di funzionamento della azienda, in modo distaccato ed imparziale.

Il secondo obiettivo è di definire un modello in grado di spiegare i dati del passato. Con questo modello non è solamente possibile comprendere le dinamiche di business, ma di centrare il terzo fondamentale obiettivo: prevedere la dinamica futura.

Quanti visitatori avrò alla fiera? Qual’è il limite strutturale delle componenti tecniche? Quando posso attendermi un picco nel business e regolarmi di conseguenza, anticipandolo ed approfittandone al meglio?

Sono tutte domande vitali per le aziende, ed è proprio il Data Scientist ad essere chiamato a rispondervi. Il Data Scientist è una figura sempre più richiesta, dotato di una solida preparazione matematica con un certo background informatico (database, in primis), che opera lungo quattro direttrici fondamentali.main-qimg-d9f961a492f073fbfed7202ef5badf17

La prima è l’estrazione dei dati dalle sorgenti a disposizione in azienda. Queste sorgenti sono eterogenee e di natura estremamente variegata, come ad esempio informazioni anagrafiche, socio-economiche, comportamentali, indicatori specifici di performance aziendali, e molto altro.

La seconda attività del Data Scientist è di condurre una analisi statistica delle informazioni estratte. I dati estratti dalle sorgenti sono eterogenei per loro natura, perché provengono da fonti diverse, ed è proprio il Data Scientist che ne costruisce una visione integrata in termini di variabili esplicative di sintesi, ciascuna dotata delle relative statistiche. Questa attività è di grande interesse per le aziende perché consente di rappresentare in modo obiettivo una vasta quantità di fenomeni, come
ad esempio le differenze comportamentali di acquisto per fasce di età, reddito o collocazione geografica, o la tendenza ad abbandonare l’uso di un certo servizio o pool di servizi.

La terza importante attività del Data Scientist è di identificare raggruppamenti omogenei rispetto ad uno specifico obiettivo aziendale. Idprevisionelucca2014entificare omogeneità nel business è importante perché consente da un lato di ottimizzare le azioni sul mercato, e dall’altro di rendere profittevole ciascun cliente individuandone le esigenze sulla base dei propri pari. Un esempio per tutti è dato dalle campagne di marketing, oggi fastidiosissime perché invadenti. Con queste tecniche è possibile inviare il messaggio giusto alla persona giusta, anticipandone i bisogni.

Ed è proprio sull’anticipo dei bisogni, o sulla previsione, che è centrata la quarta importante direttrice di azione del Data Scientist: intercettare schemi del passato per formulare previsioni affidabili sul futuro. Grazie al mix di competenze matematiche ed informatiche, il Data Scientist è in grado di costruire e di realizzare strumenti informatici basati su modelli matematici che individuano gli schemi ricorrenti nei dati. Questi modelli sono in grado di formulare predizioni del futuro, corredandole di indicatori che riflettano l’effettiva probabilità che queste possano verificarsi. Un esempio di grande interesse per le aziende è il churn o abbandono. I modelli predittivi, opportunamente addestrati, consentono di identificare i clienti che abbandoneranno l’uso di un prodotto o servizio, prima ancora che ciò avvenga.

Il Data Scientist è, quindi, un mestiere che promette bene. Per diventare Data Scientist occorre una laurea in Matematica, Statistica, Fisica, Ingegneria o Informatica. Il resto, lo fa la caparbietà della persona e, ovviamente, il mercato.

Per i più curiosi, vi lasciamo con una serie di link di approfondimento.

-> Vai all’approfondimento su un caso d’uso in Predictive Analytics

-> Vai alla analisi della diffusione di Ebola

-> Vai al calcolo del limite teorico del record del mondo sui 100 metri piani

Share
Questa voce è stata pubblicata in Scienza oggi e contrassegnata con , , , , , , . Contrassegna il permalink.

2 risposte a Il Data Scientist, mestiere del terzo millennio

  1. Pingback: La sfida Open Source al Predictive Analytics | LidiMatematici

  2. Pingback: Predictive Analytics: una leva fondamentale per ridurre l’incertezza del Business | LidiMatematici

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *