Decisioni strategiche e Predictive Analytics: un caso d’uso

luccacomicslogo2015A circa un mese di distanza, riprendiamo l’analisi del numero di visitatori previsti per la manifestazione Lucca Comics & Games. E’ uno scenario di business particolare, perché Lucca Comics è una manifestazione ormai estremamente ben posizionata nel mercato, che dal 1993 macina consensi sempre crescenti, tanto da avere un andamento del numero di visitatori assimilabile all’esponenziale.

L’edizione scorsa ha visto, infatti, un picco notevole di oltre 240 mila visite, con non pochi problemi di ordine pubblico. Il potenziale di questa manifestazione è tale da far prevedere, in assenza di modifiche strutturali al processo di vendita e alla manifestazione stessa, che il numero di biglietti venduti per l’edizione 2015 arrivi a sfiorare i 290 mila.

Nel post precedente abbiamo proposto un modello predittivo per la valutazione del numero potenziale di visitatori per le edizioni a venire, riassunto in questo grafico:

previsionelucca2015

e relativa distribuzione delle visite nelle quattro giornate, dal giovedì alla domenica.

Dato l’indubbio potenziale della manifestazione e grazie ai problemi di ordine pubblico delle scorse edizioni, il gruppo dirigente della manifestazione ha preso una serie di decisioni di sicuro impatto sul business, ovvero:proiezvisitelucca2015

– Vendita dei biglietti esclusivamente online.
– Aumento del costo dei biglietti selettivo, proporzionale al numero dei visitatori delle scorse edizioni.
– Tetto al numero di biglietti: 80.000 al giorno.
– Appoggio ad un circuito di vendita esterno, con ulteriore incidenza sui prezzi all’utente finale.
– Pubblicazione giornaliera dei dati delle vendite nei quattro giorni della manifestazione.
– Eventuale vendita in loco dei biglietti residui, rispetto alla tetto prefissato.

Ed ecco i risultati delle vendite online, a meno di un mese dall’inizio della manifestazione:
Nelle ascisse, cioè l’asse orizzontale, il grafico riporta il numero di giorni dall’inizio della prevendita. Al trentatreesimo giorno siamo a circa 46000 unità vendute. Notevolemente inferiore alle 80000 giornaliere, target di vendita.

I dati della prevendita online mostrano chiaramente come le decisioni strategiche intraprese abbiano prodotto un trend di vendita online decisamente sottotono. Il giorno di Sabato, notoriamente critico, proprio quello che aveva visto il picco di oltre cento mila visitatori nelle scorse edizioni, si attesta – alla data di oggi – sotto le 16 mila unità vendute.

trendluccaday

Trend delle vendite ad oggi per i quattro giorni della manifestazione

Vogliamo mostrare come, attraverso tecniche di Predictive Analytics, sia possibile costruire modelli predittivi in grado di valutare gli scenari possibili, attuabili prima dell’inizio della manifestazione, ovvero nelle prossime tre settimane.

Dal punto di vista del trend di vendita, si possono delineare tre scenari:

1. Gli utenti sono perfettamente al corrente del tetto di vendita, ed hanno deciso di ignorare l’obbligo di prevendita online, fidando sul fatto di poter acquistare le quote residue sul posto ed evitando quindi i sovracosti di prevendita.

2. Gli utenti non sono sufficientemente informati della nuova strategia di prevendita e ad usare il servizio online è una quota parte fisiologica.

3. Gli utenti sono in attesa degli sviluppi della prevendita online, e potrebbero decidere all’ultimo minuto, caoticamente, di precipitarsi all’acquisto per non perdere il posto.

Lo scenario 1 è quello in cui le prevendite seguono una caratteristica curva di iniziale rilento, poi tendenza costante alla crescita, per poi stabilizzarsi a ridosso della chiusura. E’ la tipica regressione logistica, di cui ci siamo occupati più volte in questo blog.

Lo scenario 2 è la classica situazione in cui una quota parte del fenomeno che si vuole osservare è fisiologica e stazionaria, cioè avviene sempre nello stesso modo. In questo caso si applica una curva di regressione che va con una potenza della variabile indipendente, nel nostro caso i giorni. E’ la tipica regressione potenza.

Lo scenario 3 è caotico ed imprevedibile, picchi estemporanei non sono infatti modellabili mediante tecniche analitiche.

Data la natura divulgativa di questo articolo, è chiaramente troppo complesso applicare modelli sofisticati come le serie ARIMA, su cui torneremo in post successivi, tuttavia è possibile addestrare modelli piuttosto aderenti al dato reale, come riassume la figura seguente, che confronta vendite reali e dato previsto per i due modelli, lineare e logistico:

confrontoaddestra

Confronto tra dato reale e modelli predittivi

Assolutamente interessante notare come il modello migliore adottabile tra le regressioni sia proprio un modello lineare. Come già detto negli articoli precedenti, i modelli predittivi sono dotati di specifici indici di bontà di adattamento. Indice che, nel caso del modello lineare è il coefficiente di correlazione, che tende proprio ad 1. Una chiara indicazione che l’aderenza del modello rispetto ai dati reali è importante.

Applichiamo quindi i due modelli per prevedere il numero di biglietti venduti nei giorni a venire e fino all’inizio della manifestazione, ovvero dal 34mo al 60mo giorno dall’inizio della prevendita, ed ecco il grafico che ne risulta:
Si può ragionevolmente ipotizzare che, alla fine della prevendita e salvo ondate di panico collettive dell’ultimo minuto – quelle sì, imprevedibili – il numero previsto di biglietti venduti si attesti (stima in migliaia) tra le 60 e le 70 mila unità.

raffrontomodelliluccaco

Previsione delle vendite nei giorni a venire

E’ importante notare che i modelli di Predictive Analytics non hanno come scopo produrre previsioni esatte, ma di indicare strategie di business. Il driver è sempre il business, non il dato. Tra le pieghe di questi modelli sono infatti nascoste indicazioni importanti, dal punto di vista del business.

La prima è che il modello di regressione logistica, quello destinato allo scenario in cui le vendite partono a rilento per poi accelerare e stabilizzarsi nuovamente, fornisce una stima inferiore al secondo scenario. Questo vuol dire che, stando così le cose, non è prevedibile un aumento delle vendite, ma che i dati indicano proprio come la quota parte di utenti che usano la prevendita online sia, semplicemente, fisiologica. Sempre, chiaramente, che non si verifichi un picco di panico da acquisto dell’ultimo minuto, dovuto a fattori imprevedibili. La seconda è che le decisioni intraprese hanno, purtroppo, impattato in modo negativo sulle vendite o, quantomeno, determinato un utilizzo del canale online decisamente inferiore a quello atteso.

Cosa può fare il business, allora? Innanzitutto lavorare sulla comunicazione, tentando di recuperare la quota parte residua di utenti che non ha ancora realizzato che la vendita è solamente online.

Esiste, tuttavia, la non trascurabile possibilità che ad impattare negativamente sul trend di vendita sia stata la politica dei prezzi, cosa che rende estremamente più complesso il recupero della situazione.

Questo caso d’uso dimostra chiaramente il valore aggiunto del Predictive Analytics per le decisioni strategiche di business: ne sentirete parlare parecchio negli anni a venire.

LidiMatematici va in pausa e torna tra due lunedì.

-> Vai al post scorso

-> Vai al sito della manifestazione

->  Vai all’approfondimento sul Data Mining

-> Vai all’analisi dei dati epidemici di Ebola
-> Vai alla previsione del record mondiale di Usain Bolt

(Elaborazione del modello dati: Casio Classpad II FX-400)

Share
Questa voce è stata pubblicata in Teoria e Pratica e contrassegnata con , , , , , . Contrassegna il permalink.

2 risposte a Decisioni strategiche e Predictive Analytics: un caso d’uso

  1. Pingback: Il Data Scientist, mestiere del terzo millennio | LidiMatematici

  2. Pingback: Predictive Analytics: una leva fondamentale per ridurre l’incertezza del Business | LidiMatematici

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *