Un modello predittivo del numero di visitatori: il caso di Lucca Comics & Games

luccacomicslogo2015In questo blog ci siamo occupati a più riprese di Data Mining e Modelli Predittivi, cioè di processi analitici destinati a trovare relazioni ricorrenti tra i dati e di sfruttarle nientemeno che … per prevedere il futuro. In questo articolo vogliamo esaminare un caso concreto, per tentare di fornire una previsione del numero di vistatori di un evento di grande richiamo.

Si tratta della manifestazione Lucca Comics & Games, che ha visto un crescendo di visite negli ultimi anni e che, per questo motivo, ha dovuto modificare la politica di vendita dei biglietti, da quest’anno interamente online. Adottando un modello opportunamente addestrato, è possibile non solo valutare l’impatto della nuova politica di vendita, ma anche prevedere il numero di visitatori che avrebbe visitato la fiera, posto che le condizioni di vendita non fossero state modificate.

Un modello predittivo consente di rispondere a queste e altre domande decisamente interessanti: quanti visitatori avrebbe accolto la manifestazione se le regole non fossero cambiate? Le nuove regole sono giustificate rispetto alla dinamica delle visite?

Ma andiamo con ordine, questo grafico mostra i numeri delle visite dal 1993 al 2014, in continuo aumento. Il picco del 2014, con ben 240 mila visitatori, ha creato non pochi problemi di ordine pubblico alla città di Lucca. Gli organizzatori hanno deciso, quindi, di limitare il numero di visite ai soli spettatori paganti con prenotazione online, e con tetto di 80 mila biglietti giornalieri, per tutte e quattro le giornate della manifestazione, da giovedì 29 ottobre a domenica primo novembre.

lucca93-15

Serie storica del numero di visitatori di Lucca Comics dal 1993 al 2014

 

Le visite si concentrano tipicamente nella giornata del sabato, con un terzo dei visitatori totali, mentre gli altri giorni si ha tipicamente tra un quinto ed un quarto delle visite, come da grafico a torta seguente. Ovviamente la nuova politica di vendita dei biglietti avrà un impatto importante, anche perché i prezzi sono stati modulati proprio in funzione delle giornate: più costosi il sabato e meno onerosi gli altri giorni.distribluccacomics Gli anni passati non prevedevano questa differenziazione.

La sempre maggiore notorietà della manifestazione ha fatto imboccare a questa serie un andamento esponenziale, che va chiaramente limitato tramite opportune azioni, proprio come è stato fatto per l’edizione 2015. Dall’analisi di questa serie risulta che l’andamento è letterlamente esponenziale. Fingiamo ora di collocarci indietro nel tempo, a settembre 2014, e di non sapere che ad ottobre dello stesso anno la manifestazione avrebbe avuto 240 mila visite.

Il grafico che segue dimostra che è possibile addestrare un modello con un errore medio decisamente ridotto, con una precisione (statistica) di più o meno 20 mila visitatori per tutte e quattro le giornate, e cioé del 8,5%, davvero pochissimo.

La previsione per il 2014 sarebbe stata di 251 mila visitatori, contro i 240 mila effettivi.

previsionelucca2014

Previsione del numero di visitatori nel 2014, effettuata a settembre 2013

Rieseguiamo quindi lo stesso esercizio includendo i dati del 2014, per prevedere il numero di visitatori del 2015. Il grafico che segue mostra il nuovo modello esponenziale identificato (in rosso), sovrapposto ai dati reali (in blu).Con questi dati, la previsione per l’edizione 2015 è della ragguardevole cifra di 288 mila visitatori. Il dato del 2016 è puramente indicativo, poiché la complessità del modello scelto non è congruente con previsioni a due anni, che richiedono un approccio più sofisticato.

previsionelucca2015

Previsione per la prossima edizione di Lucca Comics & Games 2015

Il grafico seguente mostra la distribuzione dei giornalieri per le quattro giornate della manifestazione, con circa 56 mila visite il giovedì, 75 mila il venerdì, 95 mila il sabato e 62 mila la domenica. Il tetto di 80 mila biglietti sarebbe quindi applicabile alla sola giornata di sabato 31 ottobre.

proiezvisitelucca2015

Proiezione del numero di visite giornaliere per l’edizione 2015

Le proiezioni non tengono conto della nuova modalità di vendita, rispetto a cui non sono ancora disponibil dati statistici con cui correggere il modello. Alla data di oggi in realtà la vendita online dei biglietti sta andando decisamente a rilento, evidenziando dati in controtendenza anche rispetto alle manifestazioni degli scorsi anni. Non abbiamo dati storici di vendita dei biglietti nei due mesi precedenti, per le manifestazioni dello scorso anno: con quelli sarebbe possibile anche prevedere l’andamento delle vendite, che si auspica vedrà un picco a ridosso dell’inizio della manifestazione e per tutto il mese di ottobre.

La novità della vendita dei biglietti esclusivamente online è un cambiamento significativo. Il modello mostra chiaramente come, se le quote di vendita non dovessero seguire la tendenza esponenziale in essere, la causa sarebbe sicuramente da imputare alla modalità di vendita che avrebbe agito da “filtro”, riducendo così il numero dei visitatori.
I

->  Vai all’approfondimento sul Data Mining
-> Vai all’analisi dei dati epidemici di Ebola
-> Vai alla previsione del record mondiale di Usain Bolt

(Elaborazione del modello dati: Casio Classpad II FX-400)

Share
Questa voce è stata pubblicata in Teoria e Pratica e contrassegnata con , , , , , . Contrassegna il permalink.

3 risposte a Un modello predittivo del numero di visitatori: il caso di Lucca Comics & Games

  1. Stefano scrive:

    Caro blogger,

    La vera domanda, sui modelli esponenziali è: quando il modello esponenziale comincerà a sbagliare ? Intendo dire che la crescita esponenziale è esplosiva, e tende ad infinito. E nessun fenomeno reale (men che mai umano) tende all’infinito.

    Ad esempio è facile dire che entro il 2030 non vi sarà alcuna edizione della mostra con più di 8 miliardi di visitatori (ovvero tutta l’umanità esclusi forse gli ultra centenari e gli infanti) , eppure ho la sensazione che il tuo modello esponenziale potrebbe arrivare a quei valori (anche se non ho visto l’esponente (!))

    Una domanda più interessante dunque, è quella di capire quando la crescita raggiungerà il su massimo e poi comincerà a decrescere, per tendere infine a 0.
    Per farla breve, l’esponenziale non è che il primo tratto di una sigmoide (o logistica) che fatalmente si presenterà.

  2. LidiMatematici scrive:

    Corretto,
    proprio per questo motivo per previsioni più a lungo termine occorre un approccio più sofisticato. In realtà le esponenziali sono quasi sempre “inizi” di regressioni logistiche.
    Accade tuttavia che un miglior “fitting” del modello a breve termine in questa parte di regione sia proprio ottenibile da una esponenziale che, appunto, a lungo termine va usata con estrema cautela.

  3. Pingback: Decisioni strategiche e Predictive Analytics: un caso d’uso | LidiMatematici

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *