La sfida Open Source al Predictive Analytics

datamining2Ci siamo occupati a più riprese di Predictive Analytics e Data Mining, in questo blog. Sappiamo che queste due discipline stanno vivendo un momento d’oro nel panorama dell’Information Technology moderna.

Lo ricordiamo, il Data Mining è quella branca delle Scienze dell’Informazione che consente di derivare informazioni dal dato anche quando queste non sono espressamente dichiarate nelle basi dati. I sistemi di Predictive Analytics rappresentano proprio la sfida ultima delle imprese: dotarsi di sistemi informatici, processi, algoritmi e servizi in grado di osservare continuamente il dato, nel momento in cui si materializza, e derivarne informazioni che possono essere cruciali per operare nel contesto di business in cui opera l’azienda.

Le applicazioni sono numerose e spesso sorprendenti, compresa la previsione del futuro. Una azienda che si dota di modelli predittivi è in grado di operare sul mercato prima ancora che gli eventi del mercato si verifichino. Giusto per citare qualche esempio:
– posso prevedere se il cliente abbandonerà la mia azienda?
– posso prevedere il flusso di incassi nel prossimo mese, due mesi, tre mesi e oltre?
– posso stimare il valore atteso di un cliente nei prossimi mesi?
– cosa e come devo comunicare al cliente in modo da anticiparne i bisogni e rendere massima la probabilità di trarne valore?
– quali clienti sono a rischio insolvenza?

Ed è un elenco breve, a meramente esemplificativo, appunto. Il Data Mining affonda le radici nel passato delle Università, con solide pubblicazioni scientifiche ormai da oltre venti anni. Eppure solo oggi si comincia a vederne un uso attuale e, soprattutto, proficuo per le aziende. Fino a ieri, però, le aziende dovevano spendere una cifra piuttosto consistente del proprio budget per dotarsi di strumenti analitici efficaci, come ad esempio SAS o IBM SPSS.

Oggi il quadro sta cambiando e, complice la proliferazione dell’Open Source, ovvero del Software Libero, anche Predictive Analytics inizia ad essere alla portata delle PMI (Piccole e Medie Imprese). Insomma, non bisogna essere dei paperoni per avere sistemi “intelligenti” in grado di rendere il proprio business non più reattivo agli eventi, ma proattivo, cioè in grado di anticiparli. E la novità interessante è che anche le grandi aziende iniziano a percepire l’importanza di realizzare un significativo risparmio dotandosi di Predictive Analytics, risparmio ancor più consistente se queste vanno a braccetto con l’Open Source.

Così, mentre da anni il software R è a disposizione per le università per realizzare modelli predittivi anche di notevole complessità, iniziano ad essere disponibili anche componenti che rendono interessante l’applicazione, e profittevole, in contesti aziendali. Il linguaggio Python ne è un esempio, consentendo di realizzare componenti di automazione di processo a costo relativamente basso, abbattendo completamente l’impatto delle licenze sul totale della lista della spesa a carico delle aziende.

Non mancano soluzioni anche sul fronte delle basi dati di grandi dimensione, o Big Data. Un esemmpio per tutti è Apache Hadoop, framework per la gestione di basi dati distribuite di grandi dimensioni  e Apache Spark, una suite completa non solo per il Machine Learning, branca di fatto parallela al Data Mining per l’automazione dell’apprendimento al calcolatore, ma anche per la generazione di grafici dinamici ed interrogazioni delle basi dati tramite SQL (Structured Query Language), il linguaggio d’elezione – ormai standard mondiale – per la interrogazione e gestione delle basi dati.

Oggi tutti parliamo con Siri e Cortana, i nostri assistenti virtuali rispettivamente per il mondo iOS ed Android: anche le tecnologie di elaborazione del linguaggio naturale (NLP – Natural Language Processing) sono implentabili mediante software libero, come Apache OpenNLP, una suite completa di classificazione, disambiguazione, interpretazione del linguaggio naturale.

Possiamo ben immaginare che, in un quadro di tale fermento,  ci sia veramente tanto da proporre e da realizzare e saranno soprattutto le competenze a rappresentare il vero valore aggiunto. Con le tecnologie non proprietarie, infatti, a vincere sarà il più veloce ad identificare l’opportunità di business, ed il più bravo a realizzarla. Un quadro roseo di cui possono beneficiare soprattutto i giovani, che potranno accedere in completa autonomia a tecnologie che, fino a ieri, erano appannaggio solamente dei grandi colossi.

Giovani che, va da sé, è imperativo siano sempre più preparati.

-> Vai agli articoli di approfondimento sul blog

Share
Questa voce è stata pubblicata in Teoria e Pratica e contrassegnata con , , , , , , , , . Contrassegna il permalink.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *