Dallo Strutturalismo al Deep Learning al calcolatore

originalOrmai diverso tempo addietro abbiamo parlato del linguista svizzero Ferdinand de Saussure, padre dello strutturalismo. Secondo Saussure, un termine ha significato di per sé indefinito, ma lo acquisisce dalla rete di relazioni con i termini che figurano, sistematicamente, nel suo contesto.

La scienza medica e la psicologia cognitiva non hanno ancora fornito una spiegazione sul modo in cui il cervello umano impara, o definisce, i significati dei termini o dei segni in generale. La tesi di Saussure è interessante perché apre la strada all’ipotesi che siano gli schemi specifici in cui appaiono i segni a definirne il significato.

Fu proprio Saussure a proporre il Triangolo Semiotico come mezzo illustrativo del cosiddetto processo di significazione, in cui segno, significato, significante e referente concorrono alla comunicazione attraverso schemi condivisi dalla stessa comunità di parlanti. Il segno linguistico è infatti completamente arbitrario e assume significato con 300px-triangolo_semioticol’uso, ovvero mediante il contesto in cui appare. In sostanza il linguaggio è una convenzione.

Quando ci occupammo per la prima volta dei temi dello strutturalismo e dell’impatto potenziale sull’apprendimento al calcolatore era il 2011 e, nel frattempo, sono cambiate parecchie cose. Innanzitutto c’è stato l’avvento dell’era dei cosiddetti Big Data & Analytics, ovvero delle tecnologie che consentono di trattare grandi moli di informazione con modelli statistici sofisticati.

Questa novità rende di fatto possibile insegnare ad una macchina a costruire il significato di un discorso o di un intero corpus di testi anche piuttosto esteso, come ad esempio l’intera Wikipedia.

In qualsiasi lingua.

L’idea che presentò Saussure nel suo Corso di Linguistica Generale, ormai oltre cento anni fa e per la precisione nel 1916, si è rivelata infatti fondamentale non solo per comprendere come si genera il linguaggio umano, ma anche per costruire modelli matematici che intercettano la relazione tra i concetti.

L’innovazione di Saussure, vincente per lo sviluppo della linguistica computazionale, sta nel principio ipotetico secondo il quale il significato di un termine, o la definizione di un concetto generale, possa essere costruita sulla base dei termini che appaiono nel suo stesso contesto. Il significato è definito dalla struttura di significati ad esso connesso, lo strutturalismo, appunto.

Un po’ come a dire che non abbiamo bisogno di sapere cosa sia una mela per definirla, basta sapere che è dolce, rossa e che si può mangiare. Oggi, che abbiamo a disposizione testi da milioni di parole, grazie al web, e una enorme disponibilità di risorse scientifiche, come ad esempio il linguaggio Python di cui abbiamo parlato la volta scorsa, l’idea di Saussure ha trovato piena applicazione.

Dal 2008 il matematico cecoslovacco Radim Řehůřek ha iniziato a sviluppare una rete neurale che ha l’obiettivo di convertire le parole di un qualsiasi linguaggio naturale in vettori di numeri reali e, su questo, applicare un processo di apprendimento profondo, o Deep Learning, in modo da scendere al massimo livello di dettaglio possibile attraverso una qualsiasi rete di concetti. Obiettivo: rappresentare il significato di tutti i termini trovati nel testo in base al contesto in cui sono collocati.

Il modulo, che va sotto il nome di Gensim, è stato inizialmente sviluppato in vari spezzoni di codice per la libreria di matematica digitale cecosclovacca, per poi trovare una struttura più omogenea e, dal 2008 a oggi, ha visto una crescita costante fino a diventare una vera e propria libreria, gratuita e disponibile online, che consente di paragonare testi sul principio della similarità semantica. Da qui il nome di GenSim, ovvero Generatore di Similarità semantica.

Gensim, ad oggi il più robusto algoritmo di Deep Learning per il calcolo di similarità semantica, consente di eseguire operazioni al limite della fantascienza. Una volta addestrata la rete neurale su un testo qualsiasi ed in qualsiasi lingua, è possibile interrogarla per farsi restituire il termine più simile ad uno qualsiasi, ad esempio interrogandolo con la parola “mela” risponde con tutti i frutti simili. O calcolare proporzioni semantiche, come ad “giovane” sta a “bello” come “vecchio” sta a ?

E Gensim risponde “buono”.

Negli anni a venire il Deep Learning svolgerà un ruolo sempre più preminente nel contesto di business. Con l’avvento dei Social Network, infatti, le interazioni con i clienti a mezzo testo avvengono con maggior frequenza e, soprattutto, con volumi importanti.

Così le aziende possono utilizzare tecnologie semantiche per classificare automaticamente il contenuto delle interazioni via chat, telefono, sms o e-mail e stabilire una classifica degli argomenti di maggior interesse per i propri clienti (trending topics), ricercare le comunicazioni per significato inteso anziché per parola chiave (full text search), valutare la percezione del proprio marchio (brand awareness), o il grado di soddisfazione dei clienti (sentiment analysis). Per fare ancora alcuni esempi  le risorse umane potrebbero valutare la aderenza di un curriculum vitae rispetto ad una posizione lavorativa specifica in base alla similarità semantica dei termini, mentre una azienda di assistenza tecnica potrebbe estrarre automaticamente le informazioni sui guasti e/o interventi sul campo dal testo libero compilato nelle schede di intervento.

Si tratta, ovviamente, di esempi non esaustivi, ma la tendenza dei prossimi anni è già chiara ed evidente: avremo macchine sempre più “intelligenti”, ovvero capaci di estrarre conoscenza osservando il mondo che le circonda e, grazie a questa, interagire con noi “umani” in modo mirato ed efficace.

-> Vai all’approfondimento su Ferdinand de Saussure

Share
Questa voce è stata pubblicata in Scienza oggi e contrassegnata con , , , , , , , , , , , , , . Contrassegna il permalink.

Una risposta a Dallo Strutturalismo al Deep Learning al calcolatore

  1. Pingback: Predictive Analytics: una leva fondamentale per ridurre l’incertezza del Business | LidiMatematici

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *