Big Data

Big data, intelligenza artificiale e linguistica computazionale

Uno degli ambiti di applicazione più interessanti della Linguistica computazionale e della IA è quello relativo alla raccolta e classificazione delle informazioni presenti nel nostro universo digitale. Dati fondamentali per la ricerca nel Web, per la profilazione degli utenti, per la costruzione di domini di conoscenza e per altro ancora.



Ma iniziamo dai big data. Cosa sono realmente?
Enormi quantità di informazioni? Sì, ma non solo. Anzi! L’elemento chiave non è tanto la quantità di informazioni quanto la velocità con cui possono essere raccolte, classificate e soprattutto analizzate grazie ad algoritmi capaci di fare computazioni prima possibili soltanto grazie a computer dai costi nell’ordine del milione di dollari.

Il concetto di big data rimanda soprattutto a questo: alla possibilità di ricavare accuratissime analisi a partire da una quantità notevole di dati in una quantità minima di tempo. Lo scopo è quello di fare previsioni su scenari futuri che sarebbero sfuggiti al calcolo umano ma non sfuggono a quello della macchina. In una parola, monetizzare i dati.

Anche se gli ambiti di utilizzo sono vari, la prima applicazione a cui si pensa è quella del marketing e della profilazione degli utenti. Ogni volta che un motore di ricerca ci mostra annunci personalizzati sulle nostre preferenze – tra quelle di milioni di altri utenti – ci troviamo davanti a quello che si definisce come “metodo di raccomandazione” offerto proprio grazie ai big data.

In questo universo di informazioni, ovviamente, i grandi colossi del Web e i social network sono come sempre una finestra interessante. Per citare solo due esempi tra quelli più noti, nel 2019 Twitter rappresentava il social meno “popolato” con soltanto 330 milioni di utenti (sic!) mentre il più frequentato era Facebook, con 2,4 miliardi di utenti mensilmente attivi.
Appare scontato che con simili cifre a disposizione sia possibile fare analisi estremamente precise sui trend di mercato, per creare campagne di marketing funzionali e mirate tanto a livello tanto locale quanto globale.

La profilazione dei clienti non è però l’unica sfera di applicazione dei big data che possiamo sperimentare nella quotidianità.

Un altro ambito di applicazione che tocchiamo con mano ogni giorno, infatti, è quello legato alla costruzione dei motori di ricerca semantica e più in generale della conoscenza in Rete. Nella cosiddetta keyword search infatti – che è la modalità adottata da alcuni dei maggiori motori di ricerca come Google e Yahoo! – il gioco forza lo fa la “semplice” ricerca di parole chiave all’interno dei dati.
Ancora, la classificazione automatica di grandi quantità di dati ha dato un impulso enorme alla progettazione di ontologie digitali, ovvero raccolte di informazioni relazionate tra loro relativamente a specifici domini della conoscenza. Anche qui la Linguistica computazionale ha giocato e continua a giocare un ruolo importante, accanto agli approcci statistici e naturalmente alla potenza di calcolo data dagli algoritmi.

Un punto di incontro tra i temi appena accennati è il cosiddetto Semantic Web, che trova proprio nel commercio online uno dei suoi settori più vivaci, visto che per ottenere la maggiore visibilità possibile è necessario descrivere al meglio gli articoli in vendita online. Anche qui, grazie allo sviluppo tecnologico e agli avanzamenti degli ultimi anni, troviamo strumenti che vanno incontro alle esigenze del mercato in modo sempre più mirato: uno di quelli più noti per la visibilità degli shop online, ad esempio, è GoodRelations, un’ontologia realizzata per classificare e mettere in relazione tra loro, appunto, tutti gli elementi e tutti gli attori che partecipano ad una compravendita online.

A ben guardare, anche sulla base dei pochi esempi riportati qui, appare chiaro che la rivoluzione dei big data è in atto da tempo, anche se purtroppo resta ancora una rivoluzione di nicchia perché – come spesso accade – la maggior parte delle risorse è nelle mani di pochi. E, in questo caso, le risorse sono i nostri dati.

E qui arriviamo all’ultimo punto della questione, ovvero quello legato al trattamento dei dati degli utenti, alla loro conservazione e al loro utilizzo – che troppo spesso avviene senza che il consenso da parte degli interessati sia esplicito. Una questione che ha costretto di recente diversi enti nazionali e sovranazionali a prendere provvedimenti – come nel caso del G.D.P.R. europeo – per tutelare gli interessi degli utenti il cui cosiddetto diritto all’oblio, ovvero la possibilità di “sparire” da determinate banche dati, deve essere sempre e necessariamente garantito.

Seguici su Facebook, Twitter e Linkedin e consulta la nostra pagina Novità per saperne di più sul mondo dell’Intelligenza Artificiale e capire i funzionamenti delle nuove tecnologie.

Condividi:

Post correlati

Innovazione e imprenditorialità: Logogramma tra le realtà innovative

Logogramma tra le realtà all’avanguardia sul territorio, per un momento di confronto e scambio tra ricercatori, imprese e accademia, in occasione dell’evento Percorsi di Innovazione e Imprenditorialità nell’ambito del progetto Pathways to Innovation and Entrepreneurship finanziato dall’Ambasciata degli Stati Uniti d’America in Italia e coordinato dalla professoressa Mita Marra dell’Università degli Studi di Napoli Federico II.

Hai qualcosa da chiederci?