Dino Pedreschi, la società riflessa nei Big Data

Dino Pedreschi, la società riflessa nei Big Data
  • 9
  •  
  •  
  •  
  •  
  •  
  •  
    9
    Shares

L’emergere di disuguaglianze, la diffusione di innovazioni, la polarizzazione delle opinioni e l’intelligenza della comunità

Comunità virtuali. Benvenuti nella società dell’informazione dove le opinioni si confondono con i fatti e dove l’influenza (non quella suina) spesso prende il posto della competenza. Tra le pieghe delle comunità virtuali, i dati – però – possono indicarci la strada giusta. Liberi di rifletterci nello specchio che rimanda la nostra stessa immagine. Ma liberi anche di scoprire la realtà che si nasconde dietro le correlazioni nascoste, che ci spalancano la strada dell’incomprensibile, dello straordinario e della scoperta inattesa, che si trova soltanto quando si sbaglia o quando ci si perde. Oltre i luoghi e il senso comune. Il Festival della Mente di Sarzana ha mostrato tutte le sfaccettature del concetto ambiguo di comunità in rapporto alla moltiplicazione dei contenuti, delle opzioni di scelta e delle identità. Perché le idee e l’innovazione nascono sempre dal terreno fertile delle differenze. Un concetto di appartenenza e relazione in bilico tra le categorie classiche di società e comunità che si riflette nei dati, che disseminiamo nella “infosfera” e che costantemente raccontano, chi siamo e cosa desideriamo, mostrando anche qualche volta il loro lato oscuro. Fuori e dentro le imprese, il concetto di comunità si estende con le sue regole, le sue contraddizioni e i suoi fossati. E può essere interpretato e declinato in modi diversi. Tra gli ospiti più attesi della XV edizione del Festival, Dino Pedreschi, pioniere della Data Science, professore di Computer Science all’Università di Pisa, che ha spiegato come i Big Data possono offrirci una nuova prospettiva di osservazione per misurare e prevedere l’emergere di disuguaglianze, la diffusione di innovazioni, la polarizzazione delle opinioni, la diversità e l’intelligenza della comunità. Ma attenzione. Quando si parla di Big Data non bisogna confondere mai correlazione con causalità. Non bisogna commettere l’errore di pensare che un modello predittivo valga per sempre e che “big” sia sinonimo di qualità. E quando si parla di Intelligenza Artificiale (AI) occorre non farsi ingannare dall’aggettivo “artificiale”. Non credere che l’AI sia necessariamente più oggettiva e affidabile dei giudizi umani, e non puntare a una AI che sostituisce il lavoro e il contributo delle persone.

Data Manager: Che cosa ci possono raccontare i dati?

Dino Pedreschi: I dati sono il prodotto della società digitale, e costituiscono la differenza forse più sostanziale con la società analogica in cui si è sviluppata l’umanità fino a pochi anni fa. Nella società di oggi, le attività di tutti i giorni, mediate attraverso le tecnologie digitali, lasciano traccia. Ogni apparecchiatura che usiamo per muoverci, comunicare, pagare, cercare in rete, leggere, giocare, fare sport, scrivere, fare operazioni in banca, lascia traccia delle nostre azioni, delle nostre scelte. E ovviamente c’è molto, in queste tracce, delle nostre preferenze, dei nostri interessi, delle nostre emozioni, dei nostri pregiudizi. Sia come singoli individui che, a maggior ragione, come collettività.

Come si estrae senso dai dati?

Mettere in condizione i dati di raccontarci delle storie individuali o collettive è un’operazione complessa, piena di ostacoli da superare e errori da evitare. In questa ricerca di senso consiste la scienza dei dati, l’evoluzione dell’informatica e della statistica iniziata trenta anni fa, quando i dati non erano ancora così “big” ma era già chiaro, per noi ricercatori di “data mining” e “machine learning”, che avrebbero cambiato il mondo.

Leggi anche:  Dell EMC porta i vantaggi del machine e deep learning a tutte le aziende

Che cosa possiamo chiedere ai dati?

Ai dati si può chiedere di svelarci il meccanismo dietro un sistema complesso, come il traffico di una grande città, la dinamica del mercato finanziario o di una epidemia, il diffondersi di nuove tendenze ed emozioni, o anche il meccanismo di sviluppo di malattie complesse come i tumori o il diabete. A patto, però, che i dati siano sufficienti a descrivere accuratamente i fenomeni che vogliamo comprendere, a misurarli, quantificarli e, in prospettiva, a prevederli. Perché solo i ciarlatani cercano di prevedere il futuro senza dati, se invece abbiamo osservazioni abbastanza dettagliate su un fenomeno, anche inaspettato o bizzarro – un cigno nero – possiamo creare dai dati un modello fisico-matematico che può prevederne lo sviluppo. Proprio per questo è necessaria una scienza dei dati, che ci aiuti a capire quando abbiamo dati di sufficiente qualità e come usarli per costruire modelli affidabili dei sistemi sociali, economici, biologici che ancora non conosciamo appieno – ed anche come analizzare questi modelli per capirne i limiti e i difetti, e migliorarli costantemente.

Siamo pedinati dagli algoritmi e guidati dalle emozioni. Questo che cosa significa?

Fino ad ora l’applicazione prevalente dei Big Data è stata la pubblicità, nella sua variante, moderna ma antichissima, del “marketing” personalizzato: scoprire i gusti di uno specifico cliente per assecondarli e riuscire a vendergli qualcosa in più. I giganti del web fanno questo mestiere, utilizzando i dati, riuscendo a portare a livello globale, a miliardi di clienti. In pratica, quello che il pizzicagnolo sotto casa degli anni 60 era bravissimo a fare coi clienti del vicinato, ovvero farsi un quadro il più possibile preciso dei desideri di ciascuno per proporre in modo personalizzato il prodotto giusto.

Un puzzle delle nostre vite?

Esatto, ed è costruito dagli algoritmi per l’analisi dei dati relativi all’attività pregressa di ciascun cliente. Gli algoritmi di profilazione di Amazon, Facebook, Google e compagnia non si limitano a raccogliere dati, ma cercano anche di collegarli componendo il puzzle delle nostre preferenze, della nostra personalità, delle nostre emozioni, dei nostri orientamenti. E lo fanno con l’intenzione di sfruttare questa conoscenza su di noi per orientare le nostre scelte secondo le logiche aziendali: aumentare le vendite, aumentare i “like”, catturare la nostra attenzione, aumentare le nostre risposte ai contenuti pubblicitari mirati che ci propongono.

Conoscerci meglio per influenzarci meglio?

È un gioco molto efficace e remunerativo per le web corporations, ma molto rischioso per la società se applicato senza scrupoli, per esempio, nel mondo dell’informazione, dove se la gente ascolta solo quello che si aspetta di sentire si creano le bolle, le camere dell’eco, le fake news, l’intolleranza – e la democrazia va in crisi.

Leggi anche:  Vincere la complessità dei dati. È l’ora dello smart data management

L’innovazione si basa su tre pilastri: formazione, ricerca e trasferimento tecnologico. Stiamo facendo abbastanza?

No. Il mondo sta cambiando in fretta ma i governi dei paesi più ricchi, che hanno il dovere di fare avanzare le conoscenze a beneficio di tutti, non stanno ancora comprendendo l’importanza della sfida. Le grandi corporations, per le loro finalità, investono percentuali da capogiro dei loro favolosi guadagni in ricerca e sviluppo, fino al 20%, mentre i nostri governi solo una piccola percentuale del PIL, raramente sopra il 3%.

La sfida davanti a noi è enorme: il lavoro tradizionale sta trasformandosi per effetto del digitale e dell’Intelligenza Artificiale, molti lavori scompariranno, tutti cambieranno profondamente, nuovi lavori stanno lentamente emergendo. Eppure, si fa molto poco per aiutare i giovani a mettere insieme le competenze per affrontare un territorio nuovo, pieno non solo di ansia e paura ma anche di grandi praterie inesplorate. Occorre una sintesi fra la cultura che abbiamo costruito finora e quella che a tentoni stiamo costruendo adesso, nessuno ha la bacchetta magica ma occorre la convinzione di provarci, con uno spirito da “esploratori”.

Perché il GDPR è un traguardo importante?

Il GDPR è una grande occasione per le imprese europee, grandi e piccole. È un tassello importante di una via europea e umanista dei Big Data e della Intelligenza Artificiale, che mette la persona al centro, non la corporation. La materia prima della rivoluzione di cui parliamo sono i dati prodotti dalle persone, quindi i soggetti primi di questa rivoluzione sono le persone, punto. Non i soggetti che sfruttano i dati secondo modalità opache o ingannevoli. È assolutamente possibile, tecnicamente, far coesistere il diritto delle persone ad avere la propria sfera intima protetta dalle intrusioni non autorizzate con il diritto a far fluire l’informazione per creare benessere e valore secondo modalità trasparenti e comprensibili.

Che cosa devono fare le aziende?

Le aziende devono imparare ad accettare il rischio di far conoscere di più ai propri clienti, diminuendo l’asimmetria informativa fra utenti e azienda. Attrezzarsi per la battaglia decisiva: guadagnare e mantenere la fiducia dei propri utenti. Passare dal business “estrattivo”, lo sfruttamento dei dati che caratterizza l’idea di Big Data nell’immaginario di oggi, al business “partecipativo”, in cui conoscere meglio i propri clienti coesiste con il condividere con essi pezzi di questa conoscenza. La disponibilità di informazioni esaurienti sulle tracce digitali dei clienti aumenta la responsabilità delle imprese e pone la sfida della trasparenza.

Quali sono i rischi?

Se conosci molto dei tuoi clienti e usi questo potere in modo spregiudicato, prima o poi paghi il conto, si pensi a cosa è stato lo scandalo Cambridge Analytica per Facebook. Invece, ogni azienda è in grado di operare per migliorare la qualità della vita dei propri clienti, facendo forza sui dati che sono “big” anche a livello personale, ma che gli utenti fanno a fatica a raccogliere, comprendere, usare per raffrontarsi con gli altri e confrontarsi con l’azienda. Le imprese più innovative saranno quelle che sapranno restituire conoscenza utile e usabile ai propri clienti. L’Europa, e l’Italia in particolare, ha un’occasione unica per affermare un modello “umano” dei Big Data e dell’AI.

Leggi anche:  SAP Leonardo rilascia gli ultimi aggiornamenti di Machine Learning e Analytics

Quando si parla di Big Data a cosa bisogna fare attenzione?

Prima di tutto, a non confondere correlazione con causalità. Per esempio, possiamo misurare coi Big Data che la maggiore diversità (culturale, etnica, di movimento) in una città è collegata a un maggior benessere dei suoi abitanti. Ma questa correlazione non va intesa in senso causale, ovvero che aumentare la diversità farà aumentare il benessere o viceversa. Probabilmente, sono vere entrambe le cose, o forse c’è una terza causa esterna. Ma questo errore viene fatto di continuo.

Inoltre, non bisogna pensare che un modello predittivo valga per sempre: i dati rappresentano il passato, tutto ciò che abbiamo imparato può non valere più se lo scenario cambia e i dati di apprendimento diventano obsoleti. E per finire, occorre evitare di pensare che “big” sia sinonimo di qualità. Il Twitter-bot Tay, una “intelligenza artificiale” allenata a conversare con gli utenti umani sula base di miliardi di esempi di conversazioni reali è sfortunatamente diventata rapidamente razzista e sessista, avendo imparato a conversare sugli esempi sbagliati. I suoi creatori hanno dovuto ritirarla molto velocemente.

E quando si parla di Intelligenza Artificiale?

Bisogna fare attenzione a non farsi ingannare dall’aggettivo “artificiale”. L’AI di oggi, quella che traduce automaticamente dall’inglese all’italiano o che riconosce gli oggetti nelle immagini, è fatta da due cose principali: Machine Learning e Big Data. Ovvero, apprendimento automatico da grandi masse di esempi annotate da esperti umani, per esempio medici che refertano radiografie. Quindi l’AI è umana, molto umana: impara mettendo insieme l’esperienza di tanti esperti umani. Ed eredita tutta l’esperienza e i difetti degli umani, compresi i pregiudizi. Non credere che l’AI sia necessariamente più oggettiva e affidabile nei giudizi: se un sistema di decisione ha imparato da decisioni umane, avrà certamente ereditato tutti gli eventuali pregiudizi e “bias” cognitivi presenti negli esempi di allenamento. E soprattutto non puntare a una AI che sostituisce il lavoro e il contributo dell’umano, ma piuttosto che potenzia la capacità delle persone di migliorare, di superare i pregiudizi, di perseguire il benessere individuale in armonia con quello collettivo.

Quali sono i fondamentali dell’IT da preservare in azienda?

Mi limito a un tema che reputo centrale: oggi le imprese devono attrezzarsi con le competenze che servono. I data scientist, le risorse in grado di innescare il cambiamento organizzativo necessario per estrarre conoscenza e valore dai dati. In grado di superare le barriere tradizionali fra IT e gli altri settori aziendali e favorire il clima intersettoriale che è necessario per la creatività. Merce rara, ma il panorama e l’offerta di formazione è in movimento. Così come l’ingegno delle imprese più coraggiose.


  • 9
  •  
  •  
  •  
  •  
  •  
  •  
    9
    Shares