Definire le azioni fondamentali. Costruire il tessuto connettivo necessario per introdurre nuovi dati nell’ecosistema in modo rapido e accurato. Formalizzare le pratiche di gestione dei dati operativi per la qualità continua dei dati. Ecco come sviluppare una data governance business-ready in tre passi

Di data governance si parla ogni giorno di più e a livello sempre più alto: basti pensare al dibattito in corso, dopo il via libera del Parlamento europeo al Data Governance Act, approvato in aprile con 501 voti favorevoli, 12 contrari e 40 astensioni. L’obiettivo è di porre le basi per un’economia dati trasparente, creare nuove norme europee sulla neutralità dei mercati dei dati, favorire il riutilizzo di alcuni dati detenuti dal settore pubblico e creare spazi europei dei dati in settori strategici. È una buona notizia. L’idea è quella di sfruttare i dati che verranno condivisi. La PA e gli enti privati non saranno obbligati a condividere dati ma potranno farlo per dare una spinta alla ricerca e alle iniziative delle startup. Allo stesso tempo, gli enti pubblici non potranno creare diritti esclusivi di riutilizzo di alcuni dati. Il periodo di esclusiva sarà limitato a 12 mesi per i nuovi contratti, e a due anni e mezzo per quelli esistenti, così da rendere un maggior numero di dati accessibili a startup e piccole e medie imprese. L’altro pezzo di questa strategia è il Data Act. Il suo campo di azione comprende i dati della PA prodotti e acquisiti ai sensi del Data Governance Act ma si estende anche ai big data del settore privato. In sostanza, stabilisce chi può usare i dati con quali modalità e per fare cosa.

Quindi mentre il Data Governance Act punta a creare uno spazio di condivisione di dati all’interno del mercato europeo, il Data Act intende disciplinare l’uso dei dati in chiave di business da parte delle aziende e dei privati extra-Ue. Sempre in aprile, Europa e Stati Uniti hanno poi raggiunto un accordo preliminare che disciplina il trasferimento dei dati da un versante all’altro dell’oceano. La normativa precedente, quella del cosiddetto accordo “Safe Harbor”, era stata annullata nell’ottobre 2015 da una sentenza della Corte europea di giustizia. Le aziende dovranno attendere per avere un quadro chiaro per il trattamento dei dati tra le due sponde dell’Atlantico. I quattro pilastri della strategia europea dei dati si basano sulla messa a disposizione dei dati del settore pubblico per il riutilizzo, qualora tali dati siano oggetto di diritti di terzi; la condivisione dei dati tra le imprese, a fronte di un corrispettivo in qualsiasi forma; il consenso all’utilizzo di dati personali con l’aiuto di un “intermediario per la condivisione dei dati personali”, il cui compito consiste nell’aiutare i singoli interessati a esercitare i propri diritti a norma del GDPR; e il consenso all’utilizzo dei dati per scopi altruistici, di interesse generale. In questa nuova congiuntura globale, perché la governance dei dati è un argomento così caldo per CDO, CIO e altri leader aziendali e cosa cambia per imprese, cittadini e PA? Per capirlo, abbiamo girato le domande a Giancarlo Vercellino, associate director research & consulting di IDC Italia.

COME DARE VALORE AI DATI

I dispositivi IoT, i wearable, le applicazioni SaaS e i canali dei social media sono solo alcune delle fonti da cui i dati entrano nelle organizzazioni. Se combinati e analizzati con cura, i dati provenienti da tutti questi canali possono fornire nuovi insights e sbloccare nuove opportunità. La data governance è il fondamento delle modalità attraverso le quali una organizzazione aziendale intende gestire i dati digitali, utilizzando nel modo più efficiente possibile dati ritenuti affidabili. Una gestione efficace del patrimonio rappresentato dai dati richiede una serie di meccanismi di controllo centralizzati. Potremmo definire il concetto di data governance, come quell’insieme di persone, tecnologie e processi necessari per gestire e proteggere i “data asset” di una azienda e per garantire che i dati aziendali siano sempre il più possibile comprensibili, corretti, completi, affidabili, sicuri e accessibili. I dati devono seguire regole di base all’interno di un framework di data governance per produrre un valore economico. Si considera quindi l’insieme di processi, ruoli, policy, standard e metriche con l’obiettivo di garantire un uso efficace ed efficiente delle informazioni per permettere all’organizzazione di raggiungere gli scopi prefissati. Inoltre, la governance dei dati stabilisce i processi e le responsabilità per assicurare la qualità e la sicurezza dei dati che vengono utilizzati all’interno di un’organizzazione aziendale. Definendo chi può intraprendere certe azioni, su quali dati, in quali situazioni e quali metodi utilizzare.

Leggi anche:  Il dialogo tra ERP e MES per la smart factory

Una buona strategia di data governance è essenziale per ogni organizzazione che lavora in particolare con i big data, poiché aiuta a definire come l’azienda può trarre beneficio da processi e responsabilità coerenti. Rientrano nel piano di scelte per una corretta data governance le architetture, la qualità dei dati, la capacità di costruire modelli e simulazioni, un approccio corretto ai meta-dati che servono per classificare l’informazione, i sistemi e le operazioni di storage, la sicurezza, i sistemi di data warehousing e gli strumenti di business intelligence, l’integrazione e l’interoperabilità, i documenti e i contenuti aziendali, i modelli di riferimento qualitativi.

In sostanza, una strategia di data governance punta a stabilire una serie di metodiche e un modello organizzativo con chiare responsabilità e processi finalizzati a standardizzare, integrare, proteggere e archiviare i dati aziendali. Con l’obiettivo di minimizzare i rischi, stabilire delle regole interne, implementare i requisiti imposti dalla compliance, migliorare la comunicazione interna ed esterna, massimizzare il valore dei dati riducendone al tempo stesso i costi e facilitando la continuità del business, proprio grazie all’ottimizzazione e una corretta gestione del rischio legato alla perdita o la corruzione del dato.

Quello che una volta era una noiosa compliance check-box è oggi un mezzo per accelerare la crescita, democratizzare i dati e potenziare la collaborazione. La quantità di dati disponibili è esplosa negli ultimi vent’anni. Secondo IDC, nel 2023 la “DataSphere” globale supererà i 100 zettabyte e potrebbe raddoppiare nel giro di tre, quattro anni. «I dati rappresentano una dimensione parallela che accompagna come un’ombra qualsiasi processo sociale e produttivo» – spiega Giancarlo Vercellino di IDC Italia. «Espressioni come “società dell’informazione” ed “economia della conoscenza” non sono più buzzword accademiche, ma descrivono in modo puntuale la realtà che viviamo ogni giorno. Negli ultimi dieci anni, abbiamo compreso che esiste la possibilità concreta di valorizzare non soltanto i dati strutturati ma soprattutto quella mole enorme di informazioni eterogenee che non possiamo normalmente gestire dentro i database tradizionali: il volume dei dati non-strutturati supera di otto volte quello dei dati strutturati e comprende molto spesso quel “footprint digitale” che include tutte le informazioni “calde” sulle esigenze dei clienti, le preferenze dei consumatori, le tendenze emergenti dei mercati, e così via».

PRIMO PASSO

In questo scenario, l’idea di sfruttare il dato come nuovo fattore produttivo per fare innovazione e automazione intelligente diventa la direzione strategica di sviluppo per qualsiasi azienda. Chi governa l’IT aziendale si trova catapultato in una dimensione del tutto nuova. I CIO interpellati da Data Manager si trovano a gestire la governance dei dati alla velocità del business attraverso tre step: 1) stabilire i componenti fondamentali; 2) costruire “la muscolatura” necessaria per introdurre nuovi dati nell’ecosistema in modo rapido e accurato; 3) formalizzare le pratiche di gestione dei dati operativi per una qualità continua dei dati. In molte organizzazioni, la governance dei dati è spesso limitata alla compliance, alla privacy e alla sicurezza. Qualsiasi programma di governance dei dati dovrebbe includere quattro componenti principali: il comitato direttivo per la governance dei dati; la titolarità dell’ ownership dei dati; gli amministratori dei dati; e il team di gestione dei dati.

In primo luogo, se l’azienda non avesse uno comitato direttivo di governance dei dati, converrebbe riunirne uno definendone dall’inizio gli obiettivi, ed assegnandone i ruoli. Ogni BU e funzione rappresentata dovrebbe avere i propri owner dei dati per stabilire le procedure e risolvere i problemi di qualità dei dati nei loro rispettivi domini. In seguito, è necessario assegnare gli steward dei dati. Gli steward sono allineati a livello funzionale e tattico. Servono agli owner dei dati per guidare l’aderenza alle policy, guidare la gestione dei cambiamenti specifici del dominio e segnalare i problemi di qualità dei dati. Infine, è importante stabilire un team di gestione dei dati. Questo team, tipicamente composto da risorse tecniche IT, è la spina dorsale della data governance a livello aziendale. E lavora per attivare e monitorare le policy e le procedure stabilite. Per raggiungere questo obiettivo conduce audit per assicurare l’aderenza alle politiche di privacy e sicurezza; valuta i dati in termini di accuratezza, rilevanza e completezza; guida la strategia del ciclo di vita dei dati, dalla creazione e l’archiviazione iniziale dei dati fino alla loro scadenza e distruzione.

SECONDO PASSO

Una volta che la struttura di data governance è stata costruita e che le policy sono state definite, si passa a costruire quel “tessuto connettivo” che renderà la governance dei dati una fonte di agilità per anticipare i problemi, cogliere le opportunità e cambiare rapidamente quando l’ambiente aziendale si evolve e nuove fonti di dati sono disponibili.

Leggi anche:  Architettura logica dei dati per essere data-driven

La funzione di governance dei dati è responsabile dell’identificazione, della classificazione e dell’integrazione delle nuove fonti di dati (fusioni, acquisizioni, implementazione di nuove tecnologie, cambiamenti dell’organizzazione). Lo fa definendo un insieme ripetibile di policy, processi e strumenti di supporto, la cui applicazione può essere pensata come una sequenza di punti di controllo che i nuovi dati devono attraversare. Il primo livello del processo è determinare cosa deve essere fatto per introdurre i nuovi dati in modo coerente. La modellazione dei dati serve mappare la gerarchia dei clienti dell’azienda acquisita alla gerarchia esistente e aggiornare gli artefatti di modellazione dei dati (per esempio, i diagrammi di relazione delle entità) e gli strumenti di conseguenza.

Di fondamentale importanza è l’aggiornamento del dizionario dei dati e dello strumento di gestione dei master data con il contesto storico. Inoltre è molto importante anche valutare se la postura di conformità esistente è adatta ai nuovi dati dei clienti per decidere se implementare ulteriori disposizioni di accesso o di sicurezza. A questo punto occorre costruire controlli nelle applicazioni chiave per impedire agli utenti di creare record duplicati o di inserire testo libero (invece di cercare record esistenti). Il ruolo dei data steward è centrale per comunicare i cambiamenti agli utenti interessati e gestire i successivi cambiamenti rispetto alla tecnologia, alle persone e ai processi coinvolti. La capacità di gestire l’introduzione di nuovi dati serve a resistere alla tentazione di perseguire soluzioni una tantum che offrono velocità a scapito della scalabilità e della riusabilità a lungo termine.

TERZO PASSO

Il passo finale è quello di codificare gli strumenti e le singole attività di gestione dei dati che preservano la qualità dei dati esistenti e supportano i risultati di business prefissati. Le soluzioni di gestione dei dati devono seguire procedure, cadenze e strumenti in grado di supportare una serie di requisiti comuni. Nella gestione master data, i sistemi e i processi devono supportare la creazione di un’unica fonte di riferimento principale per tutti i dati aziendali critici (per esempio, clienti, prodotti), riducendo il numero di errori e ridondanze nei processi aziendali. Il controllo e il monitoraggio della qualità dei dati permettono l’implementazione di strumenti e processi automatizzati per aiutare a identificare i dati che non si allineano alle regole di business o di conformità definite e che quindi non soddisfano le soglie di qualità definite. Il reporting della qualità dei dati rappresenta la pratica di definizione delle metriche di qualità dei dati o i KPI, con la revisione periodica dei loro progressi e la determinazione di piani d’azione per migliorarli. Le operazioni di archiviazione dei dati permettono di specificare le policy che regolano dove e come memorizzare i vari tipi di dati durante tutto il loro ciclo di vita dei dati dall’introduzione alla distruzione, tenendo conto della conformità normativa ai regolamenti privacy e data protection, oltre che di eventuali esigenze di compliance aggiuntive. Infine, la gestione dei dati consente di allocare le risorse nelle principali unità e funzioni aziendali e di gestire i cambiamenti relativi all’introduzione di nuovi dati nell’ambiente. Codificare ciascuna di queste attività può portare a una maggiore qualità dei dati in termini di accuratezza, completezza, coerenza, tempistica, validità e unicità. Una soluzione di governance dei dati può migliorare le prestazioni delle singole funzioni e unità aziendali, sfruttando i dati dell’organizzazione per alimentare la trasformazione a livello aziendale.

Leggi anche:  WhatsApp rende disponibile l’opzione “visualizza una volta” ai beta tester su Android

LA DATA GOVERNANCE SI TRASFORMA

Quali problemi devono essere risolti per consentire ai leader della data governance di avere successo? I fattori critici per raggiungere buoni risultati sono tanti e diversi. In primo luogo, come ci spiega Giancarlo Vercellino di IDC Italia, esiste un tema di competenza e di budget, che deve trovare riscontro nel commitment del top management per promuovere un processo di trasformazione graduale, modulare, ma progressivo, senza incertezze e senza ripensamenti, lungo una roadmap che può richiedere qualche anno. «Le prime sfide tecniche da superare sono legate alla definizione di un processo capace di garantire la qualità dei dati, definire dei KPI che possano comunicare efficacemente a tutti gli stakeholders il valore generato da una attività che ad alcuni può sembrare accessoria ma che in realtà ha un valore centrale per instradare tutti i passaggi successivi della data-driven transformation». Per abilitare e favorire questa trasformazione, è di fondamentale importanza attribuire i ruoli giusti, in particolare nel caso del CDO che in molte aziende sembra essersi “sdoppiato” in diverse specializzazioni. All’inizio, il chief data officer era focalizzato più sulla governance che sull’analisi. Il mandato per questa posizione era più sulla protezione dell’organizzazione che sull’ottenere valore dai dati. Attualmente, assistiamo alla convergenza delle funzioni di raccolta, governance e analisi dei dati. Tuttavia, queste aree di competenza sono così estese che è difficile, se non impossibile, presidiarle tutte insieme. Di conseguenza, alcune funzioni vengono riunite sotto l’ombrello generale del CDO, mentre altre si travasano in quelle più specifiche del chief governance officer (CGO), che si concentra quasi interamente sulla governance, fornendo dati ai dipartimenti legali e ai responsabili della compliance aziendale. Nel frattempo, ci sono altre funzioni, come il chief data analytics officer (CDAO), il chief analytics officer (CAO) e altri ruoli di questo tipo che prendono posizioni sempre più rilevanti al tavolo della leadership. Il nuovo concetto di data governance richiede un ripensamento dell’architettura dei dati. Alcuni degli strumenti che sono pensati come analitici sono in realtà orientati alla governance. Per esempio, come considerare i data catalog? Strumento di analisi o uno strumento di governance? Anche se i data catalog impongono “una struttura” su ciò che altrimenti potrebbe essere una collezione ingombrante di set di dati sparsi nei vari dipartimenti in silos di un’organizzazione (fondamentale per la governance, in particolare se un’azienda sta utilizzando un data lake), non necessariamente rendono l’analisi più facile. Governance e analitica devono essere integrate senza soluzione di continuità. Entrambe le funzioni di governance e analisi hanno un interesse condiviso nel capire “come, chi, perché e cosa”, nel momento in cui si accede a una risorsa di dati.

DATA GOVERNANCE E FIDUCIA

Come spiega Giancarlo Vercellino di IDC Italia, nel prossimo futuro, sentiremo parlare sempre più spesso di data operations: «La capacità di armonizzare in un singolo processo data governance e data engineering con il machine learning e la data science per industrializzare l’applicazione degli algoritmi ai processi aziendali e realizzare concretamente quei processi data-driven che dovrebbero idealmente caratterizzare le imprese intelligenti». Si tratta di una trasformazione che potrebbe assumere connotati molti diversi da organizzazione a organizzazione: «Un mestiere tutto da inventare che potrebbe aprire lo spazio alla creazione di nuove funzioni aziendali che non hanno niente a che fare con l’IT come l’abbiamo conosciuto finora». La governance dei dati si sta trasformando e per essere business-ready, le aziende punteranno sempre di più sull’automazione. Non solo. Alla luce delle attuali tensioni geopolitiche in corso, non è possibile parlare di governo dei dati in una società interconnessa senza farsi alcune domande. Siamo veramente certi di quali dati possiamo condividere? E soprattutto, come possiamo fidarci dei soggetti con cui condividiamo i nostri dati? La data governance ci riporta al tema fondamentale dalla fiducia nelle società complesse. E l’attenzione dei regolatori lo dimostra. Qualità, trasparenza, usabilità e integrità sono fattori chiave per creare fiducia. Senza automazione, le organizzazioni pubbliche e private potrebbero non avere le risorse a disposizione per affrontarle nel modo giusto.