Cloudera, i big data siamo noi

romain picard_cloudera

Nel segno dell’open source, la società californiana si espande sempre più anche in Europa e in Italia, sulla scia di un crescente successo che vede già la sua piattaforma per i big data al primo posto nel mondo per livello di adozione

Hadoop, la piattaforma open source che ha reso vantaggioso il trattamento dei big data, è il segno distintivo di Cloudera, società nata nel 2008 nel cuore della Silicon Valley e protagonista di una crescita che in pochi anni l’ha trasformata da startup in vero protagonista dell’IT. I numeri del resto sono di tutto rispetto: quasi mille persone impiegate, un ecosistema di più di 1700 partner, circa 600 clienti di livello enterprise in tutto il mondo e una presenza in almeno 20 paesi. Tra i quali c’è l’Italia, come conferma in una conversazione con Data Manager, Romain Picard, regional director di Cloudera South EMEA, alla vigilia della tappa milanese dell’evento “Cloudera Sessions”, che il 13 ottobre segnerà anche il debutto ufficiale della società californiana nel nostro Paese. «Siamo arrivati in Europa due anni fa, quando abbiamo aperto la filiale nel Regno Unito, alla quale sono seguite nel 2014 quella in Germania e quella in Francia, in cui si trova il quartier generale dell’area South Emea, che comprende Francia, Spagna, Portogallo, Grecia, Turchia, Medio Oriente, Nord Africa e naturalmente Italia, dove siamo presenti dall’inizio di quest’anno». Picard stesso è in Cloudera da poco più di un anno, da luglio 2014, e si esprime in termini entusiastici sull’esperienza fin qui compiuta: «è un viaggio fantastico quello che sto intraprendendo, perché più che una tecnologia, Cloudera è un sistema, che consente alle aziende e alle organizzazioni di trarre valore dai dati, che costituiscono il loro asset strategico, che sempre più deve essere trasformato in asset di valore». Quando si parla di dati, per Cloudera si parla soprattutto di Big Data, intesi come l’insieme di tutti i dati disponibili oggi, anche non strutturati, cioè come i video e le immagini, che ormai sono onnipresenti in tutte le aziende e ne rappresentano il capitale maggiore dal quale trarre valore, se gestito opportunamente.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Prospettive italiane

Riguardo al nostro Paese, Picard fa sapere che «il mercato italiano sta affrontando il tema Big Data in maniera molto seria, e in quest’area vi sono numerose aziende importanti, a dispetto della crisi di cui tanto si parla. Anzi, proprio per lo scenario economico che si mantiene da tempo in una fase poco brillante, molte aziende stanno spingendo molto sui big data per incrementare la loro competitività. L’adozione delle nostre tecnologie è praticamente cross industry, in quanto ormai tutte le aziende sono data centric». Anche per questi motivi, quello italiano è «un mercato molto interessante, dove riteniamo di avere ottime prospettive, e abbiamo già messo in piedi un valido team di persone per supportare i clienti e i partner» – fa notare Picard.

L’Enterprise Data Hub

Ma è giunta l’ora di vedere da vicino qual è la proposta di Cloudera: «Il nostro Enterprise Data Hub offre alle aziende un repository unificato in cui memorizzare, gestire, analizzare e tenere al sicuro tutti i loro dati, configurandosi come la prima piattaforma unificata per i big data realizzata su Apache Hadoop» – spiega Picard. Tipicamente, il repository unificato per i dati è costituito da server standard Intel, con importanti riflessi sul contenimento dei costi, e rappresenta una sorta di “archivio attivo” al quale si può accedere in ogni momento. Quello che è interessante notare è che l’Enterprise Data Hub di Cloudera non sostituisce alcuna tecnologia già presente in azienda, ma aggiunge un ulteriore strato di tecnologia, costituito appunto da Hadoop. «Ma attenzione» – avverte Picard. «Cloudera non aggiunge complessità al sistema, in quanto rispondiamo a precise esigenze di business, che oggi impongono di avere insight sempre più approfonditi e su set di dati sempre più estesi». In sostanza, se una società di telecomunicazioni vuole avere una visione completa sui dati, con i sistemi tradizionali non riuscirà a farlo perché tipicamente i sistemi operano soprattutto sul presente. E se una banca vuole avere una visione a 360 gradi dei clienti, troverà difficoltà in quanto spesso i dati risiedono in silos differenti. Il vantaggio dell’Enterprise Data Hub è quello di offrire una visione unica in quanto opera su un repository unificato.

L’ora di Hadoop

Tornando a Hadoop, come è noto si tratta non solo di un framework ma di un vero e proprio movimento di software open source, tra i più importanti al mondo, costituito da un insieme di progetti che rendono possibile realizzare nuove modalità di gestione dei dati, incidendo soprattutto su come questi si possono memorizzare, elaborare e analizzare su vastissima scala. Altrettanto noto è il fatto che il chief architect di Cloudera dal 2008 è Doug Cutting: creatore di Hadoop e colui che gli ha dato il nome, inventato dal figlio che così chiamava il suo elefantino di pelouche, il piccolo pachiderma giallo che poi è diventato il simbolo di Hadoop. Più in dettaglio, Hadoop è ormai un sinonimo di big data, in quanto si tratta di una piattaforma per gestire migliaia di nodi con enormi quantità di dati, nell’ordine dei petabyte (PB). Hadoop è un progetto costituito da più moduli, come Hadoop Common, Hadoop Distributed File System (HDFS), Yarn e MapReduce, solo per citare i più noti. Pur essendo tutti moduli open source, hanno la complessità di dover essere assemblati, a meno che non si ricorra a una distribuzione già pronta: Cloudera propone CDH, ovvero Cloudera Distribution Hadoop, che può essere scaricata gratis direttamente dal sito della società, analogamente a quanto avviene con molte distribuzioni Linux. Allo stesso modo, Cloudera offre a chi si abbona un ventaglio di prodotti aggiuntivi, come per esempio lo strumento di gestione Cloudera Manager o le suite complete Cloudera Enterprise e Cloudera Express, e di servizi a corollario, che rappresentano il vero punto di forza della società, con servizi professionali, consulenza, corsi di formazione e soprattutto certificazione.

Il modello di business

Se i due moduli principali di Cloudera sono gratuiti per i cluster con un massimo di 50 server, come vuole la filosofia open source, il business dell’azienda e dei suoi partner nasce soprattutto da Cloudera Enterprise, che è offerto in abbonamento e prevede sia tutti gli strumenti aggiuntivi per gestire al meglio Hadoop sia tutti i servizi prestati a corollario. Secondo la società, questo modello di abbonamento, che comprende tutti i servizi, lascia molto spazio anche alle opportunità con i system integrator, e non a caso il numero di quelli che collaborano con Cloudera è in continua crescita, e vede schierati anche nomi di rilievo mondiale come Capgemini, Accenture o Reply. Ma non solo: Cloudera è stata scelta come distribuzione commerciale principale di Hadoop un po’ da tutti i big dell’IT, a cominciare da IBM, passando per NetApp, Dell, SAP, Qlik e VMware, solo per nominarne alcuni. Forse, è anche per questo che tra i clienti di Cloudera vi sono più della metà delle aziende Fortune 50, come CBS, eBay, Expedia, JP Morgan Chase, Monsanto, Morgan Stanley, Nokia e Groupon: praticamente ovunque vi sia la necessità di analizzare e trarre valore da grandi quantità di dati, le soluzioni di Cloudera sono in pole position. E probabilmente lo saranno a lungo, vista la posizione di leadership della società, consolidata anche tramite «il continuo investimento nella comunità open source, di cui beneficiano tutti – conclude Romain Picard – sia il nostro vasto ecosistema costituito da partner, Independent Software Vendor e consulenti, sia soprattutto i nostri clienti, che non comprano solo una tecnologia, ma anche la qualità del nostro supporto e la nostra vision del mercato».

Leggi anche:  Dati di valore, SAS Viya come motore del business