A cura di Flora Cavinato, Senior Director Global Service Strategy and Portfolio di Vertiv
L’adozione delle nuove tecnologie di raffreddamento e di alimentazione per l’intelligenza artificiale (AI) e l’elaborazione ad alte prestazioni (HPC) ha accentuato i problemi di disponibilità di risorse qualificate per la manutenzione dei data center. Oggi l’approccio tradizionale alla manutenzione ordinaria basata su interventi in sito a cadenza programmata può essere migliorato per ridurre il rischio di costose interruzioni delle apparecchiature grazie all’apprendimento automatico (ML) e ad algoritmi predittivi.
La manutenzione programmata in base alle condizioni operative (Condition-based maintenance, CBM) e i servizi di monitoraggio avanzato utilizzano i dati comunicati real-time dalle apparecchiature per generare punteggi e avvisi sullo stato di salute delle stesse. Il Service utilizza queste informazioni per valutare le condizioni degli asset e programmare la manutenzione ordinaria e straordinaria in funzione delle necessità reali, garantendo il massimo presidio della continuità con il minimo intervento in sito (vedi Figura 1).
Figura 1. Confronto tra i modelli di manutenzione tradizionali e quelli basati su esigenza: l’evoluzione dei servizi mostra che i cambiamenti e la combinazione di procedure tradizionali e di quelle più avanzate consentono l’adozione di un modello di manutenzione che ottimizza il funzionamento continuo, l’efficienza e il ciclo di vita degli asset.
Conoscere la funzionalità della manutenzione basata sulle specifiche condizioni
I servizi basati sul monitoraggio avanzato supportano i data center nell’ottimizzazione delle attività di manutenzione, migliorando la disponibilità degli asset. Questo approccio prevede:
- Connettività e raccolta dati in tempo reale
Per abilitare i servizi digitali tra cui la manutenzione basata sulle condizioni e i servizi di monitoraggio avanzati è necessario abilitare la connettività 24/24, 7/7, tramite il gateway Vertiv™ o una connessione IoT diretta supportata da una scheda di comunicazione, trasmettendo i dati di controllo dell’impianto a una piattaforma Vertiv nel cloud.
- Centralizzazione ed elaborazione dei dati
I dati trasmessi dalle apparecchiature vengono sia controllati real-time dal centro Operativo del Service sia elaborati tramite una libreria di algoritmi predittivi che sfruttando strumenti di AI e ML individuano trend operativi ed eventuali deviazioni.
- Generazione di avvisi e avvio degli interventi
Nel caso in cui le condizioni operative presentino delle anomalie che possono comportare un deterioramento delle prestazioni, il sistema genera automaticamente degli eventi di warning o allarme. Ogni avviso viene adattato tenendo conto delle condizioni di lavoro e dei modelli di vita specifici per la tipologia di macchina e di applicazione. Se viene rilevata un’anomalia, viene inviato un avviso ai Centri Operativi Service, che gestiscono e indirizzano la risposta di assistenza richiesta.
- Implementazione operativa
I servizi di manutenzione avanzati forniscono agli operatori maggiori informazioni su condizioni e comportamento degli asset, permettendo di personalizzare le attività manutentive nella singola installazione e in base ai vari fattori che la influenzano (ambientali, applicativi, ecc.). Questo determina maggiore trasparenza rispetto allo stato di salute reale dell’impianto, prolunga la vita operativa dello stesso e consente la piena visibilità di prestazioni per massimizzarne l’efficienza e l’affidabilità.
Reporting avanzato sui data center AI
I servizi di manutenzione basata sulle condizioni e di monitoraggio avanzato includono l’accesso a un portale per i clienti che consente di ottenere una reportistica sullo stato delle apparecchiature. I dashboard dettagliati mostrano i punteggi di salute del sito, gli eventi critici e i modelli di degrado.
La visualizzazione tipica del portale comprende le seguenti informazioni:
- Punteggio di salute: Dettaglio sullo stato dell’intero campus, compresi componenti e apparecchiature
- Trend del punteggio di salute: Rappresentazioni grafiche delle curve di salute
- Punteggio di salute per sito: Punteggi che evidenziano potenziali criticità
- Trend di salute per sito: Rappresentazioni grafiche delle curve di salute
- Numero di eventi critici per sito: Visualizzazione sintetica di eventuali eventi critici
- Allarmi critici: Elenco degli allarmi che richiedono un’attenzione immediata da parte dei team di Vertiv
- Numero di allarmi critici per descrizione: Tipi di eventi critici frequenti per una migliore prevenzione
Sfruttare l’AI/ML nei data center con la manutenzione basata sulle condizioni
Questo approccio innovativo alla manutenzione consente ai clienti non solo di avere piena visibilità delle condizioni operative reali dei loro impianti grazie agli algoritmi in costante evoluzione di Vertiv, ma anche garantisce migliori prestazioni e affidabilità.
- Riduzione del rischio di fermo delle apparecchiature – Sfruttando l’AI/ML per il monitoraggio avanzato degli asset, il Service Vertiv valuta i punteggi di salute, identifica anomalie ed agisce proattivamente.
- Miglioramento dell’efficienza operativa – Il monitoraggio costante consente di evidenziare condizioni operative sub ottime, di evidenziare il degrado dei componenti e di stimare la vita utile delle macchine pianificando la manutenzione e la corretta configurazione degli impianti per estenderne la longevità.
- Semplificazione del lifecycle management – La sostituzione dei componenti in base alla vita utile residua permette di pianificare le sostituzioni e le manutenzioni correttive garantendo la massima visibilità per la definizione del budget operativo.
- Miglioramento della gestione degli asset – l’acquisizione dei dati permette di valutare non solo la continuità operativa ma anche aspetti legati alle prestazioni e alla utilizzazione degli asset.
- Aumento dell’efficienza energetica – I dati operativi e il confronto con i benchmark in termini di efficienza permettono di identificare e correggere eventuali inefficienze riducendo i consumi energetici e minimizzando gli sprechi.
Migliorare la manutenzione delle unità per migliorare efficienza e affidabilità
L’accelerazione nella innovazione tecnologica coinvolge anche i servizi che si trasformano attraverso una crescente digitalizzazione che ne modifica i paradigmi.
Il futuro della manutenzione dei data center è sempre più intelligente, più efficiente e più affidabile. Con la manutenzione predittiva e i servizi di monitoraggio avanzati, i data center possono prevenire i rischi e ottimizzare i costi operativi migliorando efficienza e utilizzo degli asset. L’integrazione di logiche ed algoritmi avanzati basati su Machine Learning ed Intelligenza Artificiale abilita una valutazione costante dello stato di salute delle singole unità, delle soluzioni e dei sistemi consentendo agli operatori di prendere decisioni più informate e di pianificare gli investimenti per mantenere o espandere l’infrastruttura critica con maggiori informazioni.