A cura di Mirko Gubian, Global Demand Senior Manager & Partner di Axiante
L’evoluzione dell’intelligenza artificiale generativa sta vivendo una fase di maturazione che vede anche il passaggio dall’entusiasmo iniziale e generalizzato per i Large Language Model (LLM) verso un approccio più pragmatico. LLM come ChatGPT hanno indubbiamente contribuito a catturare l’attenzione sia delle imprese – e ancor prima degli utenti finali – verso questa tipologia di tecnologia, tuttavia l’esperienza applicativa sta dimostrando che gli Small Language Model (SLM) rappresentano spesso la soluzione più efficace per diverse tipologie di implementazioni.
Il volano della specializzazione
I modelli generalisti, pur impressionanti nelle loro capacità incrementali, presentano limitazioni significative quando applicati a contesti specifici. Infatti, dal momento che sono addestrati per rispondere a qualsiasi tipo di domanda, hanno una maggiore propensione a generare risposte plausibili ma di fatto non corrette ovvero “allucinazioni”, soprattutto se si confrontano con modelli verticali progettati per ambiti ristretti.
Attraverso un addestramento mirato su dataset curati e specifici per un determinato settore o dominio applicativo, questi modelli che possiamo definire “specialistici”, raggiungono livelli di accuratezza superiori nella loro nicchia di competenza, pur disponendo di capacità computazionali inferiori rispetto ai loro “fratelli maggiori” generalisti.
La focalizzazione su un insieme di conoscenze circoscritto permette agli Small Language Model di “assimilare” meglio la terminologia tecnica, le convenzioni linguistiche e le relazioni concettuali proprie di quel dominio. Questo si traduce in una riduzione significativa –anche nell’ordine del 40-60% – degli errori, delle allucinazioni e delle imprecisioni terminologiche che al contrario penalizzano i modelli generalisti quando affrontano contenuti altamente specializzati.
Inoltre, un modello addestrato esclusivamente su processi e documentazione, per esempio, nell’ambito del rischio finanziario, comprende indirettamente il contesto operativo, i flussi di lavoro, i processi, etc. senza necessità di spiegazioni aggiuntive nel prompt. Le risposte risultano quindi più pertinenti, precise e direttamente utilizzabili dai team di quella data funzione.
Non solo attendibilità
Come accennato, gli Small Language Model presentano una serie di vantaggi operativi, tecnici ed economici che li rendono spesso preferibili rispetto ai modelli generalisti di grandi dimensioni per molteplici applicazioni enterprise. L’architettura e la specializzazione verticale offrono infatti benefici concreti e misurabili che impattano direttamente su efficienza, costi e affidabilità dei sistemi aziendali, tra cui:
#1 Maggiore affidabilità: la limitazione del dominio di conoscenza riduce drasticamente il rischio di output inappropriati o fuorvianti, elemento critico per processi aziendali che richiedono precisione;
#2 Accessibilità economica: i costi inferiori di sviluppo e gestione rendono questa tecnologia accessibile anche ad aziende con budget limitati, un aspetto non secondario in un sistema economico come quello italiano caratterizzato dalla prevalenza di PMI;
#3 Facilità di aggiornamento: quando cambiano normative o procedure specifiche, è possibile riaddestrare solo il modello verticale interessato dalla variazione risparmiando risorse;
#4 Efficienza energetica: modelli più piccoli consumano meno energia e acqua per il raffreddamento, con ricadute positive sui costi operativi e, non da ultimo, sulla sostenibilità ambientale, un aspetto oggi sotto forte attenzione;
#5 Conformità normativa: infine, gli SLM sono maggiormente conformi ai vincoli di compliance in termini di trasparenza e verificabilità stabiliti da regolamentazioni come l’AI Act europeo;
Dove gli SLM fanno la differenza
Ovviamente gli Small Language Model rappresentano soluzioni tecnologiche particolarmente efficaci quando vengono implementati in contesti operativi dove la specializzazione verticale costituisce un vantaggio.
In questa direzione, l’adozione di modelli linguistici addestrati su una documentazione e su casistiche specifiche consente di automatizzare le richieste ricorrenti nel customer service per lasciare all’intervento umano le situazioni più critiche e meno standardizzate ovvero quelle che richiedono una maggiore complessità decisionale ed empatia. In particolare, la capacità di integrare lo storico delle interazioni con il cliente – nei casi più avanzati anche in termini di sentiment – con le informazioni aziendali, permette di generare risposte accurate dal punto di vista informativo e nello stesso tempo legate al contesto e alle relazioni già esistenti con l’utente.
Anche le attività caratterizzate da elevata ripetitività e dalla necessità di un’interpretazione linguistica – come alcuni processi amministrativi – trovano nei Small Language Model un supporto particolarmente efficiente. La revisione di contratti o la gestione di pratiche burocratiche rappresentano degli esempi di casi d’uso in cui l’intelligenza artificiale generativa può ridurre significativamente il carico operativo, mantenendo buoni standard qualitativi.
Inoltre, già oggi “assistenti digitali specializzati” supportano gli addetti alla produzione in attività critiche come la configurazione di impianti complessi, guidando gli operatori attraverso procedure di setup che tradizionalmente richiederebbero ore di consultazione di manuali tecnici, riducendo tempi ed errori. Nel mondo delle operations, gli SLM agiscono anche come consulenti virtuali sempre disponibili: analizzano colli di bottiglia, suggeriscono modifiche e rispondono a domande complesse in linguaggio naturale, rendendo questa tecnologia accessibile anche agli operatori meno esperti.
Mentre nell’area finanziaria, modelli linguistici addestrati su regole specifiche possono supportare efficacemente i processi decisionali come le verifiche in ambito compliance o fiscali oppure di procedure per esempio doganali o creditizie.
Infine in settori dove i requisiti di sicurezza e privacy sono particolarmente stringenti, come nella sanità e nella ricerca scientifica, gli Small Language Model focalizzati su specifiche aree cliniche o dataset di ricerca assicurano analisi e suggerimenti accurati mantenendo nello stesso tempo elevati standard di protezione dei dati sensibili.
Oltre il modello unico
Le aziende si trovano però spesso ad affrontare esigenze molto diverse tra loro: dal customer care alla generazione di report tecnici, dall’analisi di documenti legali alla creazione di comunicazioni. Come evidenziato, un singolo modello linguistico generalista, per quanto potente, difficilmente può eccellere in tutti questi ambiti contemporaneamente ma non può farlo tanto meno un solo SLM.
Per questo motivo, molte organizzazioni stanno adottando un approccio innovativo basato sulla creazione di un ecosistema di Small Language Models (SLM), dove ogni modello è specializzato per gestire specifici compiti o domini di competenza. Utilizzare il modello idoneo per quel dato compito significa impiegare solo le risorse computazionali necessarie, ottimizzando i costi operativi.
Tuttavia la vera sfida risiede nel coordinamento efficace di tutti questi componenti. La soluzione è implementare un layer di orchestrazione, una sorta di gateway intelligente, che funge da interfaccia unificata, che può essere una chat, un’API o un’applicazione. Questo sistema analizza le richieste in ingresso, identifica il dominio di competenza e dirige automaticamente la query allo SLM più adatto. Tutta questa complessità rimane però trasparente all’utente che rimane all’oscuro dell’esistenza dei diversi modelli sottostanti ma ne beneficia.