Regolo.ai presenta su ArXiv “Brick”: il nuovo router LLM made in Europe che seleziona i modelli giusti a seconda del task AI

olo.ai. Marco Cristofanilli, Head of AI Cloud Seeweb e ideatore di Regolo.ai

La ricerca del team Seeweb (Gruppo DHH) propone un metodo di instradamento geometrico per tagliare i costi e l’impatto ambientale, garantendo la massima qualità. La tecnologia è già utilizzabile via API sulla piattaforma Regolo.ai

Regolo.ai, l’inference provider sviluppato da Seeweb, principale infrastruttura cloud italiana e parte del Gruppo DHH, ha diffuso su ArXiv il paper scientifico che descrive Brick, un sistema rivoluzionario per il routing multimodale dei Large Language Model (LLM). La ricerca, portata avanti in particolare da Marco Cristofanilli e Francesco Massa, rappresenta un passo decisivo per l’Intelligenza Artificiale europea, affermandosi come la soluzione più efficace a livello globale rispetto alle tecnologie disponibili sul mercato.

La sfida principale affrontata dal progetto è il “costo dell’inferenza”. Attualmente, l’utilizzo di modelli “frontier” (ad alte prestazioni ma onerosi) per operazioni semplici comporta enormi sprechi economici e di risorse, mentre l’uso di modelli economici per compiti complessi rischia di abbassare lo standard qualitativo. Brick funge da “regolatore” intelligente, instradando ogni singola richiesta verso il modello più adatto, soppesando capacità tecniche, complessità del task e spesa economica.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Efficienza basata sulla geometria vettoriale

Mentre i router convenzionali operano su parole chiave o conteggio dei token, Brick mappa le competenze dei modelli in una geometria vettoriale a sei dimensioni (seguire istruzioni, programmazione, calcolo matematico, conoscenza generale, creatività e pianificazione). Un classificatore basato su ModernBERT proietta la query utente in questo stesso spazio, mentre un Small Language Model (SLM) ne valuta la difficoltà. Il sistema calcola la distanza vettoriale per evitare sia la sottocapacità che il sovradimensionamento (over-provisioning), applicando un coefficiente di costo che regola dinamicamente il bilanciamento tra qualità e risparmio, senza necessità di riaddestramento.

Leggi anche:  Kyndryl lancia AI Orchestration for Business per accelerare la trasformazione guidata dagli agenti AI

Performance e Primato Europeo

I test effettuati su 5.504 query confermano che Brick supera i router attualmente esistenti (tra cui RouteLLM e FrugalGPT) e, secondo i dati emersi, l’approccio tecnologico di Nvidia.

  • Qualità al top: 76,98% (contro il 75,02% del miglior modello singolo).
  • Modalità bilanciata: 74,11% di qualità a un prezzo 4,71 volte più basso.
  • Risparmio massimo: Taglio dei costi fino a 22 volte, con latenza scesa da 51,2 a 22,8 secondi.

Le dichiarazioni del Gruppo DHH e del team Regolo.ai

Antonio Baldassarra, Amministratore Delegato del Gruppo DHH e di Seeweb, ha espresso il proprio apprezzamento per il traguardo raggiunto in un post su LinkedIn: «Sono davvero orgoglioso di annunciare che il nostro primo articolo scientifico su “Brick”, il router LLM europeo con capacità spaziali, è uscito. Non è solo il primo in Europa, ma anche l’approccio più performante attualmente esistente a livello mondiale, migliore di quello proposto da Nvidia.»

Il progetto nasce dalla sinergia tra l’infrastruttura industriale di Seeweb e l’innovazione tecnologica di Regolo.ai. Marco Cristofanilli, Head of AI Cloud Seeweb e ideatore di Regolo.ai, ha guidato la supervisione, mentre lo sviluppo tecnico è stato curato da Francesco Massa, ricercatore R&D nel team Regolo e studente di Ingegneria. Dietro, la visione che, come indicato da Francesco, in realtà (…) “la maggior parte delle query non necessita del modello più costoso”.

Francesco Massa, ricercatore R&D nel team Regolo

Efficienza ma anche accessibilità e sostenibilità

Brick vuole rendere efficiente l’AI instradando verso la selezione e l’utilizzo dei migliori modelli llm per lo specifico task o progetto in campo ed è rilasciato completamente open source e costituisce il motore della nuova offerta di Regolo.ai. Gli sviluppatori possono integrare la soluzione tramite l’API di Regolo (modello brick-v1-beta), ottenendo visibilità in tempo reale sui consumi energetici e sui costi di inferenza. Una caratteristica, quest’ultima, che differenzia Regolo dagli altri motori di inferenza per la sua attenzione al tema delle emissioni di carbonio.

Leggi anche:  Con SB Italia, la firma digitale è centralizzata e sicura

Il documento completo è consultabile qui: https://arxiv.org/abs/2606.13241
Il modello è scaricabile su HuggingFace: https://huggingface.co/regolo

Con Brick, Seeweb e Regolo.ai ribadiscono il loro impegno per un’IA grren, compliant e accessibile, spostando il vantaggio competitivo dalla sola infrastruttura alla logica di orchestrazione intelligente, riducendo l’impronta di carbonio del settore AI e rendendo accessibili tecnologie di alto livello a un pubblico più ampio.