Microsoft lancia Phi-3 Mini, il modello di IA generativa più piccolo del settore

Microsoft lancia Phi-3 Mini, il modello di IA generativa più piccolo del settore

Al fianco della versione Small e Medium, promette di rendere più semplice e conveniente adottare progetti di GenAI

Microsoft ha lanciato la nuova versione di Phi-3 Mini, il primo di tre piccoli modelli di intelligenza artificiale che l’azienda prevede di rilasciare entro l’anno. Phi-3 Mini “pesa” 3,8 miliardi di parametri e viene addestrato su un set di dati più piccolo rispetto a modelli linguistici di grandi dimensioni come GPT-4. È disponibile su Azure, Hugging Face e Ollama. Microsoft renderà disponibili nei prossimi mesi sia Phi-3 Small (7 miliardi di parametri) che Phi-3 Medium (14 miliardi di parametri). I parametri si riferiscono a quante istruzioni complesse un modello può comprendere. L’azienda ha rilasciato Phi-2 a dicembre, che si è dimostrato capace di competere con modelli più grandi come Llama 2. Microsoft afferma che Phi-3 ha prestazioni migliori rispetto alla versione precedente e può fornire risposte vicine a quelle di un modello 10 volte più grande di lui. Eric Boyd, vicepresidente aziendale di Microsoft Azure AI Platform, afferma che Phi-3 Mini è capace, in quanto a LLM, come GPT-3.5 “solo in un fattore di forma più piccolo”.

Rispetto alle loro controparti più grandi, i piccoli modelli di intelligenza artificiale sono spesso più economici da gestire e funzionano meglio su dispositivi personali come telefoni e laptop. The Information riportava all’inizio di quest’anno che Microsoft stava costruendo un team focalizzato specificamente su modelli di intelligenza artificiale più leggeri. Insieme a Phi, l’azienda ha anche creato Orca-Math, un modello incentrato sulla risoluzione dei problemi di matematica. Anche i concorrenti di Microsoft hanno i propri piccoli modelli di intelligenza artificiale, la maggior parte dei quali mira a compiti più semplici come il riepilogo dei documenti o l’assistenza alla codifica. I Gemma di Google sono adatti per semplici chatbot e lavori legati alla lingua. Claude 3 Haiku di Anthropic può leggere densi documenti di ricerca con grafici e riassumerli rapidamente, mentre Llama 3 di Meta, recentemente rilasciato, può essere utilizzato per alcuni chatbot e per assistenza nella codifica.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Leggi anche:  Meta lancia ImageBind, IA di nuova generazione