Meta compie un altro passo verso la traduzione multimodale IA

Meta cambia le regole in Europa

Gli aggiornamenti dei modelli linguistici rendono più semplice parlare con interlocutori in altre lingue

Ad agosto, Meta ha presentato il suo modello di traduzione AI multimodale, SeamlessM4T, che supporta quasi 100 lingue per il testo e 36 per il parlato. Con un’architettura “v2” aggiornata, il gigante della tecnologia sta espandendo questo strumento per rendere le traduzioni conversazionali più spontanee ed espressive: quest’ultima è una chiave mancante per un’autentica conversazione attraverso le lingue. La prima delle due nuove funzionalità è “SeamlessExpressive” che, come si può capire dal nome, trasferisce le espressioni nel discorso tradotto. Questi includono il tono, il volume, il tono emotivo (eccitazione, tristezza o sussurri), la velocità del discorso e le pause. Considerando che fino ad ora i discorsi tradotti sono sempre sembrati robotici, questa è potenzialmente un punto di svolta, sia nella vita quotidiana che nella produzione di contenuti. Le lingue supportate includono inglese, spagnolo, tedesco, francese, italiano e cinese, anche se al momento nella pagina della demo mancano l’italiano e il cinese. 

La seconda funzionalità è “SeamlessStreaming”, che avvia la traduzione di un discorso mentre l’oratore sta ancora parlando, consentendo così agli altri di ascoltare la traduzione più velocemente. C’è ancora una breve latenza di poco meno di due secondi, ma almeno non si dovrà aspettare che qualcuno finisca una frase. Secondo Meta, la sfida qui è che lingue diverse hanno strutture di frasi diverse, quindi è stato necessario sviluppare un algoritmo dedicato allo studio dell’input audio parziale, al fine di decidere se c’è abbastanza contesto per iniziare a generare un output tradotto o se continuare ad ascoltare . L’ultimo sviluppo di Meta su questa suite “Seamless Communication” sembra essere impressionante, più degli strumenti di interprete mobile offerti da aziende del calibro di Google e Samsung. Non si sa quando il pubblico sarà in grado di utilizzare queste nuove funzionalità, ma posso già immaginare che Meta le inserirà nei suoi occhiali intelligenti un giorno, rendendoli ancora più pratici.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Leggi anche:  Meta, decine di stati americani portano in tribunale il colosso