Chat vocali e immagini, ChatGPT avanza con nuovi “poteri”

Chat vocali e immagini, ChatGPT avanza con nuovi “poteri”

OpenAI aggiorna il chatbot con funzionalità innovative, non esenti da problemi

ChatGPT sta ricevendo alcuni aggiornamenti significativi che consentiranno al chatbot di gestire comandi vocali e query basate su immagini. Gli utenti potranno avere una conversazione vocale con ChatGPT su Android e iOS e inserire immagini su tutte le piattaforme. OpenAI sta implementando le funzionalità per gli utenti Plus ed Enterprise, anche se dovrebbe, prima o poi, estenderle a tutti. Per accedere al nuovo servizio, basterà attivare le conversazioni vocali nell’app ChatGPT, toccando il pulsante del microfono e scegliere tra cinque voci diverse. OpenAI afferma che le conversazioni audio sono alimentate da un nuovo modello di sintesi vocale in grado di generare “una voce simile a quella umana, partendo dal testo e in pochi secondi di discorso campione”. La società ha creato le cinque voci con l’aiuto di attori professionisti. Viceversa, il sistema di riconoscimento vocale Whisper dell’azienda converte le parole pronunciate dall’utente in testo.

Intriganti anche le funzioni basate sulle immagini. OpenAI sottolinea che è possibile mostrare al chatbot una foto per ottenere spiegazioni approfondite, ad esempio la pianificazione di un piatto partendo da ingredienti di base. Il chatbot potrà risolvere anche problemi di matematica “leggendo” il compito e molto altro. OpenAI utilizza GPT-3.5 e GPT-4 per potenziare le funzionalità di riconoscimento delle immagini. Per utilizzare l’opzione su ChatGPT, bisognerà aprire la sezione delle foto dall’app, catturare un’immagine e lasciare che il software la analizzi. Si potrà poi chiedere a ChatGPT informazioni su più foto e utilizzare uno strumento di disegno per evidenziare una parte specifica dell’immagine. In un post sul blog ufficiale, OpenAI ricorda i problemi potenziali della tecnologia: sarà possibile, tra l’altro, imitare le voci di personaggi pubblici (e della gente comune) per commettere frodi, sfruttando le capacità avanzate dell’IA. Ecco perché OpenAI si sta concentrando sulle conversazioni vocali lavorando con partner selezionati su altri casi d’uso limitati.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Leggi anche:  Il controverso abbonamento di Meta sottoposto al controllo dell’UE