Storie di bit
L'uscita di questa newsletter è terminata con giugno 2024.
Grazie a tutti per il supporto!
Dalla newsletter del 18 maggio 2024. Leggila qua.

Intelligenza artificiale

OpenAI ci mostra il futuro degli assistenti virtuali con GPT-4o

Lunedì scorso OpenAI ha presentato un nuovo modello di AI generativa chiamato GPT-4o. È il miglior modello mai realizzato da OpenAI e oltre ad essere più preciso, più veloce e meno costoso ha la grande novità di essere nativamente multimodale. Significa cioè che è in grado di comprendere non solo il testo ma anche le immagini e i suoni, e di generare risposte vocali. Il tutto senza passaggi intermedi come ad esempio la trascrizione dell’audio. OpenAI l’ha chiamato l’«omnimodello» (da qui la “o”).

Gli esempi mostrati da OpenAI nelle demo sono sorprendenti. Si può conversare con l’assistente in modo molto naturale, anche interrompendolo, e il modello è in grado di comprendere le emozioni e il tono della voce, oltre a vedere quello che c’è intorno. Anche la voce di risposta è molto naturale, sa usare diverse intonazioni e stili e anche cantare.

Un paio di applicazioni concrete che potrebbero avere un forte impatto sono la traduzione in tempo reale bidirezionale e l’accessibilità. In un video pubblicato da OpenAI GPT-4o è in grado di agire da assistente rispondendo alle domande di una persona ipovedente, mentre durante la presentazione è stata dimostrata la traduzione in tempo reale tra italiano e inglese. La pronuncia italiana è evidentemente migliorabile e, scrive Rest of World, sarà da vedere se OpenAI si concentrerà di più sul migliorare il supporto alle lingue diverse dall’inglese, al momento insoddisfacente.

GPT-4o in versione “testo” è disponibile, o lo sarà a breve, gratuitamente (con dei limiti) per tutti, sia su chatgpt.com, nell’app ChatGPT e nella nuova app per macOS, mentre la modalità voce e video sarà resa disponibile solo agli abbonati a ChatGPT Plus, nelle prossime settimane.

I progressi di GPT-4o nella capacità di ragionare sono comunque marginali, nonostante sia passato un anno dall’ultimo importante passo avanti (il lancio di GPT-4, appunto), e problemi fondamentali come le allucinazioni sono tutt’altro che risolti, per cui c’è già chi ipotizza che OpenAI abbia raggiunto un plateau.

D’altra parte da tempo le indiscrezioni parlano del successore di GPT-4, probabilmente GPT-5, che è atteso per giugno e potrebbe fare un ulteriore salto nelle capacità.

Iscriviti alla newsletter

Non perderti le prossime uscite! Iscriviti alla newsletter per ricevere ogni weekend via email le storie più interessanti della settimana.


Dalla stessa newsletter puoi leggere anche: