Sguardi curiosi /Nuova intelligenza artificiale multilingue di Meta: SeamlessM4T

Il gigante dei social media Meta ha presentato SeamlessM4T, un modello di intelligenza artificiale multilingue per traduzioni vocali e di testo

2037107
Sguardi curiosi /Nuova intelligenza artificiale multilingue di Meta: SeamlessM4T

Una rete neurale in grado di elaborare sia testo che audio, SeamlessM4T può fare traduzioni da testo a voce, da voce a testo, da voce a voce e da testo a testo in "circa 100 lingue".

Meta afferma che il suo scopo nel produrre questa intelligenza artificiale è aiutare le persone che parlano lingue diverse a comunicare in modo più efficace tra di loro.

Nell'annuncio di SeamlessM4T, Meta ha fatto riferimento a Babel Fish, un pesce immaginario della classica serie di fantascienza di Douglas Adams The Hitchhiker's Guide to the Galaxy, che può tradurre istantaneamente qualsiasi lingua parlata quando viene inserito il testo  nel suo orecchio.

Proprio come Babel Fish, SeamlessM4T mira a eliminare il problema di comunicazione dovuta lingua non conosciuta tra le persone.

Creare un traduttore linguistico universale come Babel Fish è difficile perché i sistemi di sintesi vocale e di sintesi vocale esistenti sono solo una piccola parte delle lingue del mondo.

Meta non è la prima azienda di intelligenza artificiale a offrire strumenti di traduzione per l'apprendimento automatico.

Google Translate gia’ utilizza diverse tecniche di apprendimento automatico dal 2006 e modelli linguistici di grandi dimensioni come GPT-4 sono noti per la loro capacità di tradurre tra lingue.

Ma ultimamente,  la rivalita’ della tecnologia e’ aumentata nel fronte dell’elaborazione audio.

A settembre, OpenAI ha presentato  il proprio modello di sintesi vocale open source chiamato Whisper, in grado di riconoscere il parlato nell'audio e tradurlo in testo con un elevato grado di precisione.



NOTIZIE CORRELATE