Kíváncsi lenni az életre 54/ Új többnyelvű mesterséges intelligencia: a SeamlessM4T

A közösségi médiaóriás Meta bemutatta a SeamlessM4T-t, egy többnyelvű mesterséges intelligencia modellt a beszéd- és szövegfordításhoz.

2041669
Kíváncsi lenni az életre 54/ Új többnyelvű mesterséges intelligencia: a SeamlessM4T

A SeamlessM4T olyan neurális hálózatként, amely egyaránt képes szöveg és hang feldolgozására, képes szövegfelolvasásra, beszéd-szöveg és szöveg-szöveg fordításra "akár 100 nyelven".

A Meta bejelentette, hogy a mesterséges intelligencia előállításával az a célja, hogy segítse a különböző nyelveket beszélő embereket hatékonyabban kommunikálni egymással.

A SeamlessM4T bemutatása során a Meta utalt a Babel-halra, Douglas Adams klasszikus sci-fi sorozatának, A Stoppos Útikalauz A Galaxisba című könyvének kitalált halára, amely a fülbe helyezése esetén azonnal le tud fordítani bármilyen beszélt nyelvet.

Csakúgy, mint a Babel Hal, a SeamlessM4T célja az emberek közötti nyelvi probléma kiküszöbölése.

A Babel halhoz hasonló univerzális nyelvi fordító létrehozása azért nehéz, mert a jelenlegi beszéd-beszéd és beszéd-szöveg rendszerek a világ nyelveinek csak egy kis részét fedik le.

A Meta nem az első mesterséges intelligenciával foglalkozó vállalat, amely gépi tanulási fordítási eszközöket kínál.

A Google Fordító 2006 óta használ gépi tanulási technikákat, és az olyan nagy nyelvi modellek, mint a GPT-4, ismertek a nyelvek közötti fordítási képességükről.

Az utóbbi időben azonban a technológia felgyorsult a hangfeldolgozás terén.

Szeptemberben az OpenAI kiadta saját, nyílt forráskódú beszéd-szöveg modelljét, a Whisper-t, amely képes felismerni a beszédet a hangban, és nagy pontossággal lefordítani azt szövegre.

A SeamlessM4T erre a tendenciára épül a többnyelvű fordítás további nyelvekre történő kiterjesztésével.



Még több hír