Kíváncsi lenni az életre 54/ Új többnyelvű mesterséges intelligencia: a SeamlessM4T
A közösségi médiaóriás Meta bemutatta a SeamlessM4T-t, egy többnyelvű mesterséges intelligencia modellt a beszéd- és szövegfordításhoz.
A SeamlessM4T olyan neurális hálózatként, amely egyaránt képes szöveg és hang feldolgozására, képes szövegfelolvasásra, beszéd-szöveg és szöveg-szöveg fordításra "akár 100 nyelven".
A Meta bejelentette, hogy a mesterséges intelligencia előállításával az a célja, hogy segítse a különböző nyelveket beszélő embereket hatékonyabban kommunikálni egymással.
A SeamlessM4T bemutatása során a Meta utalt a Babel-halra, Douglas Adams klasszikus sci-fi sorozatának, A Stoppos Útikalauz A Galaxisba című könyvének kitalált halára, amely a fülbe helyezése esetén azonnal le tud fordítani bármilyen beszélt nyelvet.
Csakúgy, mint a Babel Hal, a SeamlessM4T célja az emberek közötti nyelvi probléma kiküszöbölése.
A Babel halhoz hasonló univerzális nyelvi fordító létrehozása azért nehéz, mert a jelenlegi beszéd-beszéd és beszéd-szöveg rendszerek a világ nyelveinek csak egy kis részét fedik le.
A Meta nem az első mesterséges intelligenciával foglalkozó vállalat, amely gépi tanulási fordítási eszközöket kínál.
A Google Fordító 2006 óta használ gépi tanulási technikákat, és az olyan nagy nyelvi modellek, mint a GPT-4, ismertek a nyelvek közötti fordítási képességükről.
Az utóbbi időben azonban a technológia felgyorsult a hangfeldolgozás terén.
Szeptemberben az OpenAI kiadta saját, nyílt forráskódú beszéd-szöveg modelljét, a Whisper-t, amely képes felismerni a beszédet a hangban, és nagy pontossággal lefordítani azt szövegre.
A SeamlessM4T erre a tendenciára épül a többnyelvű fordítás további nyelvekre történő kiterjesztésével.
Még több hír
MERT(21)/Minden út Rómába vezet
Ma a Római Birodalomról lesz szó, amely mérnöki tudásáról és hódításairól híres.