هوش مصنوعی چند زبانه جدید از سوی متا وارد بازار شد
متا، غول رسانههای اجتماعی، SeamlessM4T را که یک مدل هوش مصنوعی چند زبانه برای ترجمه گفتار و متن میباشد را معرفی کرد
SeamlessM4Tبه عنوان یک شبکه عصبی که میتواند هم متن و هم صدا را پردازش کند، میتواند ترجمه متن به گفتار، گفتار به نوشتار، گفتار به گفتار و متن به متن را برای «حداکثر 100 زبان» انجام دهد.
متا می گوید هدف آنها از تولید این هوش مصنوعی کمک به افرادی است که به زبانهای مختلف صحبت می کنند تا با یکدیگر ارتباط راحتتری داشته باشند. متا در اعلامیه SeamlessM4T به بابل فیش، ماهی خیالی از سری کلاسیک علمی تخیلی داگلاس آدامز که میتوانست با قرار دادن در گوشش، هر زبانی را ترجمه کند، اشاره کرد.
SeamlessM4T درست مانند بابل فیش، با هدف از بین بردن مشکل زبان بین افراد به میان آمده است. ایجاد یک مترجم زبان جهانی مانند بابل فیش دشوار است زیرا سیستمهای گفتار به گفتار و گفتار به نوشتار موجود تنها بخش کوچکی از زبانهای جهان را پوشش میدهند.
متا اولین شرکت هوش مصنوعی نیست که ابزارهای ترجمه یادگیری ماشینی را ارائه می دهد. Google Translate از سال 2006 از تکنیکهای یادگیری ماشینی استفاده میکند و مدلهای زبان بزرگ مانند GPT-4 با توانایی خود در ترجمه بین زبانها شناخته شدهاند. اما اخیراً، فناوری در بخش پردازش صدا در حال افزایش است. در ماه سپتامبر، OpenAI مدل متن باز گفتار به متن خود به نام Whisper را منتشر کرد که می تواند گفتار را به صورت صوتی تشخیص دهد و آن را با دقت بالایی به متن ترجمه کند. SeamlessM4T با گسترش ترجمه چندوجهی به بسیاری از زبانهای دیگر نیز بر این روند استوار است.