社群媒體巨擘臉書(Facebook)母公司Meta Platforms今天發布一種人工智慧(AI)模型,能夠翻譯和轉錄數十種語言的語音,可望成為實現跨語言即時通訊工具的基石。
路透社報導,Meta在部落格文章中表示,這套名為SeamlessM4T的AI模型結合了以往僅能在單獨模型中使用的技術,能夠支援近100種語言的文本和語音翻譯,以及35種語言的語音到語音翻譯。
Meta執行長兼臉書創辦人祖克柏(Mark Zuckerberg)說,他設想這類工具可促進全球用戶在虛擬世界的互動。祖克柏大舉進軍元宇宙,將這家科技龍頭企業的未來押注在虛擬世界。
根據部落格文章,Meta正將這套模型提供給公眾用於非商業用途。
Meta今年發布一連串多為免費的人工智慧模型,其中包括名為Llama的大型語言模型,對微軟(Microsoft)公司支持的OpenAI和Alphabet旗下的谷歌(Google)出品的專利模型構成嚴峻挑戰。
祖克柏說,開放的AI生態系統對Meta更有利,因為公司透過有效群眾外包(Crowd-sourcing)方式,為旗下社群平台創建面向消費者的工具,比向這些模型的使用者收費獲益更多。
關於SeamlessM4T模型,Meta研究人員在一篇研究論文中表示,他們從400萬個小時的「原始音檔」中蒐集相關訓練素材。這些音檔源自公開的網路資料庫,但研究人員未具體說明是哪一個。
Meta發言人並未回覆有關音檔資料來源的問題。
研究論文提到,文本資料取自去年創建的資料集,內容源於維基百科(Wikipedia)和相關網站。(中央社)
◤日本旅遊必買清單◢