Google推出語言模型新工具MUM,可在幾秒鐘內辨識出800種以上、超過50種語言用來稱呼疫苗的詞語,幫助使用者在Google搜尋中找到COVID-19(2019冠狀病毒疾病)疫苗的可靠資訊。
Google搜尋研究員暨副總裁納雅克(Pandu Nayak)今天在官方部落格發文說,根據Google的分析,AstraZeneca、CoronaVac、Moderna、Pfizer、Sputnik等廣泛使用的疫苗,在全世界共有超過800種名稱。使用者搜尋疫苗資訊時,可能會使用Coronavaccine Pfizer、mRNA-1273、CoVaccine等各式各樣的關鍵字。
納雅克強調,Google是否能正確識別所有疫苗名稱,對於使用者能否獲得可靠的最新疫苗資訊至關重要。然而,想辨識出全球使用者對於疫苗的不同稱呼,就得付出大量的時間成本,以人工而言需要幾百小時。
現在有了MUM(Multitask Unified Model),Google可以在短短幾秒鐘內辨識出800種以上、超過50種語言用來稱呼疫苗的詞語。納雅克表示,在驗證MUM的搜尋結果後,Google已能將這個模型應用在Google搜尋服務中,幫助使用者找到全世界有關COVID-19疫苗的資訊。
納雅克指出,這種跨語言遷移學習能力,可以幫助Google快速擴展系統改善,這在一定程度上要歸功於MUM的樣本效率;相較於之前的模型,MUM在完成同一件工作時需要的資料量大幅減少。以疫苗名稱來說,只需要一小部分官方疫苗名稱作為樣本,MUM就能快速識別這是疫苗在不同語言間的名稱。
Google期待MUM在未來可以透過多種方式,讓Google搜尋變得更實用。納雅克說,Google早期的測試結果顯示,MUM不僅可以在許多面向上改進Google現有的系統,還可以幫助打造全新的方式來探索和搜尋資訊。(中央社)
◤Blueseeds永續生活◢