國科會發展台灣可信任AI對話引擎 盼守住繁中語料

責任編輯 劉奕鋐 報導

2023/06/14 21:28
圖/中央社

政府單位、金融業等資料具機敏性,不能萬事問ChatGPT,國科會主委吳政忠今天表示,發展「可信任人工智慧對話引擎」(TAIDE)是「打地基」,未來提供公私部門加值應用、向上「蓋樓房」,也是守住台灣擁有的豐富、珍貴繁體中文語料。

隨英文、簡體中文版聊天機器人相繼問世,相關爭議叢生。國科會拍板,公私協力發展融合台灣元素、以正體中文為主的「可信任人工智慧對話引擎」(Trustworthy AI Dialog Engine,TAIDE),計畫經費約新台幣2億元至3億元。

 


國科會今天召開記者會,公布第一階段完成了「7B」中模型(參數量為70億),此模型是在LLaMA(Meta推出的語言模型)原型基礎上,由國內學界專家進一步發展及訓練調校。

在計畫起步階段、時間與資料有限下,實測自動摘要、翻譯文本、寫信及寫文章等4方面,TAIDE「7B模型」均有不錯表現,尤其對於繁體中文的處理能量及回答,更為穩定準確。

行政院政委兼國科會主委吳政忠坦言,台灣投入TAIDE預算經費「小小小」,這筆錢拿去買房確實可以買到「大房」,但拿去跟在開發引擎的歐美科技大廠相比,一定是少的;台灣不是要做泛用型,而是從基礎引擎做起「打地基」,未來「上面要蓋什麼樣的樓房」,將攜手公部門、業者做各種應用,達成綜效(synergy)。
 


吳政忠指出,後續各單位可依照需求選擇適用的模型大小,並衡量所需算力及成本,自行運用加值,加速台灣各領域掌握自主性的能力。

台灣之所以必須自己來,是因為「有些東西不能隨便問別人」。吳政忠舉例,台灣公家單位、金融業、科技大廠等資料具機敏性,當然不能問ChatGPT,畢竟AI不斷在學習,資料數據一輸入,無形中就被收走了;再者,台灣擁有豐富繁體中文語料,是「寶貝」,這部分也要守住。

國科會科技政策諮詢專家室資通訊群組召集人李育杰指出,TAIDE計畫考慮兼容、包容性,未來不管是台語、客語都會概括。

針對繁體中文語料的使用,國科會官員及TAIDE團隊表示,目前洽談合作中,後續將取得更大範圍的資料。

國科會打造TAIDE,聚集國內相關領域最頂尖的教授團隊,負責指導核心模型及對話學習技術開發;國科會轄下法人機構,例如國研院國網中心負責建置新一代超級電腦,以提升算力資源,並提供應用服務平台;科政中心則負責徵集處理訓練資料。

此外,數位發展部負責驗測環境架構的發展,並針對計畫所產出的模型進行評測,以提供可信任的證據基礎。(中央社)

◤超夯旅遊新玩法◢

👉輕奢露營新玩法!盤點夢幻露營地GO

👉 Jennie新歌〈Mantra〉人辣車更靚

👉豪華露營車新亮相!旅行說走就走


更新時間:2023/06/14 21:28