建置台灣客語語料庫 開創客語AI時代

2019/12/01 00:25

為了保存客家文化、語言,客委會結合語言、資訊和傳播三方專家,建置台灣客語語料庫,將文字和語音數位化,讓客語進入AI時代,和國際接軌。

 

語言是文化傳承最重要的基礎,為了保存客家文化.呈現客語原貌,客委會從106年起,開始建置全球第一個,由官方帶頭成立的客語語料庫。


客委會主委李永得:「透過數據數位化的保存,不但讓我們的語言做完整的保存,同時將來可以運用到AI,跟所有不同的語言對話,這個是保存語料庫很重要的一個意義。」

由語言,資訊和傳播三領域專家,帶領團隊蒐集、處理、建置系統,等複雜、繁瑣程序後,再將語料轉化成資訊,目前已經有書面語料500萬字,口語語料超過10萬字。
 



客委會主委李永得:「政大這個團隊,超出我們的預期,總共蒐集了書面語料有500萬筆,口語的已經有10幾萬筆。」

透過語料庫,客語也能與時俱進,朝向AI發展。
 

TVBS新聞YouTube頻道改版囉! 快點我按讚訂閱

◤人氣精選文◢

👉『薔薔』撩男祕訣 分享如何遠離渣男

👉 小資守財不易!5大易破財行徑大公開

👉8大招財錢包色彩推薦!換上財運滾滾


更新時間:2019/12/01 07:46