建置台灣客語語料庫 開創客語AI時代

2019/12/01 00:25

為了保存客家文化、語言,客委會結合語言、資訊和傳播三方專家,建置台灣客語語料庫,將文字和語音數位化,讓客語進入AI時代,和國際接軌。

 

語言是文化傳承最重要的基礎,為了保存客家文化.呈現客語原貌,客委會從106年起,開始建置全球第一個,由官方帶頭成立的客語語料庫。


客委會主委李永得:「透過數據數位化的保存,不但讓我們的語言做完整的保存,同時將來可以運用到AI,跟所有不同的語言對話,這個是保存語料庫很重要的一個意義。」

由語言,資訊和傳播三領域專家,帶領團隊蒐集、處理、建置系統,等複雜、繁瑣程序後,再將語料轉化成資訊,目前已經有書面語料500萬字,口語語料超過10萬字。
 



客委會主委李永得:「政大這個團隊,超出我們的預期,總共蒐集了書面語料有500萬筆,口語的已經有10幾萬筆。」

透過語料庫,客語也能與時俱進,朝向AI發展。
 

TVBS新聞YouTube頻道改版囉! 快點我按讚訂閱

◤Blueseeds永續生活◢

👉天然護膚市場升溫!無添加敏肌也可用

👉精油保養最低49折再享1111折111

👉0水保養・以油養膚,精油保養快跟上


更新時間:2019/12/01 07:46