為了保存客家文化、語言,客委會結合語言、資訊和傳播三方專家,建置台灣客語語料庫,將文字和語音數位化,讓客語進入AI時代,和國際接軌。
客委會主委李永得:「透過數據數位化的保存,不但讓我們的語言做完整的保存,同時將來可以運用到AI,跟所有不同的語言對話,這個是保存語料庫很重要的一個意義。」
由語言,資訊和傳播三領域專家,帶領團隊蒐集、處理、建置系統,等複雜、繁瑣程序後,再將語料轉化成資訊,目前已經有書面語料500萬字,口語語料超過10萬字。
客委會主委李永得:「政大這個團隊,超出我們的預期,總共蒐集了書面語料有500萬筆,口語的已經有10幾萬筆。」
透過語料庫,客語也能與時俱進,朝向AI發展。
TVBS新聞YouTube頻道改版囉! 快點我按讚訂閱
◤Blueseeds永續生活◢