廣告
xx
xx
"
"
回到網頁上方

三秒鐘取代10分鐘!AI「翻譯」古籍勝人力

記者 林育竹 報導
發佈時間:2019/11/18 20:00
圖/翻攝自 人文学オープンデータ共同利用センター 臉書專頁
圖/翻攝自 人文学オープンデータ共同利用センター 臉書專頁

日本古代手寫的草書文字,現在全日本僅數千人能正確解讀,導致許多史料被埋沒,甚至因此被當成廢物處理。不過要解讀這些草寫文書史料,需要龐大的知識和時間,日本希望借助AI人工智慧,加速正確解讀史料,甚至舉辦全球性競賽,目標提升AI辨識準確度,要讓過去不被了解的日本文化、歷史及災害紀錄,再次重見天日。

要如何解讀這些「行雲流水」的古代草書?日本要借助AI人工智慧的力量!

 

NHK記者 高橋篤史:「現代人難以解讀的草寫書體,這裡正介紹活用AI解讀的最新技術。」

這場在東京舉辦的國際競賽,邀請約300個團隊參加,使用最新AI技術,把日本古代草書(くずし字)轉換為現代文字。

日本從平安時代到明治初期,即西元9世紀起約1000年,大量古代文獻使用草寫書體,估計有約上億件,但一部作品中,光是一個字就有108種樣貌,能解讀的人有限,也無法了解史料的價值,有的甚至因此被丟棄。
 

系統開發者 土井賢治:「這次聚集各種領域的人,如果能因此解決課題就更好了。」

日本「人文學開放資料共同利用中心」於是著手開發轉換系統,現在為了提升AI瞬間解讀準確度,再拋出新發想,舉辦國際競賽,希望讓更多被埋沒的史料重見天日;結果來自中國大陸和俄羅斯的團隊拔得頭籌,數千個古文畫面,解讀準確率高達95%。

系統開發者:「這就是辨識結果。(竟日無聊...)」

日本三大隨筆集之一,14世紀的代表作《徒然草》,人類解讀一頁最少要10分鐘,AI只要3秒就能判讀;這三個對現代日本人來說,超難辨認的字,AI也正確解讀。AI對反覆出現的字,會一個一個分割辨識,辨別出的文字再跟資料庫內100萬個字對照,再篩選出最適合的文字。

人文學開放資料共同利用中心 北本朝展:「能參考的文獻因此增加,也有不少重要資訊被埋沒,讀了之後會發現,要找的資訊其實都有,像這樣的情況可能很多。」

不少地方上的古代歷史文獻也使用草書,日本東北大學江戶時代的專家指出,古文書裡記錄很多過去的災害,可為現代防災、減災,提供前車之鑑。今年十月遭哈吉貝颱風重創的宮城縣丸森町,因阿武隈川氾濫潰堤,造成10人死亡,其實這個地區在江戶時代也發生同樣的水災。

東北大學副教授 佐藤大介:「明和6年(1769年)『大高水』,寬政3年(1791年)也是『大高水』。(『大高水』,換句話說就是發生洪水。)」
 

根據古文書,多次水災後,當地居民經過討論,決定把住家從河川旁移往山腳下。

東北大學副教授 佐藤大介:「知道過去曾發生災害、有風險的地方,就有可能做出相關應對,希望能慢慢創造共享過去資訊的基礎環境。」

日本要活用AI,解讀古代文獻,開啟通往千年文字文化之門,但專家也指出,AI雖然能辨識,但判讀正確與否,最終還是得由人類來判斷,培育解讀史料的人才同樣不可或缺,雙管齊下才能讓研究更上一層樓。
 TVBS新聞YouTube頻道改版囉! 快點我按讚訂閱

◤Blueseeds永續生活◢

👉天然護膚市場升溫!無添加敏肌也可用

👉精油保養最低49折再享1111折111

👉0水保養・以油養膚,精油保養快跟上


#AI#人工智慧#草書#史料#歷史文獻#江戶時代#古文書#哈吉貝#防災#文字

分享

share

分享

share

連結

share

留言

message

訂閱

img

你可能會喜歡

人氣點閱榜

延伸閱讀

網友回應

其他人都在看

notification icon
感謝您訂閱TVBS,跟上最HOT話題,掌握新聞脈動!

0.1484

0.0911

0.2395