圖/翻攝自 人文学オープンデータ共同利用センター 臉書專頁
日本古代手寫的草書文字,現在全日本僅數千人能正確解讀,導致許多史料被埋沒,甚至因此被當成廢物處理。不過要解讀這些草寫文書史料,需要龐大的知識和時間,日本希望借助AI人工智慧,加速正確解讀史料,甚至舉辦全球性競賽,目標提升AI辨識準確度,要讓過去不被了解的日本文化、歷史及災害紀錄,再次重見天日。
要如何解讀這些「行雲流水」的古代草書?日本要借助AI人工智慧的力量!
NHK記者 高橋篤史:「現代人難以解讀的草寫書體,這裡正介紹活用AI解讀的最新技術。」
這場在東京舉辦的國際競賽,邀請約300個團隊參加,使用最新AI技術,把日本古代草書(くずし字)轉換為現代文字。
日本從平安時代到明治初期,即西元9世紀起約1000年,大量古代文獻使用草寫書體,估計有約上億件,但一部作品中,光是一個字就有108種樣貌,能解讀的人有限,也無法了解史料的價值,有的甚至因此被丟棄。
系統開發者 土井賢治:「這次聚集各種領域的人,如果能因此解決課題就更好了。」
日本「人文學開放資料共同利用中心」於是著手開發轉換系統,現在為了提升AI瞬間解讀準確度,再拋出新發想,舉辦國際競賽,希望讓更多被埋沒的史料重見天日;結果來自中國大陸和俄羅斯的團隊拔得頭籌,數千個古文畫面,解讀準確率高達95%。
系統開發者:「這就是辨識結果。(竟日無聊...)」
日本三大隨筆集之一,14世紀的代表作《徒然草》,人類解讀一頁最少要10分鐘,AI只要3秒就能判讀;這三個對現代日本人來說,超難辨認的字,AI也正確解讀。AI對反覆出現的字,會一個一個分割辨識,辨別出的文字再跟資料庫內100萬個字對照,再篩選出最適合的文字。
人文學開放資料共同利用中心 北本朝展:「能參考的文獻因此增加,也有不少重要資訊被埋沒,讀了之後會發現,要找的資訊其實都有,像這樣的情況可能很多。」
不少地方上的古代歷史文獻也使用草書,日本東北大學江戶時代的專家指出,古文書裡記錄很多過去的災害,可為現代防災、減災,提供前車之鑑。今年十月遭哈吉貝颱風重創的宮城縣丸森町,因阿武隈川氾濫潰堤,造成10人死亡,其實這個地區在江戶時代也發生同樣的水災。
東北大學副教授 佐藤大介:「明和6年(1769年)『大高水』,寬政3年(1791年)也是『大高水』。(『大高水』,換句話說就是發生洪水。)」
根據古文書,多次水災後,當地居民經過討論,決定把住家從河川旁移往山腳下。
東北大學副教授 佐藤大介:「知道過去曾發生災害、有風險的地方,就有可能做出相關應對,希望能慢慢創造共享過去資訊的基礎環境。」
日本要活用AI,解讀古代文獻,開啟通往千年文字文化之門,但專家也指出,AI雖然能辨識,但判讀正確與否,最終還是得由人類來判斷,培育解讀史料的人才同樣不可或缺,雙管齊下才能讓研究更上一層樓。
TVBS新聞YouTube頻道改版囉! 快點我按讚訂閱
◤Blueseeds永續生活◢
更新時間:2019/11/18 19:26