疫情之下,全民追疫情記者會,不方便聽聲音時,即時字幕就是好幫手。精準呈現字幕的幕後推手,是陽明交大自然語言團隊與打字速度飛快的聽打員攜手,當「AI教練」提高準確率。
「台灣人真的很愛看字幕。」陽明交大自然語言處理團隊執行長陳又碩說,台灣人理解內容時,字幕扮演要角,團隊近30名成員,研發出以台灣說話方式為主的人工智慧(AI)語音辨識系統。
這套AI系統辨識台灣人言談的準確度就可達80%以上,陳又碩比喻,就如國小中低年級學童程度,因應不同領域需求,必須持續指導訓練並更新詞彙,而聽打員就宛如教練,是訓練AI的好幫手。
2019年底總統大選辯論直播,AI語音辨識團隊與聽打員合作呈現即時字幕,發現既能提升AI準確度,還能減輕聽打員壓力。
在去年疫情初起,陳又碩便聯繫中央流行疫情指揮中心,與聽障團體中華民國聲暉聯合會合作,盼提供即時字幕讓疫情訊息發布更精準。
去年3月即時字幕試行,6月正式上線,準確度從最初約80%提升到近期的96%至97%,連指揮中心醫療應變組副組長羅一鈞都是愛用者,公務在身時,看字幕就能掌握最新記者會動態。
與聲暉聯合會合作的聽打員莊雅筑,擔任最初的「AI教練」。大學時期是法律系高材生的她,對手語深感興趣,於2013年起擔任聽打員。
她提到,一般聽打服務是坐在聽障者旁邊打字,直到近年線上直播興起,才發展出即時字幕服務。
擔任聽打員,打字速度是基本要求。以社福體系聽打員規定為例,中文聽打每分鐘至少80字、準確率達90%。莊雅筑說,一般聽打員每分鐘聽打速度約120至130字,有8年聽打員資歷的她,可達每分鐘170至180字。
莊雅筑提到,疫情之前聽打工作大多與社福與勞動政策相關,但收入不穩定,多數人都是兼職,全台全職聽打員可能不到10人,且集中在雙北地區。
選擇擔任全職聽打員,莊雅筑熱愛聽打工作的多元性與時間彈性,她曾擔任總統就職典禮與國慶致詞的聽打員,也替直銷公司做即時字幕,或參與科技論壇,藉由聽打工作探索不同領域,疫情記者會也是她的新嘗試。
「我們是全場最認真聽課的人。」目前擔任新北市疫情記者會聽打員兼督導的莊雅筑說,受疫情衝擊許多活動取消,連帶聽打工作也受影響,但卻因疫情記者會,不僅多了工作機會,每天認真聽講,也能學習防疫新知,掌握疫情也較安心,不會特別恐慌。
提到疫情記者會字幕工作的困難之處,莊雅筑提到,每位發言者口音不同,或者記者提問語速過快,對聽打或即時字幕都是挑戰,她就曾發生將「樹林」打成「士林」的糗事。
陳又碩也提到,指揮中心記者會發言以指揮官陳時中為主,資料庫也累積大量他的用語習慣,有時口齒不清或漏字時,AI也能自動補上;此外,陳時中語末常發出「吼」的語助詞,起初字幕會忠實呈現,但後續與聽打員討論,認為會徒增混淆,就設定讓AI自動過濾。
隱身幕後、鮮少被曝光的字幕團隊,因疫情記者會受到關注。莊雅筑說,新北市疫情記者會特別介紹當天的手譯員與聽打員,她對此相當肯定,表示對手譯員與聽打員的尊重。
有了AI字幕輔助,莊雅筑並不擔心聽打工作被取代,她認為,AI字幕是工具,但仍須靠人工修正錯漏字,彼此合作更能提供正確的訊息給廣大觀眾。(中央社)
◤日本旅遊必買清單◢