ChatGPT被譽為最具創新性的人工智慧工具之一,不過成功的背後,仰賴的是龐大的數據資料庫,靠數據標註員以手動的方式,對各種文字或是圖片進行標註。不過數據標註員的這個職業,門檻不算高,薪資行情初期大約落在三萬上下,若能標註電路板、晶圓等較困難的產業物件,薪資也會跟著提高。
記者劉彥萱:「ChatGPT掀起全球生成式AI熱潮,成功的背後仰賴的是龐大的數據資料庫,而在我們台灣就有一群專業的數據標註員,以手動的方式,對各種文字或是圖片進行標註。」
AI工程師邱穩碩:「像我現在要標的話是白色的那個勳章,首先就是先把白色勳章外圍先框起來,然後給它一個標籤名字,它就叫白色勳章。」
AI工程師邱穩碩:「簡單來講就是讓電腦知道說,我們現在標記的那個東西是什麼東西,例如剛剛框的那些標籤,就是像是水杯,然後那個勳章,就讓電腦瞭解說長那樣的圖形就叫勳章,長那樣的圖形就叫水杯這樣,所以我們會先大致,會相信標記的那個人都是標記是好的,然後我們先丟進到AI去做訓練,然後如果準確率有問題的話,我們再回推去檢查說,可能是標記有問題,或是我們AI有問題這樣。」
平均一張照片,10到15秒就可以標註完成,但標註工作耗時費力,如同工廠的作業員,以這家科技公司來說,若有急切需求,AI工程師才會親自進行這份工作。
資訊科技公司AI研發協理林祺政:「不見得門檻很高,但是你標註的結果是為了給AI訓練,那你如果要成效好的話,會跟標註的這個過程和它的細緻度很有關係,很多AI模型來講的話,標記是最花時間的,如果你今天是找一些實習生、工讀生來做也可以,但是那個訓練就要比較精緻,還有一些有規劃的訓練這樣子。」
數據標註員是相對門檻較低的工作,不少AI新創公司若沒有多餘人力,就會選擇將工作外包出去。而剛入行的標註員月薪大約落在三萬上下,不過如果能標註較難的物件,像是標註電路板、晶圓等產業物件,或是具備外語能力,薪資也會跟著提高。
台大電機系副教授李宏毅:「這個取決於要標得資料的性質,還有取決於這個任務的提供者,也就是他的這個老闆有多慷慨,所以它不一定是一個低薪的工作,沒有非常瑣碎的工作,就它不是一件非常非常簡單的工作。」
科技公司AI總監黃子魁:「平常我們不太限科系,我們在乎是它能不能理解工程師給他的任務是什麼,我們也會希望用我們知道有一些工業工程系的人,他們以後就是走這個方向,就工業工程師,我們也會希望這邊的人先來打工來當標註師,那他以後對這一塊,我們怎樣把AI應用在工程上面,會更有感覺。」
教AI學習的數據標註員,堪稱人工智慧的褓姆,不過近期ChatGPT的開發者OPENAI,卻被爆出委託肯亞的一家外包公司,雇用時薪不到2美元,也就是新台幣不到60元的數據標註員,就挨批血汗工廠,加上平均每小時要閱讀、標註超過2萬個單詞,以及長時間接觸色情與殘酷內容的字句文本,給他們留下心理創傷。
科技公司專案總監彭建航:「那其實以我們專業在標註智慧製造的立場來看的話,其實他有點過勞,我們整產業跟社會都會有共識說,標記員他在被分派的主題上,應該有一個好的負載,跟分散的管理,盡量不要讓一個作業員去接受到太大量單一,他可能有刺激性的主題,我覺得這應該是可以大幅的改善說,集中標記對於作業員的影響。」
數據標註員是AI發展中重要的一環,精準度也會直接影響AI模型成效,ChatGPT掀起的這場人工智慧革命,也讓過往被邊緣化,默默辛苦付出的標註員,引發全球關注。
◤Blueseeds永續生活◢