廣告
xx
xx
回到網頁上方

鴻海首推繁體中文AI大模型 4周完成訓練、輝達H100助攻

記者 謝佩穎 / 責任編輯 編輯組 報導
發佈時間:2025/03/11 11:36
最後更新時間:2025/03/11 11:59
鴻海宣布旗下鴻海研究院推出首款繁體中文AI大型語言模型(LLM)。(示意圖/shutterstock達志影像)
鴻海宣布旗下鴻海研究院推出首款繁體中文AI大型語言模型(LLM)。(示意圖/shutterstock達志影像)

鴻海研究院10日宣布,推出首款繁體中文AI大型語言模型FoxBrain,此模型以優異的運算成本,於四週內完成訓練。FoxBrain模型原為內部應用而設計,涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能,展現了強大的理解與推理能力,還能針對台灣使用者的語言風格進行優化,並在數學與邏輯推理測試中表現出色,後續將對外開源分享。

鴻海研究院人工智慧研究所栗永徽所長表示,FoxBrain模型採用高效訓練策略,專注於訓練過程優化而非盲目堆砌算力。透過精心設計的訓練方法和資源優化,成功打造出具備強大推理能力的本土AI模型。FoxBrain訓練過程中,使用120張NVIDIA H100 GPU,並透過NVIDIA Quantum-2 InfiniBand網路進行擴展,僅花約四周的時間完成,以更高效率、更低成本的模型訓練方式為台灣AI技術發展樹立新里程碑。

 

FoxBrain 模型(對比Meta Llama 3.1 70B 與 Llama-3-Taiwan-70B) 在 TMMLU+ 上面幾個重要領域的得分。(圖/鴻海提供)


鴻海表示,FoxBrain採用Meta Llama 3.1為基礎架構,擁有70B參數。透過自主技術,建立24類主題的資料增強方式與品質評估方法,生成98B tokens高品質中文預訓練資料。上下文處理長度達128K token,總計算力花費2688 GPU days。FoxBrain於數學領域較基礎模型Meta Llama 3.1全面提升,相較於目前最好的繁體中文大模型Taiwan Llama在數學測試中取得顯著進步,並在數學推理能力上超越Meta目前已推出的同等級模型。

鴻海表示,FoxBrain的研發,從資料收集、資料清理與擴增、Continual Pre-Training、Supervised Finetuning、RLAIF、Adaptive Reasoning Reflection,以自主研發的方式一步一腳印,穩紮穩打把每一個環節做好,最終在運用有限的算力資源下,仍能達到接近世界頂尖AI大模型的效益。此大型語言模型的研究成果,顯示台灣科技人才在AI大模型領域也能夠與國外人才並駕齊驅。未來,鴻海將持續與技術夥伴合作,對外開源分享,擴大FoxBrain模型運用範圍,共同推動AI在製造業、供應鏈管理與智慧決策領域的應用。

AI浪潮來襲

#FoxBrain# 鴻海# 繁體中文# AI# 大型語言模型# 台灣# 人工智慧# 模型訓練#鴻海#2317

你可能會喜歡

人氣點閱榜

延伸閱讀

網友回應

其他人都在看

notification icon
感謝您訂閱TVBS,跟上最HOT話題,掌握新聞脈動!

0.1428

0.0634

0.2062