廣告
xx
xx
回到網頁上方

中國AI新秀DeepSeek爆紅「成本降98%」 嚇跌美期指、日晶片股

記者 謝佩穎 / 責任編輯 編輯組 報導
發佈時間:2025/01/27 15:24
最後更新時間:2025/01/27 15:39
中國AI新創公司DeepSeek於1月20日正式發表新的AI模型DeepSeek-R1。(示意圖/shutterstock達志影像)
中國AI新創公司DeepSeek於1月20日正式發表新的AI模型DeepSeek-R1。(示意圖/shutterstock達志影像)

中國AI新創公司DeepSeek於1月20日正式發表新的AI模型DeepSeek-R1,不僅以低晶片數開發出性能與OpenAI最新的o1相媲美之外,成本還便宜了98%,震驚矽谷與科技界。而此消息一出,美國股市期貨指數在1月27日亞洲早盤大幅重挫,那斯達克100指數期貨大跌1.8%。日本晶片類股也遭殃,輝達的半導體測試設備供應商愛德萬測試(Advantest)股價盤中重挫8.3%,Disco下跌3.3%、東京威力科創(Tokyo Electron)跌逾4%。

 

根據中國媒體報導指出,DeepSeek僅用2,048組H800繪圖晶片(GPU)、耗時兩個月,就訓練出了一個6,710億參數的DeepSeek-V3,而且還是使用輝達相對落後的 H800 GPU晶片進行訓練。而Meta則是使用訓練參數量4,050億的Llama 3,用了16,384組更強的H100顯示卡,耗費54天,兩者相比之下,DeepSeek訓練效率提升11倍之多。
 

根據大陸網站介紹,DeepSeek是來自杭州的「深度求索人工智慧基礎技術研究有限公司」,由大陸知名量化資管巨頭「幻方量化」於2023年成立,專注於開發先進的大語言模型(LLM)和相關技術,獲得資本市場的關注。據了解,DeepSeek-V2的關鍵開發者之一羅福莉,被譽為AI天才少女,在DeepSeek參與研發MoE大模型DeepSeek-V2。
 

有業內人士指出,訓練DeepSeek的模型只需5500萬美元,而業界可能需要花費數十億美元才能達到類似的效能。微軟執行長Satya Nadella在達沃斯世界經濟論壇上讚揚DeepSeek令人印象深刻,「我們應該非常嚴肅地看待中國的人工智慧(AI)發展」。而《世界報》高級商業編輯Holger Zschäpitz更指出,DeepSeek可能對美國股市產生威脅,質疑投入AI產業數千億美元資本支出的實際效用。


#DeepSeek# DeepSeek-R1# OpenAI# 晶片# 輝達# 黃仁勳# DeepSeek-V3# Llama 3#deepseek是什麼

你可能會喜歡

人氣點閱榜

延伸閱讀

其他人都在看

notification icon
感謝您訂閱TVBS,跟上最HOT話題,掌握新聞脈動!

0.1190

0.0527

0.1717