中國AI新秀DeepSeek爆紅「成本降98%」　嚇跌美期指、日晶片股

記者謝佩穎 / 責任編輯編輯組報導
發佈時間：2025/01/27 15:24
最後更新時間：2025/01/27 15:39

中國AI新創公司DeepSeek於1月20日正式發表新的AI模型DeepSeek-R1。（示意圖／shutterstock達志影像）

中國AI新創公司DeepSeek於1月20日正式發表新的AI模型DeepSeek-R1，不僅以低晶片數開發出性能與OpenAI最新的o1相媲美之外，成本還便宜了98%，震驚矽谷與科技界。而此消息一出，美國股市期貨指數在1月27日亞洲早盤大幅重挫，那斯達克100指數期貨大跌1.8%。日本晶片類股也遭殃，輝達的半導體測試設備供應商愛德萬測試（Advantest）股價盤中重挫8.3%，Disco下跌3.3%、東京威力科創（Tokyo Electron）跌逾4%。

根據中國媒體報導指出，DeepSeek僅用2,048組H800繪圖晶片（GPU）、耗時兩個月，就訓練出了一個6,710億參數的DeepSeek-V3，而且還是使用輝達相對落後的 H800 GPU晶片進行訓練。而Meta則是使用訓練參數量4,050億的Llama 3，用了16,384組更強的H100顯示卡，耗費54天，兩者相比之下，DeepSeek訓練效率提升11倍之多。

根據大陸網站介紹，DeepSeek是來自杭州的「深度求索人工智慧基礎技術研究有限公司」，由大陸知名量化資管巨頭「幻方量化」於2023年成立，專注於開發先進的大語言模型（LLM）和相關技術，獲得資本市場的關注。據了解，DeepSeek-V2的關鍵開發者之一羅福莉，被譽為AI天才少女，在DeepSeek參與研發MoE大模型DeepSeek-V2。

有業內人士指出，訓練DeepSeek的模型只需5500萬美元，而業界可能需要花費數十億美元才能達到類似的效能。微軟執行長Satya Nadella在達沃斯世界經濟論壇上讚揚DeepSeek令人印象深刻，「我們應該非常嚴肅地看待中國的人工智慧（AI）發展」。而《世界報》高級商業編輯Holger Zschäpitz更指出，DeepSeek可能對美國股市產生威脅，質疑投入AI產業數千億美元資本支出的實際效用。

2026世界盃足球賽，最新戰況一次看