先探/DeepSeek改寫AI版圖

雖然全球最頂級的AI晶片仍由Nvidia全面主宰,這次深度求索重擊美股,加上最近Nvidia股價弱勢,鼓舞開發商未來可能不需要砸大錢買高階AI晶片就能做出適合自己用的AI模型,會激勵AI ASIC晶片產業蓬勃發展。

文/魏聖峰

美國總統川普剛就任的隔天,馬上召集軟銀、甲骨文和OpenAI高層,將耗資五千萬美元在美國成立類似主權AI的相關投資計畫。不料,隔天原本沒有名氣的中國深度求索(DeepSeek)發表一款AI模型R1,之後引發華爾街市場大震撼,且被市場稱為「AI珍珠港事件」,襲擊美國AI相關股,並讓美股在一月二十七日當天市值蒸發掉一兆美元,與AI關聯度最高的費城半導體指數當天重挫後,因Nvidia表現不佳至今走勢相對弱勢,等於是給川普洗臉。

美國與中國關係惡化,從八年前川普在第一任總統期間宣布向中國發動貿易戰。拜登繼任總統後,除貿易戰外還擴大封鎖中國科技。對中國的科技封鎖不限美國企業,還把美國所有的盟友拉進來,持續要求外資企業撤離中國並選邊站。在這樣敵我界線分明下,中國透過各種管道還是有能力拿到Nvidia的高階AI晶片。深度求索承認使用約兩千多片的H200晶片,且整個開發成本僅約五六○萬美元就打造出能與OpenAI、谷歌同等級的AI模型DeepSeek-R1。

這樣的AI模型成本結構與美國大型CSP業者至少要使用一.六萬片的H200和H100晶片相比,其開發成本僅是OpenAI成本的二%。在DeepSeek-R1大出鋒頭後,引發全球用戶大量下載,不到一個星期,累積的下載次數超過一六○○萬次,尤其以印度用戶的下載數量最高。

華爾街質疑開發成本過低

衝擊過後,華爾街引述數名半導體分析師對深度求索能以如此低成本,打造出能與美國先進AI模型相匹敵產品提出質疑,大部分分析師普遍認為深度求索不太可能以這麼低的成本打造出具突破性的AI模型,要不然那些美國大型CSP業者過去不就白花錢。OpenAI創辦人阿特曼(Sam Altman)也跳出來質疑,深度求索有不合法使用OpenAI模型的技術,而他們也掌握相關的證據。部分晶片分析師認為,深度求索應該用到五萬片的AI晶片才做得出來,而五六○萬的開發成本也僅能算是應用上的使用成本。因為五萬片AI晶片的成本就不只這些金額,也有分析師質疑應該有中國政府介入,才有辦法做得出來。

Meta目前正在研發的Research SuperCluster(RSC)至少就使用超過一.六萬片的A100晶片,該公司目前的Llama大型語言模型、谷歌Gemini和OpenAI的AI模型也都耗掉上萬片的AI晶片才做得出來。特斯拉創辦人馬斯克的xAI早已購入超過十萬片的H200和H100晶片,只要Nvidia的GB200晶片出得了貨,也都會被特斯拉、甲骨文和大型CSP業者掃貨。市場擔心如果深度求索能以極低的成本打造出AI模型,就會引來AI產業反思是否真的有必要砸大錢打造AI模型,甚至引發AI產業是否將泡沫化的問題。

遭美國封鎖下生出的產品

以時間推論,不論是深度求索在去年十二月下旬推出的DeepSeek-V3還是這次令市場震撼的DeepSeek-R1 AI模型,在開發期間都處於被美國政府科技封鎖期間。雖然Nvidia推出閹割版的H20晶片,只有H200本尊效能的十分之一,他們還是能開發出頂尖的AI模型出來。先進的AI系統需歸納文字、圖片、影音等大數據的深度學習技能,深度求索大概是把這些數據分析工作分配給多個不同模型,每個模型負責特定領域,力求讓高效數據處理的時間縮短。這種方式在美國和其他發展AI模型的國家並非沒做過,只不過是沒辦法像深度求索那樣僅用到更少的運算能力就做到這樣的地步。(全文未完)

全文及圖表請見《先探投資週刊2338期精彩當期內文轉載》


標題:先探/DeepSeek改寫AI版圖

聲明: 本文版權屬原作者。轉載內容僅供資訊傳遞,不涉及任何投資建議。如有侵權,請立即告知,我們將儘速處理。感謝您的理解。

分享你的喜愛