TradingKey - 自從DeepSeek發表新一代大模型以來,市場震動明顯,投資者和科技界對人工智慧(AI)的發展路徑展開了新一輪討論。美國科技企業近年來在AI領域投入大量資金,但此模式是否可持續,正引發越來越多的質疑。同時,DeepSeek的突破性創新也讓市場重新關注中國科技企業的競爭力。
Dakota Wealth Management高級投資組合經理Robert Pavlik表示:“AI相關支出不斷攀升,市場開始思考:‘到底還需要投入多少資本?何時才能看到資本支出的減少,而非持續大幅增長?’”
市場已經對此作出了反應,截至目前,英偉達(NVIDIA, NVDA)今年以來股價下跌8%,而阿里巴巴(Alibaba, BABA)則上漲超過31%。
來源: TradingView;BABA,BIDU,PDD,JD中概股價表現
DeepSeek如何突圍?創新技術成關鍵
DeepSeek憑藉在多項標準化測驗中的優異表現,在模型能力上挑戰OpenAI,同時在成本和效率方面展現出明顯優勢。值得注意的是,DeepSeek V3所使用的H800 GPU並非英偉達目前最先進的晶片,但在運算資源的利用上更為高效。 TradingKey分析師Viga Liu指出,DeepSeek在AI開發中引入了MOE(專家混合)、MLA(低秩分解)、MTP(多任務預訓練)和RL(強化學習)等創新方法,重新定義了大模型的發展路徑。
MOE可以透過只處理部分所需的參數,而不是像傳統大預言模型一樣輸入所有資訊從而大大增加了效率。 DeepSeek 也開發了 MLA--使用低秩分解來壓縮儲存矩陣,從而顯著減少快取大小。從而有效的降低計算複雜度。
此外,DeepSeek 引入了一種新穎的後訓練方法--強化學習。這種方法挑戰了傳統的縮放定律,顯示透過創新訓練在一定規模下可以實現顯著的效能提升,從而提高資源效率。它鼓勵探索不同的訓練方法和架構以實現非線性改進。
DeepSeek的創新不僅帶來了效能突破,也提供了更具成本效益的AI訓練方案,對投資者和產業人士而言,這無疑是一個令人興奮的訊號。
DeepSeek引發對美國AI產業的再思考
美國科技界對人工智慧的投資規模龐大,但長期以來,許多觀察家都對美國人工智慧的投資和發展方向提出質疑。
毫無例外,美國科技公司都沉迷於規模。他們引用尚未證實的“規模定律”,認為將越來越多的數據和計算能力輸入到他們的模型中是解鎖更強大功能的關鍵。有些甚至斷言「規模就是你所需要的一切」。
儘管 DeepSeek 的方法大致相同,但它似乎更依賴於強化學習、專家混合方法(使用許多較小、更有效率的模型)、提煉和精細的思維鏈推理。但這起事件暴露了美國人工智慧產業的“群體思維”,專業人事甚至提出質疑,美國人工智慧產業是否還有其他更危險的盲點。
DeepSeek對英偉達的影響
DeepSeek的高效運算方式引發了市場對晶片需求前景的擔憂。模型發布後,英偉達股價出現大幅下跌。如果越來越多的企業轉向透過最佳化演算法而非單純依賴算力提升AI效能,高階GPU的需求可能會下降。 摩根士丹利(Morgan Stanley)已下調對英偉達GB200晶片的出貨量預測,從原先的30,000-35,000台降至20,000-25,000台,預計這將為英偉達市值帶來300億至350億美元的衝擊。
此外,Viga Liu認為DeepSeek可能繞過英偉達CUDA生態。 DeepSeek利用自訂PTX(並行執行緒執行)指令,並自動調整通訊區塊大小,以最佳化運算效率。這種方法減少了對CUDA的依賴,直接與GPU硬體互動。如果CUDA生態被削弱,英偉達的護城河或將受到挑戰。
中國科技股受益
DeepSeek的崛起不僅在AI領域掀起“鯰魚效應”,也促使投資者重新評估中國科技股的投資價值。阿里巴巴股價在DeepSeek模型發布後顯著上漲,而百度(Baidu, BIDU)、拼多多(PDD, PDD)和京東(JD, JD)等中概股也在近兩週內大幅走高。
Gam Investment Management投資組合經理簡·施·克特塞(Jian Shi Cortesi)表示:“投資者在評估中國大型科技公司的時候,可能會從‘關注風險’轉向‘關注增長潛力’。考慮到這些公司的估值仍遠低於美國同行,這一趨勢尤其值得關注。”
AI相關投資機會
過去,投資人主要關注AI產業鏈上游(晶片、伺服器、雲端運算等),而對下游應用的落地持謹慎態度。然而,DeepSeek的出現可能加速AI應用場景的普及,帶來新的投資機會。
儘管DeepSeek的運算效率提升,可能對AI產業鏈上游的成長動力構成一定挑戰,但算力需求是否會下降仍有待觀察。例如,大模型仍在快速進化,未來算力需求可能不會顯著降低;同時,如果AI應用爆發式增長,算力需求或將進一步擴大。