>  訊息 >  DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

by Peyton Mar 05,2025

DeepSeek令人驚訝的是,廉價的AI模型挑戰了行業巨頭。該公司的新聊天機器人具有令人印象深刻的能力,這導致Nvidia的股價大幅下降。它的成功源於建築創新和高效培訓方法的獨特組合。

DeepSeek測試圖片:ensigame.com

DeepSeek V3利用了幾種尖端技術:多語預測(MTP),以提高準確性和效率;專家(MOE)的混合物,利用256個神經網絡進行加速訓練和改善的性能;和多頭潛在註意力(MLA)專注於關鍵句子元素,從而最大程度地減少信息丟失。

DeepSeek V3圖片:ensigame.com

但是,DeepSeek關於DeepSeek V3的培訓成本僅為600萬美元的聲稱是誤導性的。雖然這涵蓋了培訓前的GPU使用情況,但它忽略了大量研究,改進,數據處理和基礎設施費用。半分析顯示,DeepSeek的實際基礎設施涉及約50,000個NVIDIA HOPPER GPU,代表總服務器投資約為16億美元,運營成本接近9.44億美元。

DeepSeek圖片:ensigame.com

DeepSeek對數據中心的所有權,再加上其自籌資金的地位和高薪研究人員(每年收入超過130萬美元),這有助於其競爭優勢。該公司的精益結構可以快速的創新部署,與更大,更官僚的競爭者形成鮮明對比。

DeepSeek圖片:ensigame.com

儘管DeepSeek的成功是不可否認的,但其“預算友好”的敘述被誇大了。總投資超過5億美元。儘管如此,其相對於競爭對手的成本效益仍然很重要,以DeepSeek的R1(500萬美元)和Chatgpt4o(1億美元)的培訓成本的對比鮮明的培訓成本為例。 DeepSeek的故事強調了資金充足,敏捷的AI公司與已建立的參與者有效競爭的潛力,儘管大規模投資仍然是一個關鍵因素。

熱門遊戲 更多的 >