首页 >  新闻 >  DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

DeepSeek的负担能力是一个神话:革命性的AI实际上花费了16亿美元

by Peyton Mar 05,2025

DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。该公司的新聊天机器人具有令人印象深刻的能力,这导致Nvidia的股价大幅下降。它的成功源于建筑创新和高效培训方法的独特组合。

DeepSeek测试图片:ensigame.com

DeepSeek V3利用了几种尖端技术:多语预测(MTP),以提高准确性和效率;专家(MOE)的混合物,利用256个神经网络进行加速训练和改善的性能;和多头潜在注意力(MLA)专注于关键句子元素,从而最大程度地减少信息丢失。

DeepSeek V3图片:ensigame.com

但是,DeepSeek关于DeepSeek V3的培训成本仅为600万美元的声称是误导性的。虽然这涵盖了培训前的GPU使用情况,但它忽略了大量研究,改进,数据处理和基础设施费用。半分析显示,DeepSeek的实际基础设施涉及约50,000个NVIDIA HOPPER GPU,代表总服务器投资约为16亿美元,运营成本接近9.44亿美元。

DeepSeek图片:ensigame.com

DeepSeek对数据中心的所有权,再加上其自筹资金的地位和高薪研究人员(每年收入超过130万美元),这有助于其竞争优势。该公司的精益结构可以快速的创新部署,与更大,更官僚的竞争者形成鲜明对比。

DeepSeek图片:ensigame.com

尽管DeepSeek的成功是不可否认的,但其“预算友好”的叙述被夸大了。总投资超过5亿美元。尽管如此,其相对于竞争对手的成本效益仍然很重要,以DeepSeek的R1(500万美元)和Chatgpt4o(1亿美元)的培训成本的对比鲜明的培训成本为例。 DeepSeek的故事强调了资金充足,敏捷的AI公司与已建立的参与者有效竞争的潜力,尽管大规模投资仍然是一个关键因素。

热门游戏 更多 >