by Peyton Mar 05,2025
Deepseekの驚くほど安価なAIモデルは、業界の巨人に挑戦しています。同社の新しいチャットボットは印象的な機能を誇っており、Nvidiaの株価の大幅な低下に貢献しています。その成功は、建築革新と効率的なトレーニング方法のユニークな組み合わせに由来しています。
画像:Ensigame.com
DeepSeek V3は、いくつかの最先端のテクノロジーを活用しています。精度と効率を向上させるためのマルチトークン予測(MTP) 。加速トレーニングとパフォーマンスの改善のために256のニューラルネットワークを利用して、専門家(MOE)の混合。重要な文化要素に焦点を当て、情報の損失を最小限に抑えるために、マルチヘッドの潜在的な注意(MLA)。
画像:Ensigame.com
ただし、Deepseek V3のわずか600万ドルのトレーニングコストというDeepseekの主張は誤解を招くものです。これはトレーニング前のGPU使用をカバーしていますが、実質的な調査、改良、データ処理、インフラストラクチャの費用を省略しています。 Semianalysisは、Deepseekの実際のインフラストラクチャには約50,000のNvidia Hopper GPUが関与していることを明らかにしました。
画像:Ensigame.com
Deepseekのデータセンターの所有権は、自己資金によるステータスと高度に補償された研究者(年間130万ドル以上を稼ぐ)と相まって、競争力に貢献しています。同社の無駄のない構造により、迅速なイノベーションの展開が可能になり、より多くの官僚的な競合他社とは対照的です。
画像:Ensigame.com
Deepseekの成功は否定できませんが、その「予算に優しい」物語は誇張されています。総投資は5億ドルを超えています。それにもかかわらず、競合他社に対するその費用対効果は、DeepSeekのR1(500万ドル)とChatGPT4O(1億ドル)の対照的なトレーニングコストによって例示される重要なままです。 Deepseekのストーリーは、大規模な投資が依然として重要な要素であるにもかかわらず、資金提供された機敏なAI企業が確立されたプレーヤーと効果的に競争する可能性を強調しています。
Android のアクション-ディフェンス
伝説のロッカー、ローリング・ストーンズが Roblox メタバースに参加
Gotham Knights: Rumored Nintendo Switch 2 Debut
TiMi と Garena がデルタ フォースのグローバル モバイル リリースを発表
猫中心のパズル「ミスター・アントニオ」: 猫に優しいフェッチ
Wuthering Waves がついに新しい Rinascita 地域をフィーチャーしたバージョン 2.0 をリリース
没入型 FPS「I Am Your Beast」が見事な新しいトレーラーを公開
Android が Floatopia を歓迎: どうぶつの森にインスピレーションを得た魅惑的なゲーム