by Peyton Mar 05,2025
Ang nakakagulat na Deepseek ay murang mga hamon sa modelo ng AI na mga higante sa industriya. Ang bagong chatbot ng kumpanya ay ipinagmamalaki ang mga kahanga -hangang kakayahan, na nag -aambag sa isang makabuluhang pagbagsak sa presyo ng stock ng NVIDIA. Ang tagumpay nito ay nagmumula sa isang natatanging kumbinasyon ng mga pagbabago sa arkitektura at mahusay na pamamaraan ng pagsasanay.
Larawan: ensigame.com
Ang Deepseek V3 ay gumagamit ng maraming mga teknolohiyang paggupit: Multi-Token Prediction (MTP) para sa pinahusay na kawastuhan at kahusayan; Pinaghalong mga eksperto (MOE) , na gumagamit ng 256 neural network para sa pinabilis na pagsasanay at pinahusay na pagganap; at multi-head latent pansin (MLA) upang tumuon sa mga mahahalagang elemento ng pangungusap, na binabawasan ang pagkawala ng impormasyon.
Larawan: ensigame.com
Gayunpaman, ang pag -angkin ng Deepseek ng isang $ 6 milyong gastos sa pagsasanay para sa Deepseek V3 ay nakaliligaw. Habang sumasaklaw ito sa paggamit ng GPU ng pre-pagsasanay, tinanggal nito ang malaking pananaliksik, pagpipino, pagproseso ng data, at mga gastos sa imprastraktura. Ang Semianalysis ay nagsiwalat ng aktwal na imprastraktura ng Deepseek ay nagsasangkot ng humigit -kumulang na 50,000 NVIDIA HOPPER GPU, na kumakatawan sa isang kabuuang pamumuhunan ng server na humigit -kumulang na $ 1.6 bilyon at mga gastos sa pagpapatakbo malapit sa $ 944 milyon.
Larawan: ensigame.com
Ang pagmamay-ari ng Deepseek ng mga sentro ng data nito, kasabay ng katayuan na pinondohan ng sarili at lubos na nabayaran ang mga mananaliksik (kumita ng higit sa $ 1.3 milyon taun-taon), ay nag-aambag sa mapagkumpitensyang gilid nito. Ang istraktura ng kumpanya ng kumpanya ay nagbibigay -daan sa mabilis na paglawak ng pagbabago, na kaibahan sa mas malaki, mas maraming mga kakumpitensya sa burukrasya.
Larawan: ensigame.com
Habang ang tagumpay ng Deepseek ay hindi maikakaila, ang "badyet-friendly" na salaysay nito ay pinalaki. Ang kabuuang pamumuhunan ay lumampas sa $ 500 milyon. Gayunpaman, ang pagiging epektibo ng gastos na nauugnay sa mga kakumpitensya ay nananatiling makabuluhan, na ipinakita ng magkakaibang mga gastos sa pagsasanay ng R1 ($ 5 milyon) at Chatgpt4O ($ 100 milyon). Ang kwento ng Deepseek ay nagtatampok ng potensyal ng mahusay na pondo, maliksi na mga kumpanya ng AI upang makipagkumpetensya nang epektibo sa mga naitatag na manlalaro, kahit na ang napakalaking pamumuhunan ay nananatiling isang pangunahing kadahilanan.
Android Action-Defense
Gotham Knights: Rumored Nintendo Switch 2 Debut
Maalamat na Rockers, ang Rolling Stones, Sumali sa Roblox Metaverse
Inilabas ng TiMi at Garena ang Delta Force Global Mobile Release
Ang Immersive na FPS na "I Am Your Beast" ay Nag-debut ng Nakagagandang Bagong Trailer
Cat-Centric Puzzle 'Mister Antonio': Fetch Made Feline-Friendly
Sa wakas ay inilabas ng Wuthering Waves ang bersyon 2.0 na nagtatampok sa bagong rehiyon ng Rinascita
Ibinalik ng Identity V ang Phantom Thieves Para sa Isang Buwan na Persona 5 Crossover!
Ang Sag-Aftra ay tumama sa mga proteksyon ng AI laban sa mga pangunahing kumpanya ng video game
Mar 06,2025
Ang Waven ay isang bagong RPG sa Android na katulad ng mga bayani ng Fire Emblem
Mar 06,2025
Nangungunang 10 Pokémon TCG Pocket Decks na na -revamp ng alamat ng pagpapalawak ng isla
Mar 06,2025
NVIDIA GEFORCE RTX 5070 TI REVIEW
Mar 06,2025
Pokémon TCG Charizard Statue na ginamit upang ipakita ang iyong paboritong card na magagamit para sa preorder
Mar 06,2025