by Peyton Mar 05,2025
Il modello AI sorprendentemente economico di Deepseek sfida i giganti del settore. Il nuovo chatbot dell'azienda vanta capacità impressionanti, contribuendo a un calo significativo del prezzo delle azioni di Nvidia. Il suo successo deriva da una combinazione unica di innovazioni architettoniche e metodi di formazione efficienti.
Immagine: Ensigame.com
DeepSeek V3 sfrutta diverse tecnologie all'avanguardia: previsione multi-token (MTP) per una maggiore precisione ed efficienza; Miscela di esperti (MOE) , utilizzando 256 reti neurali per la formazione accelerata e prestazioni migliorate; e attenzione latente a più testa (MLA) per concentrarsi su elementi di frase cruciali, minimizzando la perdita di informazioni.
Immagine: Ensigame.com
Tuttavia, l'affermazione di Deepseek di un costo di allenamento di soli 6 milioni di dollari per Deepseek V3 è fuorviante. Sebbene ciò copra l'utilizzo della GPU pre-allenamento, omette sostanziali ricerche, perfezionamento, elaborazione dei dati e spese di infrastruttura. La semianalisi ha rivelato che l'infrastruttura effettiva di DeepSeek coinvolge circa 50.000 GPU di Nvidia Hopper, che rappresentano un investimento totale del server di circa $ 1,6 miliardi e costi operativi vicino a $ 944 milioni.
Immagine: Ensigame.com
La proprietà di Deepseek dei suoi data center, unita al suo stato autofinanziato e ai ricercatori altamente compensati (guadagnando oltre $ 1,3 milioni all'anno), contribuisce al suo vantaggio competitivo. La struttura snella dell'azienda consente una rapida implementazione dell'innovazione, in contrasto con concorrenti più grandi e burocratici.
Immagine: Ensigame.com
Mentre il successo di Deepseek è innegabile, la sua narrazione "economica" è esagerata. L'investimento totale supera i $ 500 milioni. Tuttavia, il suo efficacia in termini di costi relativi ai concorrenti rimane significativo, esemplificato dai costi di formazione contrastanti degli R1 di DeepSeek ($ 5 milioni) e Chatgpt4o ($ 100 milioni). La storia di Deepseek evidenzia il potenziale di società di intelligenza artificiale ben finanziate e agili di competere efficacemente con attori affermati, sebbene gli investimenti enormi rimangono un fattore chiave.
Android Action-Difesa
Gotham Knights: Rumored Nintendo Switch 2 Debut
Rocker leggendari, i Rolling Stones, unisciti al Roblox Metaverso
TiMi e Garena presentano il rilascio mobile globale di Delta Force
Il coinvolgente FPS "I Am Your Beast" presenta un nuovo straordinario trailer
Puzzle incentrato sui gatti "Mister Antonio": reso adatto ai felini
Wuthering Waves rilascia finalmente la versione 2.0 con la nuova regione Rinascita
Identity V riporta i Phantom Thieves per un crossover di Persona 5 della durata di un mese!
SAG-AFTRA colpisce le protezioni dell'IA contro le principali compagnie di videogiochi
Mar 06,2025
Waven è un nuovo gioco di ruolo su Android simile agli eroi di Fire Emblem
Mar 06,2025
Top 10 mazzi tascabili TCG Pokémon rinnovati dall'espansione dell'isola mitica
Mar 06,2025
NVIDIA GEFORCE RTX 5070 TI Review
Mar 06,2025
Pokémon TCG Charizard Statue utilizzata per visualizzare la tua carta preferita disponibile per il preordine
Mar 06,2025