by Peyton Mar 05,2025
El modelo de IA sorprendentemente económico de Deepseek desafía a los gigantes de la industria. El nuevo chatbot de la compañía cuenta con capacidades impresionantes, contribuyendo a una caída significativa en el precio de las acciones de NVIDIA. Su éxito proviene de una combinación única de innovaciones arquitectónicas y métodos de capacitación eficientes.
Imagen: ensigame.com
Deepseek V3 aprovecha varias tecnologías de vanguardia: predicción múltiple (MTP) para una mayor precisión y eficiencia; Mezcla de expertos (MOE) , utilizando 256 redes neuronales para capacitación acelerada y mejor rendimiento; y atención latente múltiple (MLA) para centrarse en elementos de oraciones cruciales, minimizando la pérdida de información.
Imagen: ensigame.com
Sin embargo, el reclamo de Deepseek de solo un costo de capacitación de $ 6 millones para Deepseek V3 es engañoso. Si bien esto cubre el uso de la GPU previa al entrenamiento, omite investigaciones sustanciales, refinamiento, procesamiento de datos y gastos de infraestructura. El semianálisis reveló que la infraestructura real de Deepseek implica aproximadamente 50,000 GPU de Hopper Nvidia, que representa una inversión total del servidor de aproximadamente $ 1.6 mil millones y costos operativos cerca de $ 944 millones.
Imagen: ensigame.com
La propiedad de Deepseek de sus centros de datos, junto con su estado autofinanciado e investigadores altamente compensados (ganando más de $ 1.3 millones anuales), contribuye a su ventaja competitiva. La estructura magra de la compañía permite una rápida implementación de innovación, en contraste con competidores más grandes y burocráticos.
Imagen: ensigame.com
Si bien el éxito de Deepseek es innegable, su narrativa "económica" es exagerada. La inversión total supera los $ 500 millones. Sin embargo, su rentabilidad en relación con los competidores sigue siendo significativa, ejemplificada por los costos de capacitación contrastantes de R1 de Deepseek ($ 5 millones) y CHATGPT4O ($ 100 millones). La historia de Deepseek destaca el potencial de las compañías de IA ágiles y bien financiadas para competir de manera efectiva con los jugadores establecidos, aunque la inversión masiva sigue siendo un factor clave.
Mobile Legends: códigos de canje de enero de 2025 lanzados
Defensa de acción de Android
Mythical Island debuta en Pokémon TCG, Time Revealed
El brutal juego de plataformas Hack and Slash, Blasphemous, llega a dispositivos móviles, el registro previo ya está disponible
Pokémon TCG Pocket está dejando caer una función comercial y la expansión de Space-Time Smackdown pronto
Stray Cat Falling: una evolución en los juegos casuales
Marvel Rivals muestra el nuevo mapa del centro de la ciudad
Pokémon TCG Pocket: Paralizado, explicado (y todas las cartas con la habilidad "Paralizar")
Reseña del modo Acceso Anticipado de La Quimera
Sep 10,2025
Astra Yao protagoniza el cortometraje de Zenless Zone Zero
Sep 09,2025
Fecha de lanzamiento de la versión en inglés de Umamusume
Sep 08,2025
Guión desenterrado de Dune de Ridley Scott revela una visión audaz
Aug 11,2025
Cristal de Atlan: RPG de Acción MMO Magicpunk Llega al Escenario Global
Aug 10,2025