by Peyton Mar 05,2025
O modelo de IA surpreendentemente barato de Deepseek desafia os gigantes da indústria. O novo chatbot da empresa possui recursos impressionantes, contribuindo para uma queda significativa no preço das ações da NVIDIA. Seu sucesso decorre de uma combinação única de inovações arquitetônicas e métodos de treinamento eficientes.
Imagem: Ensigame.com
A Deepseek V3 aproveita várias tecnologias de ponta: previsão de vários toques (MTP) para maior precisão e eficiência; Mistura de especialistas (MOE) , utilizando 256 redes neurais para treinamento acelerado e desempenho aprimorado; e atenção latente de várias cabeças (MLA) para se concentrar nos elementos cruciais da frase, minimizando a perda de informações.
Imagem: Ensigame.com
No entanto, a alegação de Deepseek de um mero custo de treinamento de US $ 6 milhões para o Deepseek V3 é enganoso. Embora isso abranja o uso de GPU pré-treinamento, ele omite pesquisas substanciais, refinamento, processamento de dados e despesas de infraestrutura. A semiânica revelou que a infraestrutura real da Deepseek envolve aproximadamente 50.000 GPUs da NVIDIA Hopper, representando um investimento total do servidor de aproximadamente US $ 1,6 bilhão e custos operacionais próximos a US $ 944 milhões.
Imagem: Ensigame.com
A propriedade da Deepseek de seus data centers, juntamente com seu status autofinanciado e pesquisadores altamente compensados (ganhando mais de US $ 1,3 milhão por ano), contribui para sua vantagem competitiva. A estrutura enxuta da empresa permite uma rápida implantação de inovação, contrastando com concorrentes maiores e mais burocráticos.
Imagem: Ensigame.com
Embora o sucesso de Deepseek seja inegável, sua narrativa "econômica" é exagerada. O investimento total excede US $ 500 milhões. No entanto, sua relação custo-benefício em relação aos concorrentes permanece significativa, exemplificada pelos custos de treinamento contrastante do R1 (US $ 5 milhões) e do ChatGPT4O (US $ 100 milhões). A história de Deepseek destaca o potencial de empresas de IA ágil e bem financiadas para competir efetivamente com os players estabelecidos, embora o investimento maciço continue sendo um fator-chave.
Mobile Legends: códigos de resgate lançados em janeiro de 2025
Defesa de ação Android
Ilha Mítica estreia em Pokémon TCG, tempo revelado
Brutal Hack And Slash Platformer Blasphemous está chegando ao celular, pré-registro já disponível
Pocket Pocket Pocket está lançando um recurso comercial e uma expansão espacial de smackdown em breve
Stray Cat Falling: uma evolução nos jogos casuais
Marvel Rivals apresenta novo mapa do centro da cidade
Pokémon TCG Pocket: Paralisado, Explicado (e todas as cartas com a habilidade ‘Paralisar’)