Lar >  Notícias >  Os modelos de baixo custo da AI Deepseek suspeitavam de usar dados do Openai, provocando ironia online

Os modelos de baixo custo da AI Deepseek suspeitavam de usar dados do Openai, provocando ironia online

by Logan Apr 27,2025

O surgimento da AI Deepseek, um modelo de desenvolvimento chinês, provocou controvérsias e preocupações significativas no setor de tecnologia dos EUA. A suspeita de que a DeepSeek possa ter utilizado os dados do OpenAI para treinar seus próprios modelos levou a uma reação acentuada de líderes da indústria e figuras políticas. Donald Trump rotulou Deepseek como um "despertar" para o setor de tecnologia dos EUA, especialmente depois que a Nvidia experimentou uma queda impressionante de US $ 600 bilhões em valor de mercado após uma queda de 16,86% em seu preço das ações-a maior perda de um dia na história de Wall Street. Outros gigantes da tecnologia como Microsoft, Meta Plataformas, empresa controladora do Google, Alphabet e Dell Technologies, também viram seus valores de ações diminuirem, refletindo o desconforto mais amplo do mercado sobre a ameaça competitiva representada pela DeepSeek.

O modelo R1 da Deepseek, construído no Deepseek-V3 de código aberto, afirma oferecer uma alternativa econômica aos modelos ocidentais de IA como o ChatGPT, exigindo significativamente menos poder de computação e sendo treinado por apenas US $ 6 milhões. Essa alegação não apenas desafiou os pesados ​​investimentos que as empresas de tecnologia americanas estão fazendo na IA, mas também levou a Deepseek ao topo das paradas de download de aplicativos gratuitos dos EUA, alimentados por discussões sobre sua eficácia.

Em resposta a esses desenvolvimentos, o OpenAI e a Microsoft estão investigando se o DeepSeek usou a API do OpenAI para integrar os modelos do OpenAI em sua própria, uma prática conhecida como destilação. Essa técnica, que envolve o treinamento de modelos de IA, extraindo dados de mais avançados, é explicitamente proibida pelos Termos de Serviço da OpenAI. A OpenAI enfatizou seu compromisso de proteger sua propriedade intelectual e está colaborando com o governo dos EUA para proteger sua tecnologia de tais práticas.

A situação provocou críticas fortes e acusações de hipocrisia de alguns setores. O Tech PR e o escritor Ed Zitron destacou a ironia das queixas do Openai, dada sua própria história de usar conteúdo da Internet com direitos autorais para treinar o ChatGPT. O Openai argumentou anteriormente que o treinamento de modelos de IA sem material protegido por direitos autorais é "impossível", uma postura que alimentou debates em andamento sobre a ética e a legalidade dos dados de treinamento de IA.

A controvérsia em torno dos dados de treinamento da IA ​​aumentou com ações legais contra o OpenAI e a Microsoft. O New York Times entrou com uma ação em dezembro de 2023, alegando "uso ilegal" de seu conteúdo para desenvolver produtos de IA. Da mesma forma, um grupo de 17 autores, incluindo George RR Martin, iniciou uma ação legal em setembro de 2023, acusando o Openi de "roubo sistemático em escala de massa". Esses processos destacam a questão controversa de usar materiais protegidos por direitos autorais no desenvolvimento da IA, com o OpenAI defendendo suas práticas como "uso justo".

Em meio a essas batalhas legais, um escritório de direitos autorais dos EUA que se referiu pelo juiz distrital Beryl Howell em agosto de 2023 afirmou que a arte gerada pela IA não pode ser protegida por direitos autorais, enfatizando a necessidade da criatividade humana na proteção de direitos autorais. Essa decisão acrescenta outra camada de complexidade às discussões em andamento sobre IA, propriedade intelectual e o futuro do desenvolvimento da tecnologia.

A Deepseek é acusada de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.
Jogos populares Mais >