Lar Notícias Modelos de IA Deepseek de baixo custo da China, suspeitos de usar dados Openai

Modelos de IA Deepseek de baixo custo da China, suspeitos de usar dados Openai

Autor : Caleb Feb 18,2025

O Openai suspeita que o DeepSeek, um modelo de IA chinês conhecido por seu custo significativamente menor, pode ter sido treinado usando os dados do OpenAI. Essa revelação, juntamente com o rápido aumento da popularidade da Deepseek, desencadeou uma desaceleração significativa do mercado para as principais empresas de IA dos EUA. A NVIDIA, uma participante importante na tecnologia GPU crucial para a IA, experimentou a maior perda de ações de um dia na história de Wall Street, perdendo quase US $ 600 bilhões em capitalização de mercado. As tecnologias Microsoft, Meta, Alphabet e Dell também sofreram perdas substanciais.

O modelo R1 da Deepseek, construído sobre o Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) em comparação com as contrapartes ocidentais como o ChatGPT. Embora essa reivindicação seja debatida, ela alimentou preocupações sobre os enormes investimentos que estão sendo feitos pelas empresas de tecnologia americanas na IA. A popularidade do aplicativo surgiu após discussões sobre sua relação custo-benefício.

O OpenAI e a Microsoft estão investigando se a Deepseek violou os Termos de Serviço da OpenAI usando sua API ou empregando "destilação", uma técnica que extrai dados de modelos maiores para treinamento. O OpenAI reconhece as tentativas em andamento dos chineses e de outras empresas de replicar os modelos de IA liderados e enfatiza seu compromisso de proteger sua propriedade intelectual (IP) por meio de várias contramedidas e colaboração com o governo dos EUA.

David Sacks, Czar de AI do presidente Trump, apóia a alegação de que a Deepseek usou os modelos do OpenAI, sugerindo que as principais empresas de IA implementarão medidas para evitar ocorrências semelhantes.

Esta situação destaca a ironia das acusações do Openai, dadas as alegações anteriores de que a criação de modelos de IA como o ChatGPT é impossível sem usar material protegido por direitos autorais. Openai argumentou anteriormente à Câmara dos Lordes do Reino Unido que as leis de direitos autorais tornam impossível treinar os principais modelos de IA sem acesso ao trabalho protegido por direitos autorais. Essa postura é ainda mais complicada por processos movidos contra o OpenAI pelo New York Times e 17 autores alegando violação de direitos autorais. O OpenAI sustenta que suas práticas de treinamento constituem "uso justo". O cenário legal em torno dos dados de treinamento da IA ​​e direitos autorais permanece altamente contestado, particularmente à luz de um escritório de direitos autorais dos EUA em 2018, decidindo que a arte gerada pela IA não é de direitos autorais.

Deepseek é acusado de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.

Artigos Mais Recentes Mais