O Openai suspeita que a DeepSeek, um fornecedor de modelos de IA chinês, alavancou os dados do OpenAI para criar suas alternativas significativamente mais baratas. Essa acusação segue o lançamento do modelo R1 da Deepseek, que causou uma volatilidade significativa do mercado, impactando particularmente a NVIDIA, cujas ações caíram em 16,86%. Outras empresas relacionadas à IA também sofreram perdas substanciais.
O R1 de Deepseek, construído sobre o Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) em comparação com as contrapartes ocidentais. Embora essa reivindicação seja contestada, alimentou as preocupações dos investidores em relação aos investimentos maciços na IA pelos gigantes da tecnologia americana. O aplicativo da Deepseek liderou rapidamente as paradas de download nos EUA, destacando ainda mais a controvérsia.
O OpenAI e a Microsoft estão investigando se o Deepseek violou os termos de serviço da OpenAI usando a API do OpenAI para destilação do modelo - uma técnica que envolve a extração de dados de modelos maiores. A OpenAI confirmou sua conscientização sobre tais tentativas dos chineses e de outras empresas de replicar as principais tecnologias de IA dos EUA e enfatizou seu compromisso de proteger sua propriedade intelectual. David Sacks, consultor de IA do presidente Trump, corroborou a suspeita de destilação de conhecimento dos modelos Openai.
A situação destaca uma ironia significativa: o OpenAI, acusado de utilizar conteúdo da Internet protegido por direitos autorais para treinar o ChatGPT, agora está acusando o Deepseek de práticas semelhantes. Essa hipocrisia tem sido amplamente observada, particularmente à luz das declarações anteriores do Openai à Câmara dos Lordes do Reino Unido, onde alegaram que o treinamento que lidera os modelos de IA sem material protegido por direitos autorais é impossível. Essa postura é enfatizada ainda mais por ações em andamento, incluindo uma do New York Times, alegando uso ilegal de seu conteúdo. Essas batalhas legais destacam o cenário complexo e em evolução dos direitos autorais na era da IA generativa, principalmente devido a um escritório de direitos autorais dos EUA em 2018, que decidiu que a arte gerada pela IA não é elegível para a proteção de direitos autorais.

