17 Fevereiro 2025
O salto da China no campo da inteligência artificial causou um grande choque em sua competição com os Estados Unidos, mas também fornece pistas para pensar sobre modelos de soberania tecnológica, e até mesmo IA pública, no resto do mundo.
O artigo é de Cecília Rikap, pesquisadora do Instituto de Inovação e Propósito Público da University College London e do Conselho Nacional de Pesquisa Científica e Técnica - Conicet, publicado por Nueva Sociedad, 11-02-2025.
US$ 600 bilhões (quase o mesmo PIB da Argentina ou quase o dobro do Chile): foi quanto caiu a avaliação de mercado da gigante Nvidia em 26 de janeiro. No último fim de semana, o aplicativo de inteligência artificial (IA) da startup chinesa DeepSeek se tornou o aplicativo gratuito mais baixado nos Estados Unidos. A capitalização de mercado da
Nvidia não foi a única a despencar na segunda-feira como resultado das notícias chinesas. Todos os gigantes da tecnologia dos EUA sofreram quedas chocantes, embora significativamente menos dramáticas, resultando em uma perda total de US$ 1 trilhão em um dia.
Essa reação exagerada do mercado de ações — parcialmente corrigida ao longo dos dias — não pode ser explicada pelo fato de o modelo R1 da DeepSeek ser melhor do que os existentes. De fato, o R1 não apresenta diferenças significativas com outros modelos de IA generativa de fronteira, em particular com o ChatGPT. Mas o fato de um modelo chinês ser considerado tão bom quanto o ChatGPT e outros modelos de empresas americanas é certamente algo novo. É também uma razão geopolítica suficiente para abalar o valor de mercado das maiores empresas dos Estados Unidos — que também são as maiores do mundo.
O fato de o DeepSeek ser chinês é apenas parte da explicação. A principal razão pela qual, além do mercado de ações, Donald Trump e todo o modelo global de desenvolvimento de IA generativa liderado pelos Estados Unidos tremeram é que o DeepSeek-R1 era muito mais barato de produzir e, como se isso não bastasse, está parcialmente disponível em acesso aberto para que outros possam baixar e usar para desenvolver seus próprios aplicativos. Ele também é oferecido a um custo menor do que o cobrado pela Meta por seu modelo Llama — também em acesso semiaberto — quando adquirido nas nuvens de outras gigantes da tecnologia.
O DeepSeek-R1 é mais barato em qualquer medida. É o primeiro modelo de fronteira que exigiu uma fração do poder de computação - e, portanto, do custo - usado por outros modelos de última geração para treinamento. Isso ocorre porque a startup chinesa usou uma técnica de aprendizado para modelos de IA chamada destilação . Neste contexto, “destilar” significa extrair automaticamente o aprendizado de modelos existentes. Com base nisso, o treinamento que falta ser feito é menor e cada rodada de treinamento exige menos investimento porque não parte do zero, mas de processos de aprendizagem já realizados por outras empresas.
A novidade não é o método em si, porque a técnica já havia sido usada antes, mas os resultados, até agora, eram modelos em escala menor e não tão bons quanto os originais. O DeepSeek é menor em termos de número de parâmetros (e é por isso que também é mais barato de usar) e, ao mesmo tempo, compete na primeira divisão.
Embora não possamos fazer uma comparação direta com o custo de modelos de treinamento como o GPT da OpenAI ou o Llama da Meta, porque para isso precisaríamos saber o custo total de produção do DeepSeek-R1 e essa informação é mantida em segredo, está claro que o DeepSeek produz IA de baixo custo ., já que a última rodada de treinamento exigiu apenas US$ 5,6 milhões. É aqui que a startup chinesa toca na fibra mais íntima do paradigma de desenvolvimento de IA generativa imposto pelos gigantes da tecnologia norte-americanos.
Descobrir que é possível desenvolver modelos de ponta sem concentrar grandes quantidades de chips de IA de ponta para treiná-los, com quantidades igualmente enormes de dados, coloca em risco os negócios da Nvidia, uma empresa quase inteiramente dedicada ao design desses chips. Daí a queda em sua capitalização de mercado.
A perda do valor de mercado da Amazon, Microsoft e Google, no entanto, não marca o fim de seu reinado. Muito pelo contrário, o negócio deles não é principalmente vender modelos de IA — embora eles também os desenvolvam e vendam — mas sim controlar a nuvem, ou seja, o supermercado onde esses modelos e outras tecnologias são desenvolvidos, usados e comercializados. Essas empresas se beneficiam da expansão contínua da adoção de IA, que está acelerando novamente com a chegada do DeepSeek.
A nuvem é um tipo de espaço de coworking ou fábrica virtual para produzir e consumir serviços digitais que são usados por meio do upload de seus próprios dados. Em um contexto de desconfiança em relação à China, é improvável que empresas e estados ao redor do mundo adotem o DeepSeek para analisar seus dados. O mercado de usuários que o utiliza gratuitamente, incluindo milhares de desenvolvedores que buscam melhorar seus códigos ou criar aplicativos, não é o mesmo que utiliza a IA na nuvem como um serviço personalizado para as necessidades de empresas e governos.
Neste cenário, a dependência de startups ocidentais de IA é exacerbada , desde as americanas OpenAI ou Anthropic até a francesa Mistral. Se antes era improvável que essas empresas operassem fora da nuvem da Amazon, Microsoft ou Google, hoje é impossível. Esses gigantes não são apenas os maiores investidores de capital de risco em startups ocidentais de IA generativa , mas suas nuvens também abrigam uma demanda crescente daqueles que pagam por IA. Empresas, governos, universidades, etc. Eles veem a nuvem como uma plataforma única para atender a todas as suas necessidades de serviços digitais.
Para a OpenAI e as outras, não parece fazer sentido abandonar esse ecossistema de serviços. Na verdade, é a integração perfeita com esse ecossistema que é a principal diferença com o DeepSeek. Fazer parte da nuvem faz com que os serviços oferecidos por uma startup se encaixem perfeitamente com todos os outros serviços que um usuário da nuvem já consome. Essa compatibilidade é resultado do controle que Amazon, Microsoft e Google exercem sobre todas as startups de seus ecossistemas, o que as obriga a pagar uma espécie de imposto privado para oferecer serviços em suas nuvens. Hoje, mais do que nunca, desenvolver modelos sem o suporte dos gigantes da tecnologia — especialmente se isso significa continuar usando técnicas de desenvolvimento que começam do zero e, portanto, são mais caras que o DeepSeek — não é lucrativo.
Neste contexto, a OpenAI acusa a start-up chinesa de ter usado seus modelos — protegidos por regras de propriedade intelectual — para destilar aprendizados para lançar o DeepSeek-R1. Embora um ladrão que rouba de outro ladrão possa ser perdoado por 100 anos — não podemos esquecer que a OpenAI usou milhões de documentos protegidos por direitos autorais para treinar seus modelos de linguagem — Trump estará longe de perdoar a vida do DeepSeek. De fato, uma constante desde o governo Barack Obama é que, à medida que a vantagem dos Estados Unidos sobre a China diminui, a pressão americana sobre o resto do mundo para bloquear o concorrente asiático aumenta.
Os Estados Unidos tentaram impedir o desenvolvimento tecnológico da China em IA sob o pretexto de que seus avanços poderiam ser usados no campo militar, proibindo empresas americanas e aquelas que queriam fazer negócios com os Estados Unidos de vender partes essenciais da cadeia de valor de semicondutores - incluindo os próprios chips - para a China. Mas antes que a política entrasse em vigor e conforme as tensões geopolíticas entre os dois países aumentavam, a China havia acumulado um grande estoque de semicondutores de IA. E o mesmo aconteceu com o fundo de investimento que financia o DeepSeek. Embora a quantidade de chips não fosse suficiente para acompanhar o paradigma atual e estes não fossem mais os semicondutores mais avançados do mercado, a startup encontrou uma forma de obter resultados com os semicondutores que tinha disponíveis.
Uma questão em aberto, então, é como os Estados Unidos responderão. Um cenário provável é que isso aumente a pressão sobre a adoção da tecnologia chinesa em todo o mundo e que a DeepSeek sofra o mesmo destino da Huawei com o 5G. A empresa foi a primeira a desenvolver a tecnologia, mas Washington bloqueou suas operações ocidentais uma por uma, dando tempo para seus rivais imitarem a tecnologia e limitando o crescimento de mercado da gigante chinesa da telefonia.
Aconteça o que acontecer na disputa entre as duas potências globais, o surgimento do DeepSeek-R1 abre uma janela de oportunidade para desenvolver IA pública no resto do mundo que não esteja alinhada aos modelos dominantes de controle e concentração que prevalecem. A possibilidade de desenvolver modelos de ponta mais baratos é uma oportunidade de trabalhar internacionalmente em um projeto de desenvolvimento tecnológico que coloca as necessidades sociais e as limitações planetárias em primeiro plano. A centralidade dessas tecnologias em todas as áreas da vida exige uma solução pública e comum que seja usada, por exemplo, por escolas, hospitais e outras instituições públicas.
O desenvolvimento de modelos públicos de IA também favorece sua auditoria democrática. A IA dominante hoje é desenvolvida tendo o lucro econômico como prioridade. Sem um redirecionamento que permita a criação de modelos públicos, abertos e auditáveis, corre-se o risco de que o desenvolvimento tecnológico continue a prevalecer, favorecendo aplicações que vão desde o uso militar ou para controle e vigilância dentro e fora do local de trabalho, até a IA que substitui tarefas criativas em vez de tornar o ambiente de trabalho mais estimulante.
Todos os dias testemunhamos os efeitos da perda de espaços para deliberação pública na Internet. As mídias sociais são alimentadas por algoritmos de IA que determinam quais mensagens são exibidas, onde e quando, e quais não são exibidas. A partir daí, um punhado de empresas influencia a opinião pública (e o senso comum). Ao adotar as técnicas usadas pelo DeepSeek, é economicamente possível desenvolver IA pública, aberta e auditável para governo, saúde e educação.