Quando o Custo Vence a Bandeira: A Microsoft e o Dilema do DeepSeek

Existe um momento nas grandes corporações em que a ideologia cede ao balanço financeiro. A Microsoft pode estar prestes a vivê-lo — e a escolha que se avizinha é, no mínimo, desconcertante.

jun 26, 2026

Na semana passada, a empresa confirmou ao Axios que está testando uma versão ajustada e hospedada internamente do DeepSeek V4, modelo de inteligência artificial de código aberto desenvolvido na China, como alternativa mais barata para alimentar o Copilot Cowork — sua ferramenta de agentes de IA voltada para empresas, lançada oficialmente em 16 de junho de 2026. No mesmo dia do anúncio do produto, a Microsoft também revelou que estava abandonando o modelo de preço fixo por assinatura. Não foi coincidência.

O Problema que Ninguém Queria Admitir

Imagine que você contratou um assistente brilhante — caro, formado nas melhores universidades, altamente recomendado. Nos primeiros meses, tudo parecia justificado. Mas então ele começa a trabalhar de verdade. Centenas de tarefas por semana. Cada tarefa exige dezenas de consultas, verificações, revisões, integrações com outras ferramentas. A conta chega.

É exatamente isso que está acontecendo com o Copilot. Charles Lamanna, vice-presidente executivo da Microsoft para Copilot, agentes e plataforma, colocou em palavras o que a empresa estava, até então, varrendo para debaixo do tapete:

”Temos usuários que fazem centenas de tarefas por semana, o que é ótimo — eles são altamente produtivos — mas a consequência é que os custos podem ficar muito altos.”

Não é exagero. Um estudo da própria Microsoft Research, publicado em abril de 2026, revelou que tarefas de codificação com agentes consomem cerca de 1.000 vezes mais tokens do que interações simples de chat. E o consumo varia até 30 vezes de uma execução para outra, dependendo da complexidade. A EY estima que o custo de uma interação agêntica complexa em 2026 é 30 vezes maior do que uma consulta simples de chatbot em 2023.

O Copilot Cowork, que já ultrapassou 20 milhões de assentos pagos — 5 milhões adicionados em apenas um trimestre —, com adoção em mais de 90% das empresas da Fortune 500, tornou-se vítima do próprio sucesso.

A Matemática Cruel dos Tokens

Para entender a tentação do DeepSeek, basta observar os números.

Os modelos premium da Anthropic chegam a custar US$ 50 por milhão de tokens. O DeepSeek V4 Pro custa US$ 0,87 por milhão de tokens. Uma diferença de 57 vezes. Se considerarmos o custo médio por tarefa completa, a diferença sobe ainda mais: o Claude da Anthropic sai a US$ 3,25 por tarefa; o DeepSeek V4 Pro, a US$ 0,05.

Sessenta e cinco vezes mais barato.

O Uber queimou seu orçamento inteiro de IA para 2026 em quatro meses após distribuir ferramentas agênticas para milhares de engenheiros. A própria Microsoft cancelou a maioria das licenças diretas do Claude Code em uma de suas divisões, redirecionando engenheiros para o GitHub Copilot até o fim de junho. Não é uma empresa. É um padrão.

O Elefante Geopolítico na Sala

Mas há um detalhe que transforma esse movimento de uma simples decisão de custo em algo consideravelmente mais complexo: o DeepSeek é chinês.

Desenvolvido pela empresa homônima de Hangzhou, com sede na China, o modelo opera sob a jurisdição das leis nacionais de inteligência do país — leis que, em tese, podem obrigar empresas a compartilhar dados com o governo. O governo Trump intensificou o escrutínio sobre modelos de IA de origem chinesa nos últimos meses, chegando a discutir a proibição do DeepSeek no mercado americano.

A Microsoft tentou contornar a questão: qualquer versão do DeepSeek seria hospedada inteiramente na infraestrutura do Azure, com os dados dos clientes permanecendo dentro da nuvem da empresa, sujeitos às suas políticas de conformidade e residência de dados. A empresa também realizou ajustes no modelo e adicionou salvaguardas.

O que o Azure não resolve, porém, é a origem do treinamento. O modelo foi criado na China, com dados coletados sob legislação chinesa, por pesquisadores sujeitos a obrigações legais que não desaparecem porque o servidor agora está em uma data center em Dublin ou Virginia.

A Forbes e o TechTimes foram diretos: hospedar no Azure endereça o roteamento de dados — mas não as obrigações legais do DeepSeek perante as leis de inteligência nacional da China.

Um Mercado que Está Mudando de Forma

Há algo maior acontecendo aqui, além do dilema específico da Microsoft.

O GitHub Copilot migrou para precificação baseada em tokens em 1º de junho de 2026. O Copilot Cowork seguiu em 16 de junho. Goldman Sachs projeta que fluxos de trabalho agênticos podem impulsionar a demanda por tokens em 24 vezes nos próximos anos. A Citigroup chamou o momento de “DeepSeek Shock 2”, afirmando que “os modelos de IA estão rapidamente se tornando commodities, e as empresas vão construir sistemas multi-modelo”.

E os dados de uso confirmam: segundo o OpenRouter, mais de 60% de todos os tokens utilizados na última semana vieram de modelos chineses. Entre os 10 modelos mais usados em junho de 2026, 6 eram chineses. O DeepSeek V4 Flash sozinho consumiu 16,2 trilhões de tokens.

O mercado não está esperando uma decisão política. Ele já decidiu.

O Que Vem a Seguir

A Microsoft afirma que sua escolha de modelo mais barato será anunciada “nas próximas semanas”. DeepSeek não é o único candidato: Meta Llama 4 e o mais recente modelo da Mistral também estão na lista. A empresa parece caminhar para uma estratégia multi-modelo, onde diferentes tarefas são roteadas para diferentes motores com base em custo e complexidade — resumir uma reunião não precisa do mesmo modelo que escrever uma análise jurídica.

O modelo de negócio da IA empresarial está sendo reinventado em tempo real. Flat-rate está morrendo. Token por token está chegando. E a guerra não é mais entre quem tem o modelo mais inteligente — é entre quem consegue entregar inteligência suficiente pelo menor custo possível.

Para Reflexão

E aqui chegamos ao ponto mais incômodo de tudo isso.

A Microsoft investiu aproximadamente US$ 190 bilhões em infraestrutura de IA só em 2026. É parceira estratégica da OpenAI. Tem acesso privilegiado aos modelos mais avançados do mundo ocidental. E mesmo assim, está olhando para um modelo chinês de código aberto porque a conta não fecha.

Isso diz algo sobre o estado da IA — mas diz muito mais sobre a natureza dos negócios: quando o custo ameaça a margem, até as convicções mais caras se tornam negociáveis.

Mas me pergunto: e do lado de quem usa essas ferramentas no dia a dia? Você saberia dizer, hoje, qual modelo está respondendo quando abre o Copilot ou qualquer outra ferramenta de IA que usa no trabalho? E se soubesse — isso mudaria algo para você?

Quero ouvir sua perspectiva sobre isso. Você tem uma visão sobre até onde vai a tolerância das empresas — e dos usuários — quando o assunto é origem e transparência dos modelos de IA? Me conta.

Discussão sobre este post

Pronto para mais?