Em janeiro de 2025, a startup chinesa DeepSeek chocou o mundo da tecnologia ao lançar modelos de IA que rivalizavam com o GPT-4 da OpenAI a uma fração do custo. O DeepSeek-V3 e o DeepSeek-R1 demonstraram que era possível treinar modelos de linguagem de classe mundial com orçamentos significativamente menores, desafiando a narrativa de que apenas empresas com bilhões de dólares poderiam competir na corrida da IA.

A ascensão do DeepSeek no cenário global

O DeepSeek foi fundado em 2023 pelo fundo de investimento High-Flyer, liderado por Liang Wenfeng, e rapidamente se tornou um fenômeno global. O modelo DeepSeek-V3, com 671 bilhões de parâmetros em arquitetura Mixture-of-Experts, foi treinado com um custo estimado de apenas US$ 5,6 milhões — uma fração do que OpenAI e Google gastam em seus modelos. Essa eficiência abalou as ações de empresas como a NVIDIA, que perderam centenas de bilhões em valor de mercado em um único dia.

O DeepSeek-R1, modelo focado em raciocínio, alcançou desempenho comparável ao o1 da OpenAI em benchmarks de matemática e programação. A inovação técnica incluiu o uso de destilação de conhecimento, treinamento por reforço puro e arquiteturas mais eficientes que reduziram drasticamente a necessidade de hardware de ponta.

Inovações técnicas e impacto no mercado

Uma das contribuições mais importantes do DeepSeek foi demonstrar que restrições podem gerar inovação. Limitados pelas sanções americanas que restringem o acesso a chips NVIDIA H100 de última geração, os engenheiros do DeepSeek desenvolveram técnicas de treinamento mais eficientes usando chips H800 menos potentes. A arquitetura Multi-head Latent Attention (MLA) e o sistema DeepSeekMoE reduziram os custos de inferência em até 90%.

O impacto no mercado foi imediato: a API do DeepSeek oferecia preços até 95% menores que a da OpenAI para capacidades comparáveis. Isso forçou outras empresas a reduzirem seus preços e repensar a estratégia de que a IA exigia investimentos cada vez maiores em computação.

O cenário brasileiro

O Brasil, como consumidor de tecnologias de IA estrangeiras, foi diretamente beneficiado pelo surgimento do DeepSeek. Startups brasileiras que antes não podiam arcar com os custos das APIs da OpenAI passaram a ter acesso a modelos de classe mundial por preços acessíveis. Empresas de fintech, agritech e legaltech começaram a integrar modelos chineses em suas soluções.

No entanto, o Brasil continua sem capacidade de treinar modelos de linguagem de grande porte. A falta de infraestrutura de computação de alto desempenho, a escassez de pesquisadores especializados e a ausência de uma política nacional de IA robusta mantêm o país como importador líquido de tecnologia de inteligência artificial.

Lições para o Brasil

O caso DeepSeek demonstra que inovação em IA não exige necessariamente orçamentos bilionários. Com criatividade técnica e foco em eficiência, é possível competir globalmente. O Brasil poderia investir em pesquisa de modelos eficientes adaptados ao português, aproveitando a crescente disponibilidade de modelos open source como base para fine-tuning.

A estratégia brasileira deveria focar em aplicações verticais — como IA para o agronegócio, sistema jurídico e saúde pública — em vez de tentar competir na criação de modelos fundacionais. Parcerias com empresas chinesas como o DeepSeek poderiam acelerar a adoção e a adaptação de tecnologias de IA no país.

Perguntas Frequentes (FAQ)

O que é o DeepSeek?

O DeepSeek é uma empresa chinesa de inteligência artificial fundada em 2023 que desenvolveu modelos de linguagem de grande porte com desempenho comparável ao GPT-4 da OpenAI, porém a custos significativamente menores. Seus modelos são open source e disponíveis para uso público.

Como o DeepSeek treinou seus modelos com custo tão baixo?

O DeepSeek utilizou técnicas inovadoras como arquitetura Mixture-of-Experts, Multi-head Latent Attention e treinamento por reforço eficiente. Mesmo limitados a chips NVIDIA H800 devido às sanções, os engenheiros otimizaram o processo para gastar apenas US$ 5,6 milhões no treinamento do V3.

O DeepSeek é tão bom quanto o ChatGPT?

Em diversos benchmarks de matemática, programação e raciocínio lógico, o DeepSeek-R1 alcançou desempenho comparável ou superior ao GPT-4 e ao o1 da OpenAI. No entanto, em tarefas criativas e multilíngues, os resultados variam conforme o caso de uso.

O DeepSeek é open source?

Sim, o DeepSeek disponibiliza seus modelos como open source, permitindo que pesquisadores e empresas de todo o mundo baixem, modifiquem e utilizem os modelos livremente. Isso democratizou o acesso à IA de alta qualidade.

Startups brasileiras podem usar o DeepSeek?

Sim, startups brasileiras podem acessar os modelos DeepSeek tanto pela API oficial quanto baixando os modelos open source para execução local. Os custos reduzidos tornam a IA avançada acessível para empresas de todos os portes no Brasil.