Finalmente, um supercomputador de IA para uso doméstico
Se você já tentou executar um grande modelo de linguagem, popularmente chamado de IA, no seu computador, os resultados provavelmente foram frustrantes. Por exemplo, uma máquina com um chipset intermediário decente, 16 GB de RAM e uma GPU razoavelmente potente consegue lidar bem com modelos pequenos, algo com até 7B de parâmetros (especialmente se quantizados). Qualquer coisa significativamente maior — 13B, 32B+ parâmetros — pode nem carregar ou causará troca de memória excessiva e lentidão. E, de qualquer forma, a experiência será diferente daquela à qual você se acostumou ao usar ChatGPT, Claude, Perplexity e outras IAs por meio de suas interfaces web, quando estão rodando em servidores de nível industrial. As conversas parecerão mais com um tópico de fórum de ritmo acelerado de algumas décadas atrás, não uma interação em tempo real.
A Nvidia percebeu esse problema e apresentou uma solução. É caro, mas consegue de fato executar modelos sofisticados localmente. Pelo menos, é o que seu fabricante promete.
DGX Spark da Nvidia, o “supercomputador pessoal de IA”
Na CES 2025 (leia “CES 2025: 10 dispositivos que você realmente pode achar úteis”), o CEO da Nvidia, Jensen Huang, anunciou o Project Digits, que tinha como objetivo democratizar o acesso a capacidades avançadas de IA para indivíduos e pequenas equipes. Em seu discurso, Huang mencionou que o dispositivo recém-projetado será uma máquina de classe petaflop pequena o suficiente para caber na mesa de um pesquisador e, assim, dar ao pesquisador acesso direto ao poder da IA generativa e de grandes modelos.
Em março de 2025, o Project Digits começou a dar frutos: o DGX Spark e o DGX Station, um modelo maior. Ambos foram apresentados na GTC 2025. A apresentação principal também esclareceu as especificações, a estratégia de mercado e as parcerias de fabricação.
Segundo a Nvidia, DGX Spark começa a ser vendido por US$ 3.999 em 15 de outubro de 2025. Debaixo do capô, você encontrará:
- uma CPU Arm de 20 núcleos (10 Cortex-X925 + 10 Cortex-A725 Arm);
- uma GPU com arquitetura Blackwell;
- 128 GB de memória de sistema unificada e coerente (leia-se: RAM; LPDDR5x) que funciona a 273 GB/s;
- e 4 TB de armazenamento NVME.M2 com criptografia automática.
O supercomputador de IA da Nvidia pode executar modelos com até 200 bilhões de parâmetros (compare isso ao modelo de 7B que você consegue lançar no seu PC comum hoje). Os desktops devem vir com o DGX OS baseado em Linux e toda a pilha de software de IA da Nvidia. O Spark pode lidar com tarefas de deep learning, rodar IA generativa, viabilizar pesquisa científica, fazer prototipagem, etc.
O que é bom em todo o projeto é a abordagem aparentemente altruísta da Nvidia em termos de parcerias: a empresa acolhe fabricantes de terceiros (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte e outros) para construir versões personalizadas do Spark, o que significa que haverá modelos mais baratos — embora menos capazes, mas suficientemente adequados para inúmeros casos de uso — no mercado. Fique ligado: vamos acompanhar esse tema e relatar tudo o que for importante.