Finalmente, un supercomputer di IA per uso domestico
Se hai mai provato ad avviare un grande modello linguistico, colloquialmente chiamato IA, sul tuo computer, i risultati sono stati probabilmente frustranti. Per esempio, una macchina con un chipset di fascia media decente, 16 GB di RAM e una GPU moderatamente potente può gestire adeguatamente modelli piccoli, qualcosa fino a 7B parametri (soprattutto se quantizzati). Qualsiasi cosa significativamente più grande — 13B, 32B+ parametri — potrebbe non caricarsi affatto oppure causare eccessivo swapping e rallentamenti. E, in ogni caso, l’esperienza sarà diversa da quella a cui ti sei abituato usando ChatGPT, Claude, Perplexity e altre IA attraverso le loro interfacce web, quando sono in esecuzione su server di livello industriale. Le conversazioni sembreranno più un thread di forum dal ritmo serrato di un paio di decenni fa, non un’interazione dal vivo.
Nvidia ha riconosciuto questo problema e ha proposto una soluzione. È costosa, ma può effettivamente eseguire localmente modelli sofisticati. Almeno, questo è ciò che promette il suo produttore.
DGX Spark di Nvidia, il “supercomputer IA personale”
Al CES 2025 (leggi “CES 2025: 10 devices you can actually find useful”), il CEO di Nvidia Jensen Huang ha annunciato Project Digits, che mirava a democratizzare l’accesso alle capacità avanzate dell’IA per singoli e piccoli team. Nel suo intervento, Huang ha menzionato che il dispositivo di nuova progettazione sarà una macchina di classe petaflop abbastanza piccola da stare sulla scrivania di un ricercatore e quindi fornire accesso diretto alla potenza dell’IA generativa e dei grandi modelli.
A marzo 2025, Project Digits ha iniziato a dare i suoi frutti: DGX Spark e DGX Station, un modello più grande. Entrambi sono stati presentati al GTC 2025. Il keynote ha inoltre fatto luce sulle specifiche, sulla strategia di mercato e sulle partnership di produzione.
Secondo Nvidia, DGX Spark sarà in vendita a 3.999 dollari dal 15 ottobre 2025. Sotto il cofano troverai:
- una CPU Arm a 20 core (10 Cortex-X925 + 10 Cortex-A725 Arm);
- una GPU con architettura Blackwell;
- 128 GB di memoria di sistema unificata coerente (ovvero: RAM; LPDDR5x) che opera a 273 GB/s;
- e 4 TB di storage NVME.M2 con crittografia automatica.
Il supercomputer IA di Nvidia può eseguire modelli fino a 200 miliardi di parametri (confrontalo con il modello da 7B che puoi avviare sul tuo PC di tutti i giorni in questo momento). I desktop dovrebbero arrivare con un DGX OS basato su Linux e l’intero stack software Nvidia AI. Spark può gestire attività di deep learning, eseguire un’IA generativa, abilitare la ricerca scientifica, fare prototipazione, ecc.
Un aspetto positivo dell’intero progetto è l’approccio apparentemente altruistico di Nvidia in termini di partnership: l’azienda accoglie produttori di terze parti (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte e altri) per realizzare versioni personalizzate dello Spark, il che significa che ci saranno modelli più economici — sebbene meno capaci, ma comunque sufficienti per numerosi casi d’uso — sul mercato. Restate sintonizzati, terremo d’occhio l’argomento e riporteremo tutto ciò che è importante.