Eindelijk, een AI-supercomputer voor thuisgebruik
Als je ooit hebt geprobeerd een groot taalmodel, in de volksmond AI genoemd, op je computer te starten, waren de resultaten waarschijnlijk frustrerend. Zo kan een machine met een degelijke middenklasse-chipset, 16 GB RAM en een redelijk krachtige GPU kleine modellen prima aan, iets tot circa 7B parameters (vooral als ze gequantiseerd zijn). Alles wat aanzienlijk groter is — 13B, 32B+ parameters — laadt mogelijk helemaal niet of veroorzaakt excessief swappen en vertragingen. En hoe dan ook zal de ervaring anders zijn dan wat je gewend bent met ChatGPT, Claude, Perplexity en andere AI’s via hun webinterfaces, wanneer ze op servers van industriële kwaliteit draaien. De gesprekken voelen meer als een snel forumtopic van een paar decennia geleden, niet als een live-interactie.
Nvidia zag dit probleem en bedacht een oplossing. Die is prijzig, maar kan daadwerkelijk geavanceerde modellen lokaal draaien. Althans, dat belooft de maker.
Nvidia’s DGX Spark, de “persoonlijke AI-supercomputer”
Op CES 2025 (lees “CES 2025: 10 apparaten die je echt nuttig kunt vinden”), Nvidia-CEO Jensen Huang kondigde Project Digits aan, dat bedoeld was om geavanceerde AI-mogelijkheden te democratiseren voor individuen en kleine teams. In zijn toespraak zei Huang dat het nieuw ontworpen apparaat een machine van petaflop-klasse zal zijn, klein genoeg om op het bureau van een onderzoeker te passen en hen zo directe toegang te geven tot de kracht van generatieve AI en grote modellen.
In maart 2025 begon Project Digits vruchten af te werpen: DGX Spark en DGX Station, een groter model. Beide werden onthuld op GTC 2025. De keynote gaf ook inzicht in de specificaties, de marktstrategie en de productiepartnerschappen.
Volgens Nvidia gaat DGX Spark op 15 oktober 2025 in de verkoop voor $3,999. Onder de motorkap vind je:
- een 20-core Arm-cpu (10 Cortex-X925 + 10 Cortex-A725 Arm);
- een GPU met Blackwell-architectuur;
- 128 GB geünificeerd, coherent systeemgeheugen (lees: RAM; LPDDR5x) met 273 GB/s;
- en 4 TB NVME.M2-opslag met zelfversleuteling.
Nvidia’s AI-supercomputer kan modellen met tot wel 200 miljard parameters draaien (vergelijk dat met het 7B-model dat je nu op een doorsnee-pc kunt starten). De desktopcomputers zullen naar verwachting worden geleverd met het Linux-gebaseerde DGX OS en de volledige Nvidia AI-softwarestack. Spark kan deep-learningtaken aan, een generatieve AI draaien, wetenschappelijk onderzoek mogelijk maken, prototyping doen, enzovoort.
Wat goed is aan het hele project, is Nvidia’s schijnbaar altruïstische benadering qua partnerschappen: het bedrijf verwelkomt fabrikanten van derden (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte en meer) om aangepaste versies van de Spark te bouwen, wat betekent dat er zullen goedkopere — zij het minder capabele, maar beslist toereikende voor tal van toepassingen — modellen op de markt zijn. Blijf ons volgen, we houden dit onderwerp in de gaten en berichten over alles wat belangrijk is.