Endelig en AI-supercomputer til hjemmebrug
Hvis du nogensinde har forsøgt at starte en stor sprogmodel, i daglig tale kaldet AI, på din computer, var resultaterne sandsynligvis frustrerende. For eksempel kan en maskine med et udmærket midtklasse-chipset, 16 GB RAM og en nogenlunde kraftig GPU klare små modeller nogenlunde, noget med op til 7B parametre (især hvis det er kvantiseret). Alt væsentligt større — 13B, 32B+ parametre — indlæses måske slet ikke eller vil medføre kraftig swapping og nedbremsninger. Og under alle omstændigheder vil oplevelsen være anderledes end det, du er blevet vant til med ChatGPT, Claude, Perplexity og andre AI’er via deres webgrænseflader, hvor de kører på servere i industriklassen. Samtalerne vil føles mere som en hurtig forumtråd fra for et par årtier siden, ikke som en live-interaktion.
Nvidia indså dette problem og fandt en løsning. Den er dyr, men den kan faktisk køre sofistikerede modeller lokalt. I det mindste er det, hvad producenten lover.
Nvidia’s DGX Spark, den “personlige AI-supercomputer”
På CES 2025 (læs “CES 2025: 10 enheder, du faktisk kan få gavn af”), annoncerede Nvidias CEO Jensen Huang Project Digits, som havde til formål at demokratisere adgangen til avancerede AI-muligheder for enkeltpersoner og små teams. I sin tale nævnte Huang, at den nyudviklede enhed vil være en maskine i petaflop-klassen, lille nok til at stå på en forskers skrivebord og dermed give direkte adgang til kraften i generativ AI og store modeller.
I marts 2025 begyndte Project Digits at bære frugt: DGX Spark og DGX Station, en større model. Begge blev afsløret på GTC 2025. Keynoten kastede også lys over specifikationerne, markedsstrategien og produktionspartnerskaberne.
Ifølge Nvidia går DGX Spark til salg for 3.999 $ den 15. oktober 2025. Under motorhjelmen finder du:
- en 20-kernet Arm-CPU (10 Cortex-X925 + 10 Cortex-A725 Arm);
- en GPU med Blackwell-arkitektur;
- 128 GB sammenhængende, samlet systemhukommelse (læs: RAM; LPDDR5x), der arbejder ved 273 GB/s;
- og 4 TB NVME.M2-lager med selvkryptering.
Nvidias AI-supercomputer kan køre modeller med op til 200 milliarder parametre (sammenlign det med 7B-modellen, du kan starte på din helt almindelige pc lige nu). De stationære forventes at komme med et Linux-baseret DGX OS og hele Nvidias AI-softwarestak. Spark kan håndtere dybdelæringsopgaver, køre generativ AI, muliggøre videnskabelig forskning, lave prototyper osv.
Det gode ved hele projektet er Nvidias tilsyneladende altruistiske tilgang til partnerskaber: virksomheden byder tredjepartsproducenter (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte og flere) velkommen til at bygge tilpassede versioner af Spark, hvilket betyder, at der vil være billigere — omend mindre kapable, men helt tilstrækkelige til en lang række anvendelser — modeller på markedet. Følg med, vi holder øje med emnet og rapporterer alt vigtigt.