Endelig en AI-supercomputer til hjemmebrug Endelig en AI-supercomputer til hjemmebrug

Hvis du nogensinde har forsøgt at starte en stor sprogmodel, i daglig tale kaldet AI, på din computer, var resultaterne sandsynligvis frustrerende. For eksempel kan en maskine med et udmærket midtklasse-chipset, 16 GB RAM og en nogenlunde kraftig GPU klare små modeller nogenlunde, noget med op til 7B parametre (især hvis det er kvantiseret). Alt væsentligt større — 13B, 32B+ parametre — indlæses måske slet ikke eller vil medføre kraftig swapping og nedbremsninger. Og under alle omstændigheder vil oplevelsen være anderledes end det, du er blevet vant til med ChatGPT, Claude, Perplexity og andre AI’er via deres webgrænseflader, hvor de kører på servere i industriklassen. Samtalerne vil føles mere som en hurtig forumtråd fra for et par årtier siden, ikke som en live-interaktion.

Nvidia indså dette problem og fandt en løsning. Den er dyr, men den kan faktisk køre sofistikerede modeller lokalt. I det mindste er det, hvad producenten lover.

Nvidia’s DGX Spark, den “personlige AI-supercomputer”

På CES 2025 (læs “CES 2025: 10 enheder, du faktisk kan få gavn af”), annoncerede Nvidias CEO Jensen Huang Project Digits, som havde til formål at demokratisere adgangen til avancerede AI-muligheder for enkeltpersoner og små teams. I sin tale nævnte Huang, at den nyudviklede enhed vil være en maskine i petaflop-klassen, lille nok til at stå på en forskers skrivebord og dermed give direkte adgang til kraften i generativ AI og store modeller.

I marts 2025 begyndte Project Digits at bære frugt: DGX Spark og DGX Station, en større model. Begge blev afsløret på GTC 2025. Keynoten kastede også lys over specifikationerne, markedsstrategien og produktionspartnerskaberne.

Ifølge Nvidia går DGX Spark til salg for 3.999 $ den 15. oktober 2025. Under motorhjelmen finder du:

  • en 20-kernet Arm-CPU (10 Cortex-X925 + 10 Cortex-A725 Arm);
  • en GPU med Blackwell-arkitektur;
  • 128 GB sammenhængende, samlet systemhukommelse (læs: RAM; LPDDR5x), der arbejder ved 273 GB/s;
  • og 4 TB NVME.M2-lager med selvkryptering.

Nvidias AI-supercomputer kan køre modeller med op til 200 milliarder parametre (sammenlign det med 7B-modellen, du kan starte på din helt almindelige pc lige nu). De stationære forventes at komme med et Linux-baseret DGX OS og hele Nvidias AI-softwarestak. Spark kan håndtere dybdelæringsopgaver, køre generativ AI, muliggøre videnskabelig forskning, lave prototyper osv.

Det gode ved hele projektet er Nvidias tilsyneladende altruistiske tilgang til partnerskaber: virksomheden byder tredjepartsproducenter (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte og flere) velkommen til at bygge tilpassede versioner af Spark, hvilket betyder, at der vil være billigere — omend mindre kapable, men helt tilstrækkelige til en lang række anvendelser — modeller på markedet. Følg med, vi holder øje med emnet og rapporterer alt vigtigt.

Forfatterens andre indlæg

At bede en AI om nyheder er måske ikke nogen god idé, viser en undersøgelse.
Artikel
At bede en AI om nyheder er måske ikke nogen god idé, viser en undersøgelse.
Vanen med at bede AI om at samle nyheder op kan hurtigt sætte sig, men den er ikke den sundeste, da modellen kan fordreje informationen, viser et studie.
Google introducerer 'Gendannelseskontakter', en måde at genvinde adgang til en konto.
Artikel
Google introducerer 'Gendannelseskontakter', en måde at genvinde adgang til en konto.
Google har føjet endnu en metode til kontogendannelse til de to allerede kendte. Lær, hvordan du opsætter en gendannelseskontakt.
Bluetooth i bilen: de skjulte farer og hvordan du beskytter dig selv
Artikel
Bluetooth i bilen: de skjulte farer og hvordan du beskytter dig selv
Bluetooth i bilen er almindeligt i dag; et par nyere undersøgelser har afsløret, at det ikke er særlig sikkert. Læs videre for at få detaljerne og lære, hvordan du beskytter dig selv.
Samtaleforgrening og lignende værktøjer i populære AI-systemer
Artikel
Samtaleforgrening og lignende værktøjer i populære AI-systemer
Store sprogmodeller (LLM'er), altså AI-systemer, kan accelerere emneforskning med flere størrelsesordener. Forgrening af samtalen gør processen endnu mere fleksibel.