Äntligen, en AI-superdator för hemmabruk
Om du någon gång har försökt starta en stor språkmodell, i dagligt tal kallad AI, på din dator var resultaten troligen frustrerande. Till exempel kan en maskin med ett hyfsat mellanklasschipset, 16 GB RAM och ett måttligt kraftfullt grafikkort hantera små modeller någorlunda väl, något med upp till 7B parametrar (särskilt om de är kvantiserade). Allt som är betydligt större — 13B, 32B+ parametrar — kanske inte laddar alls eller orsakar kraftig swappning och fördröjningar. Och i vilket fall som helst kommer upplevelsen att skilja sig från den du har vant dig vid när du använder ChatGPT, Claude, Perplexity och andra AI:er via deras webbgränssnitt, där de körs på servrar i industriklass. Samtalen kommer att kännas mer som en snabb forumtråd från för ett par decennier sedan, inte en liveinteraktion.
Nvidia insåg detta problem och tog fram en lösning. Den är dyr, men den kan faktiskt köra avancerade modeller lokalt. Åtminstone är det vad tillverkaren lovar.
Nvidias DGX Spark, den “personliga AI-superdatorn”
På CES 2025 (läs “CES 2025: 10 enheter som du faktiskt kan ha nytta av”), tillkännagav Nvidias vd Jensen Huang Project Digits, som syftade till att demokratisera tillgången till avancerade AI-funktioner för individer och små team. I sitt tal nämnde Huang att den nyutformade enheten kommer att vara en maskin i petaflop-klass, tillräckligt liten för att få plats på en forskares skrivbord och därmed ge dem direkt tillgång till kraften i generativ AI och stora modeller.
I mars 2025 började Project Digits bära frukt: DGX Spark och DGX Station, en större modell. Båda avtäcktes på GTC 2025. Huvudanförandet gav också klarhet i specifikationer, marknadsstrategi och tillverkningspartnerskap.
Enligt Nvidia börjar DGX Spark säljas för 3 999 dollar den 15 oktober 2025. Under huven hittar du:
- en 20-kärnig Arm-CPU (10 Cortex-X925 + 10 Cortex-A725 Arm);
- en GPU med Blackwell-arkitektur;
- 128 GB koherent, enhetligt systemminne (läs: RAM; LPDDR5x) med 273 GB/s bandbredd;
- och 4 TB NVME.M2-lagring med självkryptering.
Nvidias AI-superdator kan köra modeller med upp till 200 miljarder parametrar (jämför det med den 7B-modell du kan starta på en vanlig PC just nu). Datorerna förväntas levereras med ett Linux-baserat DGX OS och hela Nvidias AI-mjukvarustack. Spark kan hantera djupinlärningsuppgifter, driva generativ AI, möjliggöra vetenskaplig forskning, prototypframtagning med mera.
Det som är bra med hela projektet är Nvidias till synes altruistiska syn på partnerskap: företaget välkomnar tredjepartstillverkare (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte med flera) att bygga anpassade versioner av Spark, vilket betyder att det kommer att finnas billigare — om än mindre kapabla, men fullt tillräckliga för många användningsfall — modeller på marknaden. Håll utkik, vi kommer att följa ämnet och rapportera allt viktigt.