În sfârșit, un supercomputer de IA pentru uz casnic

Dacă ai încercat vreodată să lansezi un model lingvistic mare, numit colocvial AI, pe computerul tău, probabil că rezultatele au fost frustrante. De exemplu, o mașină cu un chipset decent de clasă medie, 16 GB de RAM și un GPU moderat de puternic poate gestiona adecvat modele mici, ceva de până la 7B de parametri (mai ales dacă sunt cuantizate). Orice semnificativ mai mare — 13B, 32B+ parametri — s-ar putea să nu se încarce deloc sau va provoca swapping excesiv și încetiniri. Și, în orice caz, experiența va fi diferită de cea cu care te-ai obișnuit folosind ChatGPT, Claude, Perplexity și alte AI-uri prin interfețele lor web, când rulează pe servere de clasă industrială. Conversațiile vor semăna mai mult cu un fir de discuție alert pe un forum de acum câteva decenii, nu cu o interacțiune în timp real.

Nvidia a conștientizat această problemă și a venit cu o soluție. Este costisitoare, dar poate rula cu adevărat modele sofisticate local. Cel puțin, asta promite producătorul.

DGX Spark de la Nvidia, “supercomputerul personal de AI”

La CES 2025 (citește “CES 2025: 10 devices you can actually find useful”), CEO-ul Nvidia, Jensen Huang, a anunțat Project Digits, care urmărea democratizarea accesului la capabilități avansate de AI pentru persoane și echipe mici. În discursul său, Huang a menționat că dispozitivul proiectat recent va fi o mașină de clasă petaflop suficient de mică pentru a încăpea pe biroul unui cercetător și astfel să le ofere acces direct la puterea AI-ului generativ și a modelelor mari.

În martie 2025, Project Digits a început să dea roade: DGX Spark și DGX Station, un model mai mare. Ambele au fost prezentate la GTC 2025. Prezentarea principală a oferit, de asemenea, detalii despre specificații, strategia de piață și parteneriatele de producție.

Potrivit Nvidia, DGX Spark intră la vânzare pe 15 octombrie 2025 la prețul de 3.999 de dolari. Sub capotă vei găsi:

un CPU Arm cu 20 de nuclee (10 Cortex-X925 + 10 Cortex-A725 Arm);
un GPU cu arhitectură Blackwell;
128 GB de memorie de sistem unificată coerentă (adică RAM; LPDDR5x) care funcționează la 273 GB/s;
și 4 TB de stocare NVME.M2 cu auto-criptare.

Supercomputerul de AI al Nvidia poate rula modele cu până la 200 de miliarde de parametri (compară asta cu modelul de 7B pe care îl poți lansa pe PC-ul tău obișnuit chiar acum). Se așteaptă ca desktopurile să vină cu un DGX OS bazat pe Linux și cu întregul stack software Nvidia AI. Spark poate gestiona sarcini de deep learning, poate rula un AI generativ, permite cercetarea științifică, face prototipare etc.

Ce e bun la întregul proiect este abordarea aparent altruistă a Nvidia în ceea ce privește parteneriatele: compania le urează bun venit producătorilor terți (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte și alții) să construiască versiuni personalizate ale Spark, ceea ce înseamnă că vor exista modele mai ieftine — deși mai puțin capabile, dar cu siguranță suficiente pentru numeroase scenarii de utilizare — pe piață. Rămâi aproape, vom urmări subiectul și vom raporta tot ce e important.