Konečně superpočítač s umělou inteligencí pro domácí použití
Pokud jste se někdy pokusili spustit na svém počítači velký jazykový model, lidově nazývaný AI, výsledky byly nejspíš frustrující. Například stroj se slušným čipsetem střední třídy, 16 GB RAM a středně výkonným GPU si dokáže poradit s malými modely, tedy s něčím až do 7B parametrů (zejména pokud je kvantizovaný). Cokoli výrazně většího — 13B, 32B+ parametrů — se nemusí vůbec načíst, nebo způsobí nadměrné swapování a zpomalení. A v každém případě bude zážitek odlišný od toho, na který jste si zvykli při používání ChatGPT, Claude, Perplexity a dalších AI přes jejich webová rozhraní, když běží na serverech průmyslové třídy. Rozhovory budou působit spíš jako svižné vlákno na fóru z před pár desetiletí, ne jako živá interakce.
Nvidia si tento problém uvědomila a přišla s řešením. Je drahé, ale skutečně dokáže lokálně spouštět sofistikované modely. Alespoň to jeho výrobce slibuje.
Nvidiin DGX Spark, “osobní AI superpočítač”
Na CES 2025 (viz “CES 2025: 10 zařízení, která vám mohou být skutečně užitečná”), generální ředitel Nvidie Jensen Huang oznámil Project Digits, jehož cílem bylo demokratizovat přístup k pokročilým schopnostem AI pro jednotlivce a malé týmy. Ve svém projevu Huang uvedl, že nově navržené zařízení bude stroj s petaflopovým výkonem, dostatečně malý, aby se vešel na stůl výzkumníka, a tím mu poskytl přímý přístup k síle generativní AI a velkých modelů.
V březnu 2025 začal Project Digits nést ovoce: DGX Spark a DGX Station, větší model. Oba byly představeny na GTC 2025. Úvodní přednáška také osvětlila specifikace, tržní strategii a výrobní partnerství.
Podle Nvidie půjde DGX Spark do prodeje 15. října 2025 za 3 999 $. Pod kapotou najdete:
- 20jádrové CPU Arm (10 Cortex-X925 + 10 Cortex-A725 Arm);
- GPU s architekturou Blackwell;
- 128 GB koherentní sjednocené systémové paměti (rozuměj: RAM; LPDDR5x) s propustností 273 GB/s;
- a 4 TB úložiště NVME.M2 se samošifrováním.
AI superpočítač od Nvidie dokáže spouštět modely až s 200 miliardami parametrů (srovnejte to se 7B modelem, který nyní spustíte na běžném PC). Stolní počítače by měly přijít s DGX OS založeným na Linuxu a kompletním softwarovým stackem Nvidia AI. Spark zvládne úlohy hlubokého učení, provozovat generativní AI, umožnit vědecký výzkum, provádět prototypování atd.
Na celém projektu je sympatický zdánlivě altruistický přístup Nvidie v oblasti partnerství: společnost vítá výrobce třetích stran (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte a další), aby vytvářeli přizpůsobené verze Sparku, což znamená, že na trhu budou levnější — byť méně schopné, ale pro řadu použití naprosto dostačující — modely. Zůstaňte naladěni, budeme toto téma sledovat a informovat o všem podstatném.