如果你曾在自己的电脑上尝试运行大型语言模型(俗称 AI),大概率会感到沮丧。举例来说,一台配备还不错的中端芯片、16 GB 内存和中等性能 GPU 的机器,尚能胜任小型模型——例如参数量不超过 70 亿(尤其在量化之后)。但更大的模型—比如 130 亿、320 亿以上参数—可能根本无法加载,或导致频繁换页和明显变慢。无论如何,这种体验与通过网页界面使用 ChatGPT、Claude、Perplexity 等在工业级服务器上运行的 AI 完全不同;对话更像二十年前那种快速刷新的论坛帖子,而不是实时互动。
英伟达注意到了这一问题,并提出了解决方案。它价格不菲,但确实能在本地运行复杂模型——至少厂商是这样承诺的。
英伟达 DGX Spark,“个人 AI 超级计算机”
在 CES 2025(参见“CES 2025:10 款你真的用得上的设备”)上,英伟达 CEO 黄仁勋宣布了 Project Digits(Digits 项目),旨在让个人和小团队也能获得先进的 AI 能力。在演讲中,黄仁勋提到,这款全新设计的设备将是一台 PetaFLOPS 级机器,小到可以放在研究人员的桌面上,从而让他们能够直接使用生成式 AI 和大模型的算力。
到 2025 年 3 月,Digits 项目开始结出成果:DGX Spark,以及更大的机型 DGX Station。两者均在 GTC 2025 上亮相。主题演讲还披露了规格、市场策略和制造合作伙伴信息。
据英伟达介绍,DGX Spark 将于 2025 年 10 月 15 日开售,售价 3,999 美元。其关键配置包括:
- 20 核 Arm CPU(10 个 Cortex‑X925 + 10 个 Cortex‑A725);
- Blackwell 架构 GPU;
- 128 GB 一致性的统一系统内存(即 RAM;LPDDR5x),带宽 273 GB/s;
- 以及 4 TB 自加密的 NVME.M2 存储。
英伟达这台 AI 超级计算机可运行多达 2000 亿参数的模型(对比之下,你现在在普通 PC 上通常只能运行 70 亿参数的模型)。这款台式机预计预装基于 Linux 的 DGX OS 以及完整的英伟达 AI 软件栈。Spark 可胜任深度学习任务、运行生成式 AI、支持科学研究与原型开发等。
这一项目的可贵之处在于英伟达在合作上的看似利他的做法:公司欢迎第三方厂商(宏碁、华硕、戴尔、惠普、联想、微星、技嘉等)打造定制版 Spark。这意味着市场上会出现更便宜——尽管性能较弱,但对许多用例已绰绰有余——的机型。敬请关注,我们将持续跟进并报道重要进展。