もし自分のコンピューターで、俗にAIと呼ばれる大規模言語モデル(LLM)を起動してみたことがあるなら、その結果にいら立った経験があるかもしれません。たとえば、中堅クラスのチップセット、16 GBのRAM、そこそこ強力なGPUを備えたマシンなら、小規模モデル、つまりパラメータ数が最大70億(とくに量子化されていれば)までは十分に扱えます。これより大きいもの — 130億、320億超のパラメータ — になると、そもそも読み込めなかったり、過度なスワップが発生して極端に遅くなったりします。いずれにせよ、ChatGPT、Claude、PerplexityなどをWebインターフェース経由で使うときのように、産業用レベルのサーバー上で動いている体験とは異なります。会話は、ライブなやり取りというより、二昔前のテンポの速い掲示板スレッドのように感じられるでしょう。
Nvidiaはこの問題を認識し、解決策を提示しました。高価ではありますが、ローカルで高度なモデルを実際に動かせます。少なくとも、メーカーはそう約束しています。
NvidiaのDGX Spark、“個人向けAIスーパーコンピューター”
CES 2025(“CES 2025: 実際に役立つ10のデバイス” を参照)で、NvidiaのCEOジェンセン・フアンは、個人や小規模チームが高度なAI機能へアクセスできるよう民主化することを目指すProject Digitsを発表しました。フアン氏はスピーチで、新設計のデバイスは研究者の机に収まるほど小さなペタフロップ級マシンで、生成AIや大規模モデルのパワーへ直接アクセスできるようになると述べました。
2025年3月、Project Digitsは結実し始め、DGX Sparkと、より大型のモデルであるDGX Stationが登場しました。両機はGTC 2025で発表され、基調講演では、仕様、市場戦略、製造パートナーシップについても明らかにされました。
Nvidiaによれば、DGX Sparkは2025年10月15日に3,999ドルで発売されます。内部構成は次のとおりです。
- 20コアのArm CPU(Cortex-X925 × 10 + Cortex-A725 × 10);
- BlackwellアーキテクチャのGPU;
- 273 GB/秒で動作するコヒーレントな統合システムメモリ128 GB(要するにRAM;LPDDR5x);
- 自己暗号化対応の4 TB NVME.M2ストレージ。
NvidiaのAIスーパーコンピューターは、最大2,000億パラメータのモデルを実行できます(いま手持ちのありふれたPCで起動できるのはせいぜい70億パラメータのモデルと比べてください)。デスクトップ機は、LinuxベースのDGX OSとNvidiaのAIソフトウェアスタック一式を搭載して出荷される見込みです。Sparkは深層学習タスクをこなし、生成AIの運用、科学研究の支援、プロトタイピングなどが可能です。
このプロジェクトで良い点は、パートナーシップに関するNvidiaの一見利他的な姿勢です。同社はサードパーティーメーカー(Acer、ASUS、Dell、HP、Lenovo、MSI、Gigabyte など)によるSparkのカスタマイズ版の製造を歓迎しており、つまり、市場には間違いなくより安価な — 性能はやや劣るが、多くのユースケースには十分対応できる — モデルが登場することになります。続報をお待ちください。今後もこの件を注視し、重要な情報をお伝えします。