Enfin, un superordinateur d'IA pour la maison
Si vous avez déjà essayé de lancer un grand modèle de langage, communément appelé IA, sur votre ordinateur, les résultats ont probablement été frustrants. Par exemple, une machine dotée d’un chipset milieu de gamme correct, de 16 Go de RAM et d’un GPU modérément puissant peut gérer correctement de petits modèles, jusqu’à 7B de paramètres (surtout s’ils sont quantifiés). Tout ce qui est nettement plus grand — 13B, 32B+ paramètres — peut ne pas se charger du tout ou provoquer un recours excessif au swap et des ralentissements. Et, dans tous les cas, l’expérience sera différente de celle à laquelle vous êtes habitué en utilisant ChatGPT, Claude, Perplexity et d’autres IA via leurs interfaces web, lorsqu’elles tournent sur des serveurs de niveau industriel. Les conversations ressembleront davantage à un fil de forum au rythme soutenu d’il y a quelques décennies, et non à une interaction en direct.
Nvidia a pris conscience de ce problème et a proposé une solution. Elle est onéreuse, mais elle peut réellement exécuter localement des modèles sophistiqués. Du moins, c’est ce que promet son fabricant.
DGX Spark de Nvidia, « superordinateur d’IA personnel »
Au CES 2025 (lisez « CES 2025 : 10 appareils que vous pouvez réellement trouver utiles »), le PDG de Nvidia, Jensen Huang, a annoncé le projet Digits, qui visait à démocratiser l’accès aux capacités avancées de l’IA pour les particuliers et les petites équipes. Dans son discours, Huang a indiqué que le nouvel appareil conçu serait une machine de classe pétaflop suffisamment compacte pour tenir sur le bureau d’un chercheur et lui donner ainsi un accès direct à la puissance de l’IA générative et des grands modèles.
En mars 2025, le projet Digits a commencé à porter ses fruits : DGX Spark et DGX Station, un modèle plus grand. Les deux ont été dévoilés au GTC 2025. La keynote a également apporté des précisions sur les spécifications, la stratégie de marché et les partenariats de fabrication.
Selon Nvidia, DGX Spark sera mis en vente à 3 999 $ le 15 octobre 2025. Sous le capot, on trouve :
- un CPU Arm à 20 cœurs (10 Cortex-X925 + 10 Cortex-A725 Arm) ;
- un GPU à architecture Blackwell ;
- 128 Go de mémoire système unifiée cohérente (lisez : RAM ; LPDDR5x) fonctionnant à 273 Go/s ;
- et 4 To de stockage NVME.M2 avec chiffrement automatique.
Le superordinateur d’IA de Nvidia peut exécuter des modèles allant jusqu’à 200 milliards de paramètres (à comparer au modèle 7B que vous pouvez lancer sur un PC lambda aujourd’hui). Les ordinateurs de bureau devraient être livrés avec DGX OS, basé sur Linux, et l’ensemble de la pile logicielle IA de Nvidia. Spark peut gérer des tâches de deep learning, faire tourner une IA générative, permettre la recherche scientifique, réaliser du prototypage, etc.
Ce qui est appréciable dans l’ensemble du projet, c’est l’approche apparemment altruiste de Nvidia en matière de partenariats : l’entreprise accueille favorablement les fabricants tiers (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte, et d’autres) pour construire des versions personnalisées du Spark, ce qui signifie qu’il y aura des modèles moins chers — certes moins capables, mais tout à fait suffisants pour de nombreux cas d’usage — sur le marché. Restez à l’écoute, nous suivrons ce sujet de près et rapporterons tout ce qui est important.