Наконец-то, суперкомпьютер ИИ для домашнего использования
Если вы когда-либо пытались запустить на своём компьютере большую языковую модель, в обиходе называемую ИИ, результат, вероятно, оказался разочаровывающим. Например, машина с неплохим чипсетом среднего класса, 16 ГБ ОЗУ и умеренно мощным GPU может сносно справляться с небольшими моделями — вплоть до 7B параметров (особенно если модель квантованная). Всё, что существенно крупнее — 13B, 32B+ параметров — может вовсе не загрузиться или приведёт к избыточному свопингу и сильным замедлениям. И в любом случае впечатления будут иными, чем те, к которым вы привыкли, пользуясь ChatGPT, Claude, Perplexity и другими ИИ через их веб-интерфейсы, когда они работают на серверах промышленного уровня. Общение будет скорее напоминать бодрую ветку форума двадцатилетней давности, а не живое взаимодействие.
Nvidia осознала эту проблему и предложила решение. Оно недешёвое, но действительно способно запускать сложные модели локально. По крайней мере, так обещает производитель.
DGX Spark от Nvidia, “персональный ИИ‑суперкомпьютер”
На CES 2025 (см. “CES 2025: 10 устройств, которые действительно могут пригодиться”), генеральный директор Nvidia Дженсен Хуанг анонсировал Project Digits, нацеленный на демократизацию доступа к передовым возможностям ИИ для отдельных пользователей и небольших команд. В своём выступлении Хуанг упомянул, что новый аппарат будет петафлопсной машиной, достаточно компактной, чтобы поместиться на столе исследователя, и тем самым обеспечит ему прямой доступ к мощности генеративного ИИ и крупных моделей.
В марте 2025 года Project Digits начал приносить плоды: DGX Spark и DGX Station, более крупная модель. Обе новинки представили на GTC 2025. Ключевой доклад также пролил свет на характеристики, рыночную стратегию и производственные партнёрства.
По данным Nvidia, DGX Spark поступит в продажу 15 октября 2025 года по цене $3,999. Под капотом вы найдёте:
- 20‑ядерный процессор Arm (10 Cortex‑X925 + 10 Cortex‑A725 Arm);
- графический процессор архитектуры Blackwell;
- 128 ГБ единой когерентной системной памяти (читай: ОЗУ; LPDDR5x) со скоростью 273 ГБ/с;
- и 4 ТБ накопителя NVME.M2 с самошифрованием.
ИИ‑суперкомпьютер Nvidia может запускать модели с числом параметров до 200 миллиардов (для сравнения: на обычном ПК прямо сейчас вы можете запустить модель на 7B параметров). Ожидается, что настольные системы будут поставляться с основанной на Linux DGX OS и полным программным стеком Nvidia AI. Spark может выполнять задачи глубокого обучения, поддерживать генеративный ИИ, обеспечивать научные исследования, прототипирование и т. п.
Что радует в проекте, так это кажущийся альтруизм Nvidia в части партнёрств: компания приветствует сторонних производителей (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte и других) выпускать кастомизированные версии Spark, что означает, что на рынке будут более дешёвые — пусть и менее мощные, но вполне достаточные для множества сценариев — модели. Оставайтесь с нами: мы продолжим следить за этой темой и сообщать обо всём важном.