Наконец-то, суперкомпьютер ИИ для домашнего использования Наконец-то, суперкомпьютер ИИ для домашнего использования

Если вы когда-либо пытались запустить на своём компьютере большую языковую модель, в обиходе называемую ИИ, результат, вероятно, оказался разочаровывающим. Например, машина с неплохим чипсетом среднего класса, 16 ГБ ОЗУ и умеренно мощным GPU может сносно справляться с небольшими моделями — вплоть до 7B параметров (особенно если модель квантованная). Всё, что существенно крупнее — 13B, 32B+ параметров — может вовсе не загрузиться или приведёт к избыточному свопингу и сильным замедлениям. И в любом случае впечатления будут иными, чем те, к которым вы привыкли, пользуясь ChatGPT, Claude, Perplexity и другими ИИ через их веб-интерфейсы, когда они работают на серверах промышленного уровня. Общение будет скорее напоминать бодрую ветку форума двадцатилетней давности, а не живое взаимодействие.

Nvidia осознала эту проблему и предложила решение. Оно недешёвое, но действительно способно запускать сложные модели локально. По крайней мере, так обещает производитель.

DGX Spark от Nvidia, “персональный ИИ‑суперкомпьютер”

На CES 2025 (см. “CES 2025: 10 устройств, которые действительно могут пригодиться”), генеральный директор Nvidia Дженсен Хуанг анонсировал Project Digits, нацеленный на демократизацию доступа к передовым возможностям ИИ для отдельных пользователей и небольших команд. В своём выступлении Хуанг упомянул, что новый аппарат будет петафлопсной машиной, достаточно компактной, чтобы поместиться на столе исследователя, и тем самым обеспечит ему прямой доступ к мощности генеративного ИИ и крупных моделей.

В марте 2025 года Project Digits начал приносить плоды: DGX Spark и DGX Station, более крупная модель. Обе новинки представили на GTC 2025. Ключевой доклад также пролил свет на характеристики, рыночную стратегию и производственные партнёрства.

По данным Nvidia, DGX Spark поступит в продажу 15 октября 2025 года по цене $3,999. Под капотом вы найдёте:

  • 20‑ядерный процессор Arm (10 Cortex‑X925 + 10 Cortex‑A725 Arm);
  • графический процессор архитектуры Blackwell;
  • 128 ГБ единой когерентной системной памяти (читай: ОЗУ; LPDDR5x) со скоростью 273 ГБ/с;
  • и 4 ТБ накопителя NVME.M2 с самошифрованием.

ИИ‑суперкомпьютер Nvidia может запускать модели с числом параметров до 200 миллиардов (для сравнения: на обычном ПК прямо сейчас вы можете запустить модель на 7B параметров). Ожидается, что настольные системы будут поставляться с основанной на Linux DGX OS и полным программным стеком Nvidia AI. Spark может выполнять задачи глубокого обучения, поддерживать генеративный ИИ, обеспечивать научные исследования, прототипирование и т. п.

Что радует в проекте, так это кажущийся альтруизм Nvidia в части партнёрств: компания приветствует сторонних производителей (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte и других) выпускать кастомизированные версии Spark, что означает, что на рынке будут более дешёвые — пусть и менее мощные, но вполне достаточные для множества сценариев — модели. Оставайтесь с нами: мы продолжим следить за этой темой и сообщать обо всём важном.

Другие публикации автора

Просить ИИ о новостях, возможно, не лучшая идея, показало исследование.
Статья
Просить ИИ о новостях, возможно, не лучшая идея, показало исследование.
Привычка просить ИИ собирать новости может быстро укорениться, но она не самая полезная, поскольку модель может искажать информацию, как показало исследование.
Google представляет «Контакты для восстановления» — способ вернуть доступ к аккаунту.
Статья
Google представляет «Контакты для восстановления» — способ вернуть доступ к аккаунту.
Google добавила еще один способ восстановления аккаунта к двум уже известным. Узнайте, как настроить контакт для восстановления.
Bluetooth в автомобиле: скрытые опасности и как защитить себя
Статья
Bluetooth в автомобиле: скрытые опасности и как защитить себя
Автомобильный Bluetooth сегодня встречается повсеместно; несколько недавних исследований показали, что он не очень безопасен. Читайте дальше, чтобы узнать подробности и как защитить себя.
Ветвление диалогов и похожие инструменты в популярных системах ИИ
Статья
Ветвление диалогов и похожие инструменты в популярных системах ИИ
Большие языковые модели (LLM), то есть системы ИИ, могут ускорить тематические исследования на несколько порядков. Разветвление диалога делает процесс ещё более гибким.