Cuối cùng, một siêu máy tính AI dành cho gia đình
Nếu bạn từng thử chạy một mô hình ngôn ngữ lớn, thường gọi là AI, trên máy tính của mình, kết quả có lẽ gây thất vọng. Chẳng hạn, một máy có bộ xử lý tầm trung khá ổn, 16 GB RAM và GPU tương đối mạnh có thể xử lý ổn các mô hình nhỏ, khoảng đến 7B tham số (đặc biệt nếu đã lượng tử hóa). Bất cứ thứ gì lớn hơn đáng kể — 13B, 32B+ tham số — có thể không tải được hoặc sẽ gây hoán đổi bộ nhớ quá mức và làm chậm hệ thống. Và dù sao đi nữa, trải nghiệm cũng sẽ khác với những gì bạn đã quen khi dùng ChatGPT, Claude, Perplexity và các AI khác qua giao diện web của họ, khi chúng chạy trên các máy chủ cấp công nghiệp. Các cuộc trò chuyện sẽ giống như một chuỗi thảo luận trên diễn đàn nhịp độ nhanh cách đây vài thập kỷ, chứ không phải tương tác trực tiếp.
Nvidia đã nhận ra vấn đề này và đưa ra một giải pháp. Nó đắt, nhưng thực sự có thể chạy các mô hình tinh vi tại chỗ. Ít nhất, đó là điều nhà sản xuất hứa hẹn.
DGX Spark của Nvidia, “siêu máy tính AI cá nhân”
Tại CES 2025 (đọc “CES 2025: 10 thiết bị bạn thực sự có thể thấy hữu ích”), CEO Nvidia Jensen Huang đã công bố Project Digits, nhằm dân chủ hóa khả năng tiếp cận các năng lực AI tiên tiến cho cá nhân và các nhóm nhỏ. Trong bài phát biểu, Huang đề cập rằng thiết bị được thiết kế mới sẽ là một cỗ máy cấp petaflop đủ nhỏ để đặt trên bàn làm việc của nhà nghiên cứu, từ đó mang lại cho họ khả năng truy cập trực tiếp vào sức mạnh của AI tạo sinh và các mô hình lớn.
Vào tháng 3 năm 2025, Project Digits bắt đầu kết trái: DGX Spark và DGX Station, một mẫu lớn hơn. Cả hai được công bố tại GTC 2025. Bài phát biểu khai mạc cũng làm rõ các thông số kỹ thuật, chiến lược thị trường và các quan hệ hợp tác sản xuất.
Theo Nvidia, DGX Spark sẽ được bán với giá 3.999 USD vào ngày 15 tháng 10 năm 2025. Bên trong, bạn sẽ thấy:
- CPU Arm 20 lõi (10 Cortex-X925 + 10 Cortex-A725 Arm);
- GPU kiến trúc Blackwell;
- 128 GB bộ nhớ hệ thống hợp nhất có tính nhất quán (tức là RAM; LPDDR5x) hoạt động ở 273 GB/s;
- và 4 TB lưu trữ NVME.M2 với khả năng tự mã hóa.
Siêu máy tính AI của Nvidia có thể chạy các mô hình với tối đa 200 tỷ tham số (so với mô hình 7B mà bạn có thể khởi chạy trên chiếc PC phổ thông ngay bây giờ). Các máy để bàn dự kiến sẽ đi kèm DGX OS dựa trên Linux và toàn bộ ngăn xếp phần mềm AI của Nvidia. Spark có thể xử lý các tác vụ học sâu, vận hành AI tạo sinh, hỗ trợ nghiên cứu khoa học, làm tạo mẫu, v.v.
Điều tốt ở toàn bộ dự án là cách tiếp cận có vẻ vị tha của Nvidia trong khía cạnh hợp tác: công ty chào đón các nhà sản xuất bên thứ ba (Acer, ASUS, Dell, HP, Lenovo, MSI, Gigabyte và nhiều hãng khác) xây dựng các phiên bản Spark tùy biến, đồng nghĩa sẽ có những mẫu rẻ hơn — tuy kém mạnh mẽ hơn, nhưng vẫn đủ đáp ứng cho vô số trường hợp sử dụng — trên thị trường. Hãy tiếp tục theo dõi, chúng tôi sẽ bám sát chủ đề này và báo cáo mọi điều quan trọng.