全新软件与模型优化为 NVIDIA DGX Spark 注入强大动力-育师

作者：Allen Bourgoyne

自发布以来，NVIDIA 通过持续的软件优化以及与软件合作伙伴和开源社区的紧密协作，不断提升基于 Grace Blackwell 架构的 DGX Spark 的性能。这些举措在推理、训练和创意工作流方面都取得了显著的成效。

在 CES 2026 上，全新的 DGX Spark 软件版本结合新的模型更新和开源库，为 DGX Spark 以及基于 GB10 的 OEM 系统带来了显著的性能提升。

使用统一内存和NVFP4本地扩展大模型

DGX Spark 专为大模型本地化应用而设计，配备 128GB 统一内存，并采用紧凑的桌面形态。两台 DGX Spark 系统互连可提供 256GB 的组合内存，支持开发者能够在本地运行更大的模型。

系统通过 ConnectX-7 网络连接，提供 200Gbps 带宽，实现高速、低延迟的多节点工作负载。

支持 NVIDIA NVFP4 数据格式，可使新一代模型大幅降低内存占用，同时提升吞吐量。例如，在相同的双 DGX Spark 配置上，使用 NVFP4 精度和推测解码运行 Qwen-235B 模型，相比 FP8 执行性能最高提升 2.6 倍。

使用 FP8 精度时，该模型会耗尽两台系统的组合内存，从而限制多任务处理和整体响应速度。将模型量化为 NVFP4 后，可将内存使用量减少约 40%，同时保持高精度，使开发者能够在获得 FP8 等效结果的同时实现更高性能，并释放足够内存以同时运行其他工作负载。最终使本地 AI 开发体验更加响应迅速且高效。

为创作者打造的强大桌面平台

DGX Spark 不仅是 AI 开发者的卓越平台，创作者也能充分利用其桌面级功能。

通过将 AI 工作负载转移到 DGX Spark，创作者可以使自己的笔记本电脑或 PC 在内容生成过程中保持响应。

阿里巴巴的 Qwen-Image 等领先的扩散模型正利用 NVFP4 减少内存占用，同时实现更高性能。

AI 视频生成尤其适合 DGX Spark，因为它需要大量的内存和算力。采用 NVFP8 优化权重的音视频生成模型相比上一代性能显著提升，使高质量视频生成在桌面端成为可能。

DGX Spark现已纳入NVIDIA认证系统计划

NVIDIA 认证系统计划用于验证系统在广泛加速图形处理、计算和 AI 工作负载方面的性能表现。NVIDIA 认证系统为 AI 开发、桌面推理、数据科学、设计和内容创作工作负载提供了可信的基础，同时也对数据中心和云资源进行增强。

DGX Spark 和基于 GB10 的 OEM 系统现已纳入该计划，DGX Spark 及合作伙伴系统目前正在测试中。

快速上手

了解我们如何帮助开发者立即提高生产力，展示 Blackwell GPU 的可能性，包括：

Nemotron 3 Nano：本地运行 NVIDIA 高效的 30B 参数 MoE 模型，以用于 LLM 实验。
Live VLM WebUI：将网络摄像头画面输入数据流传输至视觉语言模型中进行实时分析，并利用 GPU 进行处理。
Isaac Sim / Lab：利用 GPU 加速的仿真与强化学习，构建并训练机器人应用。
SGLang 与 vLLM 服务 Playbook：清晰的模型支持矩阵能够显示已测试与支持的模型及量化选项。
GPU 加速的量化金融与基因组学 Playbook：与基于 CPU 的实现相比，这些工作流所需的代码改动极少。
使用 PyTorch 微调：通过 FSDP 与 LoRA，在两台 DGX Spark 系统上分布式微调，支持参数最高达 70B 的 LLM。

简单可靠、步骤清晰且实用的故障排除指南，已在最新 DGX OS 上验证配置，能够让用户减少设置时间，将更多时间用于构建。

使用NVIDIA Brev随时随地访问DGX Spark

借助 NVIDIA Brev，用户可以通过安全连接随时随地访问 DGX Spark。Brev 让开发者能够轻松创建 AI 云实例，利用 Launchables 功能，实现一键即可配置 AI 环境。在 CES 上，Brev 的更新展示了注册本地计算（如 DGX Spark）的能力。在 Brev 完成注册后，用户即可随时随地访问 DGX Spark，并安全地与团队共享访问权限。

Brev 支持本地与云模型的混合部署。借助路由层，用户可以将电子邮件或专有数据处理等敏感任务保留在运行于 DGX Spark 上的本地开放模型上，同时将一般推理任务路由至云端的前沿模型。实现细节可参阅 NVIDIA LLM Router 开发者示例。

Brev 对本地计算的支持将在 CES 上进行预览，正式支持将于 2026 年春季推出。