news 2026/2/24 22:01:52

全新软件与模型优化为 NVIDIA DGX Spark 注入强大动力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
全新软件与模型优化为 NVIDIA DGX Spark 注入强大动力

作者:Allen Bourgoyne

自发布以来,NVIDIA 通过持续的软件优化以及与软件合作伙伴和开源社区的紧密协作,不断提升基于 Grace Blackwell 架构的 DGX Spark 的性能。这些举措在推理、训练和创意工作流方面都取得了显著的成效。

在 CES 2026 上,全新的 DGX Spark 软件版本结合新的模型更新和开源库,为 DGX Spark 以及基于 GB10 的 OEM 系统带来了显著的性能提升。

使用统一内存和NVFP4本地扩展大模型

DGX Spark 专为大模型本地化应用而设计,配备 128GB 统一内存,并采用紧凑的桌面形态。两台 DGX Spark 系统互连可提供 256GB 的组合内存,支持开发者能够在本地运行更大的模型。

系统通过 ConnectX-7 网络连接,提供 200Gbps 带宽,实现高速、低延迟的多节点工作负载。

支持 NVIDIA NVFP4 数据格式,可使新一代模型大幅降低内存占用,同时提升吞吐量。例如,在相同的双 DGX Spark 配置上,使用 NVFP4 精度和推测解码运行 Qwen-235B 模型,相比 FP8 执行性能最高提升 2.6 倍。

使用 FP8 精度时,该模型会耗尽两台系统的组合内存,从而限制多任务处理和整体响应速度。将模型量化为 NVFP4 后,可将内存使用量减少约 40%,同时保持高精度,使开发者能够在获得 FP8 等效结果的同时实现更高性能,并释放足够内存以同时运行其他工作负载。最终使本地 AI 开发体验更加响应迅速且高效。

创作者打造的强大桌面平台

DGX Spark 不仅是 AI 开发者的卓越平台,创作者也能充分利用其桌面级功能。

通过将 AI 工作负载转移到 DGX Spark,创作者可以使自己的笔记本电脑或 PC 在内容生成过程中保持响应。

阿里巴巴的 Qwen-Image 等领先的扩散模型正利用 NVFP4 减少内存占用,同时实现更高性能。

AI 视频生成尤其适合 DGX Spark,因为它需要大量的内存和算力。采用 NVFP8 优化权重的音视频生成模型相比上一代性能显著提升,使高质量视频生成在桌面端成为可能。

DGX Spark现已纳入NVIDIA认证系统计划

NVIDIA 认证系统计划用于验证系统在广泛加速图形处理、计算和 AI 工作负载方面的性能表现。NVIDIA 认证系统为 AI 开发、桌面推理、数据科学、设计和内容创作工作负载提供了可信的基础,同时也对数据中心和云资源进行增强。

DGX Spark 和基于 GB10 的 OEM 系统现已纳入该计划,DGX Spark 及合作伙伴系统目前正在测试中。

快速上手

了解我们如何帮助开发者立即提高生产力,展示 Blackwell GPU 的可能性,包括:

  • Nemotron 3 Nano:本地运行 NVIDIA 高效的 30B 参数 MoE 模型,以用于 LLM 实验。
  • Live VLM WebUI:将网络摄像头画面输入数据流传输至视觉语言模型中进行实时分析,并利用 GPU 进行处理。
  • Isaac Sim / Lab:利用 GPU 加速的仿真与强化学习,构建并训练机器人应用。
  • SGLang 与 vLLM 服务 Playbook:清晰的模型支持矩阵能够显示已测试与支持的模型及量化选项。
  • GPU 加速的量化金融与基因组学 Playbook:与基于 CPU 的实现相比,这些工作流所需的代码改动极少。
  • 使用 PyTorch 微调:通过 FSDP 与 LoRA,在两台 DGX Spark 系统上分布式微调,支持参数最高达 70B 的 LLM。

简单可靠、步骤清晰且实用的故障排除指南,已在最新 DGX OS 上验证配置,能够让用户减少设置时间,将更多时间用于构建。

使用NVIDIA Brev随时随地访问DGX Spark

借助 NVIDIA Brev,用户可以通过安全连接随时随地访问 DGX Spark。Brev 让开发者能够轻松创建 AI 云实例,利用 Launchables 功能,实现一键即可配置 AI 环境。在 CES 上,Brev 的更新展示了注册本地计算(如 DGX Spark)的能力。在 Brev 完成注册后,用户即可随时随地访问 DGX Spark,并安全地与团队共享访问权限。

Brev 支持本地与云模型的混合部署。借助路由层,用户可以将电子邮件或专有数据处理等敏感任务保留在运行于 DGX Spark 上的本地开放模型上,同时将一般推理任务路由至云端的前沿模型。实现细节可参阅 NVIDIA LLM Router 开发者示例。

Brev 对本地计算的支持将在 CES 上进行预览,正式支持将于 2026 年春季推出。

打造专属智能

如需进一步探索,NVIDIA 与 Hugging Face 合作展示如何构建个人桌面 AI 助手。使用 DGX Spark 搭配 Reachy Mini,用户可以创建一个私有 AI 助手,在本地私密的处理数据。请参阅 NVIDIA 与 Hugging Face 教程开始体验。

加入 DGX Spark 开发者社区,开启 AI 构建之旅。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/24 16:25:58

Excel高级技巧:循环引用的神奇应用——从迭代计算到文本处理

一、循环引用基础:理解Excel的迭代计算 1.1 什么是循环引用? 循环引用是指一个单元格内的公式直接或间接地引用了该公式本身所在的单元格。在大多数情况下,Excel会将其视为错误,但通过特定设置,我们可以利用这一特性…

作者头像 李华
网站建设 2026/2/23 0:23:48

屏幕尺寸的万花筒:如何在 iOS 碎片化生态中以不变应万变?

1. 别再跟绝对像素“死磕”:流体布局的思维重构 做 iOS 开发这么多年,我见过最恐怖的代码不是逻辑复杂的算法,而是满屏写死的 frame: CGRectMake(0, 0, 375, 667)。 老兄,醒醒,iPhone 6 的时代早就过去了。 现在的苹…

作者头像 李华
网站建设 2026/2/24 19:43:28

Mybatis:

持久层指的是:数据保存到数据库的代码 jdbc的缺点: 硬编码:指的是在注册驱动和获取连接中的一些字符串和sql语句被称为硬编码 原因:这些内容的可能被改变 如何解决那: 把硬编码配置到文件中去 1 mybatis的快速入门&…

作者头像 李华
网站建设 2026/2/23 9:21:40

进程通信一

进程通信一 一、进程通信的目的二、匿名管道什么是管道呢?站在文件描述表的角度站在内核的角度代码实现进程通信管道特征 一、进程通信的目的 我们都知道,进程是具有独立性的,但是进程与进程之间需要进行通信,因此进程之间的通信是…

作者头像 李华
网站建设 2026/2/23 23:55:36

MD5 详解:初学者一看就会的指南

🎯 一句话理解MD5 MD5就像是给任何数据"拍照"生成一张独一无二的"指纹照片"。 无论你给它一篇文章、一个文件、还是一段视频,它都会生成一个固定长度的32位字符串。 📖 什么是MD5? MD5 的全称是 Message-Digest Algorithm 5(消息摘要算法第5版)…

作者头像 李华