巨人天成
产经 科技 企业 数据 峰会 快讯 商业

NVIDIA DGX Spark个人超算登场,性能短板凸显,借Mac Studio能否破局?

2025-11-22来源:快讯编辑:瑞雪

一台被称为“全球最小超算”的设备NVIDIA DGX Spark,正引发科技圈的广泛关注。这款面向科研人员、数据科学家和学生的个人AI超级计算机,凭借其128GB内存和2000亿参数处理能力,试图在桌面端实现高性能AI计算。然而,其3万元的售价与实际性能表现,成为讨论焦点。

根据多方评测,DGX Spark在轻量级模型中表现优异,甚至能稳定运行1200亿参数的大模型,整体性能介于RTX 5070与RTX 5070 Ti之间。但其核心短板在于273GB/s的内存带宽限制——这一数据传输速度远低于高端显卡的1800GB/s,导致解码阶段(生成答案)效率低下。有用户形容其体验为“脑子转得快但说话结巴”,首字响应迅速但后续输出卡顿。

为突破带宽瓶颈,极客团队EXO Lab尝试将DGX Spark与Mac Studio M3 Ultra(带宽819GB/s)联动,通过“预填充-解码分离”技术,将推理速度提升2.8倍。然而,这种方案需同时使用两台DGX Spark和一台Mac Studio,总成本接近10万元,性价比争议随之而来。有评论指出:“用十万设备跑本地模型,未免过于奢侈。”

尽管存在缺陷,DGX Spark的128GB统一内存仍为其拓展了应用场景。官方提供超过20种开箱即用的玩法,涵盖视频生成、多智能体助手搭建等。例如,用户可利用ComfyUI框架运行阿里Wan 2.2视频模型,或通过LM Studio部署本地大模型。实测中,设备在视频生成时温度达60-70摄氏度仍保持静音,内部结构设计获博主称赞“工整有序”。

在对比测试中,DGX Spark的Prefill阶段(阅读理解)优势明显,但Decode阶段(生成答案)表现平平。以DeepSeek R1模型为例,其平均TPS(每秒生成词元数)为33.1,仅略高于Mac Mini M4 Pro的17.8。评测团队指出,批次大小对性能影响显著:当批次设为32时,DGX Spark的解码速度可飙升至370词元/秒,但对普通用户而言,如此高负载场景并不常见。

工业机器人防护服:为机器人穿上“保护衣”,助力高效稳定生产
工业机器人的运行环境通常比较恶劣,可能会遭受尘埃、水分、磨损等影响,因此,工业机器人防护服的出现,对于确保其稳定运行具有重大意义。工业机器人防护服则能够起到一道“屏障”,将这些危险因素隔离在机器人之外。在金属…

2025-11-22

智慧油田新助力:AI摄像机远程监控,精准守护设备运行状态
1.实时性:AI摄像机能够实时捕捉关键设备的运行画面,通过高速传输网络将数据传输至监控中心,确保管理人员能够第一时间掌握设备的运行状况。通过引入先进的AI技术和高速传输网络,我们可以实现对油田关键设备的全面…

2025-11-22

三十余载逐梦通信路:王晓云引领中国移动通信从空白到全球领航
王晓云长期从事移动通信组网领域研究,在超大规模移动网体系结构与交互机制方面做出开创性工作,特别是在我国TDD网从无到有、从有到优、从优到强,成为全球主导的历程中发挥了核心作用,为助力我国移动通信跨越式发展作…

2025-11-22

PLC与变频器通信接线全解析:从原理到实操,轻松掌握控制技巧
PLC以模拟量方式控制变频器的硬件连接如下图所示,由于三菱FX2N-32MR型PLC无模拟量输出功能,需要给它连接模拟量输出模块(如FX2N-4DA),再将模拟量输出模块的输出端子与变频器的模拟量输入端子连…

2025-11-22

学术先锋逐梦人刘剑锋:于6G领域深耕,以热忱奔赴科研理想
曾获博士国家奖学金(本学科仅1人)、上海市优秀毕业生(班级仅2人)、同济大学优秀博士生/硕士生/本科生奖学金、同济大学优秀学生(连续4年);在各类学科竞赛中获奖9项(代表同济大学首次参加VEX机器人世界锦标赛…

2025-11-22