巨人天成
产经 科技 企业 数据 峰会 快讯 商业

英伟达Blackwell平台适配DeepSeek-V4系列模型 助力开发者高效部署与推理

2026-04-25来源:互联网编辑:瑞雪

英伟达近日宣布,其NVIDIA Blackwell平台已完成对DeepSeek-V4-Pro与DeepSeek-V4-Flash两款大模型的适配工作。开发者可通过NVIDIA NIM微服务直接下载部署,或基于SGLang、vLLM框架实现定制化推理,为AI应用开发提供更灵活的技术路径。

在模型参数配置上,DeepSeek-V4-Pro以1.6万亿总参数量与490亿激活参数的组合,专注于复杂推理场景;而DeepSeek-V4-Flash则采用2840亿总参数量与130亿激活参数的轻量化设计,主打高速响应需求。两款模型均支持百万级Token上下文窗口与最高38.4万Token的输出能力,可覆盖长文档分析、代码生成等核心应用场景,并采用MIT开源协议保障技术共享。

性能测试显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72集群上实现每用户每秒150个token的基准性能,通过vLLM框架的Day 0优化方案,可在Blackwell B300架构上快速完成部署。随着Dynamo编译器、NVFP4量化技术及CUDA内核的持续优化,模型推理效率有望进一步提升。

在部署生态构建方面,SGLang框架提供低延迟、均衡负载及最大吞吐量三种优化模式,满足不同场景的性能需求;vLLM框架则支持跨100个以上GPU节点的分布式推理,并集成工具调用与推测解码功能,为大规模AI服务提供技术支撑。这种多框架兼容的设计,显著降低了开发者将模型落地至生产环境的门槛。

杭州镜识科技Bolt人形机器人:11米/秒奔跑速度,刷新全球纪录
其采用全尺寸人体工学设计,身高175-177厘米,体重75公斤,与普通成年男性体型相近,外观线条流畅,无外露元器件,兼具美感与实用性,脚掌设计有可弯折自由度,能有效缓解高速奔跑时的地面冲击。 除室内11米/…

2026-04-25

2026苏州科技强农大会:黑科技赋能农业,新农人共绘未来新图景
4月24日,第二十五届江苏农业国际合作洽谈会、2026苏州科技强农大会在金鸡湖畔启幕,来自20多个国家和地区的嘉宾齐聚苏州,以“科技赋能农业 开放共享未来”为主题,共探农业新质生产力培育与高质量发展路径。农…

2026-04-25

阿里云百炼平台首发DeepSeek-V4两版本,百万Tokens输入最低1元起
4月24日来自阿里的消息,阿里云百炼平台首发上线DeepSeek-V4-pro和DeepSeek-V4-flash两款模型,API价格与DeepSeek官网一致,百万Tokens输入最低仅需1元,百万Tok…

2026-04-25

越疆协作机器人领跑全球后:聚焦场景,解锁具身智能未来新路径
越疆科技创始人兼CEO刘培超在主题演讲中披露了公司在协作机器人与具身智能领域的最新进展,以及行业技术演进路径与发展方向。 与部分企业以人形外观为切入点不同,越疆选择从协作机械臂的“上肢能力”出发,先通过协作臂…

2026-04-25