巨人天成
产经 科技 企业 数据 峰会 快讯 商业

黄仁勋:英伟达软硬件协同,打造全球低成本AI Token新标杆

2026-04-22来源:互联网编辑:瑞雪

在Cadence Live 2026大会上,英伟达首席执行官黄仁勋向外界传递了一个明确信号:这家以高性能AI硬件闻名的企业,正通过软硬件协同创新重新定义AI成本竞争规则。他直言:"我们交付的不是昂贵的计算设备,而是全球最具性价比的AI语言单元。"

作为AI模型处理语言的核心单元,Token的生成效率直接取决于硬件架构与软件算法的耦合度。黄仁勋用"暴力计算陷阱"形容单纯依赖硬件堆砌的做法,指出这种模式虽能提升绝对算力,却会导致单位Token能耗与成本呈指数级增长。英伟达通过20年持续迭代的CUDA生态,构建起从芯片指令集到深度学习框架的垂直优化体系,使Blackwell架构的硬件能效较前代提升3.7倍。

尽管英伟达最新发布的Rubin平台单套售价突破千万美元量级,但其经济模型展现出颠覆性特征。以训练千亿参数模型为例,该系统每小时可生成2.5万亿Token,通过动态负载均衡技术将硬件利用率维持在92%以上。这种规模效应使得单个Token的电力成本降至0.00003美元,仅为行业平均水平的1/8。

公司同步推出的TCO 2.0评估体系,将传统以FLOPS为核心的衡量标准升级为"每瓦Token产出率"和"单位成本Token数"双维度指标。测试数据显示,在同等预算条件下,采用英伟达全栈方案的企业可处理3.2倍规模的数据集,模型迭代速度提升4.5倍。

面对AMD MI350、谷歌TPU v5等竞品的围剿,黄仁勋将竞争焦点引向生态壁垒。他透露,CUDA开发者社区已突破450万人,全球87%的AI企业采用其优化工具链。这种网络效应使得新入局者需要付出数倍成本才能达到同等性能,形成难以逾越的技术护城河。

在应用层战略布局方面,英伟达将智能体AI(Agentic AI)确定为下一代核心赛道。其最新发布的Omniverse Agent框架,可实现跨模态推理的能耗降低60%,推理延迟压缩至8毫秒。这项技术已应用于自动驾驶、药物研发等23个领域,帮助客户将项目周期从18个月缩短至5个月。

供应链挑战成为当前最大变数。受先进制程产能限制,Rubin平台的交付周期已延长至14周,部分关键组件价格季度涨幅超过25%。英伟达正通过多源采购和芯片堆叠技术缓解压力,但分析师警告这可能影响其毛利率表现。不过从历史数据看,该公司过去五年在AI市场的占有率始终保持在75%以上,展现出强大的抗风险能力。

5.35亿年前环节动物化石现身陕南 填补学界两大关键空白
近日,中国科学院南京地质古生物研究所科研团队在陕南约5.35亿年前地层中,发现了立体保存的多毛类环节动物化石,填补了学界两大空白。科研团队研究发现,这些小动物就是生活在寒武纪幸运期的环节动物,这一研究将显生宙…

2026-04-22