科技界迎来一项重大进展,英伟达在AI模型训练领域取得了突破性成就。该公司最新发布的Normalized Transformer(nGPT)架构,在保持模型稳定性和准确性的同时,大幅缩短了训练时间,最高可达原来的二十分之一。
nGPT架构的核心在于“超球面学习”概念,通过将关键组件映射到超球面表面,确保模型各层在训练中的平衡,从而创造更稳定高效的学习过程。

与传统的GPT模型相比,nGPT在速度和效率上均表现出色。在OpenWebText数据集测试中,nGPT对于长达4000个tokens的文本输入,所需训练轮次远少于传统模型。

nGPT还将归一化和表示学习结合成一个统一框架,简化了模型架构,便于扩展和适应更复杂的混合系统。这一创新设计有望为AI系统的发展带来新的突破。
光联携手利元亨,共话新能源制造AI时代网络新路径与新机遇
聚焦企业在全球范围内的多分支互联与云IDC接入问题,方案基于光联自建全球光纤骨干网络及华为SD-WAN设备,支持MPLS、Internet与4G/5G等多种链路融合,并可弹性部署多种拓扑模型,实现总部、分支…
2025-11-15
恒为科技:从可视化到智算,让复杂算力“看得见、管得住”
这家公司从 2003 年起步,长期在“网络可视化”和“智能系统平台”两条看似技术化的赛道上耕耘,逐步在运营商、科研院所、大型行业客户中建立信任与交付能力。它不像爆款公司那样靠一款产品跑路,而是靠一条条项目、…
2025-11-15
小天互连IM系统:打破政企信息孤岛 驱动一体化协作新变革
某省级政务大厅在信创升级中,通过小天互连IM系统实现了与政务服务平台、电子证照系统的无缝对接,群众办事进度可直接通过即时通讯推送,办理效率提升50%,印证了其国产化集成的稳定性。 从国产化生态适配到开放 A…
2025-11-14
水浸传感器RS-SJ:4G蓝牙双助力,高效守护防积水安全
当检测到水浸情况时,相关信息会通过4G网络快速传输至指定的管理平台或用户终端,无需人工现场查看,让用户在第一时间知晓积水隐患,为及时采取排水、设备转移等应对措施争取时间,避免积水造成更大损失。 水浸传感器凭借…
2025-11-14
中国电信2025年云网路由交换设备集采结果揭晓
中国电信近日宣布,其云网路由交换设备(2025年)集中采购项目已顺利完成评审工作。此次采购项目规模庞大,涉及多个关键网络设备领域,旨在进一步优化和提升云网基础设施能力。
2025-11-13