巨人网
产经 科技 企业 数据 峰会 快讯

英伟达nGPT新架构来袭,AI训练时间骤减20倍!

2024-10-22来源:ITBEAR编辑:瑞雪

科技界迎来一项重大进展,英伟达在AI模型训练领域取得了突破性成就。该公司最新发布的Normalized Transformer(nGPT)架构,在保持模型稳定性和准确性的同时,大幅缩短了训练时间,最高可达原来的二十分之一。

nGPT架构的核心在于“超球面学习”概念,通过将关键组件映射到超球面表面,确保模型各层在训练中的平衡,从而创造更稳定高效的学习过程。

与传统的GPT模型相比,nGPT在速度和效率上均表现出色。在OpenWebText数据集测试中,nGPT对于长达4000个tokens的文本输入,所需训练轮次远少于传统模型。

nGPT还将归一化和表示学习结合成一个统一框架,简化了模型架构,便于扩展和适应更复杂的混合系统。这一创新设计有望为AI系统的发展带来新的突破。

2025款福特电马Mustang Mach-E上新,热泵加持价格更亲民!
10月22日消息,2025款福特电马MustangMach-E已发布,虽然新款车型变化不大,但新增的热泵、运动外观套件、科技升级和价格下调还是带来了不少亮点。首先,2025款MustangMach-E…

2024-10-22

美国大选在即,对冲基金和资管公司削减看空美元的押注
对冲基金和资产管理公司在10月第二周减少约80亿美元的空头部位。商品期货交易委员会(CFTC)数据显示,美元出现自2021年疫情严重时期以来最大的交易净正波动,这些衍生性商品交易员本月初还持有逾130亿美元的…

2024-10-22