巨人网
产经 科技 企业 数据 峰会 快讯

微软开源bitnet.cpp:本地运行千亿参数AI模型,无需GPU?

2024-10-19来源:ITBEAR编辑:瑞雪

微软公司近日宣布了一项重大开源成果——bitnet.cpp,这一创新框架专为1-bit大语言模型(LLM)设计,旨在实现超高效推理。通过bitnet.cpp,用户无需依赖GPU,即可在本地设备上流畅运行规模达1000亿参数的语言模型。

bitnet.cpp不仅带来了6.17倍的速度提升,还显著降低了能耗,降幅高达82.2%。这一突破解决了传统大语言模型对GPU和电力的高需求问题,使得小型企业和个人用户也能以较低成本享受AI技术。

该框架支持1-bit LLMs的高效计算,并优化了内核以最大化CPU推理性能。目前,bitnet.cpp已支持ARM和x86 CPU,未来还计划扩展至NPU、GPU和移动设备。

根据测试结果,bitnet.cpp在ARM CPU上的加速比为1.37x至5.07x,x86 CPU上则为2.37x至6.17x,能耗减少55.4%至82.2%。

bitnet.cpp的推出有望重塑LLMs的计算范式,减少对硬件的依赖,为本地LLMs的发展铺平道路。同时,它还能增强隐私保护,降低数据发送至外部服务器的需求。微软的“1-bit AI Infra”计划中,bitnet.cpp扮演着举足轻重的角色。

台积电2nm制程领先,业界真无对手?
晶圆代工龙头台积电的先进制程可说是打遍天下无敌手,成为业界霸主,在高运算力的AI芯片订单不断涌进台积电之下,先进制程产能大增,除了3纳米制程出货占第3季晶圆销售金额的20%,5纳米制程更占32%,共占52%…

2024-10-19

正大天晴斩获重磅抗病毒药首仿权,医药界新突破!
日前,中国国家药品监督管理局(NMPA)官网显示,中国生物制药下属企业南京正大天晴开发的来特莫韦注射液获得上市批准,该药品成为国内首个仿制药。来特莫韦的片剂和注射剂最早于2017年获得美国FDA的批准上市,商…

2024-10-19

金饰市场火热,价格首次突破800元大关!
据澎湃新闻,多家品牌金饰价格突破800元。其中周大福、周六福、六福珠宝达到806元每克。…

2024-10-19

嫦娥六号月球背面珍贵样品,全球首展亮相引关注!
10月14日至18日,第75届国际宇航大会(IAC)在意大利米兰召开。中国探月工程嫦娥六号任务取得的重大成果成为全场瞩目的焦点。嫦娥六号从月球背面采样返回的月壤样品首次向全球展出。(人民日报) …

2024-10-19