巨人天成
产经 科技 企业 数据 峰会 快讯 商业

AI应用爆发前夜:推理成本骤降,免费时代即将到来?

2024-12-25来源:甲小姐甲子光年编辑:瑞雪

在科技界的一次重要盛会上,关于人工智能未来的讨论如火如荼。近日,在中关村国家自主创新示范区展示中心举办的“万千流变,一如既往”2024甲子引力年终盛典上,PPIO派欧云联合创始人兼CEO、PPTV创始人姚欣分享了他对AI时代的深刻洞察。

姚欣指出,当前大模型虽然推动了智算中心的建设热潮,但面临使用率较低的挑战。同时,需求侧的变化也十分显著,从2023年上半年大模型创业训练的热潮,到后来的逐渐降温,算力结构正在发生深刻转变。他强调,AI应用需求正在经历重大变迁,大模型正从面向VC的炒作阶段走向面向B端的应用落地阶段,未来有望进一步向C端拓展。

姚欣进一步分析,当前制约AI应用爆发的关键因素在于推理成本。他预计,2025至2026年将是AI的转折年。随着AI推理成本每年接近十倍的下降,大量AI应用的收入将足以覆盖所有的推理成本,AI应用有望迎来免费时代。这一预测引起了与会嘉宾的广泛关注和讨论。

姚欣以数据为例,回顾了数字新基建的发展历程。从2015、2016年开始,数字新基建持续发展,每年互联网数据中心的增速保持在30%-50%之间,机架上架数量在300万到1000万之间。然而,这些数据中心的建设在后期面临了使用率较低的挑战。尤其是在贵州、内蒙古等数据中心建设最密集的地区,利用率仅为34%。全国平均来看,机房利用率不到50%,出现了“IDC过剩”现象。

姚欣表示,去年大模型点燃了新一代智算中心的建设。但今年前七个月,全国新建了约140个智算中心,随着未来两年大量投产落地,也必然会面临使用率较低的情况。根据信通院的调研报告,过去两年建设的智算中心整体平均利用率约为30%。超前建设的智算中心可能会面临算力过剩问题,这也是供给侧所面临的挑战。

在需求侧方面,姚欣指出,2023年上半年大模型迎来爆发,业内纷纷投身大模型的创业和训练。然而,进入2024年,大模型热度明显降温,参与大模型预训练的企业数量显著下降。这一变化反映了行业正在从预训练转向后训练,包括微调和推理环节。国内一些公司如Kimi等,已经采用更多推理侧算力,通过新技术进一步提升模型性能和推理效果。

姚欣还提到了OpenAI发布会引发的关注,特别是音视频生成领域的发展。他指出,从文字、图片时代到视频时代的演进带来了巨大的变化。如今,生成一分钟的视频所需的token消耗相当于数万倍文字生成的资源需求,新一代多模态大模型会带来更大的推理消耗。

针对算力需求的变迁,姚欣提出了自己的观察。他认为,AI应用的发展将经历三个阶段:面向VC的炒作阶段、面向B端的应用落地阶段以及面向C端的大规模应用阶段。目前,AI正处于炒作阶段的尾声,开始进入到To B的落地阶段。未来,AI应用将逐步走向To C阶段。

姚欣强调,推理成本的优化是AI应用爆发的关键。他分享了PPIO派欧云在推理成本优化方面的实践。PPIO派欧云作为一家分布式云计算企业,从IaaS基础设施到PaaS平台服务,再到大模型应用服务,进行了端到端的全程观察。他们发现,推理成本的下降主要源自硬件成本的降低、算力调度的优化以及推理加速。

在硬件成本降低方面,PPIO派欧云探索了如何找到更便宜的电力资源和充分利用硬件资源。他们通过“梯次利用”老旧GPU卡,如A100等,在推理任务中保持较高效能,从而降低了硬件成本。在算力调度优化方面,他们通过智能预测和调度需求,实现了资源的高效利用和全局负载平衡。在推理加速方面,他们结合产学研最新成果,将先进技术整合到工程能力和实际使用能力中,实现了推理效率的大幅提升。

姚欣还分享了PPIO派欧云在实际应用中的成果。他们为一家知名小说推文APP提供了模型能力替代服务,使其推理成本降低了70%,生图速度提升了5倍,业务用量和营收在短短一个月内实现了3倍多的增长。同时,他们也将业务扩展到海外市场,帮助全球Top10招聘网站通过大语言模型进行简历筛选和优化,显著减少了人工需求。

姚欣表示,PPIO派欧云将继续致力于分布式云计算的建设和优化,通过高效的资源整合和调度、优化硬件利用率以及提升模型性能和推理加速能力,为客户提供更高性价比的AI服务。他们相信,随着技术的进一步发展,AI应用将迎来爆发式增长,为各行各业带来深刻的变革。

姚欣还提到了PPIO派欧云在全国范围内的广泛布局和合作伙伴网络。他们已经在全国1200多个城市以及亚洲的1300多个城市与本地合作伙伴建立了合作,整合了各类算力资源加入到他们的算力共享平台中。这些合作伙伴为PPIO派欧云提供了丰富的GPU资源和算力支持,共同推动了AI应用的发展。

WebRTC技术赋能物联网卡:解锁工业医疗驾驶毫秒级低时延通信新路径
WebRTC(网页实时通信)技术与物联网卡的深度融合,正通过 “协议优化 + 硬件适配 + 网络升级”,破解毫秒级响应难题。本文基于行业实践,解析 WebRTC 技术原理、物联网卡协同路径及场景落地效果,为…

2025-11-13

智慧公安大数据云平台:以科技赋能警务,构建城市安全治理新生态
通过公安云平台,各类警务数据得以高效整合与流转,实现了从“人海战术”向“数据驱动”的转变。一键式可视化报警设备的引入,进一步拓宽了公众参与治安治理的渠道,实现接警员与报警人视频对讲、现场信息实时推送,为快速处…

2025-11-13

昕锐CL系列激光测距模块:定制化驱动低空经济场景变革新引擎
结语:定制化,是技术普惠的终极路径当测距模块从“标准化商品”进化为“场景化服务”,昕锐CL系列不仅解决了无人机与吊舱的“精准降本”难题,更重新定义了技术与需求的关系:技术突破的价值,不在于参数的堆砌,而在于…

2025-11-13

企业展厅多媒体设备保养指南:从日护到年检的分层维护策略
企业展厅多媒体设备保养频率需按“基础养护+定期检查+深度维护”分层设定,核心频率为每日、每周、每月、每季度,部分设备需年度专业维保。检查设备开机状态,测试核心功能(显示、音响、互动响应)是否正常。 请专业人…

2025-11-13

2025网购流量卡选购指南:不同场景实测教你选到网速稳的好卡
所以,简单概括一下:一张正规的网购流量卡,其网速表现与同运营商的线下套餐并无本质差异。 在流量卡领域,我认为“便宜”不一定直接等于“网速差”。•警惕“物联卡”冒充手机流量卡

2025-11-13

苹果设备与电信流量卡全攻略:从兼容到技巧,助你畅享无忧网络
•运营商网络覆盖差异•手机版本支持频段不同•套餐类型与设备性能不匹配最新的iPhone 14系列甚至已经支持电信的5GSA组网,网速体验绝对令人惊艳!

2025-11-12

2025金砖大赛大数据分析赛项落幕 多元力量共促数智化人才培养新篇章
新道科技助理总裁唐梦彬在致辞中表示,大赛把企业数智化转型过程中的业务模式、典型场景与大数据分析技术相结合,体现行业和企业对人员技能的最新标准,让师生深入了解当前数智化企业的运营和管理模式,提升大数据分析的理…

2025-11-12

量子安全网络新突破:CV-QKD可插拔模块开启高效规模化部署新篇
CUbIQ Technologies:开发了 CV-QKD 收发模块和量子安全架构HPE Juniper网络:将模块集成到其路由平台中,实现量子安全 MACsec 加密Coherent 高意:提供 400…

2025-11-12