巨人天成
产经 科技 企业 数据 峰会 快讯 商业

对话贾扬清:明年AI推理成本还会降低10倍以上,一两年内AI使用成本或低于人工

2024-10-29来源:搜狐科技编辑:瑞雪

Lepton AI创始人兼CEO贾扬清

作者|郑松毅

编辑|杨锦

近日,由声网联合主办的RTE2024第十届实时互联网大会在北京开幕。

大会开始前,Lepton AI创始人兼CEO贾扬清早早就坐在了嘉宾席。蓝色衬衫、牛仔裤,熟悉的那般“码农”形象再现。

他还是习惯性地把微笑挂在嘴边,和聊了聊最近美国硅谷发生的变化,以及对AI发展现状和未来趋势的一些看法。

这是他今年第二次回国,在大会开始前一晚刚到北京,但整个人看不出来丝毫倦意。

AI如何落地应用?国内外都在忙着找答案

“这次回来能明显感受到大家对于AI应用积极探索的热闹氛围,硅谷也正如此。”贾扬清说。

“相较于AI热潮初期的硅谷,现在的硅谷‘冷静’了许多,关注点更偏向于应用。大多数企业会选择在现有模型基础上加速功能迭代和研发。几乎没人还在比谁的模型更大、参数更多。”

他补充道,“同等质量的模型,规模会变得越来越小,计算效率会越来越高,模型架构会变得更加开放和标准,这是我观察到的未来趋势。”

如果说前两年的AI是在“卷”技术,那今年无疑都转向了“卷”应用。

在贾扬清看来,今天是做应用最好的年代,AI呈现出来的智能能力让做应用变得更简单,同时能够带给用户更好的交互体验。

以前人们常认为,芯片短缺是阻碍AI发展最大的“绊脚石”。但在贾扬清看来,“芯片供应链问题已经有了非常好的解决方案,因GPU短缺造成的算力问题不再会是瓶颈。关键是看如何找到AI应用路径,与垂直领域深度结合,真正把AI用起来。”

“就像当年‘电’刚被发明出来时,很多人不知道它有什么用,直到冰箱、电视、手机的出现,才让电的价值得以体现。”

但想让AI真正用起来,成本是一个不得不考虑的问题。

有人提出,“如今AI技术难广泛落地应用,问题是出在了高额成本上。从客服行业来看,标杆是5元每小时,这是菲律宾和印度的人工价格。要是AI使用成本比人还贵,就没必要了。”

对此,贾扬清比之前更加乐观。他认为,“成本不是核心问题,Token的推理成本可能在接下去的一年还会再降低十倍,甚至更多。公司更应该关注的是用户体验。让AI使用成本降低到人工成本以下,可能就是一两年的时间。”

他表示,“核心的大语言模型其实都差不多,但企业如何管理数据、怎么打通权限、用户搜索时是想找到文档还是想要内容总结?这些长远深度的思考远比模型本身更重要。”

GPU价格是个“伪命题”

除了应用,当前AI竞技场的另一关注点在于AI基础设施。

搞云计算出身的贾扬清,认为现在迎来了“云”的第三次浪潮,而AI正是这场革命的催化剂。

他介绍,“云”的前两次浪潮分别是2000年代的“Web云”,以及2010年代的“数据云”,而这次兴起的是“AI云”。

与前两朵“云”不同的是,“AI云”是在”传统云“的基础上增加了AI算法,利用神经网络等技术,可以满足更大规模的数据处理和计算需求。

“今天所有的AI应用都对大模型有非常高的需求,无论是AI图像生成还是AI视频生成,都会调用软件框架,最后落到云基础架构和GPU上面。”贾扬清说。

谁都不想错过“风口”的机会,“AI云”也正是贾扬清在辞任阿里巴巴技术副总裁后,看准的创业方向。

贾扬清说,“挤大模型赛道不是最想干的事,更看重AI发展背后生出的机会点,即对高性能计算的需求,以及AI市场会越来越需要好的云服务,这是团队最擅长的。”

Lepton AI和很多硅谷创业公司一样,团队规模并不大,大多是程序员和产品经理。

公司名字的由来也很有意思,在物理学中,“Lepton”指的是轻子,是一种基本粒子。

这和贾扬清所期望的一样,用最简单的方式和低廉的成本帮助其他公司解决行业痛点问题。

“他们需要更快的GPU、更好的供应链、更高的性价比、更加专业的服务...这一切都是我们正在做的事。”

具体来说,Lepton AI提供的是大模型推理引擎,建立了云平台供用户找到性价比最高的GPU资源。

贾扬清认为,“GPU价格在一定程度上是个‘伪命题’,因为Buy is better than build(购买AI云服务会比自建算力设施更划算)。”

他提到,“很多有前瞻性的CEO已经放弃纠结一块GPU到底需要多少钱,而是选择了这样的方式,把更多的精力和资源放在应用开发上。”

对话最后,请贾扬清谈了谈如何才能在技术创新的道路上找到自己的方向。

他想了片刻说,“创新没有捷径一说,兴趣是最好的驱动力,因为谁也猜不到未知技术领域会带来怎样的惊喜,能做的就是追随兴趣坚持走下去。”

TLKS-PMG-TP装置:全天候精准监测,守护输电线路“体温”安全
TLKS-PMG-TP输电线路线夹及导线温度在线监测装置应运而生,以其高精度测温与全时段监测能力,为输电线路装上了一双“精准温控眼”。 TLKS-PMG-TP装置不仅提供实时监测,更实现了输电线路运维的智能…

2025-11-15

华为在阿根廷完成5G-A双场景验证 下行峰值速率创新高助力无线发展
无线业务的发展对网络性能提出了更高的要求,而阿根廷市场一直走在拉美创新无线技术探索的前列,本次创新测试验证了两种未来5G-A商用载波组合,包括覆盖更强,更易大规模部署的Sub3.5G TDD+FDD 3CC…

2025-11-14

Gartner发布2026十大技术趋势:AI主导变革,从“大而全”迈向“精而实”
近日,商业与技术洞察公司Gartner发布了2026年十大战略技术趋势:AI超级计算平台、多智能体系统、特定领域语言模型、AI安全平台、AI原生开发平台、机密计算、物理AI、前置式主动网络安全、数字溯源,以及…

2025-11-14

中国6G技术首阶段试验圆满收官,通信领域创新再启新程
在全球竞相布局6G的背景下,中国率先完成第一阶段技术试验,展现了其在通信领域的强大实力。此次试验涵盖了6G关键核心技术,测试了多种潜在技术和系统性能。业界普遍认为,6G网络将实现地面与卫星通信的融合,构建空…

2025-11-14

桥梁位移监测仪:精准感知位移 灵活部署续航 守护桥梁安全出行
这种方式能够利用清洁能源为设备持续供电,既体现了节能环保的理念,也巧妙地解决了在市政供电不便场景下的设备续航问题,保障了监测工作的不间断进行。为了便于现场操作与维护,桥梁位移监测仪还配备了便捷的配置方式。 …

2025-11-14

5.5G辐射危害健康?物理学者:比太阳光频率低,基站越密越安全
我当时听了都愣了,太阳光那不是好东西吗,怎么还跟信号辐射扯一块儿了? 最有意思的是,他说大家都觉得基站多了辐射就大,这完全是搞反了。之前吵得最凶的那个阿姨,现在天天用5.5G跟外地的孙子视频,还跟邻居说这新基…

2025-11-14

技嘉B860M冰雕主板深度评测:千元价位与酷睿Ultra的完美搭档
XMP AI Boost的DDR5-8200 CL40挡位也能够顺利开启,再叠加上高带宽、低延迟功能的性能加成之后,内存性能继续得到提升,但写入性能基本上是到顶了,主要是受限于B860芯片组主板无法调整CP…

2025-11-14

上海电信“双万兆”护航进博会:数智赋能通信保障,服务跨越语言距离
浦东机场T1电信营业厅及T2一站式服务中心电信柜台是进博会观众和外宾抵沪的“入境第一站”, 两处服务点均开设“进博专席”,为参展人员和往来旅客提供中英双语咨询、交通指引与爱心便民服务。未来,上海电信将持续夯…

2025-11-13

高光谱探测器助力宽带叠层扫描成像 开启3D高光谱成像新篇
最近的研究表明,能量分辨或高光谱探测器可以在某种程度上取代单色器的作用来执行,例如,在单次采集中使用宽带辐射进行边缘减影叠层扫描成像。利用这样的探测器,时间相干性变得可调(在探测器的能量分辨率的限制内)并且在…

2025-11-12

荣旭传媒技术破局:以专业方案化解直播痛点,成就高性价比之选
传统方案在视频、音频和网络方面存在诸多不足,而荣旭传媒通过先进的技术和专业的设备,有效解决了这些问题。传统方案的视频分辨率较低,画面不够清晰,而荣旭传媒的4K 超高清视频拍摄制作让画面质量有了质的提升;传统…

2025-11-12