巨人天成
产经 科技 企业 数据 峰会 快讯 商业

钛媒体AGI

2024-10-28来源:钛媒体APP编辑:瑞雪

声网创始人兼CEO赵斌

随着OpenAI GPT-4o等多款实时语音对话类模型的推出,RTE(实时互动)技术再次迎来新的发展时期。

钛媒体App 10月28日消息,近期举行的RTE 2024实时互联网大会上,声网创始人兼CEO赵斌(Tony Zhao)在演讲中表示,美国OpenAI近期将自身API调用成本和价格下降90%以上,中国市场也是价格战硝烟四起,而且各种算法和模型创新风起云涌、你追我赶。所以,生成式 AI 将提供无限的想象空间和广阔的可能性,包括和RTE和实时互动能力的结合,拥有巨大技术潜力。

“未来10年-20年,无论是PC,还是智能手机,都必然以如何更好支持大模型能力在端侧上应用以及推理能力提高和成熟为主要进化轴线。”赵斌强调,生成式 AI 正在驱动 IT 行业发生大变革,这一趋势主要体现终端、软件、云和人机界面四个方向上,而声网将与大模型独角兽MiniMax打造中国第一个Realtime API。

据悉,声网成立于2014年,是全球实时互动云服务商,面向社交直播、教育、游戏电竞、IoT、AR/VR、金融、保险、医疗、企业协作等多个领域提供PaaS(平台即服务)、实时互动云等技术服务。

2020年6月底,声网母公司Agora, Inc.(NASDAQ:API)在纳斯达克上市。

2023财年第一季度业绩报告上,赵斌宣布,为努力精简组织结构,提高运营效率,Agora, Inc.旗下将以不同的品牌——声网、Agora运营两个独立公司,美国和国际业务将以Agora 品牌运营,中国业务将以声网品牌运营。“我们相信,此次战略重组将使我们能够将资源最佳地集中在每个业务的优先事项上——推动 Agora 业务的增长并更有效地竞争声网业务,同时考虑到每个市场客户独特的经济和产品需求。随着新机遇的出现,这种新的组织结构还将使我们变得更加敏捷。”

今年8月,Agora, Inc. 集团发布的最新财报显示,2024财年第二季度,公司总收入3420万美元,同比增长0.5%。其中,受益于物联网等行业销售增加,声网国内收入1.319亿元人民币(1860万美元),较去年同期增长0.3%。

截至2024年6月30日,声网活跃客户数量达3774家,过去12个月内净留存率达79%。

如今,随着全球经济复苏以及全球科技转向AI技术,生成式AI赛道迎来广阔前景。

麦肯锡最新报告显示,2023年,全球生成式 AI 市场规模670亿美元,预计到2027年、2032年分别达到3990亿美元和1.3万亿美元,2023-2032年10年的复合增长率高达42%。

2024年5月,OpenAI公司推出可免费使用的全新旗舰AI模型GPT-4o,可实时进行音频、视觉和文本推理,并且在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。在API使用方面,相比GPT-4-Turbo,GPT-4o价格降低一半(50%),速度提升两倍(200%)。

OpenAI CEO奥尔特曼(Sam Altman)表示,新的GPT-4o是OpenAI有史以来最好的模型,它很智能,速度很快,是原生多模态,并且它可供所有ChatGPT用户使用,无论是免费版本还是付费GPT-4版。

今年10月,实时音视频技术公司、声网的兄弟公司Agora作为语音API合作者出现在OpenAI 发布的Realtime API 公开测试版中,引发关注。在此之前,声网和Agora上次引发关注是两年前的实时语音互动Clubhouse风靡全球,而Agora提供实时互动技术支持,该公司市值一度暴涨到100亿美元以上。

年初至今,Agora, Inc.集团美股上涨了20%左右,主要受益于生成式 AI 和海外直播电商热潮。

10月25日,赵斌在演讲中透露,过去的十年,RTE能力在各种手机应用和软件中的穿透力从不到1%,到2021年大概7%,到现在超过10%,差不多在以每年1%的速度持续穿透到各种应用。

目前,声网单月服务超过700亿分钟(按频繁人数计时)。

会上,声网正式发布RTE+AI能力全景图,其中包括从实时 AI 基础设施、RTE+AI 生态能力、声网 AI Agent、实时多模态对话式 AI 解决方案、RTE+AI 应用场景五个维度,呈现当下RTE与AI相结合的技术能力与应用方案。

赵斌强调,生成式 AI 正在驱动终端、软件、云和人机界面四个层面发生变革。在终端上,大模型能力将驱动PC和Phone往AI PC和AI Phone的方向进化;在软件上,所有软件将通过大模型重新实现,从Software with AI发展至AI Native Software;云层面,所有云都需要具备对大模型训练和推理的能力,AI Native Cloud将成为主流;人机界面的主流交互方式将从键盘、鼠标、触屏变成自然语言对话界面(LUI)。

今年RTE活动上还讨论了红杉资本合伙人 David Cahn(大卫·卡恩)曾提出的“AI 支出6000亿美元难题”,即AI基础设施的巨额投资和实际收入之间差距过大。

对此,Lepton AI创始人兼首席执行官贾扬清认为,同等尺寸的模型,能力会越来越强,尤其是通过蒸馏、压缩等技术,现在的Llama 3.2 3B(30亿参数)模型甚至可以和以前的Llama 70B模型能力相近。除了极少数头部公司之外,越来越多的企业会采用“开源+精调”来做下一代模型,因此开源架构的应用会越来越普遍。

贾扬清判断,推理成本一年内会降到现在的1/10,创业者在构建应用时可以按照做一个应用成本是目前1/10来进行成本核算,看能不能做,包括模型、硬件和应用在上量后,也都是可以降低成本的。

Hugging Face工程师王铁震表示,现在担心AI取代人类是比较早的,但是AI已经对一些行业产生了不好影响,比如视频以假乱真的影响,包括对青少年心理的影响,而这里创业的机会也是非常多的。

MiniMax合伙人魏伟强调,随着多模态的出现,生成式 AI 的边界一定会被继续拓展,文本、语音、音乐、视频这些模型可以很好地帮助艺术、影视、音乐等领域的创作者极大地提高效率,并加速相关产业的变革。

“过去的十年,实时互动从理念发展成一个行业。实时互动技术不仅助力社交泛娱乐、在线教育、IoT、企业服务等几十个行业、数百个场景实现了跨越式成长,也支撑了诸多互联网风口的进化。我们有理由期待下一个十年更为波澜壮阔和激动人心,开创一个生成式AI时代下的RTE新篇章。”赵斌在演讲结尾表示。

Valve推出Steam Frame新VR头显 正式宣告上一代Index头显停产
用户可通过无线适配器,将 PC 或 Steam Machine 上的平面屏(flatscreen)及 VR 游戏串流至 SteamFrame;与此同时,Steam Frame 本身也是一款独立设备,搭载高通…

2025-11-14

虚拟化与超融合:从架构到应用,一文读懂如何选择适合的IT方案
超融合平台通常基于成熟的虚拟化技术,例如它可能内置虚拟机管理功能,但更强调整体资源的统一管理。性能上,虚拟化可能因资源竞争而出现波动,而超融合的分布式存储设计可以提供更一致的I/O性能,特别是在高并发场景下,…

2025-11-14

杭州上城第三批50个“人工智能+”场景发布 涵盖多领域促发展
11月13日,杭州市上城区第三批“人工智能+”机会场景发布会暨场景供需对接会活动举行,推出50个高价值场景,涵盖社会治理、金融服务、民生服务、城市管理、智能建造、文化旅游、时尚消费等多个热门领域。如,由上城…

2025-11-14

中关村房山园科技对接会:昆虫机器人等“硬核”成果亮相,助力新质生产力
11月12日,中关村“火花”活动之北京理工大学专场对接会暨中关村房山园新质生产力发布厅科技成果转化对接活动在中关村新兴产业前沿技术研究院举行,极限搜救昆虫机器人、通信感知超宽带收发芯片等一批来自北京理工大学、…

2025-11-14

浪潮KaiwuDB V3.0发布:多模融合AI赋能,引领物联网数智化新篇章
KaiwuDB V3.0关系引擎新增大型对象支持,无论是传感器产生的二进制数据还是文本信息,都能实现高效管理;同时,支持高效跨模连接算子与时序算子并行处理,相较于2.2版本跨模查询性能提升5-10倍,打破了…

2025-11-13

2025年手机卡选卡指南:精准匹配需求,绕开合约套路与流量陷阱
•在运营商APP中查看过去三个月的平均流量使用量•检查你的通话时长记录•分析你最常用的APP类型(这会影响你对通用流量和定向流量的需求)有了这些数据,你就能更准确地判断自己需要什么样规模的套餐了。 •典型代…

2025-11-13

照片压缩至5M内超全指南!七大实用方法助你轻松搞定分享难题
具体的执行步骤是:将它们直接开启,随后去挑选照片,该应用会自动给出推荐的压缩级别,你能去预览最终结果,还能够对某些设置予以调整,比如把分辨率调低或者转换格式,借此令文件大小小于5MB,这对即时分享至社交媒体来…

2025-11-12

企业宽带选不对,带宽再大也白费!这些关键因素决定实际网速
• 网速(用户感知):即实际访问体验,取决于 3 个核心因素 —— 带宽只是基础,更重要的是网络质量、路由优化和并发处理能力。 真正专业的服务商,会从企业实际业务场景出发提供解决方案,而非一味推销高带宽产品…

2025-11-12

Marantz与B&W组合:以多元功能承载家庭温情,让音乐共鸣融入日常
我在活动上最常遇到来宾,不管是男的,还是女的,他(她)问我:我手机上这些音乐能不能通过蓝牙,或Apple Airplay传到音响播放。 用高级音响回归音乐本身你会发现原来美好的东西就在身边最近我在电脑里找到了…

2025-11-12

Viwoods发布AiPaper Reader电纸书:6.13英寸墨水屏搭载AI阅读互动功能
IT之家 11 月 11 日消息,据科技媒体 NoteBook Check 今天报道,Viwoods 现已推出 AiPaper Reader电纸书,运行 Android 16 操作系统,机身配备专用 AI …

2025-11-12