巨人天成
产经 科技 企业 数据 峰会 快讯 商业

AI模型评估赛道崛起:90后团队打造LMArena 获1.5亿美元融资估值17亿

2026-01-07来源:快讯编辑:瑞雪

AI大模型评估领域迎来一匹黑马——LMArena正式宣布完成1.5亿美元A轮融资,公司估值跃升至17亿美元。这支由90后华人主导的团队,凭借独特的评估模式和开源技术积累,在资本市场掀起热潮。本轮融资由Felicis与加州大学投资公司UC Investments联合领投,Andreessen Horowitz、The House Fund等知名机构跟投。

故事要从2023年ChatGPT引发的AI革命说起。当时由UC伯克利、斯坦福等顶尖高校学者组成的开源组织LMSYS,因开发出革命性的推理引擎SGLang崭露头角。该引擎首次实现96块H100显卡集群达到接近DeepSeek官方报告的吞吐量,现已被xAI、英伟达、阿里云等全球数十家科技企业采用。但真正让团队出圈的,却是他们为验证自研模型Vicuna性能而打造的第三方评估平台——Chatbot Arena。

"传统基准测试无法区分模型的真实水平。"LMSYS核心成员郑怜悯回忆道。他们开创性地将模型匿名化,通过用户实际交互投票决定优劣。这种双盲测试模式迅速吸引全球AI开发者,新模型发布前都会偷偷在这个平台"打榜"。随着影响力扩大,2024年Chatbot Arena正式独立为商业公司lmarena.ai,转型专注AI模型评估赛道。

当前主打的LMArena平台构建了三维评估体系:匿名对战机制下,用户提问后系统随机匹配两个模型匿名作答,投票后才揭晓身份;评分系统采用改进版Elo算法,通过胜负关系动态调整分数;人机协同框架则通过算法平衡模型曝光度,避免"刷榜"行为。这种设计使评估结果兼具实时性与客观性,成为行业公认的"模型试金石"。

数据印证着平台的爆发式增长:自2024年获得1亿美元种子轮融资后,累计收集5000万张跨模态投票,完成400余种开放/专有模型评估,产出14.5万个开源战斗数据点。当前排行榜上,Gemini 3 Pro以1490分领跑,OpenAI、Anthropic等头部企业的模型均在此接受检验。资本的青睐与行业的认可,让这个由学术团队转型的创业公司,在AI评估赛道走出独特路径。

华为5A通信体验升级,Mate60等系列机型迎来新优化,速来体验!
很多用户更新后在设置里找了半天没找到,感到失望,而根据最新的资料分析,这个功能大概率是Mate80系列和Mate X7系列的独占功能。 不管怎么说,这次5A实装再次印证了华为在通信领域的底蕴,甚至可以说当友…

2026-01-07

工讯之光携手Payoneer派安盈 共筑跨境电商技术基建与生态赋能新路径
工讯之光将依托其全球智能骨干网络与技术服务能力,为Payoneer 派安盈优化全球网络架构与办公协同效率,双方将携手构建 “技术基建 +金融服务” 的跨境生态闭环,为中国跨境电商企业出海夯实基础。工讯之光与…

2026-01-07

工厂MES系统实施全攻略:从目标设定到数据准备的关键步骤
我们是深圳的一家软件实施商,目前主要联合深圳基石协作科技有限公司自研的织信AI低代码平台为企业提供软件项目实施服务(目前已成功实施了ERP、MES、WMS、PLM等系统几十套),发文章的目的也是想为大家提供…

2026-01-07

风中稳立!迈优威FC100S系留无人机完成高空安防侦测与通讯中继测试
12月31日,迈优威成功完成了FC100S系留通讯中继无人机空中安防侦测测试。在风速达8m/s(五级风)的测试条件下,无人机成功升至100米空中指定高度,全程保持稳定飞行姿态,出色完成了空中安防侦测与通讯中继…

2026-01-07