AI模型评估赛道崛起：90后团队打造LMArena 获1.5亿美元融资估值17亿-产经-巨人天成财经

AI大模型评估领域迎来一匹黑马——LMArena正式宣布完成1.5亿美元A轮融资，公司估值跃升至17亿美元。这支由90后华人主导的团队，凭借独特的评估模式和开源技术积累，在资本市场掀起热潮。本轮融资由Felicis与加州大学投资公司UC Investments联合领投，Andreessen Horowitz、The House Fund等知名机构跟投。

故事要从2023年ChatGPT引发的AI革命说起。当时由UC伯克利、斯坦福等顶尖高校学者组成的开源组织LMSYS，因开发出革命性的推理引擎SGLang崭露头角。该引擎首次实现96块H100显卡集群达到接近DeepSeek官方报告的吞吐量，现已被xAI、英伟达、阿里云等全球数十家科技企业采用。但真正让团队出圈的，却是他们为验证自研模型Vicuna性能而打造的第三方评估平台——Chatbot Arena。

"传统基准测试无法区分模型的真实水平。"LMSYS核心成员郑怜悯回忆道。他们开创性地将模型匿名化，通过用户实际交互投票决定优劣。这种双盲测试模式迅速吸引全球AI开发者，新模型发布前都会偷偷在这个平台"打榜"。随着影响力扩大，2024年Chatbot Arena正式独立为商业公司lmarena.ai，转型专注AI模型评估赛道。

当前主打的LMArena平台构建了三维评估体系：匿名对战机制下，用户提问后系统随机匹配两个模型匿名作答，投票后才揭晓身份；评分系统采用改进版Elo算法，通过胜负关系动态调整分数；人机协同框架则通过算法平衡模型曝光度，避免"刷榜"行为。这种设计使评估结果兼具实时性与客观性，成为行业公认的"模型试金石"。

数据印证着平台的爆发式增长：自2024年获得1亿美元种子轮融资后，累计收集5000万张跨模态投票，完成400余种开放/专有模型评估，产出14.5万个开源战斗数据点。当前排行榜上，Gemini 3 Pro以1490分领跑，OpenAI、Anthropic等头部企业的模型均在此接受检验。资本的青睐与行业的认可，让这个由学术团队转型的创业公司，在AI评估赛道走出独特路径。

华为5A通信体验升级，Mate60等系列机型迎来新优化，速来体验！

很多用户更新后在设置里找了半天没找到，感到失望，而根据最新的资料分析，这个功能大概率是Mate80系列和Mate X7系列的独占功能。不管怎么说，这次5A实装再次印证了华为在通信领域的底蕴，甚至可以说当友…

2026-01-07

工讯之光携手Payoneer派安盈共筑跨境电商技术基建与生态赋能新路径

工讯之光将依托其全球智能骨干网络与技术服务能力，为Payoneer 派安盈优化全球网络架构与办公协同效率，双方将携手构建 “技术基建 +金融服务” 的跨境生态闭环，为中国跨境电商企业出海夯实基础。工讯之光与…

2026-01-07

工厂MES系统实施全攻略：从目标设定到数据准备的关键步骤

我们是深圳的一家软件实施商，目前主要联合深圳基石协作科技有限公司自研的织信AI低代码平台为企业提供软件项目实施服务（目前已成功实施了ERP、MES、WMS、PLM等系统几十套），发文章的目的也是想为大家提供…

2026-01-07

风中稳立！迈优威FC100S系留无人机完成高空安防侦测与通讯中继测试

12月31日，迈优威成功完成了FC100S系留通讯中继无人机空中安防侦测测试。在风速达8m/s（五级风）的测试条件下，无人机成功升至100米空中指定高度，全程保持稳定飞行姿态，出色完成了空中安防侦测与通讯中继…

2026-01-07

卤味巨头集体“跨界”：绝味热卤杯热销，入局快餐赛道破增长困局

2026-01-07

雷军直播再谈小米汽车续航：澄清水军断章取义误导大众

2026-01-07

雷军直播透露：小米YU7拆解车为新车重装车不流入市场

2026-01-07

雷军直播再谈“丢轮保车”：行业验证的安全设计，盼网友理性看待

2026-01-07

2025年A股新开户数创近三年新高，机构开户激增，核心资产配置受关注

2026-01-07

Voghion：以嘉兴为基双引擎发力助力中国品牌扬帆全球市场

2026-01-07