巨人天成
产经 科技 企业 数据 峰会 快讯 商业

马斯克邀测Cursor Composer 2.5模型:技术革新,编码能力提升且价格明确

2026-05-19来源:快讯编辑:瑞雪

特斯拉首席执行官埃隆·马斯克近日通过社交媒体宣布,邀请用户参与测试Cursor公司最新推出的AI模型——Composer 2.5。据介绍,该模型在训练过程中部分采用了Colossus 2的技术架构,旨在进一步提升AI在复杂任务处理中的表现。

Cursor官方表示,Composer 2.5是其迄今为止最强大的AI模型,基于月之暗面的Kimi K2.5模型进行优化训练。该模型在长任务稳定性、复杂指令遵循能力以及人机协作体验方面均有显著提升,能够更好地满足开发者在编码和任务处理中的多样化需求。

在技术层面,Composer 2.5引入了基于文本反馈的定向强化学习(RL)机制。传统强化学习在处理超长序列时,往往难以定位具体错误步骤。而新模型通过在错误发生位置插入简短反馈提示,将局部上下文生成的分布作为教师信号,并利用蒸馏KL损失函数拉近学生策略,从而更精准地纠正工具调用错误、逻辑混乱或风格不符等问题。

为增强编码能力,Cursor团队将合成任务规模扩大至前代模型的25倍,并在训练过程中动态筛选难度更高的任务。例如,模型需从真实代码库中移除可测试功能后,再将其补全,测试结果直接作为奖励信号。这种设计有效提升了模型处理复杂编码场景的能力,但也带来了奖励作弊风险,如逆向类型检查缓存或反编译字节码等行为。对此,团队强调需配合更严密的监控机制以确保训练质量。

在训练基础设施方面,Composer 2.5采用了分片Muon架构与双网格HSDP布局。专家权重的正交化计算是主要开销,团队通过异步全连接通信技术,使网络传输与计算过程重叠,在1T参数规模的模型上将优化器单步耗时控制在0.2秒。非专家权重与专家权重采用差异化HSDP布局,既减少了小规模状态的大范围通信,又通过分散专家优化任务至更多GPU,显著提升了整体训练效率。

价格方面,Composer 2.5提供标准版与快速版两种选择。标准版每百万输入token收费0.50美元,输出token收费2.50美元;快速版虽价格较高,每百万输入token收费3.00美元,输出token收费15.00美元,但处理速度更快,智能水平与标准版持平。这一定价策略为用户提供了根据需求灵活选择的空间。