巨人天成
产经 科技 企业 数据 峰会 快讯 商业

浪潮YuanLab.ai开源40B参数源Yuan 3.0 Flash大模型,多任务表现优成本低

2025-12-31来源:快讯编辑:瑞雪

浪潮旗下YuanLab.ai团队近日宣布开源发布多模态基础大模型Yuan 3.0 Flash,该模型凭借400亿参数规模与创新的稀疏混合专家(MoE)架构,在推理效率与成本控制方面实现突破性进展。单次推理仅需激活约37亿参数,显著降低了算力需求,为企业级应用提供了更经济的解决方案。

模型核心创新在于引入强化学习训练方法RAPO,通过反思抑制奖励机制(RIRM)优化训练流程。这一设计有效减少了无效反思行为,在提升推理准确性的同时,将token消耗压缩至行业领先水平的1/4至1/2。语言主干网络采用局部过滤增强注意力结构(LFA)与MoE架构的双重优化,既保证了注意力精度,又进一步降低了训练与推理的算力开销。

多模态处理能力方面,Yuan 3.0 Flash构建了视觉编码器、语言主干网络与多模态对齐模块的协同体系。视觉信号经编码器转化为token后,与语言token共同输入主干网络,通过跨模态对齐模块实现特征高效融合。特别设计的自适应图像分割机制,在支持高分辨率图像理解的同时,将显存需求降低30%以上,为复杂场景应用扫清硬件障碍。

实测数据显示,在企业场景的RAG(ChatRAG)、多模态检索(Docmatix)、表格理解(MMTab)及摘要生成(Summeval)等任务中,Yuan 3.0 Flash的表现已超越GPT-5.1。在多模态推理与语言推理评测中,其400亿参数版本精度接近2350亿参数的Qwen3-VL235B-A22B与6710亿参数的DeepSeek-R1-0528,但token消耗仅为后两者的1/4至1/2,展现出极高的性价比优势。

目前,Yuan 3.0 Flash已全面开源,全系列模型参数与训练代码均开放免费下载。开发团队表示,此举旨在推动多模态大模型在工业界的普及应用,通过降低技术门槛与使用成本,加速AI技术向实体经济渗透。开源地址已同步公布,供全球开发者与研究机构自由使用。

广电手机卡信号实测大揭秘!优缺点全梳理,助你明智选卡不踩坑
特别是在电梯、地下停车场等传统信号死角,700MHz频段的穿透优势得到充分发挥,有用户反馈在这些场景下广电信号甚至优于其他运营商。对于主要在城市活动、追求高性价比的用户,广电卡在信号表现和资费方面都能提供良好…

2025-12-31

懋特物联陈骞亮相华东师大经管学院2026MBA晚会 共探校企合作新篇
2025年12月28日,华东师范大学经济与管理学院2026级MBA新年晚会成功举办。懋特(上海)物联网科技有限公司创始人兼CEO陈骞应邀出席,与学院师生、各界校友欢聚一堂,共迎新年,畅叙情谊。 懋特物联成立…

2025-12-31