巨人天成
产经 科技 企业 数据 峰会 快讯 商业

百度文心5.0正式版上线,2.4万亿参数赋能,技术骨干亮相引领AI新篇

2026-01-24来源:快讯编辑:瑞雪

百度近日正式推出文心5.0原生全模态大模型,标志着国内人工智能领域在多模态技术方向上取得重大突破。该模型参数规模达2.4万亿,采用创新的原生全模态统一建模架构,突破传统多模态技术"后期融合"的局限,实现文本、图像、视频、音频等多元数据在统一模型框架中的深度协同训练。这一技术路线使模型具备原生全模态理解与生成能力,在40余项权威基准测试中,语言与多模态理解能力超越国际主流模型,稳居全球第一梯队。

在技术架构层面,文心5.0创新性地采用超大规模混合专家结构,通过超稀疏激活参数设计将激活参数比控制在3%以下,在保持模型强大性能的同时显著提升推理效率。模型开发团队基于大规模工具环境构建长程任务轨迹数据,结合思维链与行动链的端到端强化学习训练方法,使模型在智能体交互和工具调用能力上实现质的飞跃。这种技术突破为AI在复杂场景中的应用奠定了坚实基础。

百度集团副总裁吴甜在发布会上强调,文心5.0的技术路线与业界普遍采用的"后期融合"方案存在本质差异。通过将多源数据在统一自回归架构中进行联合训练,模型实现了多模态特征的深度融合与协同优化,这种原生全模态建模方式使模型能够更自然地处理跨模态任务。例如在图像生成场景中,模型可以同时理解文字描述、语音指令和参考图像,生成更符合用户预期的视觉内容。

应用模型研发部负责人贾磊现场展示了三项突破性技术:基于声音Token的端到端合成大模型通过离散语音表示、MoE韵律建模和Unet声学编码等技术,实现了更自然的语音合成效果;5分钟直播技术通过少量音色采样和韵律模式匹配,使合成语音具备专业主播的情绪表现力;实时交互数字人技术采用三态Token联动架构,突破传统数字人制作模式,实现文本、语音、视频的流式控制,显著降低制作成本。这些技术已应用于罗永浩数字人直播等场景,创造行业新纪录。

为推动大模型技术落地,百度千帆平台推出Agent Infra解决方案,提供包含文心5.0在内的150余个场景化模型服务,集成百度AI搜索等工具链,结合数据管理和企业级服务能力,为企业打造全周期、多场景的业务运行环境。目前平台已孵化超130万个智能体应用,以百度AI搜索为代表的工具日均调用量突破千万次,形成完整的"芯云模体"技术生态闭环。

相较于国际主流AI应用仍以对话交互为主的现状,文心5.0的技术突破为AI在真实行业场景中的深度应用开辟新路径。通过构建从芯片到智能云,再到模型应用的完整技术栈,百度正在探索一条具有中国特色的AI发展道路。这种全栈自研的生态闭环,不仅提升了技术自主性,更为金融、医疗、教育等垂直领域提供了可定制化的智能解决方案。

成都高新区发布西部首个机器人交易中心方案 助力产业出海与智能未来新篇章
机器人交易中心以建设全国一流的机器人交易中心为目标,将以全国首创的“机器人交易指数+生态平台”模式,发挥成都高新区人才科技、平台载体和应用场景等多维优势,搭建机器人产业创新发展枢纽,推动人工智能与机器人技术从…

2026-01-24

中科院128页报告:全固态电池材料创新与产业化进展全解析
电池性能优化取得多项突破,开发出空气稳定的硫化物电解质及电解质膜,解决了湿度环境下的性能衰减问题;液态锂负极与硫化物固态电解质组合,实现超高电流密度和长循环寿命,且安全性提升;含Si负极的硫化物全固态电池通…

2026-01-24

马斯克最新访谈:未来3-7年变革浪潮下,人类何去何从?
所以,当你的核心价值,是处理信息时,你就站在了人工智能的主航道上。审美观,是确保它在拥有强大能力后,愿意用这种能力去“创造”,而不是去“破坏”的最终保障。未来,可能会比他想的好得多,可能会更糟糕,或者可能是…

2026-01-24

广电手机卡:低价大流量诱惑下,信号设备客服难题如何破局?
有北京用户反馈,在国贸地下三层停车场,其他运营商已显示“无服务”,而广电卡却能流畅播放四K视频。满意用户主要赞赏其性价比和信号穿透力:“十九元一百九十二G流量,同等配置移动套餐要一百二十九元”、“城中村住了五…

2026-01-24