巨人天成
产经 科技 企业 数据 峰会 快讯 商业

阿里Qwen3-Omni-Flash-2025-12-01发布:多模态交互升级,语音自然度逼近真人

2025-12-11来源:快讯编辑:瑞雪

阿里Qwen团队近日宣布,正式推出新一代原生全模态大模型Qwen3-Omni-Flash-2025-12-01。这款基于Qwen3-Omni升级的模型,实现了文本、图像、音视频等多种模态的无缝输入与实时流式输出,标志着多模态交互技术迈入全新阶段。

在交互体验层面,新模型重点优化了多模态融合能力。通过实时流式响应技术,用户输入的文本、图像、音视频信息可同步转化为高质量文本与自然语音输出。针对语音交互场景,模型突破了传统语音生成机械呆板的局限,能够根据文本内容自适应调整语速、停顿与韵律,语音自然度与拟人化程度接近真人水平,显著提升了对话流畅性。

系统提示控制能力的升级成为本次更新的核心亮点。研发团队全面开放了System Prompt自定义权限,用户可通过精细化参数设置调控模型行为模式。无论是设定特定人设风格如“甜妹”“御姐”,还是调整口语化表达偏好与回复长度,模型均能精准响应。这一功能为个性化交互场景提供了技术支撑,例如虚拟主播、智能客服等领域可实现更灵活的角色扮演。

跨语言支持方面,模型展现出强大的全球化服务能力。支持119种文本语言交互、19种语音识别语言及10种语音合成语言,确保在多语言场景下保持响应准确性与一致性。这一特性为跨国企业、国际教育等场景提供了高效解决方案,有效降低了语言障碍带来的沟通成本。

客观性能指标显示,新模型在多项基准测试中取得突破性进展。逻辑推理任务(ZebraLogic)得分提升5.6,代码生成(LiveCodeBench-v6)提升9.3,多学科视觉问答(MMMU)提升4.7。这些数据表明,模型不仅在图像视频内容理解上更加精准,在复杂指令遵循与深度逻辑分析方面也达到行业领先水平。

针对口语化场景的“降智”痛点,新模型通过增强音视频指令理解能力,显著提升了多轮对话的稳定性与连贯性。在复杂语境下,模型能够准确捕捉用户意图,避免语义歧义,为智能助手、教育辅导等场景提供了更可靠的交互基础。此次升级标志着多模态大模型从技术探索向实用化落地迈出关键一步。

聚焦粮食智能化转型:科大讯飞王士进受聘河南工大研究院院长
王士进表示,非常感谢河南工业大学的信任和重托,将依托科大讯飞在人工智能领域的技术积累,围绕粮食大模型、粮食产后安全、粮食机器人、具身智能等核心方向,带领人工智能产业技术研究院,瞄准人工智能技术前沿,在加快推…

2025-12-11

解锁ChatGPT高效秘籍:从提示构建到场景应用,开启智能沟通新篇章
明确任务、提供必要的上下文,并指定语气、风格和格式,这些都是构建优质提示的关键。使用结构化提示和自动化重复任务是释放ChatGPT潜力的关键,同时要注意数据安全,避免泄露敏感信息。 通过掌握这些技巧,您将能…

2025-12-11

半年五轮融资3亿,优理奇机器人以场景驱动加速具身智能落地
优理奇构建了涵盖感知、决策、控制的完整技术栈,并通过UniTouch多模态感知模型、UniFlex、UniCortex等行业领先的“大小脑”模型组合,以及行业首款量产的8自由度仿生机械臂和开放工具链,显著提…

2025-12-11

智元第5000台“灵犀X2”量产下线 开启人形机器人规模商用新征程
【太平洋科技】12 月 8 日消息,智元机器人联合创始人、总裁兼 CTO 彭志辉在公司位于上海的临港量产工厂宣布,第 5000台通用具身智能机器人“灵犀 X2”正式量产下线。这一里程碑事件标志着智元的人…

2025-12-11

华为携手中国电信发布FTTR+X:家庭宽带升级智能体 开启AI新体验
快科技12月10日消息,日前,华为与中国电信天翼数生联合发布新一代智能FTTR产品——FTTR+X。 FTTR+X将传统家庭宽带升级为集连接、算力、智能应用于一体的家庭智能体,号称是“面向AI时代的革命性产品…

2025-12-11

天津大学团队突破无线感知技术:Wi-Fi化身“感知管家”服务智能家居
新华社天津12月10日电记者10日从天津大学获悉,天津大学网络与云计算团队近日在无线感知领域取得关键进展,他们让家中寻常的Wi-Fi信号化身为家居环境中的“感知管家”,通过Wi-Fi信号分析人体活动变化,从而…

2025-12-11