巨人天成
产经 科技 企业 数据 峰会 快讯 商业

阿里通义实验室发布Fun-ASR1.5大模型:多语言方言精准识别,古诗词转写无压力

2026-04-21来源:快讯编辑:瑞雪

阿里通义实验室近日宣布,其自主研发的语音识别大模型Fun-ASR1.5已正式面向公众开放使用。这款模型突破了传统语音识别工具在多语言场景下的应用局限,通过统一的底层架构设计,实现了对全球30种语言的广泛支持,同时深度覆盖汉语七大方言体系及超过20种地方口音的精准识别。

在技术验证阶段,Fun-ASR1.5展现出显著的性能优势。实验室测试数据显示,针对方言场景的识别任务中,该模型较前代版本字错误率(CER)降低56.2%,其中5种方言的识别准确率突破90%阈值,另有15种方言的准确率达到80%以上。特别值得关注的是,模型对古诗词吟诵等特殊语音场景的转写能力达到行业领先水平,能够准确捕捉韵律特征与文化语境。

该模型的创新性体现在其跨语言处理机制上。研发团队通过构建多维度语音特征库,使模型能够自动适配不同语言的声学模型与语言模型,无需针对特定语种单独训练。这种设计不仅降低了多语言应用的开发成本,更显著提升了模型在混合语言场景下的识别稳定性。目前,Fun-ASR1.5已支持包括粤语、吴语、闽南语等在内的汉语方言体系,以及英语、法语、阿拉伯语等国际主流语言。

聚焦具身智能:与灵锶、鹿明、立昂机器人代表共探行业技术与发展
立昂机器人 总经理 广东灵锶智能科技有限公司的核心产品是重载四足机器狗,用于工业巡检、消防救援、核电 /化工、安防、物流运输,而公司也在研发用于家用消费机的产品以及人形机器人产品。 2、探索机器人商业化…

2026-04-20

苏检集团2项科研成果斩获省级大奖 助力行业高质量发展
“江苏省计量协会科学技术进步奖”是面向全省计量领域是计量领域极具权威性的行业奖项,旨在表彰在计量科学研究、技术创新、成果转化等方面作出突出贡献的单位与个人。 该项目聚焦氢燃料汽车产业关键环节,为国内车规级氢…

2026-04-20

谷歌A2UI 0.9发布:统一AI智能体UI设计,多框架支持促交互升级
来源:环球网 【环球网科技综合报道】4月20日消息,据The Decoder报道,谷歌近日正式推出生成式UI设计标准A2UI 0.9,为AI智能体构建用户界面元素提供统一规范,支持从现有应用组件中调用资源,…

2026-04-20

蚂蚁灵光App闪应用功能大升级 灵光圈上线开启消费级编程新体验
在原有“30秒生一个应用”这一核心功能的基础上,灵光闪应用持续强化多智能体协作、全模态生成及移动端原生能力集成,成为首个支持用户用自然语言,在手机端创建、分发、使用、迭代AI应用的平台,真正实现了0代码、0…

2026-04-20

新能源锂电池行业:西门子S7-200PLC借转换模块实现与触摸屏及MES系统高效通讯
项目核心需求:将烧结炉的温度、升温速率、保温时间等关键工艺数据实时上传至工厂MES系统,满足生产追溯与质量管控要求;保留原有触摸屏本地操作功能,确保通讯互不干扰;无需修改PLC程序,实现快速部署;适配车间高…

2026-04-20

上海发力产业互联网平台!2028年打造“10+20+X”标杆,引领数智赋能新潮流
为提升现代化产业体系融合化发展水平,进一步发挥产业互联网平台赋能产业发展作用,提高平台数智化能力,优化产业链资源配置效率,上海市经济和信息化委员会、上海市商务委员会、上海市国有资产监督管理委员会、上海市发展和…

2026-04-20