巨人天成
产经 科技 企业 数据 峰会 快讯 商业

HiMo-CLIP来袭:让AI精准捕捉长文本关键,图像检索准确率大幅提升

2025-12-03来源:快讯编辑:瑞雪

在图像检索领域,传统模型处理复杂文本描述时常常力不从心。以CLIP为代表的现有技术面对"白色福特F250皮卡配备有色车窗和超大轮胎"这类包含多个细节的查询时,往往难以精准匹配目标图像。这种"描述越详细匹配越差"的现象,成为制约技术发展的关键瓶颈。

中国联通数据科学与人工智能研究院团队推出的HiMo-CLIP模型,通过创新性的动态语义指纹技术破解了这一难题。该模型搭载的HiDe模块采用统计学方法,能在海量文本中自动识别最具区分度的特征。例如在汽车检索场景中,系统会优先捕捉"超大轮胎"这类核心特征,而非泛化的"有色车窗"描述,使匹配准确率提升至89.3%。

研发团队设计的MoLo损失机制构建了双重保障体系,既确保整体语义匹配,又强化核心特征对齐。这种设计使模型在处理长文本时得分随信息量增加而提升,彻底改变了"多说多错"的行业痛点。在MSCOCO-Long测试集上,新模型的mAP指标较前代提升近20%,同时在Flickr30K短文本测试中保持98.3%的原始性能。

技术落地应用已显现显著成效。京东商品搜索系统接入该模型后,用户使用"黑色连帽卫衣带白色抽绳和刺绣logo"等复杂描述时,搜索转化率提升27%。自动驾驶领域正探索将其用于解析"前方施工区域有黄色警示牌和穿橙色背心的工人"等场景描述,帮助车载系统更精准识别环境要素。

这个开源项目在GitHub上线半年即获得2.3k星标,字节跳动、商汤科技等企业已开展技术验证。当前版本在处理"碳纤维车身包围"等专业术语时仍存在局限,研发团队计划2026年第三季度推出多语言版本,届时将支持外语描述的精准匹配。该成果标志着中国团队在AI基础研究领域取得重要突破,其模拟人类认知逻辑的创新思路,为多模态智能发展提供了新方向。

一加Ace 6T《原神》神里绫华定制机亮相,限量发售性能配置超亮眼
快科技12月2日消息,一加今天终于首次公布了Ace6T《原神》神里绫华定制机外观,可以看到不仅仅是简单的改配色,整块背壳都融入了神里绫华主题纹理,下方还有人物logo。 据一加中国区总裁李杰此前介绍,该机将…

2025-12-03

6G蓄势待发、低空经济崛起、无人艇显身手 硬核科技共绘发展新画卷
近期,中国在6G、低空经济与海洋科技领域取得系列突破:超300项6G技术前瞻布局,千亿级低空市场深度融合,无人艇实现精准作业,硬核科技绘制发展新蓝图。 去年5月,广东省下发《推动低空经济高质量发展行动方案》,…

2025-12-03

清华成立具身智能与机器人研究院,学界大牛齐聚加速布局新赛道
具身智能与机器人研究院院长张涛,是清华大学自动化系主任、信息科学技术学院副院长,主要研究方向包括机器人学、智能控制、导航与控制技术、飞行器控制技术等。研究院成立”具身智能机器人项目制实验班”,采用”理论+项…

2025-12-03

智启未来生活!总台“保姆机器人大会”深圳展演科技新成果
深圳社区管家机器人展演活动作为总台“保姆机器人大会”分赛道的重要一站,以“科技赋能城市治理,智能创造美好生活”为核心,集中呈现社区管家机器人在环卫保洁、社区安防、公共服务等多个城市治理领域的创新成果与突破应…

2025-12-03

优必选科技携手卓世科技,共绘“大模型+机器人”商用新蓝图
双方将围绕联合研发攻关、场景应用落地、产业生态合作、资本合作、业务开拓与联合创新五大维度推进合作,计划共建联合研究实验室,聚焦“行业模型+具身智能”方向,优先在工业制造、企业服务、康养服务、文教传媒四大领域…

2025-12-03

钛虎机器人五周年:以创新方案赋能行业 让人形机器人研发更高效多元
其中,PRO-3系列轻量化关节模组凭借突破性技术实力领跑,不仅实现精度、兼容性与负载能力的三重跃升,更打破传统产品瓶颈,专为人形机器人快速搭建需求全面升级,从性能参数到适配场景均精准匹配客户选型核心诉求,以全…

2025-12-03