巨人天成
产经 科技 企业 数据 峰会 快讯 商业

京东开源JoyAI-Image-Edit模型:攻克空间难题,赋能多元领域AI应用升级

2026-04-08来源:快讯编辑:瑞雪

京东探索研究院近日宣布,其自主研发的图像编辑模型JoyAI-Image-Edit正式开源,成为全球首个深度融合空间智能技术的开源模型。该模型突破传统AI图像处理仅限于平面修改的局限,实现了三维空间重塑能力,其核心推理代码已完全开放,开发者可直接用于各类应用开发。

传统图像模型常因空间逻辑混乱导致物体变形、光影错乱等问题,而JoyAI-Image-Edit通过构建完整的空间理解体系,从相机坐标变换、物体几何控制到多视角一致性维护,系统性解决了这些行业痛点。实验数据显示,该模型在物体移动精度、空间布局合理性等关键指标上已达到国际领先水平,编辑后的图像能自然呈现遮挡关系与光影变化,即使进行视角切换或物体重组,场景结构依然保持高度真实。

该模型的创新性体现在三大核心能力:其一,支持通过自然语言精准控制相机视角,用户可指定偏航角、俯仰角等参数生成新视角图像;其二,具备空间漫游功能,能连续生成逻辑连贯的多视角图像序列,模拟三维场景中的移动观察效果;其三,可对特定物体进行位移、缩放等操作,同时自动调整周边环境的光影与遮挡关系,确保整体场景的物理合理性。这些能力使模型在处理复杂空间任务时表现出色,例如在电商场景中可快速生成多角度商品展示图,在创意设计领域能实现虚拟场景的自由编辑。

除空间编辑突破外,JoyAI-Image-Edit还兼容15类通用图像处理功能,涵盖物体替换、风格迁移、细节优化等高频需求。通过将空间智能与通用编辑能力深度融合,该模型在长文本渲染、多视角一致性生成等复杂任务中展现出显著优势,可满足全场景创作需求。例如在3D模型重建领域,模型能根据单张图片自动推断物体空间结构,生成多视角一致的三维模型;在具身智能视觉感知方面,其空间理解能力为机器人环境感知提供了关键技术支撑。

目前,该模型已开放代码与预训练权重,支持商业与学术用途。其开源特性将加速空间智能技术在电商、设计、机器人等领域的落地应用,特别是为具身智能研发提供了低成本、高效率的视觉处理解决方案。随着开发者社区的参与,JoyAI-Image-Edit有望推动AI图像技术向更复杂的空间场景延伸,重新定义智能图像处理的标准与边界。

智能网联汽车ETF鹏华(159872)4月7日微跌,规模份额变动引关注
规模方面,截止4月3日,智能网联汽车ETF鹏华(159872)最新份额为5879.97万份,最新规模为5468.38万元。回顾2025年12月31日,智能网联汽车ETF鹏华(159872)份额为5529.97…

2026-04-08

智能汽车ETF国泰(159889)4月7日微跌,规模缩水,基金经理表现分化
规模方面,截止4月3日,智能汽车ETF国泰(159889)最新份额为3940.08万份,最新规模为3853.00万元。回顾2025年12月31日,智能汽车ETF国泰(159889)份额为3940.08万份,规…

2026-04-08

科创人工智能ETF易方达(588730)涨0.88%,规模与流动性表现如何?
4月7日,易方达上证科创板人工智能ETF(588730)收盘涨0.88%,成交额8338.59万元。 科创人工智能ETF易方达(588730)成立于2025年1月16日,基金全称为易方达上证科创板人工智能交…

2026-04-08

家电ETF富国(561120)微跌0.08% 规模份额双降 牛志冬管理收益亮眼
4月7日,富国中证全指家用电器ETF(561120)收盘跌0.08%,成交额1037.56万元。 家电ETF富国(561120)成立于2022年1月25日,基金全称为富国中证全指家用电器交易型开放式指数证券…

2026-04-08

马云雷军罕见“同框”加码,千寻智能30天狂揽30亿开启新征程
截至2026年4月,千寻智能数据采集团队将扩展至千人规模,是国内首家将多样化数据采集路线从理论推向工程化、规模化,并在真实商业场景中完成双重验证的具身智能公司。 据悉,墨子机器人在京东零售场景中替代人类进行…

2026-04-08

谷歌推出Gemma 4开源AI模型,为企业AI应用提供灵活安全新选择
企业倾向于专有AI技术和开源模型的混合使用,同时考虑成本和延迟因素。 Dekate说,虽然像Gemma 4这样的开源模型在任务方面提供了灵活性,但它并不是满足公司所有需求的万能模型。不应急于将开源模型应用于…

2026-04-08