巨人天成
产经 科技 企业 数据 峰会 快讯 商业

小红书与复旦联手推出InstanceAssemble,AI绘画精准构图新突破

2025-12-27来源:快讯编辑:瑞雪

AI绘画领域迎来重要突破,小红书与复旦大学联合研发的InstanceAssemble技术,在布局控制生成(Layout-to-Image)方向取得创新性成果。该技术通过构建"实例组装注意力"机制,实现了复杂场景下的精准图像生成,相关研究已被国际顶级学术会议NeurIPS 2025收录。

区别于传统的文字生成图像(Text-to-Image)技术,布局控制生成需要同时满足空间位置约束和语义内容要求。现有技术普遍存在三大难题:物体位置偏移、语义内容脱节以及计算资源消耗过大。研究团队针对这些痛点,开发出能够精确控制每个物体位置与内容的生成方案,将AI绘画的构图精度提升到新高度。

核心技术突破在于创新设计的"实例拼装注意力"模块。该机制基于扩散变换器架构,通过解析用户提供的边界框坐标和内容描述,在指定位置生成符合语义的图像元素。实验数据显示,在包含90万个实例的密集场景测试中,新技术在布局对齐准确率和语义一致性方面均显著优于现有方法。

为降低技术使用门槛,研究团队采用轻量化适配策略。仅需调整约7100万个参数(相当于Stable Diffusion3-Medium模型总参数的3.46%),即可实现模型升级。当适配Flux.1模型时,额外参数需求更降至0.84%,这种高效适配方案大幅减少了计算资源消耗。

研究团队同步构建了专业评估体系,包含5000张图像和9万个实例的"Denselayout"基准测试集,以及全新的布局匹配度评分标准(LGS)。测试结果表明,经过稀疏场景训练的模型(实例数≤10),在密集场景(实例数≥10)中仍能保持稳定性能,展现出强大的场景适应能力。这项突破为AI绘画技术的商业化应用开辟了新路径。

海螺集团携手华为:AI大模型赋能水泥生产 开启智慧低碳新篇章
华为“100+行业智能化转型故事”第127期,我们走进海螺集团,了解一袋水泥生产过程中的技术创新,看AI大模型如何通过全流程智能化改造,实现更加精准的生产优化与控制。水泥生产流程复杂,涵盖原料配比、煅烧控制、…

2025-12-27

清华唐杰谈AI新洞察:领域大模型存争议,AI发展与应用新趋势解析
原来的agent是通过模型应用来实现,现在模型已经可以直接将agent数据集成到训练过程,增强了模型的通用性,其实难题还是不同agent环境的泛化和迁移并不是那么容易,因此 最简单办法也只有不断增加不同ag…

2025-12-27