巨人天成
产经 科技 企业 数据 峰会 快讯 商业

字节开源Bernini框架:AI视频编辑告别“听不懂人话”,先理解再生成更精准

2026-06-02来源:快讯编辑:瑞雪

在AI视频生成领域,创作者长期面临一个核心痛点:模型难以精准理解人类意图。当用户试图将晴天场景改为雪天,或要求将动画嵌入商场LED屏时,现有工具常出现雪花堆砌、透视错乱等问题。字节商业化技术团队近日推出的开源框架Bernini,通过"先理解后生成"的创新机制,为行业提供了突破性解决方案。

该框架采用双模型协作架构,由多模态大模型(MLLM-based planner)与扩散模型(DiT-based renderer)构成。前者负责语义解析与规划,通过分析文本指令、源视频及参考素材,生成包含内容结构、编辑区域等关键信息的"语义草图";后者则基于规划结果进行视觉渲染,确保生成画面在光照、透视、运动关系等方面保持时空连续性。这种分工机制使视频编辑从"指令响应"升级为"意图理解"。

在天气变换测试中,系统能同步调整天空云层、路面反光、建筑阴影等20余个环境参数,使雪天场景呈现真实的积雪厚度变化与光线衰减效果。更突破性的是镜头语言控制能力,创作者可通过指令调整画面焦点,实现从前景咖啡杯到背景窗外街景的平滑过渡,或保持主体身份不变的前提下修改动作轨迹——当棕熊视频被要求改为"跳舞"时,系统能精准控制四肢运动幅度,同时维持环境光照与镜头稳定性。

针对AIGC创作中常见的"描述偏差"问题,Bernini引入多模态参考机制。在材质替换测试中,输入布料纹理参考图后,系统能自动识别盘子表面属性,生成具有织物褶皱与纤维质感的视觉效果,且该特征会随物体运动保持稳定。风格迁移功能支持跨维度适配,当用户输入赛博朋克风格参考图时,系统不仅调整色彩基调,还能为原始视频中的汽车添加霓虹灯带、为建筑添加全息投影等细节元素。

该框架的另一创新在于多素材协同处理技术。当需要将油画植入街头招牌时,系统通过SA-3D RoPE空间编码机制,自动识别参考图与源视频的时空坐标关系,生成符合透视原理的嵌入效果,有效解决传统方法常见的边界闪烁问题。在多元素组合测试中,系统成功将大理石雕塑、猫耳耳机、热带短裤等无关参考图,融合为站立在落日海滩的虚拟角色,各部件比例与光照关系保持高度协调。

技术文档显示,Bernini在Arena基准测试中已达到行业顶尖水平,特别是在复杂场景编辑任务中展现出显著优势。目前开源的Bernini-R版本聚焦视觉渲染模块,完整版预计将整合更强大的语义规划能力。开发者可通过GitHub、Hugging Face等平台获取代码,项目主页提供了详细的操作指南与案例演示。

宇树科技73天“闪电”过会,A股首家人形机器人上市企业启航新征程
在星图金融研究院副院长薛洪言看来,宇树科技近三年营收复合增长率超226%,同时人形机器人从几乎为零到撑起“半壁江山”,这本身就回答了市场对于企业是否仍在“烧钱”“炒概念”的疑问。这家与宇树科技同处一城的公司…

2026-06-02

达实智能2天2板涨21%:液冷服务器+机器人+AI应用助力,后续潜力几何?
该股强势的概念有:液冷服务器+机器人+AI应用在AI应用相关领域,AIoT平台概念活跃!在AIoT平台相关领域,公司AIoT物联网平台深度融合AI与IoT技术,搭载多项判别式AI与生成式AI算法,提供海量丰…

2026-06-02

芯厨师AI炒菜机器人:以“三防”细节,为餐饮长期生意筑牢耐用根基
芯厨师用的是专为后厨油污环境定制的抗油屏幕——不是“防泼溅”,而是“沾满油污后,一擦即净,灵敏如初”。当设备厂商开始真正理解后厨的残酷环境,愿意在看不见的地方投入成本、死磕细节,餐饮老板才能真正从“设备焦虑”…

2026-06-02

阿里云通义千问团队发布Qwen3.7-Plus多模态Agent模型 跻身全球视觉大模型前列
观点网讯:6月2日,阿里云通义千问团队正式发布Qwen3.7-Plus多模态Agent模型,定位为“将视觉与语言统一为一体化智能体基座”。 据介绍,Qwen3.7-Plus在Qwen3.7文本与Agent能…

2026-06-02

嘉兴南湖区无人机飞行测试中心开工 2027年将成长三角低空经济新引擎
日前,南湖区无人机飞行测试中心项目正式开工建设,锚定低空经济新赛道、全力争先奔跑。该项目位于嘉兴市南湖区七星街道七大公路-和顺路交叉口东南侧,预计将于2027年年底全面建成。届时,它将作为长三角首个面向VTO…

2026-06-02

工厂自动化改造:RS485与工业以太网如何抉择?共存方案还是全面替代?
新建项目或大规模产线改造,没有历史包袱,从一开始按工业以太网规划,长期维护成本更低;现有RS485网络节点数量多、轮询周期过长,已经成为生产效率的瓶颈;业务上有设备数据实时上云、远程运维、数字孪生等需求,需…

2026-06-02