字节跳动今日宣布,其最新视频创作模型Seedance 2.0已正式上线。这款模型采用统一的多模态音视频联合生成架构,支持文字、图片、音频和视频四种模态输入,集成了目前业界最全面的多模态内容参考和编辑能力,标志着AI视频生成技术迈向新高度。
Seedance 2.0在灰度测试阶段便引发全球关注。国内科技界人士纷纷给予高度评价,游戏科学创始人冯骥称其为"地表最强",认为AIGC技术发展进入新阶段。知名导演贾樟柯也表示将使用该模型创作短片。国际科技圈同样反响热烈,a16z合伙人Justine Moore认为AI视频模型的图灵测试已被突破,马斯克则感叹技术发展速度之快。
相比前代版本,Seedance 2.0在多个关键技术指标上实现突破。模型在复杂交互和运动场景下的可用率显著提升,物理准确度、逼真度和可控性大幅增强。其核心优势包括:复杂场景下运动稳定性达到业界领先水平;支持多达9张图片、3段视频、3段音频及自然语言指令的混合输入;视频生成可控性全面提升,支持稳定延长和编辑;具备15秒高质量多镜头音视频输出能力,配合双声道音频实现极致视听效果。
技术评测显示,Seedance 2.0在运动连贯性、指令还原和画面质感方面进步明显。视频生成能够精准呈现大动态场景与微表情,支持专业运镜与叙事节奏。音频方面,双声道音质层次丰富,方言、戏曲等场景的指令识别显著优化。模型还突破性地实现了多人竞技等复杂运动生成,在双人花样滑冰等场景中,能够高保真还原同步起跳、空中转体等复杂动作,严格遵循物理运动规律。
多模态编辑能力是Seedance 2.0的另一大亮点。模型支持图文、音视频组合输入,能够精准解析并调用构图、运镜、动作、音效等元素。在创意实现方面,用户可以参考多幅名画创作穿越动画,模型能自动处理转场效果和人物交互。视频编辑功能支持定向修改片段、角色或剧情,并可按提示延长视频生成连贯镜头。
目前,Seedance 2.0已在即梦AI、豆包、火山方舟体验中心等平台上线。用户可以通过即梦网页端视频生成模块、豆包App对话框或火山方舟体验中心选择使用。该模型在影视特效、商业广告、游戏动画等多个领域展现出广泛应用潜力,能够显著降低专业内容制作成本,推动AI视频生成技术从"玩具"向"工具"转变。