阿里巴巴今日宣布,旗下视频生成模型HappyHorse迎来1.1版本重大升级,在动态表现、主体还原、指令理解、视觉呈现和音频同步五大核心能力上实现突破性进展。目前用户可通过HappyHorse官网、阿里云百炼平台及千问云服务体验最新功能,即日起同步启动的"Horsepower"AI影像大赛更提供百万级商业合作机会,著名导演张纪中领衔评委团向全球创作者发出邀请。
技术规格方面,新版本延续了3-15秒生成时长、720p/1080p分辨率及自由宽高比等基础参数,但在核心算法层面完成重构。通过引入动态运动建模系统,1.1版本有效解决了前代产品中动作迟缓、节奏断层等问题,在武术对打、舞蹈表演等复杂场景中实现更流畅的肢体运动与更强的视觉冲击力。针对电商广告、影视制作等领域的精准还原需求,模型的多图参考生成能力(R2V)获得显著提升,可精准保持商品LOGo位置、角色服饰细节等关键元素,甚至支持多分镜脚本的智能理解与组合。
在创作自由度方面,新版本强化了长文本语义解析能力,能够准确捕捉用户输入中的场景转换、角色关系等复杂指令。测试数据显示,面对包含20个以上镜头描述的Prompt,模型仍能保持87%的指令遵循准确率,较前代提升32%。视觉呈现上,通过引入分层渲染技术与真实肤质数据库,人物特写镜头的皮肤质感获得质的飞跃,既保留毛孔、法令纹等生理特征,又避免过度锐化产生的塑料感,特别在眼部微表情、发丝动态等细节处理上达到行业领先水平。
音频系统的升级成为本次更新的最大亮点。模型新增的情境感知音频引擎可自动匹配画面节奏调整语速停顿,当检测到战斗场景时会自动加快台词节奏并增强环境音效。在音乐生成方面,通过分析Prompt中的情绪关键词(如"紧张""温馨"),系统能从百万级曲库中智能推荐背景音乐,并实现0.2秒内的音画对齐精度。某测试案例中,模型生成的古风短片成功将剑击声、衣袂飘动声与背景笛声精确同步,获得影视专业人士高度评价。
即日起至8月31日,创作者可通过HappyHorse官网提交作品参与影像大赛。大赛设置最佳叙事奖、技术突破奖等六个奖项,除百万商业合约外,获奖者还将获得阿里云算力支持及张纪中工作室的创作指导机会。平台数据显示,自新版本上线以来,用户日均生成视频数量增长240%,其中电商领域应用占比达63%,影视动画类创作增长显著。
