巨人天成
产经 科技 企业 数据 峰会 快讯 商业

京东开源JoyAI-Echo框架:攻克长视频生成难题 效率与质量双提升

2026-06-04来源:快讯编辑:瑞雪

京东在长视频生成技术领域迈出关键一步,正式发布名为JoyAI-Echo的开源音视频生成框架。该框架通过创新性技术方案,针对性解决了角色一致性、声音稳定性及生成效率三大行业痛点,在实测中展现出显著优势。

技术核心在于其构建的跨模态记忆库系统。在多镜头切换过程中,该系统能持续追踪并调用角色外观特征与语音音色数据,确保长达5分钟的视频中人物形象与声音保持高度统一。实测数据显示,框架成功避免了传统模型中常见的"角色变形"问题,视觉与听觉呈现均达到专业制作水准。

研发团队通过优化训练流程实现性能突破。结合监督微调(SFT)、跨模态强化学习(RLHF)及分布匹配蒸馏(DMD)技术,在保证生成质量的同时大幅提升处理速度。其中DMD算法单环节即带来7.5倍效率提升,使复杂场景的实时渲染成为可能。

针对创作流程优化,框架集成智能导演助手Director Agent。用户通过自然语言输入即可完成剧本拆解、角色分配及镜头规划。当需要对特定片段修改时,系统支持局部内容重生成,无需整体返工,大幅降低创作门槛与时间成本。

为满足专业制作需求,框架配备实时超分辨率模块。支持将736×1280基础画面提升至1152×1920及1472×2560两种高清格式,单步处理即可实现画面与音频的同步精细化。在流媒体传输场景下,仍能保持稳定的画质输出表现。

第三方评测数据显示,该框架在跨镜头一致性(0.92)、视频质量(0.89)、文本匹配度(0.87)等核心指标上均领先行业。特别在语音内容准确率方面达到0.8646,较同类模型提升12%,展现出在复杂叙事场景中的技术优势。

目前项目已实现全代码开源,开发者可在GitHub获取完整代码库与训练权重。京东表示,此举旨在推动长视频生成技术的标准化发展,为影视制作、数字营销等领域提供基础设施支持。

华为智能光伏战略新品发布:以构网与AI之力,共拓能源低碳智能新未来
面向新型电力系统的新征程,华为董事、华为数字能源总裁侯金龙发表了“构建智能世界的绿电驱动力”主题演讲,他表示:“全球能源转型正聚焦生产侧清洁能源替代和消费侧电气化两大核心主线。 华为数字能源智能光伏产品线总…

2026-06-04

复旦系团队五年磨一剑!STI-WM模型首创时空一体架构 引领物理世界AGI新突破
在物理AI产业快速迭代的关键节点,深耕世界动作模型底层技术五年的复旦系科创企业眸深智能,正式推出STI-WM时空一体世界动作模型(SpatiotemporallyIntegrated World Mode…

2026-06-04

数智赋能守护童真:中国电信以科技之力编织儿童安全防护网络
在湖南岳阳黄沙街镇,中国电信岳阳分公司依托“5G+AI+物联网”能力,在全域水库、塘坝部署100套AI智能监控系统,并配套对村干部、网格员开展平台操作培训;演练中可实现“越界即识别—广播劝离—信息同步推送”…

2026-06-04

亨通光电携手中国移动:全球首条三波段超低损多芯光缆在青岛建成开通
近日,亨通光电联合中国移动、山东移动自主设计的全球首条“S+C+L”三波段超低损多芯光缆线路在山东青岛建成开通。作为核心光纤供应商,亨通光电与中国移动联合研发的四芯超低损大有效面积多芯光纤,在标准125μm包…

2026-06-04

中国电信AI产品亮相智博会 科技赋能打造智慧家庭新体验
以“科技赋能家庭,智享美好生活”为核心,中国电信在现场重点展出了天翼智屏与AI桌面机器人“悟空”两大核心产品,让观众亲手触摸、亲口对话,直观感受到人工智能不再是概念,而是落地的家庭生活日常。 在这个体…

2026-06-04