巨人网
产经 科技 企业 数据 峰会 快讯

火山引擎出新方案,大模型训练视频预处理已落地豆包!

2024-10-15来源:ITBEAR编辑:瑞雪

在视频云技术大会上,火山引擎推出了一项针对大模型训练视频预处理的新方案,该方案已被应用于豆包视频生成模型。火山引擎总裁谭待在活动中表示,受AIGC和多模态技术推动,用户体验正经历深刻变革。他强调,火山引擎视频云正基于抖音业务实践,探索AI大模型与视频技术的深度融合,旨在从技术底座、处理链路和业务增长层面为企业提供解决方案。

预处理训练视频是确保大模型训练效果的关键步骤。通过预处理,可以统一视频数据格式、提升数据质量、实现数据标准化、减少数据量以及处理标注信息,使模型能够更高效地学习和提取视频中的特征和知识,从而提升训练效果和效率。

抖音集团视频架构负责人王悦指出,大模型厂商在视频预处理过程中面临多重挑战,包括超大规模视频训练数据集带来的高昂计算和处理成本、视频样本数据的质量参差不齐、处理链路环节众多且工程复杂,以及需要调度部署多种异构算力资源,如GPU、CPU和ARM。

为了应对这些挑战,火山引擎依托自研的多媒体处理框架BMF,发布了新的大模型训练视频预处理方案。该方案能够有效降低模型训练的算力成本,同时在算法和工程方面进行了优化,能够高质量地预处理海量视频数据,并在短时间内实现处理链路的高效协同,从而提升模型训练效率。火山引擎还发布并开源了BMF lite版本,这是一个移动端后处理解决方案,支持端侧大模型接入和算子加速,更加轻量且通用。

豆包视频生成模型PixelDance于9月24日发布,采用DiT架构,并通过高效的DiT融合计算单元和全新设计的扩散模型训练方法,解决了多主体运动的复杂交互和多镜头切换的内容一致性难题。目前,豆包视频生成模型已通过火山引擎向企业开放邀测。

理想L6明年冲刺3万台/月产能,汽车界又迎“狠角色”?
理想L6于2024年4月24日开启交付,第10万辆量产车于9月13日下线。9月19日,理想L6汽车上市5个月累计交付超10万辆,创新势力最快交付纪录。今年7月,理想L6累计交付新车破5万辆。理想智能驾驶ADM…

2024-10-15

小米汽车新专利曝光,底盘灯带隐藏设计防刮擦?
10月15日消息,小米汽车科技有限公司今日公布了一项“车辆底盘发光系统及其控制方法和车辆”发明专利。本公开的目的是提供一种车辆底盘发光系统及其控制方法和车辆,该车辆底盘发光系统能够减小灯带受到刮擦的风险,避免…

2024-10-15

高鑫零售停牌,背后有何“野望”?
据凤凰网、环球网,彼时时任大润发COO袁彬表示:“阿里和旗下盒马把试错都做完了,现在是铺好了高速公路,大润发直接跑就好”,时任阿里CEO张勇也赞言,此次战略合作达成,意味着零售业将实现以条形码扫描为代表的IT…

2024-10-15

“双11”直播电商回暖,李佳琦又要火了?
“双11”对于电商平台、商家和品牌方而言是一年之中最为重要的增长节点,从今年“双11”优惠政策来看,多个平台优惠力度创下了历年之最,昨日预售数据与去年相比有所增长,其中美妆领域表现尤为明显。 业内人士分析,…

2024-10-15