巨人网
产经 科技 企业 数据 峰会 快讯

火山引擎新方案!大模型训练视频预处理,豆包已率先应用

2024-10-15来源:ITBEAR编辑:瑞雪

火山引擎在近期举办的视频云技术大会上,推出了一项针对大模型训练视频预处理的创新方案。该方案已被应用于豆包视频生成模型,显示出其在实际应用中的潜力。

火山引擎总裁谭待在会上表示,随着AIGC和多模态技术的发展,用户体验正在发生深刻变化。火山引擎视频云正积极探索AI大模型与视频技术的结合,旨在为企业解决技术、处理链路和业务增长层面的问题。

抖音集团视频架构负责人王悦指出,大模型厂商在视频预处理过程中面临多重挑战,包括庞大的数据集带来的计算和处理成本问题,视频样本质量的不一致,处理链路的复杂性,以及多种异构算力资源的调度和部署难题。

为了应对这些挑战,火山引擎依托自研的多媒体处理框架BMF,发布了这项大模型训练视频预处理方案。该方案能够充分利用Intel的CPU、GPU等不同资源,有效降低模型训练的算力成本。同时,通过算法和工程的优化,实现了对海量视频数据的高质量预处理,提升了模型训练效率。

火山引擎还发布了BMF lite版本,这是一个移动端后处理解决方案,支持端侧大模型接入和算子加速,更加轻量且通用。

豆包视频生成模型PixelDance于9月24日面世,采用DiT架构,并通过创新的扩散模型训练方法,解决了多主体运动复杂交互和多镜头切换的内容一致性难题。目前,该模型已通过火山引擎向企业开放邀测。

新款福特领睿上市,12.68万元起,这次诚意如何?
10月15日消息,江铃福特旗下中型SUV——新款领睿已上市,推出五款配置,价格区间为12.68万至16.55万元。作为中期改款车型,新款领睿采用了全新的设计语言,外观更加时尚动感。针对10月15日至3…

2024-10-15

谷歌再现“量子霸权”,新算法让电路体积翻倍,啥情况?
RCS 基准测试的具体输出是保真度(fidelity)的估计(一个介于 0 和 1之间的数字),用于表征含噪声的量子处理器的状态与实现相同电路的理想无噪声量子计算机的状态有多接近。 2019 年那次研究,…

2024-10-15

2024年7-8月,中国插电混动汽车全球市场占比高达83%!
10月15日消息,据乘联分会最新数据,2023年世界汽车销量8,901万辆,其中新能源汽车销量1,429万辆,燃油车销量总比占比相对下降。2024年1-8月份世界汽车销量达到5,824万辆,新能源汽车…

2024-10-15