巨人网
产经 科技 企业 数据 峰会 快讯 商业

字节跳动豆包大模型全面升级,视觉与视频领域成新竞技场

2024-12-19来源:文汇报编辑:瑞雪

在科技日新月异的今天,大模型技术的飞速发展已成为不可忽视的趋势。火山引擎总裁谭待形象地比喻道:“面对一列疾驰而来的高速列车,把握机遇的关键在于及时登车。”这一比喻恰如其分地描绘了当前大模型技术浪潮下的机遇与挑战。

近期,火山引擎Force大会的召开,再次将大模型技术的创新推向了新的高潮。字节跳动在此次大会上正式推出了豆包视觉理解模型,这一模型以极具竞争力的价格,为企业提供了一站式的多模态大模型解决方案。据悉,豆包视觉理解模型不仅在价格上实现了突破,其性能同样令人瞩目,千tokens输入价格仅为3厘,远低于行业平均水平,使得AI技术的普及与应用变得更加触手可及。

谭待强调,视觉理解作为人类获取信息的主要方式,其在大模型技术中的应用将极大地拓展大模型的能力边界,降低人与大模型交互的门槛,解锁更多应用场景。豆包视觉理解模型不仅能够精准识别视觉内容,还具备出色的理解和推理能力,能够完成分析图表、处理代码、解答学科问题等复杂任务。该模型还具备细腻的视觉描述和创作能力,为企业客户提供了更多元化的选择。

豆包大模型在此次大会上还迎来了全面升级。豆包3D生成模型的首次亮相,与火山引擎数字孪生平台veOmniverse的结合使用,为AIGC创作提供了物理世界仿真模拟器,极大地提升了创作效率和质量。豆包通用模型pro已全面对齐GPT-4o,但使用价格仅为后者的1/8,音乐模型也从生成60秒的简单结构升级到生成3分钟的完整作品,文生图模型2.1版本更是在业界首次实现了精准生成汉字和一句话P图的产品化能力。

在大会现场,即梦Dreamina的张楠也分享了生成式AI技术在创意表达方面的巨大潜力。她表示,生成式AI技术能够将人们脑海中的奇思妙想快速视觉化,像做梦一样自由、灵动。即梦希望成为“想象力世界”的相机,帮助每个人轻松表达、自由创作。

随着大模型技术的不断成熟和应用场景的持续拓展,豆包大模型的市场份额也在迅速增长。截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较首次发布时增长了33倍。在C端市场,用户利用豆包大模型进行英语对话练习、奥数教学、旅行规划等创意应用;而在B端市场,豆包大模型已与八成主流汽车品牌合作,并接入到多家智能终端设备,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长了100倍。

谭待表示,豆包大模型虽然发布时间较晚,但凭借快速迭代和技术创新,已成为国内最全面、技术最领先的大模型之一。未来,火山引擎将继续致力于推动AI技术的普及与应用,让AI成为每一家企业都能用得起、用得好的普惠科技。

在云计算领域,大模型时代的到来也推动了云计算的变革。火山引擎认为,下一个十年的计算范式将从云原生进入到AI云原生的新时代。基于这一理念,火山引擎推出了新一代计算、网络、存储和安全产品,通过vRDMA网络、EIC弹性极速缓存等技术手段,显著提升了训练和推理效率,降低了成本。同时,火山还将推出PCC私密云服务,构建大模型的可信应用体系,为企业用户提供更加安全、高效的AI服务。