巨人天成
产经 科技 企业 数据 峰会 快讯 商业

字节跳动豆包模型再降价,视觉理解或成AI新战场

2024-12-19来源:蓝鲸新闻编辑:瑞雪

在AI模型市场掀起新一轮风暴的背景下,字节跳动再次以震撼性的价格策略吸引了业界的广泛关注。近日,于火山引擎Force大会上,字节跳动正式揭晓了其最新的豆包视觉理解模型,其惊人的输入成本仅为每千tokens 0.003元,这一价格标志着多模态模型正式迈入厘计价的新纪元。

据火山引擎介绍,豆包视觉理解模型的定价相较于行业平均水平低了85%,意味着用户仅需一元钱便可处理高达284张720P分辨率的图片。这一价格优势与国内外其他顶尖的多模态模型形成了鲜明对比,例如OpenAI的GPT-4o每千tokens价格为0.0175元,Anthropic的Claude 3.5 Sonnet定价为0.021元,以及阿里的Qwen-Vl-Max定价为0.02元。

字节跳动今年早些时候推出的豆包大模型,就因价格比竞争对手低99.3%而引发轰动。随后,阿里云、百度和腾讯等国内巨头纷纷效仿,竞相降价,从而点燃了国内大模型市场的价格战。这场价格战不仅推动了价格的骤降,还加速了大模型的应用普及。火山引擎的数据显示,豆包通用模型的日均tokens使用量已突破4万亿,相较于首次发布时增长了33倍。

火山引擎总裁谭待在接受采访时指出,随着模型成本的显著下降和性能的提升,市场反馈逐渐增多,用户开始更加关注模型的调用量和token数。他强调,字节跳动希望通过一个合理、可持续且一步到位的价格策略,让企业和开发者能够毫无顾虑地使用多模态模型。

豆包视觉理解模型不仅具备精准的视觉内容识别能力,还具备理解和推理、视觉描述等功能。在演示中,该模型成功识别了动物的影子轮廓、杂志内页的星云以及体检报告的具体指标,展现了其广泛的应用潜力。这些能力在教育领域的判卷指导、作文批改,以及旅游、电商营销等方面都具有重要价值。

谭待还透露,字节跳动在类o1推理模型领域也有所布局,豆包视觉理解模型已初步具备解答数学、物理、代码问题的能力。他透露,完整的推理模型将在进一步完善后推出,并预计不会太久。

与此同时,国内其他大模型公司也在视觉方向取得了新进展。独角兽企业月之暗面发布了视觉思考模型k1,该模型既能通过视觉精准识别,又能进行分布推理思考,在数学、物理、化学等评测中表现优异。而私募巨头幻方量化旗下的AI公司DeepSeek则开源了全新的视觉模型VL2,该公司认为提升模型的视觉能力对于提升其感知和认知能力至关重要。

在火山引擎的活动上,字节跳动还发布了豆包3D生成模型,并对多款产品进行了更新。其中,豆包通用模型pro已全面对齐GPT-4o,但使用价格仅为后者的1/8。音乐模型的支持时长从60秒升级至3分钟,文生图模型2.1版本则实现了精准生成汉字、一句话P图等产品化能力。字节跳动预计,明年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,并很快上线端到端实时语音模型。

谭待在谈及大模型的未来落地场景时表示,虽然AI对话是一个通用场景,但大模型在生产力、商业化场景中的增长速度同样迅猛。以近三个月为例,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景则增长了16倍。他认为,聊天功能只是模型的基础功能,只有结合深度推理、视觉理解等能力,才能处理更复杂的任务,从而推动模型的发展空间不断扩大。

谭待强调,目前市场仍处于早期阶段,相较于竞争,字节跳动更关注用户对复杂语言场景和视觉等方面的需求。与互联网时代C端先于B端崛起不同,大模型的这两个方面并不是孤立的,而是基于同样的模型能力。因此,字节跳动对大模型的策略是To B和To C齐头并进。

对于火山引擎这一对外开放字节技术工具的云厂商而言,AI已成为其新的增长机会。谭待表示,火山引擎提升市场份额的关键在于规模优势和把握住AI大模型的技术变革。通过豆包模型,火山引擎获得了更多的关注和新的合作机会,从而有望实现从云原生到AI云原生的转型,成为这一领域的领军企业。

TLKS-PMG-TP装置:全天候精准监测,守护输电线路“体温”安全
TLKS-PMG-TP输电线路线夹及导线温度在线监测装置应运而生,以其高精度测温与全时段监测能力,为输电线路装上了一双“精准温控眼”。 TLKS-PMG-TP装置不仅提供实时监测,更实现了输电线路运维的智能…

2025-11-15

华为在阿根廷完成5G-A双场景验证 下行峰值速率创新高助力无线发展
无线业务的发展对网络性能提出了更高的要求,而阿根廷市场一直走在拉美创新无线技术探索的前列,本次创新测试验证了两种未来5G-A商用载波组合,包括覆盖更强,更易大规模部署的Sub3.5G TDD+FDD 3CC…

2025-11-14

Gartner发布2026十大技术趋势:AI主导变革,从“大而全”迈向“精而实”
近日,商业与技术洞察公司Gartner发布了2026年十大战略技术趋势:AI超级计算平台、多智能体系统、特定领域语言模型、AI安全平台、AI原生开发平台、机密计算、物理AI、前置式主动网络安全、数字溯源,以及…

2025-11-14

中国6G技术首阶段试验圆满收官,通信领域创新再启新程
在全球竞相布局6G的背景下,中国率先完成第一阶段技术试验,展现了其在通信领域的强大实力。此次试验涵盖了6G关键核心技术,测试了多种潜在技术和系统性能。业界普遍认为,6G网络将实现地面与卫星通信的融合,构建空…

2025-11-14

桥梁位移监测仪:精准感知位移 灵活部署续航 守护桥梁安全出行
这种方式能够利用清洁能源为设备持续供电,既体现了节能环保的理念,也巧妙地解决了在市政供电不便场景下的设备续航问题,保障了监测工作的不间断进行。为了便于现场操作与维护,桥梁位移监测仪还配备了便捷的配置方式。 …

2025-11-14

5.5G辐射危害健康?物理学者:比太阳光频率低,基站越密越安全
我当时听了都愣了,太阳光那不是好东西吗,怎么还跟信号辐射扯一块儿了? 最有意思的是,他说大家都觉得基站多了辐射就大,这完全是搞反了。之前吵得最凶的那个阿姨,现在天天用5.5G跟外地的孙子视频,还跟邻居说这新基…

2025-11-14

技嘉B860M冰雕主板深度评测:千元价位与酷睿Ultra的完美搭档
XMP AI Boost的DDR5-8200 CL40挡位也能够顺利开启,再叠加上高带宽、低延迟功能的性能加成之后,内存性能继续得到提升,但写入性能基本上是到顶了,主要是受限于B860芯片组主板无法调整CP…

2025-11-14

上海电信“双万兆”护航进博会:数智赋能通信保障,服务跨越语言距离
浦东机场T1电信营业厅及T2一站式服务中心电信柜台是进博会观众和外宾抵沪的“入境第一站”, 两处服务点均开设“进博专席”,为参展人员和往来旅客提供中英双语咨询、交通指引与爱心便民服务。未来,上海电信将持续夯…

2025-11-13

高光谱探测器助力宽带叠层扫描成像 开启3D高光谱成像新篇
最近的研究表明,能量分辨或高光谱探测器可以在某种程度上取代单色器的作用来执行,例如,在单次采集中使用宽带辐射进行边缘减影叠层扫描成像。利用这样的探测器,时间相干性变得可调(在探测器的能量分辨率的限制内)并且在…

2025-11-12

荣旭传媒技术破局:以专业方案化解直播痛点,成就高性价比之选
传统方案在视频、音频和网络方面存在诸多不足,而荣旭传媒通过先进的技术和专业的设备,有效解决了这些问题。传统方案的视频分辨率较低,画面不够清晰,而荣旭传媒的4K 超高清视频拍摄制作让画面质量有了质的提升;传统…

2025-11-12