12月18日,字节跳动在“火山引擎Force大会”上宣布,豆包视觉理解模型每千tokens输入价格定为3厘(即0.003元),让视觉理解类大模型价格步入“厘时代”。
又一次大幅度降价背后,是过去几个月豆包大模型调用迅猛的增长量。字节跳动火山引擎总裁谭待透露,过去7个月里,豆包大模型调用次数增长了33倍。规模快速增长,数据飞轮效应逐渐显现——这恰是火山引擎所一直追求的。而在此基础上,一条更加清晰明确的商业化道路也呼之欲出。
规模猛增下多模态步入“厘时代”
字节跳动再次把大模型的价格打了下来。
在12月18日举行的“火山引擎Force大会”,字节跳动正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。在展示强大性能的同时,谭待也宣布,豆包视觉理解模型每千tokens输入价格定为3厘(即0.003元)——较目前行业均价几乎便宜了85%。
有意思的是,相较于炫耀强大的技术,多位负责人均强调了新产品的“实惠”。
例如,对长对话中记忆文本tokens的定价模式,项目负责人宣布,着重降低被唤起标记tokens的价格,这意味着企业在制作私人化AI助手时,成本将大大降低。此次大会上,字节跳动宣布豆包通用模型pro已全面对齐GPT-4o,而使用价格仅为后者的1/8。
大幅度降价背后,是豆包大模型今年以来迅猛的调用需求增长。“5月的时候,我们模型日均tokens 1200亿,而到本月15号,日均tokens数已经突破4万亿。”谭待透露,这意味着在短短7个月时间里,模型调用增长了33倍。
大会上,多位豆包具体业务负责人也披露了几大热门行业中大模型的落地情况。
在智能终端领域,目前豆包已携手众厂商覆盖超3亿台终端设备,日均tokens调用量在半年里增长了100倍。而在汽车领域,火山引擎聚焦汽车座舱场景和车企业务场景,过去7个月,汽车行业的日均Tokens消耗增长了50倍。截至目前,豆包大模型已服务了国内市场八成汽车品牌。
对于大模型,字节跳动的策略是“一步到位”。
“我们对于大模型并不太在意首发,我们希望打磨得足够好,然后推出来给到一个合理的商业价格。”谭待对记者说道,“这次降价前,我们评估了我们的火山方舟算力储备,我们有能力满足巨大的市场需求。”
生产力,将成商业化核心
相较于过去二十年互联网产业从C端发展起来的模式,在谭待看来,B端与C端同时推进或许更符合此轮AI的演进。“AI是一种生产力的革新。”他说道。
生产力,是字节跳动大模型发展的一条暗线。“以现在大家讨论比较多的AI助手为例,我认为一个AI助手是否合格,评估他能够辅助人工作的时长是一个非常重要的指标。”谭待说道。
豆包3D生成模型首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持AIGC创作的物理世界仿真模拟器。
“这意味着未来数字资产的价值将不断提升,在工业设计领域会有广泛的应用场景。”一位上海3D设计公司负责人告诉记者。此外,华鑫证券传媒行业分析师朱珠也认为,随着越来越多大厂布局“AI+3D”,未来诸如文旅、文博等行业都将受益。
值得一提的是,在此次会上,沉寂许久的张楠也携剪映业务在AI领域的诸多最新成果亮相。在介绍剪映旗下大模型平台即梦Dreamina时,张楠着重展现了多个已投放抖音平台的AI影视作品。
记者注意到,此前PixelDance和Seaweed两款模型上线即梦曾一度引发市场关注。在前期测试中,更加贴合影视创作的生产页面,也得到不少影视从业者的肯定。
“生成式AI技术可以把每个人脑子里的奇思妙想快速视觉化,像做梦一样。”张楠说道,“即梦希望成为想象力世界的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。”
“火山引擎一直倡导数据飞轮的理念,通过业务应用和数据资产建设,提升数据消费,做好数据驱动。”谭待说道,而大模型的出现使得数据使用在变得更加容易,同时非结构化数据的价值会得到极大提升。他表示,正是基于这两个洞察,火山引擎的数据飞轮产品体系也进行了全面升级。
当谈及行业竞争时,谭待笑称,行业仍处于极其早期的阶段,竞争有利于市场的发展。“我们也不害怕竞争。”他补充道。