“市场需要充分竞争,降低成本是技术优化的结果,做得最好才能活下来。”
12月18日,字节跳动旗下火山引擎总裁谭待在接受澎湃新闻等媒体采访时,提到大模型行业的现状。
在当天举办的火山引擎Force大会上,字节跳动再次掀起价格战:发布豆包视觉理解模型,每千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%。
此前5月,字节也是首先推出低价,引发全行业跟进:豆包主力模型在企业市场的定价只有0.0008元/千Tokens,比行业便宜99.3%。
豆包大模型多款产品也同时迎来更新:通用模型Pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。
豆包日均使用量增长33倍
“豆包不看带动多少云收入,而是看有多少客户使用我们的大模型产品,目前我们在整个市场份额上都做到了较大领先。”谭待告诉记者。
目前大模型混战已进入深水阶段,除了字节跳动、腾讯、百度等大厂参与,月之暗面、Minimax、智谱、百川智能等AI独角兽也有很强的竞争力。不过,在业界看来,目前字节跳动旗下豆包发展尤为迅速。
数据显示,在11月的全球月活跃排行榜上,豆包APP的MAU(月活)达到5998万,仅次于OpenAI的ChatGPT,位列全球第二。
不过,对于相关MAU数据的准确性,谭待在采访中未予以回应。谈及市场竞争,他坦言,“企业之所以用豆包更多,还是因为使用体验较好,而不是没有尝试过其他的产品。这个市场就是要充分竞争,最关键的是能不能把自己的东西做好,能不能把成本做低,能不能把方案的落地应用性做好。”
据谭待介绍,豆包视觉理解模型不仅能识别视觉内容,还具备理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。此外,该模型有着细腻的视觉描述和创作能力。此前,豆包视觉理解模型已经接入豆包App和PC端产品。
数据显示,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长33倍。
此外,澎湃新闻记者获悉,2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也即将上线,提供多角色演绎、方言转换等新功能。
字节强攻AI
在大模型赛道上,字节跳动攻势迅猛。
市场研究机构Quest Mobile数据显示,截至2024年1月,豆包的安装量已经飙升至2500万,最高访问量超1700万,成为最头部的大模型产品之一。
国泰君安证券研报指出,未来字节跳动可能形成以豆包AI为核心的硬件产品矩阵,包括办公、教育、陪伴等多类产品。随着豆包模型的持续进步与迭代,若字节跳动进一步拓展以豆包为核心的产品矩阵,相关豆包产业链公司将持续受益,端侧AI或驱动NOR Flash用量提升。
豆包的表现在股市上也掀起一股热潮。12月18日,A股抖音豆包概念股集体大涨,视觉中国(000681)、博瑞传播(600880)、天娱数科(002354)、遥望科技(002291)等涨停,不过12月19日开盘回调明显。
在具体落地和应用方面,据谭待披露,目前国内安卓手机大部分都在和豆包合作,对手机厂商来说,会在某些场景用豆包,某些场景用其他的大模型,或者某一个场景混合使用,对企业用户来说,肯定也需要一个多云或者多模型的策略,“最终还是能力更好、成本更低,就会用谁,这笔账就很好算。”
字节跳动正在AI方面形成软硬件一体的多元化生态。当天,火山引擎还宣布旗下两款AI应用开发平台——HiAgent、扣子全面升级。两个平台均给开发者提供了提示词模板、插件和知识库等一系列智能体开发元素。数据显示,扣子平台上已超过100万活跃开发者,发布超过200万个智能体。
澎湃新闻记者从多位业内人士处获悉,目前豆包确实在国内大模型领域位于第一梯队,不过,强有力的增长部分源于投流。
据第三方平台数据,截至11月15日,Kimi、豆包、星野、元宝等国内十款大模型产品今年合计投放超625万条广告,投放金额达15亿元。