12月19日,市场传出消息,苹果正在与腾讯、字节跳动初步洽谈iPhone整合AI模型事宜,对此,三家公司没有给出明确回应。不过,或受该消息影响,此前传出与苹果合作不顺的百度港股盘中一度跌超6%。
前一天,字节跳动发布了一系列关于豆包大模型的新进展,其中一条内容引人注意:豆包视觉理解模型输入价格仅为0.003元/千tokens,官方宣称比行业价格便宜85%。
在大洋彼岸, “12 Days of OpenAI”接近尾声,连续11天的“挤牙膏”之后,OpenAI预告第12天将会有“非常令人兴奋的事情”。与此同时,谷歌大招频出,在AI图像、视频生成、量子芯片、推理模型方面接连发布新品,对OpenAI发起猛烈狙击。
综合来看,AI仍然是2024年科技领域的最强叙事,而大公司的进攻效率再次验证了“大力出奇迹”的可行性。经历了技术、人才、资本的又一轮洗牌之后,淘汰赛还在继续,行业整合将加速,对于还留在牌桌上的玩家来说,无论ToB还是ToC,技术迭代和应用落地,缺一不可。
“价格战”不是目的
一年多前,行业里还充斥着大量字节AI掉队的声音,但如今情况已大有不同。
12月19日晚间,字节跳动向外界发出预警:近期,资本市场出现炒作“豆包概念股”现象,流传着众多夸大其词甚至是虚构的内容,涉及字节跳动资本开支、数据中心花费、AI硬件、应用合作等多方面。请投资者切勿轻信市场传言,以免遭受不必要的投资损失。
资本市场的躁动背后,最近两天,字节跳动旗下火山引擎发布了一系列字节AI在技术方面的新突破和市场布局新进展。12月18日,字节跳动正式发布豆包视觉理解模型、豆包3D生成模型,以及全面更新的豆包通用模型pro、音乐模型、文生图模型等,为企业提供多模态大模型能力。其中,豆包视觉理解模型的价格降至0.003元/千tokens,一元钱就可处理284张720P的图片,比行业平均价格降低85%。
在自然语言处理(NLP)和大模型(如语言模型、图像模型等)的情境下,token是文本(或其他数据形式)的基本处理单位。大模型的训练和推理过程需要强大的算力支持,而算力的消耗与token数量直接相关。处理的token数量越多,所需的计算资源就越多,相应的硬件购置、能源消耗等成本也会大幅增加。
火山引擎展示了其他具备多模态能力的大模型输入价格,对比来看,OpenAI GPT-4o的输入价格为0.0175元/千tokens,Anthropic的Claude 3.5 Sonnet定价为0.021元/千tokens,阿里Qwen-Vl-Max为0.02元/千tokens。
字节跳动此次把视觉理解模型拉入“厘时代”,不免让外界联想到半年前的那场“价格战”。5月15日,火山引擎宣布豆包主力模型在企业市场的定价比行业便宜99.3%,大语言模型价格开始以厘计算。随后,阿里云、百度、腾讯等头部厂商纷纷宣布跟进降价,甚至一度进入免费时代。
但从后续企业和开发者的实际使用来看,“薅羊毛”的热度过去之后,能不能留住客户,价格不是决定性因素。目前来看,行业内还未开始复制上一轮的“降价潮”。字节跳动也似乎不想被贴上价格战发起者的标签,或者说,价格战并不是目的。
抖音集团副总裁李亮很快在社交媒体上否认了“价格战”的说法,他表示,豆包大模型通过技术创新来降低成本,在算法、软件工程和硬件方案上做了非常多优化,3厘/千tokens的定价也有可观的毛利。而且这是一步到位的透明价格,并不是“刊例价+折扣”的玩法。
ToB、ToC两手抓
不可否认的是,低价是快速提升市场份额和渗透率的有效手段。
根据11月的全球月活跃排行榜,豆包APP的MAU(月活)达到5998万,仅次于OpenAI的ChatGPT,位列全球第二。
官方披露的数据侧面印证了豆包大模型的迅猛增长。据火山引擎总裁谭待透露,“5月刚推出的时候,模型日均tokens调用量是1200亿;到7月份涨到了5000亿,到9月份是1.3万亿;而截至12月15日,豆包大模型的日均tokens数已经突破了4万亿,在7个月的时间里增长超过33倍。”
这也反映了行业内外聚焦方向的转移,经过两年多的竞赛和淘汰,AI大模型已经告别“百模大战”时代的比拼参数规模和评测模型能力,对商业化的迫切渴求之下,AI应用领域吸引了更多目光。
自身并不擅长硬件的字节正在通过合作加速渗透——豆包大模型目前已与八成主流汽车品牌合作,并接入多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长了100倍。
最终谁能和苹果合作,还是一个未知数。谭待在采访中提到,“其实国内安卓手机比苹果多,国内安卓手机大部分都在和豆包合作。”
大模型商业化的路径选择,究竟是ToB还是ToC,行业内有不同的观点。虽然创业公司在两种路线上有各自的侧重点,但主流的探索模式仍是两条腿走路。
大公司自然是都不放过。根据豆包内部数据,工作、娱乐、生产力的场景差不多,大模型处于ToB和ToC齐头并进状态。
无论是模型层还是应用层,字节跳动仍在输出“APP工厂”的方法论。根据Z Finance、七麦数据统计,字节已在全球上线超过20款AI应用,覆盖视频生成、虚拟陪伴、图片生成等几乎所有热门细分赛道。
目前来看,在应用端,豆包APP拿下国内第一,实现后来居上,但不能否认这是烧钱投流换来的王座,用户留存和使用习惯仍是行业共同面临的挑战。
对手们也在持续突破,且更加主动地对外展示商业化成果。最近,爱诗科技和智谱AI相继宣布了新的融资进展,爱诗科技的核心AI视频生成产品PixVerse全球用户数超1200万,月活跃用户数近600万;智谱AI也首次披露了公司今年以来的商业化收入同比取得100%以上的增长。