近日,有报道称人工智能领域新星Anthropic正在进行一笔高达20亿美元的融资谈判,该轮融资由Lightspeed Venture Partners(光速创投)领投。
自2021年成立以来,Anthropic已从Menlo Park Ventures等VC以及亚马逊、谷歌和 Salesforce等科技巨头获得超过113亿美元的资金。最新一轮融资完成后,Anthropic估值将达到600亿美元,较一年前的180亿美元估值翻了三倍多。600亿美元的估值意味着Anthropic将跻身美国估值最高的五大创业公司,仅次于SpaceX、OpenAI、Stripe和Databricks。
最近,海内外模型厂商相继开启了新一轮融资。上个月,马斯克的大模型平台xAI完成了60亿美元的C轮融资,市场估值超过400亿美元。国内模型厂商方面,2024年12月11日,面壁智能宣布完成新一轮数亿元融资;12月17日,智谱AI获得新一轮30亿元融资;12月23日,阶跃星辰完成了数亿美元的B轮融资。
火热背后,传出异动。李开复创立的零一万物被曝要将团队整体打包卖给阿里,虽然李开复连夜在朋友圈辟谣否认出售,但零一万物明显减少了对基础大模型的押注。多位投资人、业内高管向时代周报记者透露,“AI六小龙”普遍已不在预训练方面倾斜更多精力。
Anthropic的市场期待已高于OpenAI?
Anthropic由一对在美国旧金山的意大利裔美籍兄妹创立,两人都是OpenAI的早期员工。公司成立两个月后,A轮融资就筹集了1.24亿美元;一年后拿下5.8亿美元的B轮融资,团队随之扩展到40多人。
Anthropic的大语言模型Claude,被认为是OpenAI ChatGPT的最大竞争对手。Claude主要被应用在B端销售、营销和客户服务等领域。据了解,Anthropic目前的年化收入约为8.75亿美元,主要来自B端客户,按照600亿美元估值计算,Anthropic估值/收入比约68.6倍;OpenAI的最新估值为1570亿美元,预计2024年收入为37亿美元,估值/收入比约为42.4倍,这意味着市场对Anthropic寄予了高度期待。
与背靠微软的OpenAI相比,Anthropic背后的支持者并不逊色,这些公司都希望全力争夺未来十年内市场收入超过1万亿美元的AI份额。
作为Anthropic的重要支持者,亚马逊在去年11月追加了40亿美元投资,成为Anthropic的最大投资者。同时,Anthropic也承诺使用亚马逊云科技的自研芯片Trainium和 Inferentia来训练和部署其人工智能模型;谷歌此前也表示向Anthropic投资20亿美元,并已确认持有该公司10%的股份,同时两家公司之间签订了一份大型云计算合同。
Anthropic在去年加大了研发力度,技术和产品迭代加速。去年9月,Anthropic推出了Claude Enterprise,这是自其聊天机器人Claude问世以来最大的产品更新,专为希望将人工智能技术集成到业务中的企业设计。早些时候,Anthropic还推出了更强大的AI模型Claude 3.5 Sonnet。
2024年10月,Anthropic宣布其AI智能体能够像人类一样使用计算机完成复杂任务。据介绍,Anthropic的“计算机使用能力”新功能使其能够与计算机界面交互,解读计算机屏幕上的信息、选择按钮、输入文本、导航网站并通过任何软件和实时互联网浏览执行任务,这为实现更智能化的工作流程奠定了基础。
国内独角兽“让路”大厂
Anthropic和OpenAI的大参数模型对外发布速度已经放缓。
Anthropic Claude系列模型从大到小,分为Opus、Sonnet和Haiku 3个版本。Claude 3发布了全部 3个版本,而 Claude 3.5 目前只对外发布了Sonnet和Haiku。同样地,GPT-5(或GPT-4.5)也迟迟未出现在大众眼前。
据了解,Opus模型和GPT-5均在内部取得了良好的测试效果,但因效果无法与成本匹配都被内部当作“教师模型”使用,即在内部扮演者提升小模型性能的角色。
对大参数模型,国外创企尚在坚持,国内独角兽已“让路”大厂。
1月6日晚,有消息称零一万物将把预训练团队和算力资源打包出售给阿里云。随后,第一财经也报道,“阿里云正在洽谈收购零一万物的预训练团队,已谈好报价。”彼时,阿里云未对该消息作出回应。
零一万物CEO李开复很快在朋友圈辟谣称,“不知为什么会有这样的谣言散播,不过散的快,撤的也快。”零一万物公众号在凌晨发布官方回应,否认“阿里收购零一万物”。后据界面新闻和智能涌现报道,相比于“零一万物出售预训练团队”的说法,更接近事实的是,零一万物的确在进行预训练团队及Infra团队的调整,部分人员以跳槽形式加入阿里旗下公司。其中预训练算法团队获得通义团队offer,Infra团队则获得阿云offer。
1月7日,李开复回应表示,只有大厂能够“烧”超大模型,零一万物内部愿意继续训练超大参数模型的成员,加入了零一万物和阿里云成立的“产业大模型联合实验室”。
去年5月,在零一万物发布千亿参数模型Yi-Large时,李开复还宣布公司已经启动下一代万亿参数Yi-XLarge MoE模型训练。当时,智谱、MiniMax、百川、月之暗面、零一万物、阶跃星辰在内的“AI六小龙”也在全力追逐AGI。
困扰李开复的“预训练”是什么?所谓“预训练(pre-train)”,指对大模型的基础教育,即赋予模型海量而通用的知识,来决定模型性能,这是模型厂商最核心的技术壁垒。而狂堆参数的Scaling Law,目前是预训练的主流路径,同时也意味着高昂且持续的算力和数据投入。
马斯克曾估算,GPT-5的训练可能需要3万-5万张H100,仅芯片成本就超过7亿美元(约50亿元),对于尚未规模化盈利的创业公司而言,继续堆参数训练模型,要跨越高企的资金门槛。
而大模型发展至当下阶段,边际效应显现。在接受晚点采访时,李开复提到,去年9、10月时,公司看到Scaling Law明显进入 diminishing return(收益递减)。不是说用更多算力和数据做不出进步,而是进步不符合投资回报,“从一张卡加到10张卡时,可以达到9.5张卡的价值,但从10万张卡加到100万张卡,也许只能达到 30万张卡的价值”。
事实上,去年10月有报道称,“AI六小龙”中已经有两家公司逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。而目前,放弃预训练的公司数量还在攀升。
“当下的技术路径很容易同质化和到达瓶颈,再多投入也可能无法建立有效壁垒。”一位业内高管告诉时代周报记者,“去年大部分人不是这样预期的。彼时大家认为,领先的大模型会步步领先,AGI会很快到来。如果该预期能实现,那的确应该在训练上死砸(资金)。至于资金实力强如Open AI和Anthropic的这类企业想实现‘暴力美学’,更多要看下一代技术框架能在什么时间诞生”。
从一级市场资金流向来看,侧重落地的细分领域AIGC投融资情况相对乐观。IT桔子的数据显示,2024年国内人工智能行业投资事件466个,投资金额634亿元,相比2023年分别减少27%、9%;细分领域AIGC方面,国内AIGC投资事件117个,同比减少26个,投资金额370亿元,增加164.82亿元,平均每个投资事件投资金额增加了一倍。
“从资金消耗程度来看,训练模型比开发推广应用要大。”上述高管向时代周报记者解释称,投流获客和推理算力是应用层两大成本,不过,这两项成本支出的高与低,企业在策略推进上有较大的自主权和灵活性。