AI大模型的发展日新月异。从文生视频到长文本,从“深度思考”到“解放双手”,AI大模型的能力边界不断拓宽;从能力到产品力,从“百模大战”到头部大模型“出圈”,AI大模型产业格局加速演变。
未来,从重投入转变为重产出,将是AI大模型产业的重要主题。AI大模型应用的商业模式将越来越成熟,并被更多人接受。随着应用场景更加多元,规模持续扩大,AI大模型公司将从比技术趋向比成本、比服务;大公司赢家通吃,中小公司百花齐放或成未来格局。◎记者刘怡鹤
亮点频出大模型能力全面展现
2024年,对于AI大模型产业来说仍是技术突飞猛进的一年。年初,OpenAI发布了文生视频模型Sora。这款“世界模拟器”的横空出世,不仅可能颠覆影视内容产业,而且被视为迈向通用人工智能(AGI)的重要一步。
文生视频之后,超长文本点燃了大模型产业的另一把火。“一口气读完20万字小说”的Kimi火了,背后是国产大模型的上下文处理能力,从十万字级别跃升到千万字级别。
9月,OpenAI的o1模型预览版推出;12月,o1正式版、o1 pro发布。o1系列聚焦“深度思考”,可以“思考”(推理)更长的时间来获得更可靠的响应。在外部专家测试人员的评估中,o1 pro 模式可以产生更可靠、更准确、更全面的响应,尤其是在数据科学、编程和判例法分析等领域。
各大科技巨头也亮点频出。美国AI独角兽Anthropic的大模型Claude推出了Computer use(电脑使用)的功能,大模型可以根据指令控制电脑进行相关操作,指向了未来“解放双手”的理想状态。谷歌Gemini 2.0 Flash Thinking不仅和o1模型一样擅长编程、数学等“慢思考”工作,而且还能给出其“思考”的过程。
上海市数据科学重点实验室主任肖仰华对记者说:“OpenAI o1推出之后,我们就有一个判断,即AI大模型作为人类智能的一个复制,其从0到1的技术突破已经全面展现出来。o1之后大部分大模型的各项进展,事实上是在已有各种能力上的不断完善。”
用户激增 AI应用产品力爆发
2024年,AI大模型的产品力逐渐显现出来。
11月的全球月活跃用户排行榜显示,ChatGPT 的MAU(月活跃用户人数)居全球首位,达到2.87亿。12月初,OpenAI宣布,ChatGPT 每周已有3亿活跃用户,每天发送的消息超过10亿条,并且美国有130万开发者在OpenAI平台上开发应用程序。
ChatGPT已形成较为成熟的订阅式商业模式。普通版本的ChatGPT免费提供给用户,帮助完成日常任务,plus和pro版分别定价每月20美元和200美元。12月最新推出的pro服务可以无限制地访问OpenAI最智能的o1系列,包括最新发布的o1 pro,以及o1-mini、GPT-4o和高级语音模式(Advanced Voice)。
豆包App成为国内最火AI应用,其11月的MAU接近6000万,仅次于ChatGPT。截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。
在12月18日到19日字节跳动举行的火山引擎Force大会上,豆包大模型围绕用户体验进行了全面升级。豆包战略研究负责人周昊表示:“豆包一直在努力,让用户的输入更快更方便。”因此,豆包产品非常注重多模态的输入和打磨,包括语音、视觉等能力。
研究显示,人类接收的信息超过80%来自视觉。字节跳动发布了豆包视觉理解模型,旨在极大地拓展大模型的能力边界,同时降低人们与大模型交互的门槛,为大模型解锁更丰富的应用场景。
在企业服务方面,豆包大模型已经与八成主流汽车品牌合作,并接入多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。
火山引擎总裁谭待认为,豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念,让AI成为每一家企业都能用得起、用得好的普惠科技。
在二级市场上,“豆包概念股”行情火热。光云科技全资子公司杭州其乐融融科技有限公司获得了火山引擎“万有计划”产品生态合作伙伴钻石级称号。12月18日到20日,光云科技三日涨幅达46.78%,位列A股全市场涨幅榜第一。12月以来,润欣科技、视觉中国股价已实现翻倍,润泽科技、天娱数科、汉得信息、乐鑫科技等多股均大幅上涨。
上海市人工智能技术标准化委员会委员王文广接受记者采访表示,在产品化方面,目前应用较为广泛的是知识搜索和自动编程。
通过外部知识增强大模型的方法,已经成为大模型应用的标准配置。ChatGPT、豆包、百度的文小言(文心一言)、智谱清言、讯飞星火、DeepSeek等产品都支持搜索功能;谷歌、百度、微信的“搜一搜”等传统搜索引擎也都加入了大模型应用。
在大模型自动编程方面,微软旗下的GitHub Copilot推出了免费版本,Devin推出了每月500美元的完全自动化版本,WindSurf和Cursor也被开发者广泛使用。“这些大模型编程产品大幅提升了编码效率,甚至在简单应用场景下,几乎实现了完全自动化。”王文广说。
头部集中未来产业格局浮现
“百模大战”之后,头部集中的格局正在浮现。OpenAI作为行业的先行者,持续开创性地推出技术升级和新功能,其迭代既有着较高的用户关注度,也往往引发行业效仿,行业地位难以撼动。豆包虽然起步较晚,但作为字节跳动旗下首个AI应用,坐拥字节跳动生态的强大本土流量优势,以及用户体验的打磨能力与经验。
上海人工智能研究院算法工程师黄冠对记者说:“ChatGPT的产品路径优点首先在于探索‘无人之境’,其次生成结果质量较高,一些实用性功能锦上添花,实时搜索、高级语音视频的交互模式显著提升了用户体验。”
豆包的产品化路径主要是深入用户端的实际使用场景,更贴“地气”。豆包覆盖了电脑端、手机端、网页端等多个场景。比如电脑端的豆包可以开启“划词”等功能直接与用户互动,帮助用户更高效地完成日常办公,培养出了较高的用户黏性。最新融入视觉大模型后,豆包的应用场景有望进一步拓宽。
“大模型公司明显开始转向打造爆款应用,打造让用户群体满意、适配各场景、解决实际问题的平台和工具。”肖仰华说,大模型产业从不计成本的投入和研发,转变为关注获得产出。未来,如何打开更大规模的应用场景,采取什么方式获得更丰厚的回报,成为行业的重要趋势。
王文广认为,随着AI技术和产品不断成熟,订阅服务的商业模式将逐渐被广泛接受,越来越多的用户愿意为提升工作效率而付费。
黄冠预期,具备强大预测能力和决策能力的大模型最有可能成为下一个行业风口,例如在机器人具身智能、端到端的自动驾驶等方面的应用。随着行业应用场景将出现爆炸性增长,大模型将从一项高新技术“落入凡间”,转向比拼成本和落地服务能力。
“基座大模型具有AI基础设施的特性,和其他基础设施一致,只有资本雄厚、场景丰富、渠道多元的头部公司才能成为赢家。”肖仰华认为,绝大部分中小企业可以转型成为大模型的应用开发商,打造基于大模型基础设施的各种应用程序,完成大模型变现的“最后一公里”。