作者 | 周智宇
小米在大模型上正发起一轮迅猛的攻势。
华尔街见闻了解到,大模型上非常低调的小米,在过去几个月里持续提升算力储备,也有了更高的算力资源投入规划,为自家大模型研发提供更充分的算力供给。
在算力资源上进一步提升资本开支,是小米创始人雷军向AI大模型发起一轮猛攻的侧写。此前,小米在内部组织能力建设、外部人才引入上,已有了诸多动作。
今年11月中旬,小米基础技术平台部成立AI平台部,曾被雷军公开称赞是“小米的大神”的张铎,担任AI平台部负责人。
随后,DeepSeek-V2 的关键开发者之一罗福莉也传将入职小米,或入职小米AI实验室。罗福莉在自然语言处理(NLP)领域享有盛名,尤其是其参与的DeepSeek-V2,因大模型使用成本远低于行业均值,引发行业关注。罗福莉的加入也将助力小米在大模型领域研发加速。
从种种迹象看,在雷军的领导下,小米正在加速推进大模型的研发进展。不过小米在大模型上,过去一段时间里颇为低调。
去年年度演讲中,雷军就表示小米会全面拥抱AI大模型。小米AI实验室也在2023年4月设立了专门的大模型团队。
接近小米的人士表示,小米对需要大规模烧钱的预训练态度谨慎,而轻量级模型在某些特定任务上,比千亿级大模型也具备一定优势。这也使得小米在大模型上的侧重点在于“轻量化”和“本地部署”。
小米的大模型参数规模在百亿,作为对比,vivo在11月初推出的蓝心大模型已经有了千亿级参数量级的模型。
小米相关人士认为,小米与其他公司不一样的点,在于注重产品落地。这使得大模型会跟着产品出来。
小米集团总裁卢伟冰也曾表示,目前发布的号称AI手机的都是AI Feature (特征)手机,也就是用AI的技术做了一些AI功能,而真正的AI手机是搭载基于AI大模型重构的操作系统。
这种思路使得外界对小米的大模型认知度并不高。
在今年底多家手机厂商的发布会中,大模型对自家产品智能化的赋能,都成为发布会宣传的重点。小米则在今年旗舰手机小米15的发布会中,将小米澎湃OS 2.0作为突出重点,但对于大模型没有更详细的介绍。
不过小米自研大模型进展不小。今年5月,小米的大语言模型MiLM已成功通过大模型备案。
今年11月,小米第二代模型MiLM2系列发布,拥有0.3B到30B多个参数规模,以适配云边端各侧场景的需求。
从模型规模上看,MiLM2系列也延续的是轻量化思路,参数规模依旧在百亿。MiLM2-30B模型专为云端场景设计,在指令遵循、常识推理和阅读理解等方面,超越了主流竞品大模型。
此外,截至11月中旬,小米智驾总算力达到了8.1E FLOPS,在目前整车厂中处于第一梯队。且累计数据积累达到了300万Clips,与同期理想处于一个梯队。按照小米方面预期,其年底会完成1000万Clips数据积累。
当然,这距离特斯拉100E FLOPS的算力还有不小差距。在新能源汽车智能化下半场里,小米要继续“守正出奇”,也需要在智能化上加速。由此,小米在算力资源上进一步增加投入,并不意外。
相比其他科技大厂,小米拥有广袤的终端生态,涵盖手机、汽车和IoT等。这在AI大模型经历百模大战,进入寻找AI应用落地的阶段里,会是个优势。但这也需要小米在AI大模型领域有更加突出的表现。
随着小米加码AI大模型领域,这场AI应用之争也渐入高潮。