豆包大模型家族全新升级,新发视觉理解模型成为最大亮点
12月18日火山引擎举办FORCE原动力大会,升级了豆包家族系列大模型,包括:新发布视觉理解模型和3D生成模型,升级豆包通用模型pro(对标GPT-4o)、视频生成模型(动态海报)、音乐模型(生成3分钟作品,复杂音乐创作)、文生图模型(一键P图/海报)。其中,视觉理解模型成为最大亮点,可同时输入文本和图像的相关问题,模型能综合理解并给出准确回答。豆包大模型的日均tokens调用量最新已超4万亿,较5月发布时增长超33倍。我们认为,豆包模型及相应AI应用正快速渗透,AI赋能B/C端时代有望加速到来。
豆包视觉理解模型跨模态能力突出,低价推广有望解锁更多价值场景豆包视觉理解模型展现出卓越的视觉理解与跨模态能力:
1)更强内容识别。能识别物体类别、形状、纹理等,理解物体之间关系和空间布局;
2)更强理解推理能力。根据所识别的内容进行复杂的逻辑计算,如拍题解题等;
3)更细腻视觉描述。视觉理解模型输入定价为每千tokens 0.003元,比行业平均价格低85%,我们认为,视觉理解模型能拓展豆包大模型的场景边界,拓展教育、旅游、电商、金融、医疗、物流等领域。较低的模型定价有望加速推广应用场景,提高字节系AI应用产品用户粘性。
豆包通用模型pro升级后全面对标GPT-4o,价格仅为后者1/8
升级后的豆包通用模型pro能力大幅提升:综合任务处理能力上提升32%,和GPT-4o持平;指令遵循能力提升9%;代码能力提升58%;专业知识领域提升54%,这一效果略微领先GPT-4o;逻辑推理上提升13%;在数学上大幅提升43%。综合能力已全面对齐GPT-4o,使用价格只有GPT-4o的1/8。我们认为,豆包Pro凭借其更强的模型效果和更低的推理成本,将进一步推动企业AI升级,以及增强C端用户体验和使用量。
企业端产品:火山方舟、扣子、HiAgent帮助构建AI能力中心
1)火山方舟提供全栈MaaS能力,支持模型精调、推理、评测等全方位功能,及丰富插件、扩展API和高代码解决方案,升级上下文缓存和记忆加工加载技术,强化AI搜索和推荐。
2)扣子为中国最具活力的智能体开发社区,已有超100万的活跃开发者,创造了超200万智能体应用。1.5版本推出,支持发布成小程序、H5、API等应用形态,增强了多模态能力,可与各种硬件集成。
3)HiAgent支持企业私有部署和混合部署模式,沉淀出超100个行业的应用模板,增强知识融合效果,帮助企业打造AI知识助手。
AI应用大时代已来,探索字节AI产业链投资价值
从C端AI应用看,字节自己推出的AI APP应用相对闭环生态;AI智能硬件方面字节已推出AI智能耳机OLA friend,AI玩具显眼包(尚未正式发售),后续AI眼镜、AI机器人等值得期待。从B端AI合作看,我们梳理了产业链相关标的,具体请见研报原文。
风险提示:
AI发展不及预期,用户反响不及预期,政策监管风险。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。