$瑞芯微(SH603893)$ Deepseek利空GPU但整体影响应该也不太大因为专项大模型与普用大模型对算力需求差异就很大,绝对利多NPU,首先说明AI应用推进可更快对端侧AI需求量就更大,对数据交换也更大
算力重大利好!算力硬件最大的误伤解除了! Deepseek回应算力需求问题,质疑可以结束了。
1.这是否意味着 AI 训练对算力的要求普遍降低了?
并非如此:我们的优化是针对 DeepSeek-V3 的特定设计和任务进行的,这些改进可能并不直接适用于其他模型或任务。例如,训练大规模多模态模型(如 GPT-4 或 Gemini)仍然需要巨大的算力。
AI 训练的整体趋势:虽然单个模型的效率在提升,但 AI 领域的整体趋势是模型规模和复杂性不断增加,这对算力的需求仍然很高。例如,训练一个万亿参数级别的模型可能需要数千张 GPU 和数月的计算时间。
总结
DeepSeek-V3 的训练时间减少和算力需求降低,主要得益于算法优化、硬件适配和模型架构改进。然而,这并不意味着 AI 训练对算力的要求普遍降低,因为 AI 领域的整体趋势仍然是模型规模和复杂性不断增加。我们的优化是针对特定任务和设计进行的,旨在提高效率的同时保持高性能。
瑞芯微持续保持研发投入,很大一块就是投入到基础核心IP,在NPU、ISP、高性能视频编解码、视频后处理等方向不断更新迭代。
与此同时,和IP一样重要的是给客户提供TurnkeySolution的能力。TurnkeySolution就是交钥匙方案,在SoC芯片的基础上设计好其它芯片形成参考设计/开发板,提供基础软件,客户只要拿这套TurnkeySolution直接就可以生产产品,实现绝大多数的基础功能,这样的方案极大简化了客户的研发成本,加快了客户产品的上市周期。TurnkeySolution也是MPU厂商的核心竞争力之一,国内市场上留活下来的MPU厂商都是此中好手,瑞芯微更不用说。
3588这么高端的端侧AI芯片是为类人智能机器人及其他高端AI智能体如AI眼镜而准备的,其产品将大大打开其市场空间,瑞芯微下一代旗舰3688产品预计也将很快推出,又将是国内最优秀的端侧AI芯片,瑞芯微未来将进一步奠定其端侧AI芯片领先地位