财中社1月7日电华金证券发布半导体行业快报。
从云到端,AI催生端侧存储容量增加。在云端,AI依赖于大规模的数据中心和高效庞大的存储系统来存储、传输并处理数据。数据中心有着大规模集群式的存储硬件来应对海量数据,而在端侧,AI需要在计算资源、存储资源受限的设备上实现实时、低功耗的数据处理,这对存储芯片的容量、速度和能效提出全新的要求,也推动存储技术革新。对端侧AI设备来说,算力和数据的加持实现了各种智能功能,而数据存放及高效读写需要更强大的存储芯片为其提供助力。(1)AI手机:16G的DRAM已是AI手机最低基本配置。根据电子发烧友网统计,基于高通和联发科旗舰芯片的智能手机比较集中的是支持70亿的AI大模型参数,且16GB+512GB存储搭配最为集中。根据电子发烧友网数据,以70亿大模型压缩后需要4GB来算,再加上6GBApp保活、4GB安卓OS,故支持70亿参数大模型的智能手机,实现图像生成功能等,其内存至少需要14GB。(2)AIPC:更快的数据传输速度、更大的存储容量和带宽需求也带动了主流LPDDR5x和LPDDR5T产品的需求。如微软发布的AIPC内存容量最低为16GB,搭载新处理器的AIPC已普遍将内存提升至32GB,为AI模型的部署升级留下充足空间。(3)AITWS耳机:AITWS耳机中功能更多,为存储更多固件和代码程序,需要外扩串行NORFlash。当前几款已发布的AI耳机中NORFlash容量较之普通TWS耳机也有了比较大的提升,基本上实现了翻倍来支持内置的AI新功能。以字节跳动豆包Ola Friend AI耳机为例,单只耳机内部配备两颗128Mb NORFlash,总存储容量为256Mb(即32MB)。相比之下,普通TWS耳机的存储容量一般较低,通常为64Mb(即8MB)到128Mb(即16MB)。
存算一体解决打破传统存储/功耗/算力墙,在大算力设备领域具有绝对影响力。存算一体核心是将存储功能与计算功能融合在同一个芯片上,直接利用存储单元进行数据处理——通过修改“读”电路的存内计算架构,可以在“读”电路中获取运算结果,并将结果直接“写”回存储器的目的地址,不再需要在计算单元和存储单元之间进行频繁的数据转移,消除数据搬移带来的消耗,极大降低功耗,大幅提升计算效率。存算一体芯片在特定领域可以提供更大算力(1000TOPS以上)和更高能效(超过10-100TOPS/W),明显超越现有ASIC算力芯片。存算一体技术还可以通过使用存储单元参与逻辑计算提升算力,等效于在面积不变的情况下规模化增加计算核心数。在能耗控制方面,存算一体技术可以通过减少不必要的数据搬运将能耗降低至之前的1、10~1、100。存算一体芯片适用于各类人工智能场景和元宇宙计算,如可穿戴设备、移动终端、智能驾驶、数据中心等。按算力大小划分:1)针对端侧的可穿戴等小设备,对算力的要求远低于智能驾驶和云计算设备,但对成本、功耗、时延、开发难度很敏感。端侧竞品众多,应用场景碎片化,面临成本与功效的难题。存算一体技术在端侧的竞争力影响约占30%。(例如arm占30%,降噪或ISP占40%,AI加速能力只占30%);2)针对云计算和边缘计算的大算力设备,是存算一体芯片的优势领域。存算一体在云和边缘的大算力领域的竞争力影响约占90%。边缘端存算一体芯片在边缘端具有高算力、低功耗、高性价比的优势。而针对智能驾驶、数据中心等大算力应用场景,在可靠性、算力方面有较高要求,云计算市场玩家相对集中,各厂商算法和生态细节不同,芯片售价较高。根据存储与计算的距离远近,将广义存算一体的技术方案分为三大类,分别是近存计算(PNM)、存内处理(PIM)和存内计算(CIM),其中,近存计算和存内计算是目前存算一体技术实现主流路径。大厂对存算一体架构需求是实用且落地快,而作为最接近工程落地的技术,近存计算成为大厂们的首选,典型代表是AMD的Zen系列CPU。国内初创企业则聚焦于存内计算,典型代表有Mythic、千芯科技、闪亿、知存、九天睿芯等。