液冷行业正在步入快车道。
随着AI技术快速发展,算力需求激增,这给承载算力的数据中心带来了不小的挑战,同时也提供了广阔的发展空间。从政策导向来看,数据中心绿色化、低碳化发展方向也已明确。
近日,曙光数创副总裁兼CTO张鹏接受了上海证券报记者的专访。在他看来,液冷技术发展是大势所趋,同时大有可为。
三大优势
液冷是一种采用液体带走发热器件热量的冷却技术。作为北交所上市公司中的专精特新“小巨人”企业代表,曙光数创深耕数据中心液冷领域20余年,处于行业领先地位。
据中国电子技术标准化研究院发布的《液冷数据中心白皮书》统计,曙光数创2023年度液冷基础设施市场份额为61.3%,连续3年位居行业榜首。
在快速增长的国内液冷市场中,曙光数创保持行业龙头的“诀窍”何在?
“我们主要有三大核心优势。”张鹏表示:一是先发优势。曙光数创自2011年便已进行相关研究,2015年推出冷板式服务器和对应的数据中心整体解决方案,2017年推出了浸没式服务器和对应解决方案。无论是案例数量、运行经验还是产品成熟度,都保持着行业领先。二是持续研发能力。曙光数创每年用营收的10%作为研发费用投入,不断创新技术发展。张鹏透露,目前公司有技术储备,正在研发一些新的冷却技术。三是交付和服务能力。去年,曙光数创(青岛)产业创新基地成立,拥有国内唯一兆瓦级液冷基础设施实验室等七大研发创新实验室和四条先进生产线,对于创新发展和交付生产能力都是强力保障。
绿色低碳
在国家政策的积极引导下,数据中心正向绿色化、低碳化演变。凭借高效、节能、环保的特点,液冷技术成为推动数据中心发展的必然选择。
据了解,液冷技术主要分为浸没式、冷板式和喷淋式三类。目前冷板式是市场主流,与浸没式的比例约为9:1。
张鹏看好浸没式技术:“我不认为冷板是未来散热服务器的终极形态。随着智算需求的提升,数据中心设计、建设的改变,GPU应用增多后,浸没式中的相变浸没将进一步发展。”
他进一步介绍了公司的“独门秘籍”——曙光数创相变浸没液冷系统。这一技术就是把服务器100%完全浸没到电子氟化液中,并通过电子氟化液从液体沸腾变为气体的两相变化,利用汽化潜热吸收并带走服务器内全部发热元件产生的所有热量,极大提高了整个数据中心系统的换热效率。
“这种相变浸没液冷技术可让芯片核心温度降低20℃至30℃,芯片性能约可提升10%至30%,可最大化利用计算能力,单位算力的投资成本则可降低10%至25%。”张鹏表示,该技术极大地减少了对电能的依赖,真正做到了极致节能,PUE(数据中心总能耗/IT设备能耗)低至1.04,节约能效超过30%。
其中,浸泡服务器所使用的特殊液态介质功不可没,其被称作“冷媒”。“我们使用的冷媒——电子氟化液,是曙光数创自主研发的产品,已实现全国产化的生产,并可替代国外同类产品。”张鹏表示,这对于未来浸没式技术发展至关重要。
张鹏表示,冷媒的经济性需要综合考虑原材料的价格、生产工艺、运输方式、材料的使用周期及回收处理等因素,以达到最佳技术经济效益。
“目前,曙光数创最新一代的冷媒成本不到国外同类产品售价的三成,有效的成本控制,将加速促进相变浸没液冷数据中心的大规模普及和转化。”他告诉记者。
空间广阔
随着AI技术的不断发展,算力需求激增。这对液冷行业来说,可谓是如虎添翼、恰逢其时。
“液冷,作为AI发展的必选项,不仅是技术上的革新,更是对未来可持续计算能力的一次重大突破。”张鹏表示,随着AI模型日益复杂,数据处理量爆炸式增长,传统的风冷技术已难以满足高端计算设备对散热的严苛需求。
过去20年,服务器CPU功耗只有100瓦至200瓦,而现在已经达到350瓦至450瓦。GPU更是从A100的450瓦发展到H100的700瓦,最新的B100甚至达到1200瓦。因此,传统风冷技术不仅会影响芯片性能发挥,还可能导致稳定性和可靠性下降。
与此同时,由于AI大模型训练对算力需求的激增,高密度部署已成为大型GPU集群的必然选择,这就需要更先进的冷却技术。
“液冷技术的引入,如同为AI的飞速发展安装上了强大的引擎。”张鹏表示,液冷技术不仅极大地提升了数据中心能效比,降低了能耗,还有效延长了硬件的使用寿命,为构建绿色、高效的AI生态系统奠定了坚实的基础。
放眼国内外液冷市场,均出现快速增长态势。在张鹏看来,我国液冷行业大有可为。“2022年数据中心的液冷渗透率约为3%至5%,2023年大概是8%至10%。我们判断,近几年液冷行业会迎来爆发式增长。预计未来3至5年,液冷业务有望保持30%以上的年复合增长率。”