日前,浪潮信息将射流技术融入传统冷板,设计完成4个全新的射流冷板架构,在不改变冷板管路流量和压力的前提下,通过增压腔、微孔喷射等技术对芯片等高热区域实现射流散热,大幅提高了冷板对服务器局部热点的解热能力,让客户可部署芯片的最大功率提高了28%。同时,该系列方案也大幅提高了散热效率,同流量冷却液导走的热量提高40%,降低了数据中心PUE值和整体成本。
01 创新架构,让射流与冷板融合
基于增压泵的射流冲击技术最大可实现1kW/cm2热流密度,主要应用于大型发动机、激光切割等大型高热系统的散热场景。如果将其直接应用于服务器散热,射流所需的高压会对当前服务器液冷的结构、用料、漏液管理等方方面面形成巨大挑战,从而大幅度增加整体液冷方案的技术复杂度、应用难度和经济成本。
浪潮信息在传统冷板的基础上用增压腔和微孔喷射等技术实现无泵射流,对芯片等局部高功率区域提供强大解热能力,并根据不同服务器的结构和散热需求,以及不同结构拓扑的解热效率,设计出中置扩散式、太阳花式、上下腔斜板式和环形腔式等四种射流冷板架构,均已获得国家发明专利保护。 太阳花式是针对CPU等小面积高功率热点的高效散热架构,中置扩散式和环形腔式射流冷板针对AI加速器模组等大面积热点的解热需求设计而成,可以适配到所有的AI服务器。上下腔斜板式是目前厚度最小的射流冷板,该方案不仅可以适配单宽AI加速器,也具有非常领先的防堵塞能力。
02 推动传统冷板升级 让芯片表面均温
传统铲齿形冷板,微通道只有0.2-0.4mm,冷却液流速低,流态稳定,流经芯片时会顺着流向形成不同温度的层流,如下方的传统冷板温度云图所示。芯片的高温区为红色,而低温区为蓝色,差异十分明显。冷却液在流经芯片表面过程中温度升高吸收热量的能力快速下降,却无法与后续的低温冷却液混合,这是造成芯片表面冷热不均的直接原因。过大的表面温差会影响芯片的正常运行和使用寿命。
射流冷板方案将高速冷却液直接喷射在CPU、AI加速器等高功率芯片处,而且将冷却液从慢速稳流变为快速湍流,实现了高低温冷却液的快速混合,极大的解决了芯片表面温度不均的问题。同样的芯片在采用太阳花式冷板以后,从温度云图可以看出,层流现象基本消失,表面呈现一致的蓝绿色。
03 解热能力边界拓展25%,减少碳排2355吨
经过测试,在每分钟0.8升的流量工况下,中置扩散式冷板、环形腔式冷板、太阳花式冷板、上下腔斜板式冷板的解热能力比传统的冷板分别提升27.6%、28%、15.1%、25.6%,也就是说,在每分钟0.8升的流量工况下,平均传统冷板每导出100千焦热量,四种方案分别可以导出127.6千焦、128千焦、115千焦和125.6千焦热量。
同时,四个射流冷板方案相比传统冷板散热能力有明显的提升,提高幅度在25-30%不等。射流冷板将大幅减少泵驱冷却液需求,降低对CDU的数量和功率需求,降低数据中心能耗进而减少碳排放。假如要解决1万片1kW 异构加速卡的散热需求,传统冷板需要18台CDU,提供每分钟9000升流量,而射流冷板需要11台CDU,提供每分钟5400升的流量,CDU的需求量减少且冷却液的需求量减少了40%。更低的冷却液需求带来更低的能耗成本及二氧化碳排放,相较于传统冷板,搭配射流冷板的万卡数据中心5年的二氧化碳排放量减少2355吨。
04 引领冷板创新,迎接芯片高功耗时代
当前,制程技术创新减缓,登纳德缩放定律失效,芯片在性能越来越强的同时,功耗也在快速攀升,发热限制已经成为所有高性能芯片面对的重大技术挑战。
芯片性能要继续提升不仅需要芯片架构师创新技术提高能效,也需要在设备和数据中心层面不断提高散热能力,应对芯片设计的发热挑战。从传统冷板到射流冷板,到浸没式、两相浸没式,浪潮信息正在全面推进液冷技术的创新,不仅解决当下高热密度散热难题,也为3D封装、异构集成芯片等未来芯片技术发展提供散热保障。