打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
超算时代,数据中心急需“降温”

文|哀佳 石丹

在经历了蒸汽机时代、电气时代之后,我们迈入了信息化时代和数字化时代。

在这个时代中,信息技术成为各行各业制胜的关键,而信息时代的基层载体就是数据中心(即 IDC:Internet Data Centre)。无论是ChatGPT引爆的大模型,还是无处不在的云计算,其产生的大量数据都将在数据中心里面交互、存储、运算。数据中心成为了保证计算机系统(包括服务器、储存和网络设备等)安全稳定持续运行的重要基础设施。

数据显示,到2023年,中国数据中心在用数量将超过800万架。

但是,这些设备的运行会产生大量的热量,在数据中心的环境中,散热成了一个重大的挑战。如果不能有效地散发出这些热量,那么数据中心就会变得像蒸笼一样热,甚至会导致设备故障或者系统崩溃。

数据中心的散热和管理开始成为一个重要的课题,并引发了碳排放的问题。据中国信息通信研究院测算,到2030年,我国数据中心耗电量将超过3800亿度,如果不采用可再生能源,碳排放量将超过2亿吨。为了解决这个问题,很多企业现代化的数据中心都采用了各种创新的散热技术,大体上可以分为“冷风降温”和“液体冷却”两大类。这些技术能够帮助数据中心有效地管理热量,确保设备稳定地运行。

01

机器也需降温

不管运用哪一种技术,一个连续稳定的制冷系统对于数据中心来讲非常重要。

以人类作为类比,人类在散热方面有多种方式。例如,我们通过呼吸、皮肤、汗腺和血液循环等自身机制来进行散热。除了这些内在的散热机制外,我们还可以利用外部力量来辅助散热。比如,除了吹风,还可以通过淋浴、游泳等用水喷淋的方式进行散热。

在数据中心,比较常见的降温技术是风冷技术,好比人热了便拿一把扇子给自己降温。目前,风冷技术在市场上应用占比可达60%~70%左右。除此之外便是液冷技术,主流的液冷技术主要分为冷板式和浸没式液冷两种形式。

2015年10月,广东合一新材料研究院有限公司(以下称“广东合一”)正式成立,创造性地为行业提供了另一种降温解决方案——喷淋式液冷系统。

广东合一总经理蔡贵立向《商学院》记者比喻道:“冷板式液冷好比'背靠水缸吹凉风’,将液冷冷板固定在服务器的主要发热器件上,依靠流经冷板的液体将热量带走达到散热目的;单相流动浸没好比'泡浴缸’,发热元件直接浸没在冷却液中,依靠液体的流动循环带走服务器等设备运行产生的热量;相变浸没则好比'泡澡堂’,相变浸没式液冷的冷却液在循环散热中发生相变,利用液体的汽化达到散热的效果。”

以此类推,广东合一自主知识产权的喷淋式液冷就好比'淋浴’,根据电子器件发热位置和发热量大小,在服务器喷淋板对应位置开孔,让冷却液对发热体进行喷淋,达到设备精准冷却的目的。

“将机器完全浸没在液体中比往机器上喷水降温更快吗?当以高流速的液体喷向发热元件,其实能达到更好的降温目的,这就好比手被烫伤后需要及时用流动的冷水进行冲洗降温一样。”蔡贵立说。

不管运用哪一种技术,一个连续稳定的制冷系统对于数据中心来讲非常重要。当几千上万台设备同时运行时,产生的热量是非常大的,温度一高,设备就会罢工。此外,数据中心是高能耗的场所,过高的能耗还可能进一步导致环境污染。

在业内,大家通常用“PUE值”(Power Usage Effectiveness,电能利用效率)的大小来评价数据中心设备运转情况以及能源利用效率。

在不影响算力的情况下,PUE值越接近于1,说明数据中心的绿色化程度越高,能源利用效率越高,这意味着所有能源都被用于设备工作,而不是被散热功能消耗掉了。因此,从数据中心诞生之日起,追求PUE值的下降就成为了研发人员拼命“内卷”的课题。

02

从风冷转液冷

相比传统的风冷技术,液冷技术通过冷却液体替代传统空气散热,液体与服务器高效热交换,提高了效率,可以将PUE值进一步下探至1.25甚至1.2 以下。

2021年 7月,工信部印发《新型数据中心发展三年行动计划(2021-2023年)》(工信部通信〔2021〕76号),明确“到2023年底,新建大型及以上数据中心 PUE值降低到1.3以下,严寒和寒冷地区力争降低到1.25以下”。

2022 年 1月,发改委同意启动建设全国一体化算力网络国家枢纽节点的系列复函中明确要求,国家算力东、西部枢纽节点数据中心 PUE值分别控制在 1.25、1.2 以下。

由于传统主流风冷数据中心的PUE值通常在1.5~2.0之间,面对行业提出更高要求的情况下,传统的风冷技术已经显得“力不从心”。

与此同时,随着人工智能、云计算、大数据以及区块链等技术的创新发展,使得数据资源的存储、计算和应用需求快速扩张。特别是ChatGPT技术推广进一步催生了AI算力等大功率应用场景加速落地。作为信息基础设施的数据中心及通信设备承担的计算量越来越大,对计算效率的要求也越来越高。

根据中国信通院的数据显示,到2023年底,全国数据中心机架规模年均增速保持在20%左右,预计到2023年,中国数据中心在用数量将超过800万架。

蔡贵立表示,相比传统的风冷技术,液冷技术通过冷却液体替代传统空气散热,液体与服务器高效热交换,提高了效率,可以将PUE值进一步下探至1.25甚至1.2 以下。因此,液冷技术逐步开始成为行业内一种新型制冷解决方案,从风冷转液冷已是时代所趋。

03

不同技术路径的优势比较

由于浸没式液冷要将服务器完全浸没在冷却液中,所以冷却液的使用量更大,使用浸没式液冷方式将意味着更高的成本投入。

从液冷技术的产业链上来看,液冷产业生态涉及产业链上中下游,包括上游的产品零部件提供商、中游的液冷服务器提供商以及下游的算力使用者。

比如:上游主要为产品零部件及液冷设备,包括快速接头、CDU、电磁阀、TANK等组件;中游主要为液冷服务器,此外还包括数据中心的集成运维设施、产品及部件;下游行业则是为云计算、人工智能及物联网等方面提供集成产品服务。

目前,国内下游行业主要包括了互联网、金融、电信、政府、交通和能源等信息化程度相对较高的行业,比如三大电信运营商,以及腾讯、阿里巴巴等互联网大型企业。涵盖智慧计算、电子政务、企业信息化、关键应用以及民生等相关领域。

作为中游液冷服务器的提供商,蔡贵立解释道,在冷板式、喷淋式和浸没式三类主要的液冷技术中,按普及率排序,冷板式覆盖面最广,浸没式次之,喷淋式最少;但从冷却效率来看,冷板式最差,浸没式次之,喷淋式却是最好。

令人不解的是,冷板式液冷的制冷效率相对更差,但为何普及率反而更优于浸没式和喷淋式液冷?

蔡贵立表示,虽然冷板式液冷的冷却效果差一些,但是从工程可实施和后续维护的角度来看,冷板式液冷系统只需在原风冷服务器上加装板式换热器,再搭建一个循环冷却管道即可,机房整体不需要大的改动。但浸没式液冷需要定制化地进行机房设计和设备配套,工程难度比较大。对于想要从风冷转液冷的企业,在两种模式均能达到国家能耗要求的前提下,大家倾向于选择更容易的方式。

不仅如此,液冷技术的核心在于“冷却液”,目前大多以氟化液为主,从全球市场竞争格局来看,电子氟化液市场长期被国外企业占据。国外生产电子氟化液的企业主要以3M公司为主,占据了全世界绝大多数市场份额,使用起来成本很贵。

由于浸没式液冷要将服务器完全浸没在冷却液中,所以冷却液的使用量更大,使用浸没式液冷方式将意味着更高的成本投入。此外,为了不损坏机器,浸没式液冷对于冷却液的质量要求也更为严格。相比之下,冷板式液冷的冷却液和服务器不直接接触,限制条件也少了很多。

目前市场上,由于发展时间最早、技术成熟度较高,冷板式液冷已经在军用雷达、高密度数据中心、高性能电脑、动力电池以及高功率LED散热领域均有应用。浸没式由于具有更优的节能效果,散热优势明显,在超算、高性能计算领域取得了广泛应用。相比之下,喷淋式液冷公开展示的研究成果和应用实践相对较少。

实际上,在综合考虑成本和效率的双重条件下,蔡贵立认为,喷淋式液冷可以很好兼顾两方面的要求。

在广东合一的北京分公司,一些小巧的机器方格里,喷淋系统源源不断地从机体上方释放出低温冷却液,每一滴都精准地降落在芯片及主板上的发热单元,就如同冰雨从天而降,带走了热浪,留下了清凉。

据蔡贵立介绍,相较于其他液冷技术,喷淋液冷技术承重和占地少、用液低(相当于浸没式的1/8)。广东合一的喷淋液冷技术是一种基于超导热材料的高效热管理技术,芯片驱动、精准喷淋、按需可控,在不增加IT硬件投入、不大改机房的前提下,喷淋液冷可将算力提高50%,而能耗下降50%,系统PUE值甚至可以降至1.0以下。

04

中国液冷的减碳计划

在算力需求和政策引导的共同作用下,模块化液冷产品、余热回收技术等将推动中国液冷数据中心市场持续快速发展。

根据赛迪顾问的统计,2022年中国液冷数据中心市场规模达到68.4亿元,未来三年将以超过25%的年均复合增长率快速增长。在算力需求和政策引导的共同作用下,模块化液冷产品、余热回收技术等将推动中国液冷数据中心市场持续快速发展。

此外,随着“双碳”目标升级成为国家战略,对数据中心来说,“碳排放”已经变成和“能耗”同等重要的评价指标。如何运用新技术、新工艺、新产品降低机房制冷所消耗的电能,建设绿色环保机房,已成为业界关注的核心问题。

以新建3500个标准机柜、单机柜平均功耗为1.2kW的数据中心为例,运用风冷方案的PUE值为1.4,一年的耗电量为3297万kW·h,一年支付电费2472万元;运用冷板方案的PUE值为1.3,一年的耗电量为3061万kW·h,一年支付电费2295万元;运用喷淋和浸没方案的PUE值为1.1,一年的耗电量为2331万kW·h,一年支付电费1748万元,一年平均下来可节省724万元的电费,减碳9625吨。更低的PUE值意味着更环保、更节能和更省钱。

蔡贵立表示 :“在国家倡导减碳计划的时代背景下,我们主要从节能减排上去发力,能省电的地方要尽可能省,能省材料的地方也一定尽可能省,从碳的角度去实现变现。在产品上也体现了绿色设计的想法,比如,原材料尽可能选择耗能少的材料,为了达到省电的效果,去除一些冗余的组件,使产品更加精简高效。”

蔡贵立进一步表示,相比传统的风冷技术,液冷技术前期的投入可能会稍微高一些,但后端运营成本会明显降低,首先是电费会大幅度节省下来,其次安全性更高,机器故障率也更低。

目前,长三角、珠三角等对算力有较高需求的地区液冷的普及程度比较高,其次,相对于西部地区,北部地区由于耗电量高,从节能降碳的角度,液冷布局的地区也比较广。此外,由于国家的政策引导,类似于贵阳、甘肃等西部地区也开始往液冷转型,以更好地服务于东部。

赛迪顾问电子信息产业研究中心资深分析师袁钰提醒道,当前液冷的设计、部署、运维各环节只有少数行业/团体标准,常常出现液冷产品因为标准不一而无法兼容的现象,用户蒙受较大时间和预算损失。液冷的普及必将带来各类细化标准的出台,最终影响力最大、接受度最高、部署效率最高的标准才会成为行业认可的标准,从而为液冷全面铺开提供必要的基础。

“虽然目前风冷技术仍是市场主流,但从风冷转液冷的大方向、大趋势不会改变,未来工作的重点,是如何让技术与服务器更好的结合,我们的喷淋式液冷也还有很长的路要走。”蔡贵立如是说。

05

广东合一的绿色设计秘籍

创造性地为数据中心行业提供了喷淋式液冷系统这一降温解决方案。

液冷技术通过冷却液体替代传统空气散热,液体与服务器高效热交换,提高了效率。

广东合一的喷淋液冷技术是一种基于超导热材料的高效热管理技术,芯片驱动、精准喷淋、按需可控,在不增加IT硬件投入的前提下,喷淋液冷可将算力提高50%,而能耗下降50%。

液冷技术前期的投入可能会稍微高一些,但后端运营成本会明显降低,首先是电费会大幅度节省下来,其次安全性更高,机器故障率也更低。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
对液冷技术及其发展的探讨
厂商踊跃、数据中心观望 液冷距离爆发还差一场风
液冷技术让数据中心降温又降碳
图解液冷技术
冷板式、浸没式、喷淋式液冷散热能否引领高性能计算发展?
浸液式液冷:数据中心主流液冷技术,龙头全梳理
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服