打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
液冷服务器超温告警处理方法

      冷板液冷服务器在使用过程中,服务器的算力芯片(GPU)发生超温告警,故障原因和大致诊断步骤如下:

一、二次侧工质温度异常

  • 检查CDU二次侧工质温度设置(推荐值:30℃~40℃),有异常的及时进行正确设置;

  • 如果设置值正常,而实际温度异常,检查CDU水泵转速、系统流量、一次侧温度、流量等相关数值设置是否正常;

  • 如上述情况正常,检查一次侧水温和流量,如有异常现象及时修复。

二、二次侧工质温度流量异常

  • 检查二次侧机柜内部系统是否存在空气,通过放空阀进行排气操作;

  • 检查二次侧管网是否存在漏液等异常情况,结合CDU补液告警综合检查;

  • 检查二次侧水泵转速情况,是否正常;

  • 检查二次侧工质情况,如乙二醇浓度是否正常,是否存在缺液,浓度、浊度异常的问题,根据需要更换或补充二次侧工质。

三、冷板内部流量不足

       如果液冷服务器超温为个例情况,重点检查该服务器机柜的manifold、液管、芯片液冷板是否存在堵塞、阀门是否打开。

  • 检查冷板波纹管是否被挤压导致水流不通畅;

  • 检查整柜与二次侧主管路连接的软管是否被挤压;

  • 检查整柜二次侧球阀是否完全打开;

  • 液管、芯片液冷板是否存在堵塞情况。

四、冷板与芯片未充分接触

      如果二次侧工质流量正常,进出温度正常,检查下列内容:

  • 检查确认冷板的弹簧螺钉是否拧紧;

  • 检查冷板与芯片之间的导热垫放置是否正常,有无压缩异常情况

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
2021数据中心科技成果奖一等奖——冷板式液冷全链条解决方案
数据中心--冷板式液冷介绍
高能耗怎么办?浪潮新型液冷服务器赋予芯片冰凉“蚕衣”
【新技术】5G基站路由器液冷系统的设计
热力膨胀阀及工作原理
大模型引发“暴力计算”,巨头加速推进液冷“降温”
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服