腾讯服务器靠什么冷却?

腾讯作为全球领先的互联网企业,其数据中心(服务器集群)的冷却方案是典型的高效、绿色、多技术融合的体系,没有单一的冷却方式,而是根据地理位置、气候条件、服务器功率密度和运营成本,采用了综合的、分层的冷却策略

核心思路是:在保证服务器稳定运行的前提下,最大限度地利用自然冷源,降低能耗(PUE值)。

以下是腾讯主要采用的几种冷却技术:

风冷(自然冷源+精密空调)

这是最传统也最普遍的方式,但腾讯做了大量优化。

基本原理: 通过室内精密空调将冷风通过架空地板或机柜通道,送到服务器入口(冷通道),吸收热量后的热空气从热通道返回空调。

腾讯的创新:间接蒸发冷却,在北方干燥地区(如腾讯位于张家口、怀来的数据中心),当室外温度低于一定值时(比如冬季),不使用压缩机,直接将室外过滤后的冷空气与室内热空气通过换热器进行热量交换,从而冷却室内,这种方式能极大节省电力。

应用场景: 低功率密度机柜、气候凉爽的地区。

液冷(冷板式 + 浸没式)

随着AI和高性能计算(HPC)的发展,服务器功率密度急剧上升(单个芯片可达700W以上),传统风冷已到极限,液冷成为腾讯的核心方向。

冷板式液冷:

原理: 将冷却液(通常是纯水或专用冷却液)通过管路流经固定在CPU、GPU等核心发热部件上的“冷板”,带走热量,这些热量再通过冷却塔散发到大气中。

腾讯实践: 腾讯自研的“T-block”数据中心架构中,广泛采用了冷板式液冷,特别是针对AI训练集群(如H800/A100服务器),它是目前技术最成熟、应用最广的液冷方案。

特点: 不需要改变服务器主板结构,兼容性好,但需要精密的管路和防止泄漏系统。

浸没式液冷:

原理: 将整个服务器主板完全浸泡在绝缘的、不导电的电子氟化液或矿物油中,发热部件与液体直接接触,热交换效率极高(比空气高上百倍)。

腾讯实践: 腾讯在“清远云计算数据中心”和“仪征数据中心”部分部署了浸没式液冷系统,这是腾讯在绿色节能上的重大突破,PUE(电能利用效率)可以做到1.1以下甚至更低。

特点: 散热效率最高、噪音极低、节省空间,但初期改造成本高,维护和运维复杂(需要更换液体等)。

自然冷源利用(选址智慧)

腾讯在选择数据中心地址时,会优先考虑低温、干燥、电价低的地区,以最大化利用自然冷源。

典型选址: 贵州贵安(利用山洞和天然低温)、内蒙古乌兰察布(利用常年低温)、河北怀来、张家口(利用“风口”和冷空气)。

具体做法:

贵州山洞数据中心: 利用山洞恒温、恒湿、低尘的环境,直接节省了大量制冷能耗。

风能+智能温控: 在风能富集的地区,通过软件预测算法,根据天气预报提前调节机房温度和风扇转速,实现“削峰填谷”。

智能化动态管控(软件定义冷却)

这是腾讯核心竞争力之一,不是硬扛硬件,而是用软件来“智慧”地指挥冷却。

AI调优: 腾讯云智维平台和DeepCool等自研系统,通过机器学习模型,实时分析成千上万个温度传感器数据、IT负载数据、气候数据,自动动态调节空调风机转速、冷机启停、阀门开度等。

结果: 能够实现“按需供冷”,避免过度制冷,节能效果显著(通常可达5%-15%)。

技术方案 核心原理 适用场景 腾讯典型应用
间接蒸发冷却 风+水+自然冷 北方干燥、低PUE要求 张家口、怀来数据中心
冷板式液冷 液体通过冷板带走热量 高密度计算、AI训练 自研“T-block”架构
浸没式液冷 服务器泡在液体中 极高功率密度、极致节能 清远、仪征部分机房
自然冷源+山洞 利用地理环境恒温 特定气候、低成本 贵州贵安数据中心
AI智能运维 软件动态调节 所有场景 云智维平台、DeepCool

一句话概括: 腾讯服务器冷却的核心不是“硬扛”,而是“混合冷却 + 自然利用 + 智能调度” ,在需要高算力的地方用液冷,在气候合适的地方用自然风冷,再用AI把整个系统管得滴水不漏。

文章摘自:https://idc.huochengrm.cn/js/25837.html

评论