——专访维谛技术全球专家Simon Brady与高级经理王超女士
【环球科技网】在数字化时代的浪潮中,全球智算市场正以前所未有的速度蓬勃发展,数据中心作为这一变革的基石,正经历着前所未有的挑战与机遇。特别是在智算中心的算力集群高密散热和节能降耗方面的需求,更是对传统数据中心冷却技术提出了更高要求。在这样的背景下,我们有幸邀请到维谛技术(Vertiv)的两位专家——Simon Brady(Vertiv Global Expert)以及维谛技术热管理解决方案部高级经理王超女士,就智算中心冷却技术的现状与未来进行了深入探讨。
1、全球智算市场及中国智算市场的发展态势
Simon Brady在采访中明确指出,从全球范围来看,智算市场的发展呈现出几个显著特点。首先,智算的应用场景日益广泛,不再局限于传统的互联网行业,而是逐步向金融、医疗、教育等各行各业扩展,如印度的一家银行通过部署智算中心研究客户习惯,显著提升了服务质量。
其次,全球头部互联网公司如谷歌、亚马逊等都在积极部署大量智算资源来训练自己的大模型,以应对日益复杂的数据处理需求。
王超女士也指出,国内的智算发展同样迅速。国内头部互联网公司和科技企业纷纷投入巨资建设智算中心,模型训练,推动行业创新。可以说,智算正在从头部客户向行业客户扩展,帮助更多企业优化和提升工作效率。
2、AI时代对制冷技术提出的全新挑战和要求
在AI时代,智算中心在制冷层面面临着更高层级的要求。一旦设备散热出现问题,对数据中心将会造成毁灭性的伤害,未来在智算中心的冷却技术的研发上也提出了越来越高的要求。
针对未来智算中心建设的需求,Simon Brady认为,在AI时代,智算中心的制冷需求发生了显著变化。随着芯片技术的发展,特别是从CPU向GPU的转变,单个芯片的功率密度急剧攀升,从最初的300—400W提升到了现在的700—800W,甚至更高。这种高功率密度对制冷技术提出了更高要求,需要更高效、更节能的散热解决方案。
未来的智算中心冷却技术将向液冷方向发展,液冷技术能够直接对芯片进行散热,大幅提升散热效率,同时降低能耗。Simon Brady和王超女士都认为:未来,液冷技术将逐渐成为智算中心制冷的主流方案,特别是在高功率密度的应用场景中。
王超女士表示,维谛技术目前拥有冷板式液冷和浸没式液冷两种液冷解决方案,能够显著提高数据中心的冷却效率和能源利用效率,以其高热传导特性,能够有效应对高功率密度的散热需求。
在液冷领域,王超女士指出,维谛技术更是走在了行业前列,研发了多种液冷设备,包括冷板液冷、浸没液冷以及背板液冷等,这些设备能够更好地匹配AI芯片的散热需求,冷板液冷可以直接将冷却液导入芯片表面的微通道冷板中进行散热;浸没液冷则将整个服务器浸泡在冷却液中,实现全方位散热。这些液冷设备在实际应用中取得了显著效果,大幅提升了智算中心的散热效率和能效比。
她进一步解释说,在应对算力集群的高密散热挑战方面,维谛技术拥有一系列创新性的解决方案。在风冷领域,我们积累了丰富的经验和技术储备,能够根据不同应用场景提供定制化的风冷解决方案,同时,我们也在不断优化和升级风冷技术,提高散热效率和能效比。
3、AI快速发展的背景下,风冷和液冷将如何平衡?
在讨论风冷与液冷技术的融合时,Simon Brady表示,即使在液冷时代,风冷技术仍将发挥重要作用。风冷结合智能控制是一个关键点,做好控制是做好节能的前提。在液冷方面,未来单机柜的功率将进一步提升,从当前的40kW、100kW,到未来的200kW,甚至更高的密度,液冷技术将不断迭代。
王超女士介绍,维谛技术在液冷领域拥有冷板式液冷、浸没式液冷和DCD背板类产品,将结合功率密度和场景,进行全面的产品规划。目前,国内智算发展仍以风冷为主,风冷占据了80%或更高的市场空间。风冷技术的界限在于,如果是远端制冷的方式,可以解决单机柜20kW到25kW的散热需求,如果单机柜功率密度进一步提升,就需要用到近端制冷的解决方案。
4、2025年的冷却技术的发展方向
谈到2025年风冷和液冷比例的变化,Simon Brady指出,风冷依然是当前的主流,但随着智算的发展,液冷的比例将会逐渐上升。他强调,整个行业的变化非常快,液冷已经成为全球的行业热点。在传统数据中心,风冷仍将是主流解决方案,而AI液冷则是关键方案。因此,液冷的比例不会迅速达到50%这样的比例。
Simon Brady还提到,从技术的维度来讲,无论是在海外还是国内部署液冷,技术都是类似的。最大的差异在于供应的维度,海外有条件和全球头部的芯片厂家做配合,而国内的优势在于供应链。对于芯片规格的理解以及对细节问题的理解,需要和芯片厂家有更紧密地配合,以确保设备能够更好地匹配芯片的散热要求。
在谈及中国市场的占有变化趋势时,Simon Brady表示,AI发展最快的还是互联网企业,尤其是美国的互联网企业,如亚马逊、谷歌等,他们部署了大量的芯片来训练自己的模型,因此美国的发展速度非常快。紧随其后的是欧洲,而中国的智算发展增长速度也达到了35%甚至更高。尽管通用计算和传统计算的增长速度是5%到8%,但智算的增长速度远超通算和传统计算。从业务角度看,美国市场的增速比欧洲和中国市场都要快,这得益于美国互联网公司能够优先获取芯片,从而在智算领域发展更快。
Simon Brady分享了维谛技术在全球范围内推广解决方案的经验。他指出,维谛技术与全球头部互联网企业合作,提供了大量的风险解决方案。在海外,部分客户具备冷冻水的冷源,维谛技术会结合这些条件,帮助客户部署风冷和液冷散热方案。液冷方案的实施取决于客户当前的基础设施条件,维谛技术会根据具体情况制定最适合用户的方案。在海外,维谛技术的部署规模非常庞大,部分客户单个项目的规模甚至达到了30MW。有些客户也会按照每个模块3~5MW的规模进行模块化建设,再通过叠加模块形成更大的规模。
王超女士介绍,单机柜功率密度达到100kW时,一个非常小的算力微模块总功率的就可以达到1MW,数据中心部署方案需要同步调整。未来,单机柜和单模块的功率密度将进一步提升,维谛技术也会紧密结合智算发展,从芯片散热,到机房内部集热,再到户外散热,做好数据中心热管理链产品升级迭代。
通过这次深入的访谈,我们可以看到维谛技术在智算中心冷却技术领域的创新和领导地位及深远的技术探索。公司的解决方案不仅满足了高密度散热的需求,还实现了能效提升和成本节约,为数据中心的绿色发展提供了强有力的支持。随着技术的不断进步,维谛技术将继续引领智算中心冷却技术的革新,为全球数字化转型贡献力量。