近期,TrendForce发布的调查报告引发了市场对NVIDIA GB200整柜式方案(Rack)的广泛关注。此方案由于其在高速互通界面、热设计功耗(TDP)等多个角度的设计规格远超市场主流产品,因此其供应链的优化和调校进展将需要更长的时间。根据最新预期,GB200 Rack的出货高峰可能将延迟至2025年第二季度至第三季度之间。
GB200及GB300机柜的设计复杂性和高成本特性使其主要目标客户集中在大型云服务提供商(CSP)、Tier-2数据中心、国家主权云及学术研究单位等高性能计算(HPC)和AI(AI)应用项目。NVIDIA正在积极推广GB200 NVL72机柜,预计在2025年将成为市场上主要的解决方案,占比接近80%。
为了提升AI和HPC服务器系统的整体运算能力,NVIDIA开发了NVLink高速互连技术,GB200采用了第五代NVLink,预计其总带宽将大幅优于当前主流的PCIe 5.0接口。此外,GB200 NVL72的每个机柜热设计功耗(TDP)高达140KW,相较于2024年市场主流的HGXAIServer每柜60KW至80KW的TDP更进一步。因此,市场对液冷散热解决方案的需求也在迅速增加,许多业者正在加大研发液冷散热组件的投入。
TrendForce分析指出,目前GB200 Rack系统的高设计规格可能会引起某些零部件的供应出现延迟,进而影响整体出货量。预计2024年第四季度,Blackwell GPU芯片的出货将略低于早前预期,仅实现少量出货,随后的2025年第一季度将逐步放量。然而,因整个供应链的协调调整,2024年年底的出货量仍然难以达到整体业者的预计。
GB200机柜采用的高 TDP 值使得传统的气冷散热技术已不足以满足要求,液冷技术则成为了应对这一挑战的关键。随着GB200 Rack方案在2024年底开始小量出货,相关企业也在努力提升散热效率,冷却分配系统(CDU)制造商正通过扩大机柜尺寸,并优化冷却板(Cold Plate),试图显著改善散热性能。
TrendForce提到,当前的Sidecar CDU散热要在60KW至80KW之间,未来预计将达到双倍甚至超过三倍的散热表现。更高效的液对液(L2L)型 in-row CDU方案的散热能力已超过1.3MW,预计未来也会继续提升,以满足日渐增长的算力需求。
综上所述,NVIDIA GB200机柜方案在供应链优化和技术创新方面都处于关键发展期,尽管出货高峰有所延后,但其推动的AI和HPCECO的升级将为云计算及其他相关行业带来新的机遇。在未来几年,我们大家可以期待这些创新技术逐步推动行业发展,并为用户更好的提供更强大的计算能力和更优质的服务。
解放周末!用AI写周报又被老板夸了!点击这里,一键生成周报总结,无脑直接抄 → →
上一篇:
君逸数码智慧园区助力成都科学城天府科创园智能运营、创新治理
下一篇:
朗威股份:公司现在有液冷服务器机柜的出售