高性能计算随想:DGX GH200官方技术探究1
2023-08-09 11:10:51   来源:   评论:0 点击:

看了一天才算看个大概,DGXgh200每个主机都有一条总线,南北对接所有的GRACE HOPPER 超级芯片,每个芯片电路集成了36个50GB s的NVLINK 4,六个NVSWITCH 芯片也通过集中数据总线按图一的方式从总线对接8条50G

另外,这一代GH200基础设施尺寸走的是OCP 标准,传统的19英寸宽,44mm/RU的常见机架是没法用的。但是从公开渠道资料还没看到是不是支持标准的Ocp v3机架直接安装,如果支持的话那么对单柜功率的要求应该会小于20千瓦。

hgx grace hopper 官方计划是推出带nvlink 和不带的基板,不过还没看到谁家拿到带nvlink 的适配板组。要是有适配机型出来,很多企业级用户就可以低成本获得拥有同样数据访问特性的大模型训练设施了。

英伟达在大模型训练这个领域可谓是集技术与大成者,通过对麦伦斯的收购,完成了超高速带宽的数据传输网络整合,和自家的高性能计算芯片深度绑定,造就了一个Ai hpc应用护城河,并开发了相应的软件生态,Cuda编程体系已经变成具有统治地位的异构计算编程平台,Amd最新推出的mix3000想挑战这个软件生态地位,相信要付出不小的代价才有可能从他黄叔手上分一杯羹。

高性能计算随想:DGX GH200官方技术探究1

高性能计算随想:DGX GH200官方技术探究1

高性能计算随想:DGX GH200官方技术探究1


高性能计算随想:DGX GH200官方技术探究1

                                              原创文章请转载注明出处 www.jifang369.com   欢迎您

相关热词搜索:站长联系方式18289282072

上一篇:机房100问:PCIe 5.0 x16 FHHL slot(s) PCIe 5.0 x16 AIOM slot(s) 有什么区别?
下一篇:高性能计算你知道:人工智能服务的机架风量要求?

合作伙伴
  友情链接