GPU市场领袖Nvidia每年在全球举办数次GPU技术会议似乎每个秀都有一些大公告 公司推向GPU计算极限 并创造更多客户选项举个例子GTC圣何塞公司宣布NVSwitch架构, 将最多16GPU连接到单织物上, 产生大规模虚拟GPUGTC台本周公告HGX-2服务器平台,GTC圣何塞宣布DGX-2服务器建基于HGX-2架构
有个足球雷竞技appMarc Ferranti出色地报道了公告细节本文章包括服务器伙伴使用参考架构构建自己的产品深入了解HGX-2的重要性和它带来的益处
HGX-2从NVSwitch获取马力
Ferranti表示HGX-2利用NVSwitch互连织物NVSwitch对GPU计算来说是一大跃进,没有它NVSwitch无法实现Nvidia获取速度PCI总线速度最快,太慢无法向多GPU提供消息通过创建单虚拟GPU,HGX-2提供2petaflops单服务器
服务器伙伴使用HGX-2基础平台设计有弹性
雷竞技电脑网站并使用AI和HPC结构从数据中心到数据中心不等HGX-2基础构件使服务器生态系统伙伴能搭建全服务器平台,满足客户独有需求举例说,一些超尺度客户偏爱服务器后端有PCIe和联网电缆,而一些人偏爱前端电缆。服务器电源如何通过电流总线实现机架或使用每个服务器的单电源Nvidia正采取的方法让它做它最能做的, 提供GPU子系统市场领先性能同时允许服务器制造厂家关注系统级设计、电源、冷却和机械这会加速创新并开发新系统满足A.I.不断变化的需求机器学习行业
下图显示Nvidia服务器结构高性能AI和HPC工作量
使用此设计, CPU主机节点和GPU服务器平台使用PCIe电缆连接允许GPU和CPU以不同速度操作并按自身速度刷新分类架构允许CPUs和GPUs独立升级值得注意的另一个好处是四种PCIex16连接为持续向GPUs提供宽频量多位数据科学家告诉我 机器学习和人工智能的最大问题无法快速向GPUs提供持续工作
HGX-2对HPC工作最终弹性有用
HGX-2的另一个趣味元素是它可用于HPC工作量和A.I平台配有FP64和FP32(计算精度度)科学计算、建模和模拟,同时支持FP16和INT8用于A.I训练推理通常,这需要多平台投资,驱动成本穿透楼顶单平台同时操作能力意味着更大的弹性和较低的成本启动A.I.主动性
Nvidia目前对行业有大头启动
Ferranti表示Nvidia市场领先注定会面临越来越多的完成并提到Intel和Xylinx为可能的竞争者逻辑上说 Nvidia会看到更多竞争 并可能发生, 但它不太可能来自它现有的竞争者是什么使得Nvidia今天的独特性不是它GPUs网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际网际其余GPU制造商没有一个生态库 甚至接近Nvidia人民对Intel也有同样的想法 PC产业蓬勃发展 并花了几十年后Nvidia有相似的十年历程 对A.I同样重要Intel计算