如果你的桌面上有一台配备了Volta GPU的高性能Nvidia DGX-1超级计算机,你就不需要购买400台服务器。
DGX-1超级计算机——看起来像一个普通的机架服务器——的大部分计算能力来自8个特斯拉V100 gpu。
该GPU是第一款基于全新的Volta架构的GPU,于周三在加州圣何塞举行的该公司GPU技术大会上发布。
英伟达首席执行官黄仁勋(Jen-Hsun Huang)在一次主题演讲中表示:“它从盒子里出来,插上电源,然后就可以工作了。”
但配备特斯拉V100电脑的DGX-1价格不菲。它价值14.9万美元,相当于一些人一生的积蓄。但黄鼓励人们订购,他说箱子将在第三季度发货。
新的超级计算机40,960个CUDA核心,这Nvidia公司表示,等于800个的CPU的计算能力。它取代了前一DGX-1基于当前帕斯卡架构,其具有250双路服务器的功率,根据NVIDIA。
Nvidia说,该系统提供了约960万亿次浮点运算的半精度(16位浮点)性能,这意味着较低的单精度和双精度性能。这些数字无法获得,但是半精度的性能对于机器学习任务来说是有价值的。
伴随着GPU是两个20核Intel Xeon E5-2698 V4S为2.2GHz的时钟速度运行。该系统有四个1.92TB的SSD,运行在Ubuntu Linux操作系统。
这个系统耗电3200瓦,所以不要让它整天开着,否则会增加你的电费。
游戏玩家不应该对这台机器感到兴奋。拥有特斯拉V100的DGX-1可能太贵了,不足以成为一个大型游戏平台;相反,它更多地是为机器学习而设计的。
GPU的功耗已经机器学习在数据中心的任务,和NVIDIA的超级计算机是GPU是如何使像图像雷竞技电脑网站识别和自然语言处理现实应用的一个例子。
黄说,cpu没有提供足够的计算能力,尤其是在GPU适合的人工智能领域。
黄说,DGX-1中的特斯拉V100比目前的Pascal架构快5倍。它将拥有像NVLink 2.0这样的新技术,一种带宽高达300Gbps(比特/秒)的新型互联网络。GPU拥有超过210亿个晶体管和5120个核。它还具有每秒900GBps(字节)的HBM2内存带宽。
Nvidia还包括一个类似立方体的张量核,它将与常规的处理核一起工作,以改进深度学习。英伟达专注于构建核心,以加速矩阵乘法,这是有效的深度学习系统的核心。该结构将有助于调整低级浮点计算,这将加速深度学习。
黄夸耀说,该GPU能提供每秒120万亿次的深度学习性能,尽管这很难验证。标准的基准测试工具并不存在于机器或深度学习应用程序中,尽管像谷歌这样的公司正在进行开发。
超级计算机与许多高性能计算和深度学习框架(如CUDA、Tensor和咖啡因2)一起工作。
该公司还推出了DGX工作站,这是新DGX-1的一个较小版本。它看起来更像一个工作站,有四个特斯拉V100 gpu,是DGX-1的一半。它的售价为6.9万美元,将于第三季度发货。
英伟达没有立即透露这些产品是否将销往全球。