我们最初的样子在英特尔的架构日集中在新的Xeon处理器和IPU处理器。现在,我们将进入细节,以及看看其他即将到来的技术。
蓝宝石急流
英特尔即将推出的下一代Xeon处理器代号为蓝宝石急流,并承诺一个全新的设计和性能提升。它的一个关键区别是其模块化的SoC设计。该芯片具有出现在系统的整体CPU和所有的瓷砖的相互沟通,让每个线程都有完全访问所有资源在所有瓷砖的多个区块。
在某种程度上,这类似于其EPYC处理器小芯片设计AMD用途。通过打破单片成较小的碎片很容易制造。
除了更快/更广泛的内核和互连,蓝宝石急流有一个叫做末级高速缓存(LLC),具有高达100MB的可在所有核心共享缓存,拥有多达四个内存控制器和DDR5八个内存通道的新功能存储器,次世代Optane持久存储器,和/或高带宽存储器(HBM)。
蓝宝石急流还提供英特尔超路径互连2.0(UPI),用于多插座通信的CPU互连。UPI 2.0设有每个处理器4条UPI链路与16GT / s的吞吐量和支持多达八个插槽。
随着蓝宝石急流这么多新的,高性能的技术,它应该打击当前一代出来的水。蓝宝石急流一代至强处理器的可扩展是由于明年年初到来。
老桥:莫尔托贝内
英特尔决心进入GPU业务,而不是让NVIDIA的统治地位阻止它。氙架构后,其第三次尝试灾难性的Larrabee和至强融核,并在纸上,这样一个看起来有机会的。
像Nvidia和AMD,英特尔正在为不同的市场多GPU。一个是PC客户端和游戏玩家旨在正视。另一个是老桥,基于氙GPU为HPC和AI工作负载而优化。
老桥是一个疯狂复杂的硅片,也许是英特尔有史以来最大规模的。老桥处理器拥有超过100个十亿个晶体管(据报道,新的Xeon可扩展拥有300万美元)和使用五种不同的工艺节点和多个代工厂,使所谓的专业瓷砖。
总而言之,Ponte Vecchio SoC有47个活动瓷砖,包括:Compute,一个名为Rambo,HBM,XE链路和称为EMIB块的专用高速互连的HPC面向专用缓存。它使用称为Foveros和专用多瓦包的3D包装架构。有趣的是,一些瓷砖是由tsmc制造的,而其他瓷砖是由英特尔制作的。
这是第一次,英特尔透露初始性能数据。它声称老桥硅载体吞吐量FP32 45 TFLOP,这对于训练AI,大于5TBps存储器织物带宽是至关重要的,并且比2TBps连通更大。相比之下,NVIDIA的新安培架构19.5 TFLOPs的报价峰值FP32性能。
像Nvidia的CEO黄仁勋看起来戳熊一旦过于频繁。
像蓝宝石急流,老桥将在明年发布。