美洲

  • 雷竞技比分
MICHAEL库尼
高级编辑器

Cisco、Arista、HPE、Intel领先财团超大Ethernet实现AI基础设施

新闻分析
2023年7月20日 5分钟
思科系统 生成AI 微软

由Linux基金会支持的新Ethernet财团旨在增强Ethernet网络的规模、稳定性和可靠性,以满足AI高性能联网需求

改善网络简单化服务
信用度:HPE

AI工作量预期会给网络带来前所未有的性能和能力需求, 少数网络商联手提高今日以太网技术以处理AI要求的规模和速度

AMD阿里斯塔Broadcom、Cisco、Eviden、HPE、Intel、Meta和微软宣布UrtraEthernet财团

业界以太网50周年纪念今年以太网的特征是弹性适应性,可贵技术在支持AI基础设施方面无疑将起关键作用。传统网络互连无法提供所需性能、规模和带宽以跟上AI需求,

人工智能对网络要求高 因为它们既是数据又是计算强度工作量大到参数分布成千数处理器大型语言模型,如GPT-3、Chinchilla和PALM, 以及建议系统,如DLRM[深学习推荐]和DHEN[深层次编译网]接受多千多组GPU共享参数与计算中的其他处理器共享培训博客关于新财团计算交换周期中数据交换量如此之大以至于因网络差错而减速可严重影响AI应用性能

历史上唯一连接处理器核心和存储器的选项是互连性,如Infiniband、PCIExpress、Ethernet远程直接内存存存访问

Arista和UltraEthernet财团创始成员认为是时候重新考虑并替换RDMA限制Infiniband贸易协会几十年前定义的传统RDMA显示它老化时高要求AI/ML网络流量RDMA大流传输数据,这些大流可能导致不平衡和超载链路,Ullal写道

Ullal写道, “现在该从净板开始构建现代交通协议支持RDMA新应用了, Ullal写道 。UltraEthernet传输协议将整合Ethernet/IP的优缺点,同时处理AI网络应用规模、端点和流程并维护开放标准和多供应商互操作性目标

UEC写白纸将推进以太网规范以突出核心技术与能力包括:

  • 多路和包喷雾以确保AI工作流同时访问目的地
  • 弹性传送顺序以确保以太网链路最均衡命令只有在AI工作量要求带宽密集操作时才强制执行
  • 现代拥塞控制机制确保AI避免热点并均衡分布多路可设计成多路口包喷洒工作,可靠运输AI
  • 端对端遥测管理拥塞网络信息可通知参与者拥塞的地点和原因缩短拥塞信号路径并提供更多端点信息可提高拥塞控制响应性

UEC表示这将提高以太网网络的规模、稳定性和可靠性并增强安全性

UEC交通设计整合网络安全并加密认证AI培训或推理作业计算端点间发送的所有网络流量UEC开发运输协议, 利用验证核心技术高效会议管理、认证和保密,

工作增长后, 支持加密时必须避免会话状态向主机和网络接口加热UET服务新关键管理机制允许数万计算节点高效分享键UEC表示:「设计高效执行速度和尺度需要AI培训推理

以太网大修无关超以太网财团主席JMETZ声明以太网提高工作效率 并有特定性能需求从物理层到软件层, 寻找提高尺度效率和性能的最佳方法。”

增强AI连通技术的需要正开始出现雷竞技电脑网站Dell'Oro集团表示, 20%的以太网数据中心交换口 将连接到加速服务器 支持到2027年AI的工作量雷竞技电脑网站新建型AI应用的兴起将帮助数据库切换市场加速增长, 预测未来5年累计销量将超过1000亿美元, Dell'Oro副总裁Sameh Boujelbene表示,

雷竞技电脑网站650Group最近发布另一份报告表示AI/ML为网络提供大量的带宽性能需求,AI/ML是未来5年数据中心切换的主要增长驱动器之一。

以太网切换AI/ML加速计算800Gbps开关和光学传输记录一经产品大规模生产解决AI/ML问题,Alan Weckel创建者和技术分析师650Group表示。