软件漏洞使Windows在超级计算速度上超越Linux的努力脱轨

Windows或Linux ?东京高性能计算主管让用户决定

几天前,我们告诉你微软的令人惊讶的报价加入千兆计算时代。Windows HPC Server,似乎能够在日本最大的超级计算机上达到千万亿次浮点运算的速度,但这一成就没有被两年一次的500强榜单认可,因为Linux在同一台机器上表现得更好。

我们当时只知道东京工业大学的HPC集群Tsubame 2.0在Windows和Linux上测试了机器的速度,Linux领先,因为Linux运行在稍微多一点的节点上。

微软突破了千万亿次的障碍,把500强的位置让给了Linux

25年后的Windows:一个可视化的历史

一位读者在博客上评论道,东京官员“没有足够的许可证在那么多人身上运行(Windows)”。

但事实证明,一个软件漏洞使Windows HPC服务器无法与Linux的速度和跨更多节点运行的能力相匹配。这个bug并不存在于Windows HPC服务器本身,而是存在于微软设计用于运行500强基准测试的软件包中。

东京工业大学(Tokyo Institute of Technology)教授Satoshi Matsuoka今天在新奥尔良举行的SC10超级计算会议上向我解释了这一点,他说Linux的胜利“纯属偶然”。

这是发生了什么事。为了向500强超级计算机列表提交分数,集群操作员必须运行Linpack Benchmark,这是一个旨在测试极端条件下集群速度的软件库。

松冈说,这就像驾驶一辆法拉利(Ferrari),“在四个小时里全速前进”。

由于Tsubame同时使用英特尔cpu和Nvidia图形处理单元,东京官员需要运行高性能Linpack基准的自定义实现,以充分利用系统的异构性。东京的计算机科学家们自己编写了Linux运行的代码,而Windows运行则使用了微软员工编写的Linpack代码。

虽然完整的Linpack运行需要几个小时,但Tsubame的创建者实际上花了一周多的时间来准备和执行测试。该策略是从小型测试开始,然后逐步增加,在测试过程中识别导致性能下降的问题。

“事实上,这是一项巨大的努力,”松冈说。“事情分解。这个系统承受着巨大的压力。这种压力是这台机器在实际生产中永远不会遇到的。”

最终,Linux运行在1357个节点上,达到了每秒1.192次(一千万亿次浮点运算等于每秒一千万亿次计算)。这种速度使Tsubame获得了世界上第四快超级计算机的称号。

据Matsuoka说,Windows在小的工作负载下的表现要优于Linux,最终在略低于1300个节点上达到了1.118千万亿次浮点运算。但是,当尝试跨1360个节点运行Windows时,为Windows运行设计的Linpack软件由于内存初始化错误而失败。

微软已经修复了这个漏洞,但这足以让Windows击败Linux的努力失败。

“Windows代码中有一个小错误,基本上让它们无法完成最后的运行,”Matsuoka说。我们没有时间了。我们不得不使用他们第二好的数字,结果比Linux略低。”

他说,如果没有软件漏洞,Windows是否能打败Linux是“一个淹没在历史中的谜,因为他们在最后一刻失败了”。

Matsuoka感兴趣的是为什么Windows能够在运行较小的问题上胜过Linux。由于这两次运行的硬件是相同的,所以它必须归结为操作系统或自定义Linpack软件包之间的差异。

松冈说:“我们还没有时间做对比。”“我们可能会这样做,并发表一篇论文。”

Tsubame是一款非常节能的通用超级计算机,在学术和工业研究领域约有2000名用户。由于Tsubame使用KVM管理程序和各种类似云的配置工具,因此它可以在不同的节点上同时运行Windows和Linux,并为用户提供各种类型的处理配置。

松冈说:“我们非常灵活。“我们可以将某些节点子集从Linux切换到Windows,反之亦然。”同时运行两个操作系统是可能的,“因为我们在一些节点上运行虚拟机”。

自然,松冈的用户群对Linux的需求要多于Windows。他说,这台机器80%多一点的时间用于Linux,特别是Novell SUSE Linux 11,不到20%的时间用于Windows。

“当然,我们得到了更多的Linux需求,”松冈说。“但我们也有对Windows的需求。因为我们可以做动态配置,所以我们会根据需求和负载相应地调整Linux和Windows的大小。”

谈到Windows/Linux的灵活性时,他补充道:“这可能是第一次在如此大规模的情况下实现这一点。”

尽管超级计算领域的大多数人可能会嘲笑Windows,因为Windows在前500个高性能计算集群中只占5个,Matsuoka说,在性能上似乎没有什么差别。值得注意的是,微软已经资助了东京工业大学的超级计算项目。

Matsuoka说:“我非常好奇,想看看哪一个在Linpack算法和底层操作系统方面都更优秀。”“这非常令人惊讶,因为它们在性能上非常相似。”

在推特上关注Jon Brodkin

加入网络世界社区有个足球雷竞技app脸谱网LinkedIn对自己最关心的话题发表评论。

版权所有©2010 IDG ComRaybet2munications, Inc.

SD-WAN买家指南:向供应商(和您自己)提出的关键问题