“我们是来给你打气的。”I can't help but think about the old Saturday Night Live routines with bodybuilders汉斯和弗朗茨看看今天的云数据中心。雷竞技电脑网站他们是大。他们都变大了。事实上,他们已经被打足了气。但它们到底有多强大呢?就像我们会问的那样:它们能伸缩吗?他们能执行吗?或者它们是少女男人的云?
这些是很难回答的问题。
了解数据中心的容量几乎是不可能的。雷竞技电脑网站技术规格很简单——如此多的服务器,如此多的cpu,如此多的千兆赫,如此多的网络连接,如此多的存储I/O带宽。这些规范很简单,但也没有意义,因为它们没有实际度量整个堆栈的端到端性能。
上周,我参观了菲尼克斯地区一家大型电信公司的数据中心,并与一位工程师讨论雷竞技电脑网站了容量问题。数据中心的一小部分被指定用于电信公司自己雷竞技电脑网站的基于VMware的多租户托管云服务。该设施的其余部分包括数百(数千个?)个客户租用的搭配架和笼子,其中一些还用于托管面向云的服务。
“您的云中可以托管多少虚拟机?”I asked. The engineer said he didn't know. The operations team monitors both virtual and real CPU and I/O utilization statistics, he said, and when they go above predetermined thresholds, they reallocate the load or add more resources.
工程师没有好的答案我烦人的问题数据中心的云计算能力,性能瓶颈在哪里,他们怎么知道托管公司可以提供多少服务,如何优化云的硬件和软件栈最大的可伸缩性,雷竞技电脑网站多少产能过剩在架未来的增长。他唯一确信的容量数字是服务器总数、cpu数量、存储总量pb和网络带宽(他不愿告诉我这些数字)。
这对我来说很可怕,尤其是因为我以前也听到过同样的不回答。电信公司、云服务提供商甚至企业都要花费数千万美元建设云数据中心——有时用于内部使用,有时出租给客户托管。雷竞技电脑网站据我所知,他们不知道一个特定的云可以承载多少负载,也不知道在什么负载级别上云的性能会开始下降。无论云服务是由一个齿轮架提供的还是由几十个齿轮架提供的,他们都没有真正的知识,对自己的容量估计也没有信心。
部分问题是,这真的很难弄清楚。规范表不会告诉您,虚拟机管理程序控制面板也不会告诉您。如果是大型云设备,则其容量大小是基于餐巾或Excel中得出的最佳猜测,可能是基于对单个计算机的工作负载的推断。云根本不是这样伸缩的,特别是当你把硬件、软件和基础设施的多层考虑在内的时候。添加由软件定义网络(SDN)提供的动态架构,以及由网络功能虚拟化(NFV)定义的基于软件的防火墙和负载平衡器。结果呢?没有人知道。
如果没有人知道,那么每个人都在猜测——然后观察实时操作屏幕来实时管理容量,希望管理员能够看到性能下降,并在出现中断、数据包丢失和应用程序响应时间降至可接受水平之前有足够的时间做出反应。即使在这种情况下,回应也必须很快——几分钟或几小时,甚至几天。这并不适合长期的容量规划(周、月、季度),因此答案是有大量的备用容量准备在短时间内投入云中。
几个月前互操作,我与来自中国的高管们聊天思博伦则通信是一家网络测试和测量供应商。我解释了我的担忧:虽然有很多负载测试产品(包括它们的)用于测试单个数据中心组件和小型数据中心(比如一个机架),但没有任何商业产品可以对整个云进行压力测试。雷竞技电脑网站他们告诉我,“等着瞧吧。”
我等待着,在9月初,斯皮伦特预先向我介绍了他们宣布的消息”超大型测试解决方案,“一个为运行的非常非常大的虚拟化云数据中心而设计的负载测试系统雷竞技电脑网站vSphere / vCenter或OpenStack。有多大?Spirent说,HyperScale的设计目的是通过自动设计、配置和部署多达一百万台虚拟机来填充和测试云。
每个测试vm都被设计为消耗实际数量的CPU、存储以及LAN和WAN I/O带宽。我们的目标是查看云数据中心在不同负载级别上的性能,以及当负载增加时雷竞技电脑网站,它在哪些地方会变慢或中断。
现在,这些都是“破坏性”测试,这意味着您只能在离线云数据中心上运行它们;雷竞技电脑网站很明显,如果你想让云崩溃,你就不可能有实时或客户流量。不过,我认为HyperScale是一种突破,因为云计算运营商可以在云构建时真正地对其进行负载测试,并对实际的、可测量的、真实的容量有确定性。
之后,当运营商监控生产中的云系统时,他们就可以准确地知道它的性能下降点在哪里,并且可以根据对端到端系统的断点在哪里的真实了解做出决策,而不是从单个服务器或小集群推断出的预测。它还可以帮助管理员更实际地预测云计算何时达到极限,这样管理人员就可以决定何时(以及如何)扩展云计算,或者选择停止添加新服务。
了解云可以扩展到多大,以及它在像Hans和Franz这样的沉重负载下的表现如何,确实是一个很难的问题。我很高兴Spirent显然已经找到了答案。