达顿(Dammions Darden)出任德克萨斯州加兰市(Garland)的新高级系统管理员后,他知道,这个位于达拉斯之外、拥有23.4万人口的城市的50至60台物理主机的运行效率并没有达到应有的水平。有些产能过剩,有些过热。
传统上,如果应用程序很慢,虚拟机需要更多的内存,但简单的答案是一个不幸的一个:在问题上抛出更多硬件。但杜德对此并不满意。在两年前在VMWorld漫游世博会楼,他偶然发现了VMTurbo是一家专门分析虚拟环境的公司。
使用vmturbo进入洞察虚拟领域中发生的事情,花环市发现它可以大大棘上某些机器上的VM负载,在某些服务器上从20到25 vms到40到45。该整合释放了可用于支持其他举措的主持人。例如,这座城市正在考虑虚拟桌面环境,但担心硬件成本,突然Darden有服务器托管部署。
Darden说,只需保留硬件即可更容易加入硬件,但有更好的方法。
IDC企业平台集团总经理Matt Eastwood同意。他估计典型的企业服务器今天运行10到12台虚拟机,大约为30%到40%容量。最佳服务器利用率通常约为60%至70%,这意味着许多服务器可以轻松处理VM负载两倍。随着VMS的爆炸,IDC预测未来四年增加130%的VM数量 - 有些商店将购买更多硬件以增加容量。但专家表示,智能组织将首先优化其现有环境。
这是一个人的问题
组织首先如何最终少于最佳系统?“导致服务器,系统管理和云管理效率低下的事情通常与手动,断开连接和碎片化的流程相比,这是一个专门从事管理软件的IDC分析师Mary Johnston Turner说。“改善IT运营的真实方法是采用更集成,标准化和自动化的管理流程,涵盖所提供的服务的生命周期。”
这样做并不容易。Johnson说,从一个资源被请求和临时交付的环境,到拥有一个完全自动化和自助服务的系统,用户可以请求和消费他们需要的东西,这是一个转型的转变。这可能需要花费大量的时间和精力来建立它,但其回报将伴随着更良好的运行。
她说,将服务器生命周期环境自动化可以节省10%到15%的硬成本和软成本——这意味着节省了实际的美元和时间。提高服务器利用率很好,但是如果业务单元需要数周才能访问它所请求的VM,那么服务器的运行效率如何就无关紧要了。
提高IT操作 - 通过更自动化的服务管理,或者使用软件工具为您的硬件降压获得更多爆炸 - 是每个虚拟机管理员的目标。问题正在发现时间。“人们知道他们需要做些什么,”VMware用户组的IT架构教练和董事会成员Brian Kirsch说。“但优先级是保持灯光。今天的首要任务是让所有东西都遍历和运行。“
你不能优化你看不到的东西
Johnston说,使用管理工具来构建私有云,或者使用像Chef、Puppet和Ansible这样的配置工具来自动化VM配置,有助于节省时间,专注于提高效率。但另一个关键是要清楚地看到里面到底发生了什么。咨询公司The Virtualization Practice的容量管理分析师贝恩德•哈尔佐格(Bernd Harzog)表示:“(效率低的)唯一最大原因是,缺乏能够轻松做出更激进决策的信息。”虚拟化管理人员通常对其环境没有足够的信息和可见性,因此担心过度配置服务器并降低性能。
整个新的供应商细分会发芽以帮助解决这个问题。vmturbo,在花环中使用的darden是一种选择。Darden安装了软件,几小时内建议改进。初始安装后两年后,Darden仍然每天使用它来监控他的操作,运行报告和自动修复。
Cirba另一家公司专注于这个问题,但采用效率指数采用效率指数来评估工作负载并展示可以进行改进。CTO和联合创始人安德鲁希尔埃斯表示,其系统中的完美指数评级为1.0,它很常见,发现在.5到.7时找到运行的环境。
为什么?“工作负荷适合的方式通常看起来像一个非常糟糕的俄罗斯州的游戏,”Hillier说。“VMware或其他虚拟化工具中的任何内容都会查看工作负载如何一起工作或尝试弄清楚如何最佳地平衡它们。”
但是,他指出,最佳利用率会因工作负载而异。对于某些工作负载,您希望保持保守,因此1.0级别意味着利用率远低于要求较低的情况。
另一个优化问题是VM蔓延,其中有更多的VM提供的VM,而不是必需的。容量管理工具也可以帮助解决这个问题。The Virtualization Practice的Harzog说,评估工具时要注意的一个关键问题是,确保它们可以被配置为在环境中自动做出更改,而不是仅仅提醒您应该做出的更改。VMTurbo和Cirba都做到了这一点。
虽然许多服务器利用工具主要用于Compute Resources,但是启动Cloudphysics的联合创始人John Blumenthal表示,看看整个IT环境非常重要。他的公司产品是一个基于云的SaaS服务,分析了从CPU到内存,网络和存储的所有内容的用法。
John Blumenthal,Cloudphysics的联合创始人
他说,效率低下的最大原因是他所说的“千刀万剐”。添加另一个服务器对环境有什么影响?为什么系统响应时间变慢?这种变化将如何影响更广泛的环境?“问题的本质是阴险的,”他说。“不是一个巨大的恶魔盯着你的脸。这是指无法看到行动的后果,无法找出正确的行动路线。”CloudPhysics表示,许多客户在最初部署该工具时,发现最多可释放3.5 tb的存储空间。
达到峰值效率可能意味着将工作负载溢出到公共云资源,由AutoTrader.com等公司审查的替代方案。
到云端
其开发区域中的一些Autotrader的200个ESX主机运行多达140个VM;生产主持人越来越少。但像许多组织一样,AutoTrader.com正在探索如何使用公共云资源来补充其内部主机的内容。
Chris Nakagaki是云基础设施团队的高级系统工程师,他喜欢这样的想法,即能够将工作负载迁移到VMware的vCloud Air公共云,并且能够在需要时跨多个VMware公共云合作伙伴供应商进行联合。但是,转移到公共云也有自己的一套效率挑战;公共云可能是一个复杂的地方。
像亚马逊网络服务、微软Azure和谷歌云平台这样的供应商有几十种类型的虚拟机可供选择,资源会动态变化,并按分钟或小时付费。例如,如果在不再需要资源时关闭资源,那么可以大大节省资源。
高德纳(Gartner)分析师Leong说,一旦用户达到某一阈值公共云,值得探索管理云使用和优化支出的工具,注意到这个门槛会因公司规模的不同而不同。Cloudyn和Cloud Cruiser各自都有工具,可以帮助组织确定在Amazon Web Service的云计算中何时使用按需与保留实例定价,以及对工作负载合适的VM实例大小。像Cloud Cruiser这样的工具将监视混合环境,并建议何时在私有云中运行工作负载,而不是使用公共云中。Cloudyn表示,它可以通过优化使用,帮助花费1万美元的AWS客户收回其公共云支出的三分之一。
这些工具类似于来自Cirba和VMTURBO的前提。Harzog估计,任何管理超过50名VM的客户都可能使用那些占据三分之一的效率。