掌握微软云sla的10个技巧

服务水平协议(sla)在云中可能会令人困惑

微软服务水平协议

2014年11月19日,德克萨斯州契约公司的IT部门开始报告,Microsoft Office 365基于云的电子邮件系统对其员工不可用。用户无法通过电话或通过Outlook获取电子邮件。由于某些用户的电子邮件回来的那一天,其他人没有。当美国工人签字时,国际员工开始报告类似的问题。对于某些用户,电子邮件已出现24小时。

停电后,IT领导人挤满了微软索赔,违反了公司的服务级别协议(SLA),保证办公室和其他Microsoft Online服务将获得给定月份的99.9%。如果该服务可用少于那种,则可以向客户发出25%的信用。但是,他们从微软获得的回复让他们感到惊讶:Web Access仍然可用,因此服务在技术上并不可用,因此它不是违反SLA。

“愿意、有能力、有足够知识使用这个选项的人很少,”IT部门的一名高级员工说,他要求匿名,以免破坏与微软的关系。作为回应,这家承包公司教育员工在Outlook宕机时如何使用网络邮件访问。

为了回应关于对情况发表评论的请求,Microsoft发出了一份声明,说明它争取“始终可用的服务”,并将SLAS到位,为该承诺提供财务保证。如果Microsoft Online服务不到95%的给定月,客户可以为此期间获得完整的陈述信用。

然而,这一集目的示出了需要了解云SLA中的所有条款和条件。企业协议可能很复杂,因此在查看Microsoft Office 365(SaaS提供)和Microsoft Azure(包括IAAS和PAAS组件)时,请注意为10件事要注意。许多提示也适用于其他云平台,例如AWS,但他们专门用于Microsoft云服务。请参阅Microsoft的Azure IAAS SLA正常运行时间保证列表在这里;可以找到在线服务SLA在这里

  1. 阅读了合同所有支持文件

这似乎是显而易见的,但许多人并不真正阅读合同,就像他们浏览最终用户许可协议一样。“我遇到过很多人,他们快速浏览完幻灯片,然后签了合同,”保罗·德格鲁特(Paul DeGroot)说,他是Pica Communications的顾问,为客户提供微软授权方面的咨询。分析合同内容后,如有不明白之处,应寻求帮助。理解SLA的关键是阅读它。

Paul Soltoot,Pica Communications的顾问

合同可能会令人困惑。Soltoot说有时相关信息是在支持文档中。SLA参数可以在文档的一个部分中概述,但合同可以受到其他文献中定义的术语。确保阅读整个合同,包括任何支持文件。

  1. 必须报告SLA泄露

有些供应商会在服务中断时自动给客户授信,而有些则不会。客户必须报告他们认为违反SLA的任何中断。DeGroot遇到过这样的情况:客户经历了多天的停电,并确信他们的账单将简单地反映出该事件,并计入信用额度。但如果你不记录和报告它,你就没有任何方法证明你经历过停机。如果您有问题,记录它,立即通知您的提供商,并就违反SLA提出索赔。

Microsoft要求客户在事件发生后的日历月结束时向客户支持提交SLABreac区索赔。(例如,如果事件发生在2月中旬,则客户直到3月底报告。)索赔必须包括:事件的详细说明;事件持续时间;受影响的用户或站点数量;您对纠正这种情况的尝试的描述。

  1. SLA具有99.9%的正常运行时间仍然允许每年停机8小时

许多微软的服务都有99.9%的正常运行时间担保(三九)。这听起来不错。但是,今年的99.9%仍然允许每年8小时和45分钟的停机时间,没有违反SLA。如果您有一天8小时不可用您的工作量,您会觉得如何?这个正常运行时间计算器可以帮助用户根据SLA正常运行时间保证,预测他们应该从提供商处获得多少停机时间。

  1. 每个服务都可以拥有自己的SLA

每个服务都可以拥有自己的SLA正常运行时间保证。例如,Microsoft Azure VMS具有99.95%的upTime保证(如果在两个可用性集中部署;更稍后的情况),SQL数据库有99.9%的正常运行时间保证。大多数Microsoft在线SaaS产品也有99.9%的正常运行时间保证。但99.9%的正常运行时间允许在一个月内发生最多43分钟的停机时间而不违反SLA。

+谈判混合云SLA时要考虑的内容+

作为特洛伊亨特,一个微软专家博客在这件作品中指出,那些停机事件不必同时为提供商的SLA完整发生。因此,例如,如果您有一个依赖于Azure VM的系统,则在一个月的第一天依赖于Azure VM,Azure VM可能会下降21分钟并将工作量降低。第二天Azure SQL可以再次进入42分钟并将申请表达下来。这两者仍将在SLA的条款范围内。有关此事的更多,Blogger Brent Stineman探索如何在这里计算跨多个服务的聚合sla

  1. 为了启用SLA,可能需要跨多个实例部署vm

云计算的一个咒语是故障准备。实际上,包括微软和AWS,包括Microsoft和AWS的一些云服务,使客户建立其制定的系统,以便未能满足SLA的条款。AWS,例如,要求跨多个可用性区域(在AWS云中的不同数据中心)部署虚拟机,并且VM的两个副本都必须不可用遭到破坏的SLA。雷竞技电脑网站Microsoft使用术语可用性集而不是可用区域,但这是相同的想法。客户必须注意最佳实践架构,以确保其系统符合SLA的条款。

  1. 迁移到健康的VM可能导致停机时间,可能不会违反SLA

要记住的一件事是,如果您将系统架构为容错并将故障转移到另一个VM或Availability Set,那么该操作本身可能会导致问题,例如重新启动。如果您的系统因为没有设置为处理迁移到新vm集而宕机,那么该故障不是提供商的错误,也不会被视为违反SLA。Netflix的Simian Army Chaos Monkey和Chaos Gorilla等工具可以帮助AWS客户测试他们的系统对宕机的容忍度。

  1. 该服务是否真的无法使用是你的供应商的错吗?

在上面这家德克萨斯公司的例子中,IT员工认为宕机是微软的错,事实的确如此。但该服务并不是真的不可用,因为网络访问仍然是一个选项,所以它不计入SLA。所以如果你的应用宕机了,这真的是你的供应商的错吗?是否所有接入点都无法提供服务?类似地,有时云服务宕机,但这不是供应商的错。该公司表示,如果微软的SLA被破坏,服务必须因为“在微软控制范围内的情况”而中断。当出现中断时,检查是否有什么原因导致了中断。例如,你到云的网络连接好吗?客户必须证明他们的供应商是错误的,并且服务确实宕机了,以便为SLA违反获得赔偿。确定您的提供商是否已中断的一个有用工具是服务运行状况指示板,微软和AWS会在其中报告哪些服务不可用。

  1. 服务条款可以改变

云是一种快速移动的行业,提供商的产品可以改变。当产品发生变化时,SLA也可以。通常,SLA将概述提供商是否必须通知客户对服务或SLA的更改,或者如果客户应准备用于服务中断。但是,它可以因提供商和服务而异,以便为客户提供更改的客户。如果对服务的突然变化会影响您的工作量,请检查以确保您的提供商会通知您此类更改。

+让你的云SLA无懈可击的5个技巧+

微软将向客户通知客户对其核心产品的“中断变化”,Notes Donald Restallack,Microsoft关于微软的指示,咨询公司的指示。Microsoft将“中断更改”定义为:“更改,客户或管理员需要采取行动,以避免对在线服务的正常运行进行重大劣化。”例如,Microsoft承诺在其动态CRM平台上提前六个月通知客户。但如果没有微软通知客户,则可能会发生其他非中断更改。

  1. 计划的停机时间并不总是计算在SLA中

服务是一个意想不到的原因的服务是一件事,但有时云可以下降,因为服务提供商将其取下。例如,verizon几乎48小时计划停机今年早些时候。像这样的中断意味着服务掉了下来,但它不计入SLA。客户可以要求他们的提供商确保他们将被告知任何计划的停机时间。

  1. “预览”或Beta服务可能不会带有SLA

许多供应商提供免费的服务层或其他处于预览阶段的产品。通常,这些免费和预览服务不在sla的覆盖范围内。所以,您可以随意使用它们,但在依赖它们实现关键功能之前,请确保您了解术语和使用它们的风险。

加入网络世界社区有个足球雷竞技appFacebook.LinkedIn评论是最重要的主题。

版权©2015Raybet2

IT薪水调查:结果在