2021年10大中断

Cisco-owned网络情报公司ThousandEyes揭示了2021年的十大中断。

  • 在Facebook上分享
  • 在Twitter上分享
  • 分享在LinkedIn
  • 在Reddit分享
  • 通过电子邮件分享
  • 印刷资源
红旗警告按钮(警报/危险灾难)
Matejmo /盖蒂图片社

2021年的最大中断一个共同点:他们影响重大基础设施或服务提供者,因此,大量的企业和最终用户的影响。的教训吗?公司需要小心他们基础设施的把所有鸡蛋放在一个篮子里,或者,如果他们必须准备停机,如果特定服务下降。

“需要有一个计划,”安吉丽麦地那说ThousandEyes产品营销主管,一个Cisco-owned网络智能公司跟踪互联网和云流量。“组织不需要的摆布”任何一个特定服务的可用性。

去年的两个最大中断包括云提供商AWS和Azure。两个涉及互联网服务提供商Verizon和Azure。四个中断CDN和DNS提供商Akamai, Cloudflare、快速。和排ThousandEyes”名单的2021年10大停机两个Facebook中断。

Facebook的中断不只是把社交媒体网络和其他公司服务Instagram和WhatsApp。许多企业使用Facebook对用户进行身份验证。当服务下降,用户不再能够登录到这些企业的网站。

“认证,像DNS,常常被忽视,当人们考虑可用性,”梅迪纳告诉网络世界。有个足球雷竞技app(阅读更多关于美国和全世界中断每周网络健康检查。)

另一个被忽视的网络问题,出现在今年中断顶部边界网关协议路由。边界网关协议——这代表边界网关协议——告诉互联网流量的路线。即使DNS列表指向正确的目的地,如果路由信息是不正确的,那么交通可以转移到终端路由或路由,没有足够的能力来处理所有的流量。

“东方劫持可以非常非常可怕,”梅迪纳表示。“它可以是一个非常具有挑战性的事情会控制和非常严重的影响。”

中断顶部的列表:

1。Facebook: 10月4日

最大的停机2021年10月Facebook停机。“这是一个艰难的约7个小时,”梅迪纳表示。“七个小时是非常重要的。”

停电影响了Facebook的所有服务,包括Instagram, WhatsApp和眼睛,以及所有的企业,使用Facebook的身份验证机制。

日常维护工作出错,系统服务器和边界网关协议线路受到影响。更糟的是,Facebook不仅面向公众服务下降,而且员工使用的工具来管理这些服务。因此,员工必须身体进入数据中心手动重启系统。雷竞技电脑网站

根据Facebook的基础设施副总裁桑托什Janardhan,命令是不小心发出了骨干网络的所有连接,断开所有Facebook的数据中心。雷竞技电脑网站

“我们的系统被设计用来审计这些命令来防止这样的错误,但是错误的审计工具阻止该公司正常停止命令,“Janardhan在一份报告中说第二天公布。

错了系统响应的DNS查询。因为Facebook的DNS服务器无法连接到数据中心,他们自动禁用相关边界网关协议的广告,所以这些DNS服务器变得不可到雷竞技电脑网站达的,尽管他们自己仍是启动和运行。

“这一切发生得很快。和我们的工程师致力于找出发生了什么和为什么他们面临两大障碍:“Janardhan写道。“首先,这是不可能的访问我们的数据中心通过我们正常的手段,因为他们的网络,第二,DN雷竞技电脑网站S的总损失了许多的内部工具我们通常使用调查和解决这样的中断。”

教训,麦地那,企业需要保持他们的管理系统孤立的从他们的生产环境。

”,还要考虑多元化的提供你的服务,”她补充道。“不一定只是依靠自己的内部服务,但可能考虑外部提供者或多个外部提供者。”

2。AWS: 12月7日

AWS是世界上最大的云计算服务提供商,其服务下降时,数以百万计的企业可以受到影响。

停机12月7日,持续了一个多小时影响亚马逊的服务,以及消费设备Roomba和环和流媒体服务,如迪斯尼+和Netflix,因为AWS EC2 api US-EAST-1地区的问题。

突出显示的故障需要企业监控的健康的所有api的一部分,他们的应用程序和服务交付,客户体验,构建和部署和公司的能力,高级技术销售工程师Chris Villemez说旧金山ThousandEyes。

让问题更加复杂的是,企业客户没看到任何信息在AWS状态页面一个多小时。

“这是从来没有一个仅仅依靠一个提供者的信息,”梅迪纳表示。“有更多的一个独立的实时视图将给你更多的洞察力。”

3所示。快速:6月8日

是一个较小的内容分发网络。根据Enlyft相比,该公司有4%的市场份额,为Amazon CloudFront CloudFlare为39%和24%。

不过,100000多家公司使用其服务,包括Reddit和纽约时报。即使亚马逊和eBay使用一些快速的服务和快速影响6月停机。

但客户已经大大不同故障的经验,根据他们的程度依赖于快速服务和他们如何反应中断。

例如,Reddit完全下降,保持了整个宕机,持续了将近一个小时,据报告ThousandEyes

但是,纽约时报能够减少停机时间发送用户直接到其网站服务器,托管在谷歌的云平台。它仍然需要时间修复,更新DNS记录传播和时间。

“根据你的DNS记录有多长寿,可以影响你的速度有多快能够帮助你的用户,”梅迪纳表示。

亚马逊使用多个内容分发网络,包括自己的Cloudfront CDN和Akamai。急剧下降的时候,可以请求重新路由到其他组合,显著减少停机的影响。

同样,快速eBay使用只有一些内容,特别是web页面上的单个对象。公司使用Akamai提供web页面本身。在停机过程中,eBay能够将请求重定向快速离开,最终能够进一步减少停机的影响。

4所示。Akamai边缘DNS: 7月22日

Akamai是一个全球性的内容分发网络,类似于在用户数量和市场份额。快速的中断,公司使用多个cdn看到更少的停机的影响。

在这种特殊的情况下停机,Akamai DNS服务,指导用户Akamai的CDN网络,走了一个多小时。据该公司软件配置更新引发了他们的安全优势内容分发网络的错误影响,网络域名服务系统。

很多大网站受到影响,包括蒸汽、美国航空公司、福克斯新闻(Fox News)和汇丰银行(HSBC)。亚马逊,它使用多个发布商,能够重新路由流量和用户免受任何影响。

5。Akamai Prolexic路由:6月16日

7月停机并不是唯一去年Akamai的主要故障。今年6月,该公司看到一个崩溃的DDOS缓解服务,Prolexic路由,因为一个问题和边界网关协议路由。

一些客户网站无法访问不同的大量的时间,根据ThousandEyes。但很快删除的行动路线,Prolexic最小化影响其客户,和客户是免费的恢复边界网关协议公告通过其他供应商来绕过这个问题。“一旦行动,迅速恢复了连接到他们的网站上的客户是那些冗余进程已经到位。”

“组织不需要怜悯的任何一个特定服务的可用性,”梅迪纳表示。

根据Akamai,大约有500的客户使用这个DDOS减灾服务。许多人自动路由,在几分钟内恢复操作。其余大多是手动改航不久。宕机是因为不小心超过路由表。

6。Verizon: 1月26日

Verizon的停机是2021年的第一次重大故障,用户从华盛顿特区到波士顿。“很多人可能不记得,但这非常重要,”梅迪纳表示。

成千上万的客户是没有服务作为Verizon的FIOS网络下降,包括公司和员工在家工作。

据Verizon,中断是由于“软件问题”引发了在常规网络管理活动,并减少纤维线在布鲁克林无关,发生在同一时间。

7所示。康卡斯特:11月9日

互联网服务提供商的另一个主要的故障发生在11月,当康卡斯特的网络骨干在旧金山地区下降了近两个小时,然后紧接着更广泛的停机持续了一个多小时在美国多个城市,包括芝加哥和费城和伸展到新泽西和南卡罗来纳。

成千上万的家庭和商业用户康卡斯特的网络这个公司也受到影响。“显然有一些内部的路由问题,”梅迪纳表示。

与康卡斯特和Verizon中断,教训是,公司需要备份连接计划,不仅对自己的服务,但也为他们的员工和其他关键用户。

8。Cloudflare魔法交通:5月3日

5月Cloudflare断电停机的另一个例子是由于服务,是专门设计用于保护公司免受中断。像亚马逊的Prolexic Cloudflare的魔法交通服务是为了帮助保护客户针对DDOS攻击的路由流量通过他们的网络,检查它,擦它,发送它到它应该去的地方。

这个特殊的停机影响Cloudflare全球基础设施,与问题发生不同程度大约两个小时。

“有一些顾客非常能够迅速回应,“麦地那说。这些客户了,有问题的边界网关协议路由和快速宣传新的路线,她说。“早期的意识发生了什么以及冗余-即使中断正在进行的减少影响你。”

9。Azure广告:12月15日

最近2021年的主要故障是12月的Active Directory停机。Azure的广告服务走一个半小时在12月中旬,防止用户签署到微软Office 365等服务。

一些企业还使用服务进行身份验证自己的系统和服务,麦地那说。

”所以即使应用程序本身可能是可用的,用户无法登录,”她说。“身份验证是一个依赖性,有时被忽视,当你考虑可用性。”

10。Facebook: 4月8日

最后,再次排在列表是Facebook, 4月停机,持续了大约40分钟。

“非常有趣的关于这个特定的事件真的是突出显示Facebook如何使用DNS路由用户服务,”梅迪纳表示。

在这个故障,太多的用户路由到一个数据中心,造成网络拥塞。雷竞技电脑网站

“花了一些时间他们正常路由在CDN边缘,”她说。

知道你的数字供应链

外卖从所有这些中断的关键是,企业需要注意的所有组件和依赖项,进入他们的系统工作,在后端,支持他们的应用程序服务器,前端,向最终用户提供数据。

“这些组件给我们很多选择,很多灵活性和最终的权力交付内容在互联网上,“Villemez说。

但它导致一组复杂的相互关联的服务和依赖关系,其中许多是外面公司的直接控制。

“所以,对于ITOps团队来说,这绝对是至关重要的,我们不仅知道我们直接依赖,但也间接的,”他说。然后,公司需要提前计划的失败,这些关键组件。“知道如何解决问题,而供应商正试图解决的东西,”他说。

加入网络社区有个足球雷竞技app脸谱网LinkedIn上面的评论主题思想。

版权©2022 IDG通信公司。Raybet2