CenturyLink遭遇了一次重大故障美国东部时间8月30日上午6点刚过,Twitter、微软(Xbox Live)、Discord、Reddit、Cloudflare、OpenDNS和Hulu等供应商和企业都受到了影响。在中断开始后不久,供应商开始将流量从CenturyLink重新路由到其他供应商,以缓解影响,但考虑到CenturyLink的网络规模和分布,许多服务仍然无法访问,千眼说。美国东部时间上午8点13分,CenturyLink宣布正在调查影响其加拿大安大略省米西索加数据中心部分服务的问题。雷竞技电脑网站CenturyLink认为原因是Mississauga数据中心发布了错误的flowspec公告,并要求其一级互联网供应商合作伙伴对来自其网络的任何流量进行隔离和忽略。雷竞技电脑网站(BGP flow specification (flowspec)是一种可以在大量BGP对等体路由器之间快速部署和传播过滤策略的特性。)为了解决这个问题,CenturyLink重置了所有的设备,并开始清理BGP路由表,这个过程花了近5个小时完成。就在美国东部时间下午3点之前,CenturyLink宣布问题已经解决,所有服务已经恢复。
8月24日更新
从全球来看,8月17日至23日这一周,这三种类型的停电总数比前一周增加了21%,从245次增加到296次。美国的新增人数从上周的90人增至106人,较前一周增加了18%。
ISP中断全球从166到214上升,从美国的72到80起。
全球公共云网络中断次数从28次下降到27次,美国则保持不变,为4次。
全球协作应用网络中断从零增加到两次,但在美国仍然为零
一周内的一些人标记了三个显着的中断。
刚刚在8月18日EDT凌晨8点之后,Spotify遭受了阻止用户从服务中播放歌曲的中断。中断持续了一个半小时,会播放歌曲几秒钟,然后暂停并返回错误。据信停电将被消耗的TLS证书复杂化。点击在这里有关证书到期的影响的解释。
大约11:30。EDT于8月17日,Equinix遭到伦敦码头码头的电源停电。大约需要2:: UPS系统输出静态开关的故障触发了火警,导致多个客户丢失电源。上午3:50。服务开始恢复,并在下午4:50完全恢复。美东时间。受影响的客户包括BT,Sky,Virgin Media,Giganet,Epsilon,Sipalto,EX Networks,Fast2host,Icuk.net和唤起电信。
美国太平洋时间8月19日晚上10点50分左右,Cogent Networks遭遇了36分钟的中断,影响了美国用户访问微软网络和相关服务,以及TikTok和ESPN等服务的CDN内容。这次中断影响了美国各地的节点,显然是由于配置调整造成的。两小时后的晚上11点26分,PDT持续了24分钟,可能与第一次中断的配置调整有关。它影响了美国、亚太、欧洲、中东和非洲的用户。点击在这里查看中断的交互视图。
Update 8月17日
所有三个类别的全球性中断在8月3日至9日和8月至8月的星期间,从294到245(-17%)和美国,123至90(-27%)。
ISP中断从227到166下降到全球,从美国的109到72。
全球公共云中断从30次降至28次,美国从5次降至4次
全球协作应用网络中断连续第二周保持在0。
8月13日美国东部时间晚上10点30分左右,Cogent Networks遭遇了一次严重的停电,持续了约40分钟,影响了其位于佐治亚州亚特兰大的公司。、网络。它影响了对微软网络和相关服务的访问,比如Sharepoint、Office、Azure服务和主机托管,而且似乎位于亚特兰大的Cogent数据中心。雷竞技电脑网站从受影响的接口和节点来看,这似乎是配置调整的结果,而不是控制平面问题。
另外,英国电信的欧洲主干线在美国东部时间晚上7:30左右发生故障,影响到英国、美国、瑞典和德国的客户和合作伙伴。停电发生在25分钟内,间隔3次,每次4分钟,这表明是一个自动恢复过程,可能是为了维护。停电在美国东部时间晚上7点55分结束。
更新8月10日
在全球范围内,本周没有任何协作应用网络提供商中断。在美国,这是连续第二周的零停电。
这三种类型的故障总数从248次增加到294次,是4月底以来的最高记录。在美国,这一数字从99上升到了123。
全球ISP断网次数从181次增加到227次。在美国,这一数字从88人增加到109人。
全球范围内的云服务供应商中断次数从18次增加到30次,美国从3次增加到5次。
协作应用的网络中断从1下降到0。美国的断网率维持在0。
美国太平洋时间8月4日晚上8点25分左右,Cogent Networks经历了一次15分钟的网络中断,影响了其旧金山部分网络以及在英国、德国和荷兰的基础设施。近70个网络接口受到影响。中断的范围和时间表明提供商正在进行服务调整/维护。下面是中断的交互式可视化在这里。
CDT在8月5日上午3:25,GTT有一个10分钟的网络中断,影响达拉斯,芝加哥,洛杉矶和伦敦的基础设施的部分。中断的时序和范围与服务调整活动一致。中断的互动可视化是在这里。
8月3日更新
在7月27日至8月2日这一周,全球所有三类的停电次数比前一周减少了6%,从263次减少到248次。在美国,断网次数从90次增加到99次,比上周增加了10%。
全球ISP中断的数量从183到181年下降1%。在美国,ISP中断从73到88上升,与前一周相比增加了21%。
与前一周相比,全球云提供商的服务中断减少了38%。在美国,连续第三周出现了三次公共云网络中断。
在全球范围内,协作应用网络供应商的中断从3个减少到1个,与前一周相比下降了66%。在美国,本周没有合作应用程序网络中断的记录。
期间有两个值得注意的中断:
Verizon Business在其网络中遭受了中断,影响用户访问Zoom,Bloomberg Professional和Flagstar Bank等服务。中断位于位于圣何塞加利福尼亚州的前Uunet节点。和西雅图。停电在7月27日在11:00 AM PDT之前发生,并在55分钟内持续了27分钟。停电在11:55 AM PDT约为。
Reddit用户在7月29日在EDT左右10:30左右访问Reddit的网站时开始遇到一些错误。在事件中,Reddit站点已到达,但许多页面组件产生错误要么无法加载或根本无法响应请求,但所有其中表示申请问题,而不是网络中断。Reddit在PM EDT 1:32的reddit实施了修复,Reddit宣布发出的问题在于edt 3:24。
7月27日更新
During the week July 20-26, the number of outages globally in all three categories increased by 14% from the week prior, from 231 to 263. In the U.S., outages rose from 70 to 90, a 29% increase from the week prior.
全球ISP中断次数增加了5%,从175次增加到183次。在美国,ISP断网次数从60次增加到73次,增长了22%,恢复到了6月底的水平。
全球云提供商中断几乎是两倍,从15到29起增加了93%。在美国,连续第二周有三个公共云网络中断。
在全球范围内,协作应用网络供应商的中断从1个增加到3个,增幅达200%,所有中断都是由美国的一家供应商造成的。这是自6月中旬以来美国国内首次出现协作中断。
本周最值得注意的故障发生在7月23日凌晨3点15分,Garmin.com和Garmin Connect的服务中断。在写这篇文章的时候,停电还在继续,这也影响到了Garmin的呼叫中心,他们无法接听电话和电子邮件,也无法参与在线聊天。与Garmin服务的网络连接仍然活跃,但Garmin Connect上的数据同步和访问功能仍处于关闭状态。从周四开始,试图访问这些功能的用户会看到一条“服务器维护”消息。在27日发布的一份新闻稿中,Garmin证实他们遭受了一次网络攻击,加密了他们的一些系统,导致许多在线服务中断。
7月20日更新
在7月13日至19日星期三,全球中断所有三种从前一周下降了19%,从285年到231.美国中断下降甚至更大 - 28% - 从97到70。
ISP中断从215到175或19%的全球降落。在美国,他们下降了34%,从91到60。
云提供商的宕机次数下降了58%,从36次下降到15次,其中大部分发生在南美洲。美国的停电从2次增加到3次,占50%。
在全球范围内,协作应用网络中断从4次减少到1次,下降了75%,其中英国的一个供应商造成了中断。美国已经连续5周没有中断。
GitHub在美国东部时间7月13日凌晨2点30分刚过就遭遇了一次中断,一直持续到美国东部时间凌晨4点31分。全世界的用户都受到了影响。GitHub还没有提供有关中断原因的细节,但千眼表示,有迹象表明源头在GitHub服务内部。
从美国东部时间7月14日下午6点45分开始,WhatsApp遭遇了约一个小时的宕机,导致全球用户无法通过该服务发送和接收消息。一旦中断结束,用户可以连接到服务,但一旦加载,他们就无法执行任何功能。WhatsApp向千眼网证实,原因是服务器的内部更新。
7月6日更新
本周29日至7月29日,所有三个类别的全球中断人数从199年增加到208,增加了5%。然而,在美国,中断从83升至63,从前一周减少了24%。
在全球范围内,ISP中断的数量从160到152减少了5%。美国ISP中断的数量也下降,从77到55个中断。两滴代表自2月以来的最低数量的ISP中断。
在全球范围内,云服务提供商的宕机次数下降了11%,从28次下降到25次。本周美国记录的唯一一次云服务中断比前一周的五次下降了80%。
在全球范围内,协作应用网络提供商的中断从0增加到2,这是自6月初以来的首次记录。本周,美国没有合作应用中断,整个6月只中断了两次。
期间有两个值得注意的中断:
6月29日在上午8:15,PDT电源故障影响了服务区US-EAST1-C和US-EAST1-D中的Google Compute引擎。遇到服务中断的客户无法到达现有的虚拟机或创建新的虚拟机。该区域中的其他区域不会受到影响,因此冗余架构,其中工作负载在区域内的多个区域中托管,可以减轻用户影响。谷歌宣布所有服务都已恢复,并在PDT 1:06解决问题解决。
7月4日下午5点。PDT Comcast遭遇了33分钟的中断,影响了美国的用途,以及尝试使用Comcast网络访问服务的多个其他国家的使用情况。停电是由40分钟的活动和美国东部和西海岸和中部地区的康卡斯特节点有超过40分钟的事件引起的。停电在下午5:45清除。太平洋夏令时。
更新6月29日
6月22日至28日这一周的全球宕机总数比前一周下降了29%,达到了自4月初以来观察到的最低宕机数量。在美国,停电次数下降了20%。
ISP中断也达到过去八周内记录的最低水平。在全球范围内,本周数量下降了26%,从216升至160.在美国,ISP中断与上周相比下降了20%,从96到77。
在全球范围内,云服务提供商的断网事件从本周的46起减少到28起,降幅达39%,其中大部分是南美造成的。与上周相比,美国云提供商的宕机次数从11次下降到5次,下降了55%。
在全球范围内,上周在一行连续第二周看到零协作应用网络提供商中断。
康卡斯特有线通信公司(Comcast Cable Communications)遭遇了24分钟的中断,影响了美国各地访问Zoom、Visa和美国银行等服务的用户。此次中断主要集中在位于华盛顿州西雅图的康卡斯特基础设施上。,并在凌晨2:30 PDT后被清除。
更新6月22日
云提供商停止飙升至6月15日至21日这一周的新纪录级高点。在全球范围内,云提供商中断的数量从20增加到46,增加了130%。在美国,中断的数量增加175%,从4到11增加。
上周也出现了创纪录的低点。自2月24日那周以来,全球和美国首次没有出现合作应用网络提供商中断的情况
在全球范围内,互联网服务中断的数量上周小幅下降,从221个下降到216个。然而,在美国,与前一周相比,ISP中断的数量增加了22%。
从总中断的角度来看,该数量在全球范围内略有下降,从287下降到282。然而,美国的停电情况较前一周增加了14%。从99到113次中断。
An outage of note occurred June 18 at 2:45 PDT and lasted 23 minutes, affecting multiple countries including Australia, France, Germany and the U.K. The outage affected access to Microsoft services including some identity systems and appeared to originate in Microsoft nodes in Des Moines, Iowa. The outage was divided into two outages over two hours, concluding just after 5 p.m. PDT. Click在这里对于中断的互动视图。
更新6月15日
在6月8日至14日这一周,全球范围内上述三类网络中断的总数增加了35%,美国跃升了34%
全球的ISP断网次数从168次增加到221次,增长了32%;美国的ISP断网次数从68次增加到79次,增长了14%。
在美国,云服务提供商的宕机从23次减少到20次(下降13%),从2次增加到4次