大多数围绕自主车,聊天机器人的人工智能(AI)中心的嗡嗡声,digital-twin技术、机器人和基于人工智能的“智能”系统的使用,以从大型数据集中提取业务洞察力。但是人工智能和机器学习(ML)总有一天会在企业数据中心的服务器机架中扮演重要的角色。雷竞技电脑网站
人工智能潜力的提升数据中心效率——延伸到改善业务——可分为四大类:
- 能源管理:基于人工智能的电源管理可以帮助优化供暖和制冷系统,这可以降低电力成本,减少人员数量,提高效率。该领域的代表供应商包括施耐德电气、西门子、Vertiv和伊顿公司。
- 设备管理:AI系统可以监控服务器的健康状况,存储和网络设备,检查系统是否保持正确配置,并预测设备何时会发生故障。根据Gartner的数据,AIOps IT基础设施管理(ITIM)类的供应商包括OpsRamp、Datadog、Virtana、ScienceLogic和Zenoss。
- 工作负载管理:人工智能系统可以自动将工作负载实时转移到最高效的基础设施,既可以在数据中心内部,也可以在数据中心内部雷竞技电脑网站混合云环境的预置型云之间边缘环境。有越来越多的小公司提供基于AI-工作负载优化,其中包括红木,潮汐自动化和Ignio。像思科,IBM和VMware权重股也有产品。
- 安全:AI工具可以“学习”交通看起来像什么网络正常,发现异常,优先考虑哪些警报需要安全从业者,用了什么差错事件后分析帮助的注意,并堵在企业安全防护孔提供建议。供应商提供这种能力包括VectraAI,Darktrace,ExtraHop和思科。
综上所述,该公司的愿景是,人工智能可以帮助企业创建高度自动化、安全、自修复的数据中心,无需人工干预,并在高效率和弹性水平上运行。雷竞技电脑网站
“AI自动化可以扩展以超越人类的能力水平来解释数据,拾遗需要优化能源使用,分配工作负载,并最大限度地提高效率,实现更高的数据中心资产利用率势在必行的见解,说:” TABET,在全球CTO办公室的著名工程师解释戴尔技术。
当然,就像自动驾驶汽车的承诺,自驾车的数据中心还没有实现。雷竞技电脑网站有显著的技术,业务和人员是站在方式的AI在数据中心突破的障碍。雷竞技电脑网站通过今天是新生的,但潜在的收益将保持企业寻找机会使针。
电源管理水龙头到服务器工作负载管理
雷竞技电脑网站数据中心估计消耗约温室气体排放量的2%的全球电力供应和原因的3%,所以一点也不奇怪,这么多的企业正在为数据中心电源管理硬盘来看看,既省钱又是对环境负责。
丹尼尔加入Bizo,在高级分析师451研究他说,基于人工智能的系统可以帮助数据中心操作员了解当前或潜在的冷却问题,例如,由于一个高密度的柜体阻塞了空气流通而导致的冷空气输送不足,暖通空调系统性能不佳,或冷热通道之间的空气密封不足。
人工智能承诺带来的好处“超过简单的良好设施设计所能带来的,”Bizo说。人工智能系统“可以通过将暖通系统数据和环境感知读数相关联来了解设备”。
IT咨询和咨询公司的创始人格雷格•舒尔茨(Greg Schulz)补充道,电源管理是唾手可得的果实StorageIO公司。“今天,这是关于生产力,关于每英热单位完成更多的工作,每瓦特能源完成更多的工作,这意味着更聪明的工作和让设备更聪明的工作。”
还有一个容量规划的角度。除了寻找热点和冷点,人工智能系统还可以确保数据中心为正确数量的物理服务器供电,并且在出现临时需求激增的情况下,还能提供向上(或向下)运行新物理服务器的可用能力。雷竞技电脑网站
Schulz补充说,电源管理工具正在开发连接到管理设备和工作负载的系统。例如,如果传感器检测到服务器运行过热,系统可能会快速自动地将工作负载转移到未充分利用的服务器,以避免可能影响关键任务应用程序的潜在停机。然后系统可以调查服务器过热的原因——可能是风扇故障(HVAC问题)、即将崩溃的物理组件(设备问题),或者服务器刚刚过载(工作负载问题)。
AI驱动的健康监控,配置管理监督
雷竞技电脑网站数据中心正以饱满的,需要定期维护的物理设备。AI系统可以超越预定的维护和帮助,可以精确定位到需要立即注意的具体领域遥测数据的收集和分析。“AI工具可以通过所有的数据和现货模式,现货异常嗅,”舒尔茨说。
“运行状况监视从检查设备是否正确配置和是否按预期执行开始,”Bizo补充说。由于有数百甚至数千个IT机柜和数万个组件,这样的平凡任务可能是劳动密集型的,因此并不总是及时和彻底地执行。”
他指出,基于大量感知数据日志的预测设备故障建模可以“发现潜在的组件或设备故障,并评估其是否需要立即维护,以避免可能导致服务中断的容量损失。”
Michael Bushong是微软的企业和云营销副总裁Juniper网络公司他认为,企业数据中心运营商应该忽略一些与人工智能有关的过度承诺和炒作,而专注于他所说的“无聊的创新”。
是的,人工智能系统也许有一天会“告诉我哪里出了问题,并修复它”,但Bushong说,在这一点上,许多数据中心操作员会满足于“如果出现问题,告诉我去哪里找”。
依赖映射也是AI有用的一个重要但不是特别令人兴奋的领域。如果数据中心管理人员正在对防火墙或其他设备进行策略更改,可能会产生什么意外后果?“如果我提出改变,知道爆炸半径内可能有什么是有用的,”Bushong说。
保持设备运行平稳,安全的另一个重要方面是控制一些所谓的配置偏差,为的方式,特设配置随时间的变化,最多可以添加到创建问题数据中心的术语。AI可以作为“附加的安全检查”,以确定即将基于配置的数据中心问题,Bushong说。
AI和安全
根据Bizo的说法,人工智能和机器学习“可以通过对事件进行快速分类和聚类来识别重要事件,并将其从噪音中分离出来,从而简化事件处理(事件响应)。”更快的根源分析可以帮助操作员做出明智的决定并采取行动。”
人工智能在实时入侵检测方面尤其有用,舒尔茨补充道。基于人工智能的系统可以检测、阻止和隔离威胁,然后可以返回并进行法医调查,以确定到底发生了什么,以及黑客能够利用哪些漏洞。
在安全运营中心(SOC)工作的安全专业人员常常会遇到警报过载的情况,但基于ai的系统可以扫描大量的遥测数据和日志信息,清除日常任务,这样安全专业人员就可以腾出时间来处理更深入的调查。
基于ai工作负载优化
在应用层,AI有潜力自动将工作负载转移到适当的着陆点,无论着陆点是在本地还是在云中。Bizo说:“AI/ML将来应该根据性能、成本、治理、安全、风险和可持续性等多种规格,实时决定将工作负载放在哪里。”
例如,工作负载可以自动移动到最节能的服务器,同时确保这些服务器以最高的效率,这将是70〜80%的利用率运行。AI系统可能会对性能数据集成到方程式,所以对时间敏感的应用程序是高效率的服务器上运行,而在同一时间确保多余的能量没有被烧毁在不要求快速执行应用程序,申请Bizo说。
基于AI-工作负载优化已经引起了MIT的研究人员,谁在去年宣布,他们已经开发出一种人工智能系统,可自动学习如何安排跨越数千台服务器的数据处理操作的眼睛。
但是,正如Bushong所指出的,现实是,工作负载优化是当今的领域hyperscalers比如亚马逊、谷歌和Azure,而不是一般的企业数据中心。雷竞技电脑网站这有很多原因。
实现人工智能的挑战
数据中心的优化和自动化是正在进行的数字转型计划的一个组成部分雷竞技电脑网站。戴尔的Tabet补充说:“随着COVID-19的出现,许多公司正在考虑进一步的自动化,推动‘数字数据中心’的理念,即人工智能驱动的、能够自我修复的数据中心。”雷竞技电脑网站
2018年,谷歌宣布,它已将几个超大规模数据中心的冷却系统控制权交给了一个人工智能程序,该公司报告称,人工智能算法提供的建议使能耗降低了40%。雷竞技电脑网站
但是,Bizo说,对于那些名字不是谷歌的公司来说,在数据中心使用人工智能“在很大程度上是一种理雷竞技电脑网站想”。一些AI/ML特性在事件处理、基础设施运行状况和冷却优化中可用。但AI/ML模型要实现比标准数据中心基础设施管理(雷竞技电脑网站DCIM)今天。就像具有自主汽车的发展,初期可能是有趣的,从经济学的突破/业务情况下,它最终承诺却远“。
泰伯特表示,其中的一些障碍是“需要雇佣或培训合适的人来管理这个系统。”另一个需要注意的问题是数据标准和相关架构的需要。”
Gartner公司是这么说的:“AIOps平台的成熟,IT技术和业务成熟度是主要的抑制剂先进的部署等新兴挑战包括数据质量,以及缺乏数据的科学技能。” IT基础设施和运营团队中。
Bushong补充说,最大的障碍始终是人。他指出,走出去,招聘数据科学家是对很多企业是一个挑战,和培训现有从业人员也是一个障碍。
另外,Bushong说,长期以来,员工们一直抵制那些夺走他们控制权的技术。他指出,软件定义的网络(SDN)已经有十年了,但是超过四分之三的IT操作仍然是clidriven的。
“我们必须相信,各种基础设施的运营商准备把控制权让给人工智能,”Bushong表示。“如果一群人还不相信空管员能做出决定,那么你怎么训练、教育和安慰一群人,让他们做出如此重大的转变呢?业内普遍的态度是,如果我这么做,我就会失业。”
这就是为什么Bushong建议企业在人工智能方面采取那些小而乏味的步骤,而不要被围绕一项新技术的大肆宣传所包围。