作者 | CDA数据分析师
大数据革命引发了数据中心的爆炸式增长,这些中心正在以越来越高的速率消耗能源。本文回顾了两种提高数据中心效率的标准方法,并认为第三种方法-机器学习-是最佳解决方案。
天网,VIKI和HAL 9000就是一些具有机器学习功能的AI的例子。创建它们的目的是解决对人类而言过于复杂的问题,并通过神经网络对其进行控制,以提高效率,安全性和成功率。当然,电影需要对立面,因此这些AI奇迹给了不利的黑暗面——但是这种复杂的机器学习是真实的并且已经成功实现。
自2000年代以来,数据中心已经激增。一个大型电子商务服务数据中心仅用几个19英寸机架来部署所需的服务器,存储器,以及网络设备。如今,超大型数据中心成千上万的硬件设备部署在数千个机架上。它们源自本地办公室的小型服务器,现已发展成为超大型设施,以维护我们的物联网和所有相关数据。美国人使用的数据,流程,连接性和存储量需要大量电力,这意味着数据中心是主要的能源消耗者。占全国年用电量2%的行业和政府专家正致力于提高效率,因为预计数据中心的需求将会增加。
目前,解决此问题的方案主要有两个方面:
但是,它并没有确定解决此困难的解决方案。而真正的解决方案在于实现机器学习系统。通过它们的过程,可以减少数据中心的能耗,并使其效率比以前更高。如今,部署依赖于机器学习的工具的数据中心运营商正在从效率和可靠性方面获得最初的收益,但他们才刚刚开始摸索机器学习将对数据中心管理产生的全部影响。
机器学习是人工智能的子集,有望优化未来数据中心运营的各个方面,包括计划和设计,管理IT工作负载,确保正常运行时间以及控制成本。IDC预测,到2022年,由于具有嵌入式AI功能,数据中心中50%的IT资产将能够自主运行。
容纳大量服务器场的大型,不起眼的容纳器慢慢地在美国兴起。这是全球性现象,因为数据和信息都以数字方式存储,因此需要空间。由于节省了大量资金,我们对人类的模式和趋势有了更复杂的了解。不幸的是,将数据存储在服务器中并不像一个库。他们需要恒定的功率来产生热量,并且热量需要被冷却,从而消耗更多的能量。
2014年,仅美国数据中心就使用了约700亿度电,从这个角度来看,1 kWh将使智能手机充电一年。需要能源以保持数据中心24/7全天候运行,使用大量的冷却系统进行冷却以及在紧急情况下维持冗余电源。也就是说每年维护在大约七十亿美元,能源成本影响着每一个人。消费者,数据库提供者和环境都感受到了如此大量能源消耗的后果,但我们的利用率没有丝毫放缓的迹象。因此,利用和能源效率是适应的主要目标。
图1:数据中心的用电量(十亿千瓦时/年)
美国至少有300万个数据中心,足以容纳该国每100个人中的一个。数据中心的增长非常复杂,大多数服务器和相关设备都是在2000年至2010年期间购买的。但是,随着服务器空间使用效率的提高和对大型数据中心的依赖性增加,统计数据表明存储量将适应而不是增加。
有些人可能认为办公服务器比新的超大规模数据中心更有效率。或在破土动工并不必要地淘汰它们之前,应使用较旧的就地数据中心。这些想法有逻辑上的支持,独立服务器由其所有者处理,并且回收而不是更换,但是它们实际上并不起作用。现场服务器需要数据中心做的所有事情,因此公司在自己的服务器场上花费更多的钱,而不是使用远程中心所需的确切空间。而且,较旧的数据中心在构建时就没有考虑能源效率,因此,即使是看似新的数据中心也可能已过时。
图2:数据中心总用电量(十亿千瓦时/年)
美国能源部鼓励大规模实施能源效率。他们的“更好的建筑”计划邀请企业和数据中心减少能耗或使用可再生能源。诸如Google之类的大型科技公司率先采用了这种方式,通过机器学习系统来减少其数据中心的能耗。
机器学习是AI的过程,能够从场景中学习并做出反应,而不是通过编程的选项做出响应。机器学习系统会获得历史数据,参数(目标),并通过模仿我们自己大脑功能的神经网络进行操作。它们非常适合数据中心,这些数据中心对于以前的系统和专业人员来说已经变得复杂起来,无法有效地进行管理。数据中心每天都会发生近十亿次事件,只有通过直观的系统才能处理这些事件,以实现最大的可操作性。例如:
Google通过输入DeepMind系统,希望将其能降低和保持40%的能源效率,这是一个通用系统,他们希望广泛发布以减少能源使用。Google数据中心团队针对某些操作场景对DeepMind进行了培训,创建了自适应参数,输入了历史数据(例如温度和泵速),并将目标定位为未来的电源使用效率(PUE)。PUE实际上是建筑能耗与IT能耗之比;用于衡量能源效率。
当部署在Google的数据中心时,它可以通过分析难以理解的数据集并建议采取的措施来成功地减少能耗。这听起来与最初提到的AI所承担的任务相差不远。幸运的是,科幻小说与科学之间有清晰的界线。诸如DeepMind之类的系统是一项优势,能够以人类无法掌握的规模降低能耗。随着时间的流逝,更多的系统将实施机器学习,以便它们可以最大限度地提高可操作性,从而为人们节省金钱,更重要的是,为环境节省了资金。
Uptime Institute研究副总裁Rhonda Ascierto说:“这是数据中心管理的未来,但我们仍处于早期阶段。”IDC Cloud to Edge数据中心趋势服务研究总监Jennifer Cooke表示,随着越来越多的公司采用包含云,托管设施和内部数据中心的混合环境,并且将越来越多地包括边缘站点,创建更智能的数据中心变得越来越重要。
何为机器学习?简单来说,机器学习是从例子和经验(即数据集)学习而不是依赖于硬编码和预定义规则的算法。换句话说,不是开发者告诉程序如何区分苹果和橙子,算法被数据“训练”并且自己学习如何区分苹果和橙子。以下是当今数据中心管理中机器学习的五个最大用例:
Ascierto说,当今的组织正在使用机器学习来提高能源效率,主要是通过监视温度和调整冷却系统来实现的。
例如,谷歌在今年早些时候曾发布,它正在使用AI通过分析21个变量来自动管理和优化其数据中心的冷却,例如外部气温,数据中心的功率负载以及后方的气压。发出热气的服务器。该公司表示,Google的机器学习算法可实时自动连续不断地调整冷却装置的设置,从而使冷却每年的能源使用量减少30%。
此外,它可以就设计或配置数据中心的最有效方法(包括IT设备或工作负载的最佳物理位置)提出建议。
机器学习可以帮助IT组织预测需求,因此它们不会耗尽电力,冷却,IT资源和空间。例如,如果一家公司正在整合数据中心并将应用程序和数据迁移到中央数据中心,则算法可以帮助其确定此举如何影响该设施的容量,Ascierto说。
DCIM软件供应商Nlyte Software的首席战略官Enzo Greco说,容量规划是组织建立新数据中心的一项重要服务,该公司最近推出了数据中心管理即服(DMaaS)产品,并与IBM Watson合作对其进行了集成。将机器学习功能纳入其产品。
“您需要使数据中心尽可能准确。您需要多少台服务器?您需要多少冷却?您只需要与服务器数量一样多的散热。”他说。“此外,您需要多少电量?这取决于散热和服务器容量。”
在所有用例中,使用机器学习进行风险分析是最关键的,因为它可以识别异常并帮助防止停机。“机器可以检测出异常,否则将无法发现,” Ascierto说。
例如,施耐德电气的DMaaS可以分析来自关键数据中心设备(例如电源管理和冷却系统)的性能数据,并预测何时可能出现故障。施耐德电气数据中心解决方案架构师副总裁Joe Reele说,当算法检测到异常现象时,系统会警告客户,以便他们能够在设备出现故障之前进行故障排除。
将来,Ascierto看到托管服务提供商使用机器学习来更好地了解他们的客户并预测他们的行为-从购买或添加新服务到续订合同甚至支付账单的可能性。她说,这是客户关系管理的扩展,可以包括通过聊天框自动进行客户互动。
Maya HTT已经分析了客户情绪。Duquette说,它目前没有数据中心客户使用它,但是通过自然语言处理,该公司的软件可以分析电子邮件并记录支持电话以预测未来的客户行为。
Ascierto说,这将数据中心的运营和性能数据与财务数据(甚至包括适用税项在内)混合在一起,以了解购买和维护IT设备的成本。她说:“它模拟了一件设备的总拥有成本和整个生命周期,例如一种冷却系统与另一种冷却系统相比。”
例如,Salesforce在2016年收购了一家名为Coolan的初创公司,该公司使用机器学习来分析IT设备的总体拥有成本,直至单个服务器组件。问题是越来越多的公司将使用机器学习进行预算影响分析的时间。一些私人公司可能会自己做,但是这很复杂,因为它要求以计算机模型可以提取的格式容易获得财务数据。
出于安全原因,DMaaS客户不太可能希望与第三方共享其财务数据。她说:“对于DMaaS服务,在早期,让客户共享他们的财务数据是一个比较棘手的提议。”
这个领域还不成熟,但发展速度很快。人工智能系统正式交付使用还将需要一定的时间,就像数据中心招募的新的工作人员一样,不过类似的机器学习工具终将可以真正的帮助您运营数据中心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13