作者 | CDA数据分析师
大数据革命引发了数据中心的爆炸式增长,这些中心正在以越来越高的速率消耗能源。本文回顾了两种提高数据中心效率的标准方法,并认为第三种方法-机器学习-是最佳解决方案。
天网,VIKI和HAL 9000就是一些具有机器学习功能的AI的例子。创建它们的目的是解决对人类而言过于复杂的问题,并通过神经网络对其进行控制,以提高效率,安全性和成功率。当然,电影需要对立面,因此这些AI奇迹给了不利的黑暗面——但是这种复杂的机器学习是真实的并且已经成功实现。
自2000年代以来,数据中心已经激增。一个大型电子商务服务数据中心仅用几个19英寸机架来部署所需的服务器,存储器,以及网络设备。如今,超大型数据中心成千上万的硬件设备部署在数千个机架上。它们源自本地办公室的小型服务器,现已发展成为超大型设施,以维护我们的物联网和所有相关数据。美国人使用的数据,流程,连接性和存储量需要大量电力,这意味着数据中心是主要的能源消耗者。占全国年用电量2%的行业和政府专家正致力于提高效率,因为预计数据中心的需求将会增加。
目前,解决此问题的方案主要有两个方面:
但是,它并没有确定解决此困难的解决方案。而真正的解决方案在于实现机器学习系统。通过它们的过程,可以减少数据中心的能耗,并使其效率比以前更高。如今,部署依赖于机器学习的工具的数据中心运营商正在从效率和可靠性方面获得最初的收益,但他们才刚刚开始摸索机器学习将对数据中心管理产生的全部影响。
机器学习是人工智能的子集,有望优化未来数据中心运营的各个方面,包括计划和设计,管理IT工作负载,确保正常运行时间以及控制成本。IDC预测,到2022年,由于具有嵌入式AI功能,数据中心中50%的IT资产将能够自主运行。
容纳大量服务器场的大型,不起眼的容纳器慢慢地在美国兴起。这是全球性现象,因为数据和信息都以数字方式存储,因此需要空间。由于节省了大量资金,我们对人类的模式和趋势有了更复杂的了解。不幸的是,将数据存储在服务器中并不像一个库。他们需要恒定的功率来产生热量,并且热量需要被冷却,从而消耗更多的能量。
2014年,仅美国数据中心就使用了约700亿度电,从这个角度来看,1 kWh将使智能手机充电一年。需要能源以保持数据中心24/7全天候运行,使用大量的冷却系统进行冷却以及在紧急情况下维持冗余电源。也就是说每年维护在大约七十亿美元,能源成本影响着每一个人。消费者,数据库提供者和环境都感受到了如此大量能源消耗的后果,但我们的利用率没有丝毫放缓的迹象。因此,利用和能源效率是适应的主要目标。
美国至少有300万个数据中心,足以容纳该国每100个人中的一个。数据中心的增长非常复杂,大多数服务器和相关设备都是在2000年至2010年期间购买的。但是,随着服务器空间使用效率的提高和对大型数据中心的依赖性增加,统计数据表明存储量将适应而不是增加。
有些人可能认为办公服务器比新的超大规模数据中心更有效率。或在破土动工并不必要地淘汰它们之前,应使用较旧的就地数据中心。这些想法有逻辑上的支持,独立服务器由其所有者处理,并且回收而不是更换,但是它们实际上并不起作用。现场服务器需要数据中心做的所有事情,因此公司在自己的服务器场上花费更多的钱,而不是使用远程中心所需的确切空间。而且,较旧的数据中心在构建时就没有考虑能源效率,因此,即使是看似新的数据中心也可能已过时。
美国能源部鼓励大规模实施能源效率。他们的“更好的建筑”计划邀请企业和数据中心减少能耗或使用可再生能源。诸如Google之类的大型科技公司率先采用了这种方式,通过机器学习系统来减少其数据中心的能耗。
机器学习是AI的过程,能够从场景中学习并做出反应,而不是通过编程的选项做出响应。机器学习系统会获得历史数据,参数(目标),并通过模仿我们自己大脑功能的神经网络进行操作。它们非常适合数据中心,这些数据中心对于以前的系统和专业人员来说已经变得复杂起来,无法有效地进行管理。数据中心每天都会发生近十亿次事件,只有通过直观的系统才能处理这些事件,以实现最大的可操作性。例如:
Google通过输入DeepMind系统,希望将其能降低和保持40%的能源效率,这是一个通用系统,他们希望广泛发布以减少能源使用。Google数据中心团队针对某些操作场景对DeepMind进行了培训,创建了自适应参数,输入了历史数据(例如温度和泵速),并将目标定位为未来的电源使用效率(PUE)。PUE实际上是建筑能耗与IT能耗之比;用于衡量能源效率。
当部署在Google的数据中心时,它可以通过分析难以理解的数据集并建议采取的措施来成功地减少能耗。这听起来与最初提到的AI所承担的任务相差不远。幸运的是,科幻小说与科学之间有清晰的界线。诸如DeepMind之类的系统是一项优势,能够以人类无法掌握的规模降低能耗。随着时间的流逝,更多的系统将实施机器学习,以便它们可以最大限度地提高可操作性,从而为人们节省金钱,更重要的是,为环境节省了资金。
Uptime Institute研究副总裁Rhonda Ascierto说:“这是数据中心管理的未来,但我们仍处于早期阶段。”IDC Cloud to Edge数据中心趋势服务研究总监Jennifer Cooke表示,随着越来越多的公司采用包含云,托管设施和内部数据中心的混合环境,并且将越来越多地包括边缘站点,创建更智能的数据中心变得越来越重要。
何为机器学习?简单来说,机器学习是从例子和经验(即数据集)学习而不是依赖于硬编码和预定义规则的算法。换句话说,不是开发者告诉程序如何区分苹果和橙子,算法被数据“训练”并且自己学习如何区分苹果和橙子。以下是当今数据中心管理中机器学习的五个最大用例:
Ascierto说,当今的组织正在使用机器学习来提高能源效率,主要是通过监视温度和调整冷却系统来实现的。
例如,谷歌在今年早些时候曾发布,它正在使用AI通过分析21个变量来自动管理和优化其数据中心的冷却,例如外部气温,数据中心的功率负载以及后方的气压。发出热气的服务器。该公司表示,Google的机器学习算法可实时自动连续不断地调整冷却装置的设置,从而使冷却每年的能源使用量减少30%。
此外,它可以就设计或配置数据中心的最有效方法(包括IT设备或工作负载的最佳物理位置)提出建议。
机器学习可以帮助IT组织预测需求,因此它们不会耗尽电力,冷却,IT资源和空间。例如,如果一家公司正在整合数据中心并将应用程序和数据迁移到中央数据中心,则算法可以帮助其确定此举如何影响该设施的容量,Ascierto说。
DCIM软件供应商Nlyte Software的首席战略官Enzo Greco说,容量规划是组织建立新数据中心的一项重要服务,该公司最近推出了数据中心管理即服(DMaaS)产品,并与IBM Watson合作对其进行了集成。将机器学习功能纳入其产品。
“您需要使数据中心尽可能准确。您需要多少台服务器?您需要多少冷却?您只需要与服务器数量一样多的散热。”他说。“此外,您需要多少电量?这取决于散热和服务器容量。”
在所有用例中,使用机器学习进行风险分析是最关键的,因为它可以识别异常并帮助防止停机。“机器可以检测出异常,否则将无法发现,” Ascierto说。
例如,施耐德电气的DMaaS可以分析来自关键数据中心设备(例如电源管理和冷却系统)的性能数据,并预测何时可能出现故障。施耐德电气数据中心解决方案架构师副总裁Joe Reele说,当算法检测到异常现象时,系统会警告客户,以便他们能够在设备出现故障之前进行故障排除。
将来,Ascierto看到托管服务提供商使用机器学习来更好地了解他们的客户并预测他们的行为-从购买或添加新服务到续订合同甚至支付账单的可能性。她说,这是客户关系管理的扩展,可以包括通过聊天框自动进行客户互动。
Maya HTT已经分析了客户情绪。Duquette说,它目前没有数据中心客户使用它,但是通过自然语言处理,该公司的软件可以分析电子邮件并记录支持电话以预测未来的客户行为。
Ascierto说,这将数据中心的运营和性能数据与财务数据(甚至包括适用税项在内)混合在一起,以了解购买和维护IT设备的成本。她说:“它模拟了一件设备的总拥有成本和整个生命周期,例如一种冷却系统与另一种冷却系统相比。”
例如,Salesforce在2016年收购了一家名为Coolan的初创公司,该公司使用机器学习来分析IT设备的总体拥有成本,直至单个服务器组件。问题是越来越多的公司将使用机器学习进行预算影响分析的时间。一些私人公司可能会自己做,但是这很复杂,因为它要求以计算机模型可以提取的格式容易获得财务数据。
出于安全原因,DMaaS客户不太可能希望与第三方共享其财务数据。她说:“对于DMaaS服务,在早期,让客户共享他们的财务数据是一个比较棘手的提议。”
这个领域还不成熟,但发展速度很快。人工智能系统正式交付使用还将需要一定的时间,就像数据中心招募的新的工作人员一样,不过类似的机器学习工具终将可以真正的帮助您运营数据中心。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21