大数据遇上大型机 结果会如何?
进入数据大爆炸时代,企业所面临的局面无疑更复杂了。看着日益累积的各种数据,相信有不少用户都有这样的感觉:明知面前是座金矿,却苦于没有合适的开采方法,只能任机会流逝。
当然,并不是所有用户都在坐等时机,也有不少在尝试的。比如有用户在用分布式平台进行数据的整合、存储、分析、应用,也有用户在用集中式平台进行相关的工作,同样还有用户从分布式平台转向集中式平台。
究竟谁好?各有各的道理,不妨看个具体的案例,从中或许能受到一些启发。
Banca Carige实践心得
Banca Carige Group (Banca Carige) 是意大利的一家银行,距今已经有500多年的历史。其雇佣约6000名员工,有650多个网点,服务120万客户,年营业总额超过8亿欧元。
随着银行业的主战场不断转向移动端,Banca Carige凭借500多年服务客户的经验,果断地提出了改进计划,即通过数据分析更好地了解客户行为,从而达到吸引新客户服务老客户的目的。
最终Banca Carige选择了IBM 大型机作为未来的业务承载平台。至于原因,就像Banca Carige 的ICT治理经理Daniele Cericola所讲,“在银行业中,可用性与安全性对于业务而言至关重要,而大型机的这些性能都经过了实践检验,这一事实使其自然而然成为了我们新计划的平台之选。”
从这个角度看,Banca Carige选择大型机更多还是从安全性、可用性方面出发的结果。由于其之前一直在使用大型机(多年来,Banca Carige一直在采用IBM DB2数据库的IBM CICS Transaction Server上运行包括账户、支付、贷款等在内的核心银行系统,而该数据库位于可运行IBM z/OS的两台IBM zEnterprise EC12 服务器上),给出这样的理由并不意外,那究竟大型机在数据分析方面的表现如何呢,是不是能满足Banca Carige的需求?
“满意。”Daniele Cericola表示,“通过整合,我们所有的分析都是针对大型机的数据仓库进行的,借此我们可获得单一事实来源,而且在为所有新需求开发分布式数据集市时能够避免多余的成本投入和复杂性。”
据悉,Banca Carige已经将原来运行在分布式环境的多个营销数据库和应用迁移至了大型机,并借助运行在Red Hat Enterprise Linux上的IBM Campaign软件开发了新的活动管理数据模型,同时将这些整合至大型机环境中,从而使 DB2 for z/OS 成为分析和大数据唯一的数据储存库。
简单来说,相当于用大型机构建了一个平台,现在这些数据统一在这个平台进行处理。很显然,这个过程所需要的采购成本、电力成本、人力成本在一定范围内并不会像分布式平台那样随着业务量的增加而增加。也就是说,使用大型机做大数据分析并不一定比使用分布式架构成本更高。
虽然短短几段话,但是透露的内容很多。比如鉴于大型机强大的整合能力,最终的TCO并不一定高;再比如支持Linux,使得其解决方案变得更加丰富……
就像Daniele Cericola 在采访中所讲,“在大型机的 Linux 环境中运行我们的移动银行服务,使我们在大型机发展方面又迈进了一步。我们的关键业务价值是,最重要的服务可通过一致稳定的具有高度安全性的平台进行统一管理,而且该平台要能提供一流的可扩展性与性能。”应该说这就是对大型机核心价值的准确概括。
其实类似这样的应用案例还有很多,比如花旗银行、乐购、珠海社保等。
与时俱进的大型机
当然,举了这么一个例子笔者想说的并不是一定要使用大型机进行数据分析,事实上,大型机肯定有其更擅长、更适用的领域。笔者想说的是,在分布式环境大张旗鼓的今天,其实用户还有另外的选择,而且这个选择本身也在发生着变化,这才是最重要的。
说起大型机本身,可能很多人的印象依旧停留在几年甚至十几年前,呆板、贵、封闭。事实上,大型机早已通过实际行动着力改变这一形象。
它不断开放自己,尽管不能说IBM一直在引领潮流,但至少也是在紧跟趋势,比如IBM是 最早的Linux支持者,IBM大型机也很早就支持了Linux,再比如随着OpenStack的兴起,IBM大型机也支持在OpenStack平台上对 其进行统一管理。另外还有很多开源软件,IBM大型机均可支持,包括Docker、Hadoop、Spark、MongoDB、MariaDB等。
它不断提升自己的性能,单台最高支持8000台虚拟机,提供无与伦比的扩展性;在动态多线程技术的帮助下,Linux和Java工作负载运行速度提升30%。论整合能力、性能、安全性、可靠性,绝对无人可及。
它不断以更低的成本来面对用户,当然这个成本不仅是采购成本,因为IT系统的采购成本只占总体拥有成本(TCO)的一小部分,还包括电力、运维、管理等成本,试想能容纳8000台虚拟机的大型机能整合多少台服务器?应该说这个数量是惊人的,由此带来的后期使用成本的节约也是巨大的。
凭借着与时俱进,市场给了大型机、给了IBM积极的反馈。根据IDC发布的2015年第 二季度服务器市场调研报告显示,该季度IBM z13大型机表现强劲,同比增幅近两位数。根据刚刚发布的2016年第一季度IBM财报显示,与去年同期相比,来自z Systems大型主机服务器产品的营收增长了16%(计入汇率变动影响后上涨了21%)。以MIPS(每秒百万指令数)计算的z Systems所交付的计算能力,上升了28%。
记者观察
好多人说大型机不行了,但我们看到的却是大型机的逆势增长,这说明什么?这表明集中式与 分布式之争从来就不是非此即彼的关系,用户关心的只是是否有更好解决问题的方案,这才是他们的根本出发点。因此,就厂商而言,要做的是不断完善方案,并让 用户认识到其中的价值;对于用户而言,则要对各方解决方案有个充分的比较。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-12以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-11随着数字化转型的加速,企业积累了海量数据,如何从这些数据中挖掘有价值的信息,成为企业提升竞争力的关键。CDA认证考试体系应 ...
2025-03-10