大数据管理问题亟待解决
如果在百度谷歌去搜索"大数据",你会发现,大数据包括三个V,第一个V数据量足够大;第二个V是指数据的种类非常多、结构复杂;第三个V则是对于数据的实时性要求非常高。所以,拥有大量的数据,能够快速将这些数据进行抽取,挖掘,分析,并且可供拥有者实时访问,调用,能够满足其实际需求,这就是大数据。
大数据的出现与互联网的发展息息相关,从搜索引擎、社交网站到移动终端,互联网上的信息总量正以每年50%的增速不断膨胀,其中90%的信息来自近三年,包括每个月Facebook上分享的30亿条内容,每天12TB的Twitter信息,每天淘宝上超过30亿条店铺、商品浏览记录以及上千万的成交、收藏记录等等。据IDC统计,2011年全球所产生的数据总量是1.8ZB(10的21次方),如果把这些数据刻录到CD此片中门起摞起来的高度等于地球到月球的距离!
大数据没有限定的数量,比如多少TB,或者EB的数据。若是中小企业用户,可能企业内部只有十几、二十几个人,那么十个TB对这个企业来说就是大数据了,所以大数据的概念因人而异。工信部十二五的物联网规划引人注意,其中包括海量级的数据存储,数据挖掘,图象视频的智能分析,以及信息感知和信息传输,这些规划提供了一个警示信号,即大数据是未来的发展方向,所以在此后的一段时间内,热门话题会是大数据、云存储、以及对象存储。这些都是在存储或者计算领域热门的话题。
"大数据"是大势所趋。纵观整个数据市场,甚至存储市场,用户的数据量正呈现出爆炸式的增长态势。大概四、五年前,一个邮件系统用终端存储就可以满足一个中等规模企业的需要,数据量大概在30-50T.随着企业员工数量逐年增长,邮件系统的空间也呈爆炸式增长,由于人员沟通之间邮件更容易成为沟通的桥梁,邮件的附件越来越大,邮件系统的数据量亦随之水涨船高。现在该企业的数据量恐怕已增长到2.5PB甚至更多,需要添置一台存储设备或是几台储备设备做邮件系统,可见存储需求量增长之快。
尽管大数据的产生多半是因为企业发展及数据产生的种类多元化这个"大环境"所致,但是面对这些快速增长的大数据所暴露出的问题还是让企业管理者们不安。到底该如何管理这些大数据?如何进行安全有效的保护?出现问题时怎样进行恢复?这些都是企业待解的难题。
第一、在大数据愈演愈烈之时,对于企业来说,如何经济、高效访问数据值得探讨。并非购买了最高端的存储,更昂贵的备份存储就可以高枕无忧,如何经济、高效的访问数据才是企业目前需要研究的课题之一。通常情况下,按照数据被访问频率的高低,可以将这些大数据分为热数据和冷数据,热点数据放在昂贵的介质上没有任何异议,但是冷数据放在昂贵的介质上面则会导致IT建设成本上升,是一种浪费。所以如何将冷、热数据进行分层存储,既能优化存储系统的性能,又可以有效地降低存储系统的整体拥有成本,实现一举两得是企业的突破方向。
第二,如何组织、检索、存储、处理分析这些大数据。最近开展的题为"大数据:商业领袖们的经验"的全球调查发现,稿营收企业的成功与明确的数据战略之间有着极强的关联性。大数据的时代迎面袭来,企业重视大数据的潜在价值只是一个良好的开始,如何应对海量数据在管理方面的挑战才是企业至关重要的策略之一。
第三,数据备份。数据备份可谓"老生常谈",大家一直在谈数据需要备份,备份是企业最后的保障、最后的一个利器,可以保护企业的系统依然有数据可用。10年前的"9.11"事件,早给过我们惨痛的教训:世贸中心中大约2/3企业因为未做数据备份而导致彻底倒闭。
无独有偶,就在前不久前,雅虎日本服务器系统发生故障,导致近5700家企业数据丢失,除了小林制药这样日常进行数据备份的用户可以在几天之内恢复数据外,其他用户的数据绝无回复的可能,其损失可谓"惨重".一个企业的数据信息决定着企业的生死存亡。但是今天,数据量的持续增长增加了备份和恢复的时间,是企业面临着严重的合规和宕机风险,数据备份却越来越困难。用户数据量越来越大,备份时间窗口又那么小,设备又是有限的,怎样快速把大数据中的核心数据抽取出来,保障企业数据信息能够适时进行恢复,成为企业CIO们共同考量的当务之急。
第四、重复数据删除。由于存储经理们继续降低备份数据量,重复数据删除技术从而一度成为热门的技术,但尽管这个话题已经"风靡"了多年,近三、五年的时间大家都在讲重复数据的删除。基本上主流的厂商和用户能够接受的还是把带库删除。如周一到周五的数据一样,就把重复的数据删掉,以后每天把增量的数据保存。但是有一些厂家也提倡在线存储删除,这也可行。只是现在某些技术尚不完全成熟,所以现在的重复数据删除重点还是在备份领域涉猎较多。
第五,如何节省电力、节约空间、节约成本等。面临数据爆炸式增长带来的问题,我们将怎么样节省电力、空间、成本呢?近几年企业在采购存储时,会发现存储硬件的成本在逐年走低。回顾过去,硬盘价格都是高高在上的,而现在不管是传统的机械硬盘还是SSD(固态硬盘)都开始变得越发"亲民",而价格更低的同时容量却更高了。但是,对于很多企业来说,整体的存储成本却不降反升,原因就是存储的管理成本在逐年走高。因为大数据的接茬大涨需要大量的人力管理和维护,所以如何节约IT资源,减少IT人员的压力等也是现在企业需要考虑的因素。
在大数据时代,尽管这些快速增长的海量数据所引发的一系列蹩脚问题,足以让CIO们感到炙手可热,但是管理这些数据所带来的几多挑战并不能令人窒息。完整的数据保护解决方案或许能够成为"成人之美"的一剂良药。毕竟,实践是检验真理的唯一标准,这的确是不易之论……
数据分析咨询请扫描二维码
在准备数据分析师面试时,掌握高频考题及其解答是应对面试的关键。为了帮助大家轻松上岸,以下是10个高频考题及其详细解析,外加 ...
2024-12-20互联网数据分析师是一个热门且综合性的职业,他们通过数据挖掘和分析,为企业的业务决策和运营优化提供强有力的支持。尤其在如今 ...
2024-12-20在现代商业环境中,数据分析师是不可或缺的角色。他们的工作不仅仅是对数据进行深入分析,更是协助企业从复杂的数据信息中提炼出 ...
2024-12-20随着大数据时代的到来,数据驱动的决策方式开始受到越来越多企业的青睐。近年来,数据分析在人力资源管理中正在扮演着至关重要的 ...
2024-12-20在数据分析的世界里,表面上的技术操作只是“入门票”,而真正的高手则需要打破一些“看不见的墙”。这些“隐形天花板”限制了数 ...
2024-12-19在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17数据分析,是一项通过科学方法处理数据以获取洞察并支持决策的艺术。无论是在商业环境中提升业绩,还是在科研领域推动创新,数据 ...
2024-12-17在数据分析领域,图表是我们表达数据故事的重要工具。它们不仅让数据变得更加直观,也帮助我们更好地理解数据中的趋势和模式。相 ...
2024-12-16在当今社会,我们身处着一个飞速发展、变化迅猛的时代。不同行业在科技进步、市场需求和政策支持的推动下蓬勃发展,呈现出令人瞩 ...
2024-12-16在现代商业世界中,数据分析师扮演着至关重要的角色。他们通过解析海量数据,为企业战略决策提供有力支持。要有效完成这项任务, ...
2024-12-16在当今数据爆炸的时代,数据分析师是组织中不可或缺的导航者。他们通过从大量数据中提取可操作的洞察力,帮助企业在竞争激烈的市 ...
2024-12-16