大数据 是否大得难以处理
尽管现如今的企业对于大数据项目充满了热情,但究竟有多少关于大数据的探讨最终变成了实际执行的大数据项目呢?到底是哪些因素阻碍了企业对于大数据项目的实施呢?为了找出企业迄今没有对于这一时下炙手可热的技术做出实质性进展的原因,计算机世界网站从今年5月开始在香港地区展开了一项调查。
该项调查的重点是基于用户对于大数据的“三大特性”(数据量、种类、输入和处理速度)的态度进行的采访,这三大特性定义了大数据。截至到七月,有140多名香港地区的IT专业人士参与了这项仍在进行中的调查。
大数据项目从讨论到正式部署
首先统计的是受访者所在企业目前的状态和对大数据采用的计划。调查结果显示,采用率很低,仅有五分之一(20.1%)的受访专业人士表示,他们的企业目前正在使用大数据技术进行生产,另外,有9.7%的机构计划在未来12个月内实施大数据项目。
但也有40.3%的IT专业人士表示,他们所在的企业没有任何实施大数据项目的计划。而表示不确定的受访者也占到了29.5%的比例。
对于该项新兴技术采用的趋势和态度不同的企业各有不同:大多数企业往往对这项新技术持怀疑、等待和观望的态度。但是,这项调研也显示了香港地区的大多数IT专业人士都对他们所在的企业实施大数据计划的态度是十分鲜明的:它们要么非常积极的赞成该技术,要么直接持拒绝态度,并没有留下一点持怀疑态度的空间。
大数据项目的驱动因素和其所面临的挑战
为了更好的了解市场对于该技术的热情和接受程度,我们让受访者基于他们对于大数据三大特性的印象对大数据的益处进行了评价。
大数据的收集和分析大量数据的能力获得最高评价,有47%受访者将这一特性评为最重要的益处。评价第二的是:处理各种数据格式的能力(占29.1%)。大数据技术传递速度和性能分析是排名最低,只有23.9%的IT专业人士认为该特性是其最重要的益处。
调查显示,关于实施大数据项目所面临的挑战:数据集成工具较差(占48.8%),数据质量差(占39.8%),缺乏数据架构(占39%)和混乱的数据所有权(占39%)位列受访者们调查结果的前四名。
在这四大因素中,前三名的挑战与技术不成熟和数据管理有关。尽管这些问题都是相当麻烦的,但他们主要是与技术相关的问题,通常是容易解决的。
好消息是,更为复杂的挑战问题,诸如开发商业案例(占24.4%)或企业内部文化冲突(占14.6%)的排名很低。这一发现表明,企业用户均普遍意识到大数据的益处,今后在员工教育和说服用户方面的不用花费大量的资金投资了。
数据量与种类
除了研究企业部署大数据项目的动机和面临的挑战,本次调查还进一步的研究的大数据的“三大特性”,以了解进行大数据管理的需求和期望。
在香港,被企业视为大数据的数据量标准与全球标准是持平的。大约三分之二的本地IT专业人士认为,大数据的数据量将至少要在10TB以上,接近20%的受访者不是,超过100TB的数据量才能被认为是大数据。
根据维基百科介绍,决定大数据大小的指标永远在变,截至2012年,大数据中的数据集可以由几十兆字节至数拍字节的数据组成。这指标不固定是因为传统数据库管理系统以至NoSQL等新型数据库,它们的科技和处理大容量数据的能力不断在改进。
随着技术的进步,企业的数据量还将继续增加。除了针对数据量的调查,本次调研还试图量化数据的性质对于促进大数据增长的作用。调查采访了受访者们两个单独的问题:不同类型的数据所产生的数据量,以及可能导致大数据分析的数据类型。
调查显示,目前正在大规模产生的海量数据预计也将用于大数据分析。IT专业受访者们表示,目前产生最大数据量的来源为结构化的事务处理数据和电子邮件数据,分类占到数据量的62.7%和53%。这两大数据来源所产生的数据也是可用于大数据分析的最流行的两种数据类型。
后起之秀:社会化媒体内容
鉴于大多数IT用户将能够处理大量数据的能力作为大数据最为重要的益处。大容量的数据类型就更可能被用于先进的分析了。
然而,也有例外的情况发生。社会化媒体内容即是如此。相对而言,仅有较少的企业(26.9%)表示,社交媒体正在产生大量的数据信息,但是社会媒体的数据信息则占到了大数据分析很高的权重(40.5%)。
虽然从社会媒体所产生的数据量是巨大的,大多数企业尚未开始捕获并分析这些数据集。随着社会媒体流动性和影响力的继续增加,更多的企业将转向这方面平台的洞察,届时大数据技术有望在这个过程中发挥关键性的作用。相同的动机驱动因素在利用大数据来分析数字丰富的数字媒体,如视频、音频、图像方面占到的比例更高(37.3%)。
分析当前和未来的状况
该调查还研究了不同类型的业务在当前所支持和采用的先进的分析方法,并预计其将在未来的发展趋势。
顶级商务功能方面,目前正在采用和执行的高级分析包括:业务报告(71.9%),规划和预测(56.8%)和预算(53.5%),这几项在未来先进的分析性能预测中排名很低。
调查表明,目前的分析主要用于执行操作的角色。更具战略性的业务功能,如战略管理(64.8%),利润模型(58.7%),企业绩效管理(58.6%)和研发(58.3%),预计在未来的先进分析应用中将占主导地位。
这一发现表明,香港地区的企业非常了解大数据分析的战略价值。先进的分析方法是将从当前的业务支持更多转向发挥战略方面的作用。随着企业对于更大量数据和更多类型数据的收集的增加,以及分析模型演进,预计企业将在未来利用大数据分析进行战略决策。
输入和处理速度仍然很重要
尽管受访者对于数据分析速度的排名较低,但其性能似乎对本地企业来说仍然是一个问题。
该调研调查了受访者们关于查询分析结果的最佳时间。虽然大多数的IT受访者(42.1%)表示可以为结果等待一分钟的时间,超过三分之一(37.3%)的受访者则希望能够在不到10秒的时间内就得到分析结果,以满足其业务需要。
这一发现表明,输入和处理速度、以及数据量的问题将对企业的IT部门及其处理进程提出相应的要求。如果数据结构和IT基础设施还没有准备好能够在10秒内处理并分析100TB的数据,一些IT用户则表示这是无法接受的。
调查结果表明,大多数IT用户(58.5%)关心的是现有的信息基础设施所采集的大数据的状态。对于数据结构和IT基础设施缺乏信心是香港企业最为关注的问题。而如果不建立这样的信心,大数据项目的采用将很难实现。
数据分析咨询请扫描二维码
统计学基础 - 理解统计学的基本概念和方法是数据分析师必备的技能之一。统计学为他们提供了处理数据、进行推断和建模的基础。 数 ...
2024-11-25数据分析师在如今信息爆炸的时代扮演着至关重要的角色。他们不仅需要具备扎实的数据分析技能,还需要不断学习和适应不断发展的技 ...
2024-11-25数据分析师的工作职责涉及多个关键方面,从数据的获取到处理、分析再到可视化,旨在为企业的决策提供有力支持。让我们深入了解数 ...
2024-11-25数据分析师:洞察力量的引擎 数据分析师的兴起 数据分析师行业目前正处于快速发展阶段,市场需求持续增长,薪资水平也有所提升。 ...
2024-11-25数据收集与整理 - 从各种来源收集数据,清洗和整理以确保数据质量和可用性。 数据分析与建模 - 运用统计学方法和机器学习模型对 ...
2024-11-25数据分析是当今社会中不可或缺的一项技能,涵盖了广泛的工具和技术。其中,掌握各种数据处理函数对于数据分析师至关重要。本文将 ...
2024-11-25“大数据治理”是一个涵盖广泛的复杂概念,其核心在于确保大规模、多样化的数据资源能够被有效管理和利用。不仅涉及数据的采集、 ...
2024-11-25一、引言 背景介绍 随着信息技术的快速发展和互联网的普及,大数据已经成为现代社会的重要资产。大数据的兴起不仅推动了各行各业 ...
2024-11-25《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22