大数据是否大得难以处理_数据分析师考试
尽管现如今的企业对于大数据项目充满了热情,但究竟有多少关于大数据的探讨最终变成了实际执行的大数据项目呢?到底是哪些因素阻碍了企业对于大数据项目的实施呢?为了找出企业迄今没有对于这一时下炙手可热的技术做出实质性进展的原因,计算机世界网站从今年5月开始在香港地区展开了一项调查。
该项调查的重点是基于用户对于大数据的“三大特性”(数据量、种类、输入和处理速度)的态度进行的采访,这三大特性定义了大数据。截至到七月,有140多名香港地区的IT专业人士参与了这项仍在进行中的调查。
大数据项目从讨论到正式部署
首先统计的是受访者所在企业目前的状态和对大数据采用的计划。调查结果显示,采用率很低,仅有五分之一(20.1%)的受访专业人士表示,他们的企业目前正在使用大数据技术进行生产,另外,有9.7%的机构计划在未来12个月内实施大数据项目。
但也有40.3%的IT专业人士表示,他们所在的企业没有任何实施大数据项目的计划。而表示不确定的受访者也占到了29.5%的比例。
对于该项新兴技术采用的趋势和态度不同的企业各有不同:大多数企业往往对这项新技术持怀疑、等待和观望的态度。但是,这项调研也显示了香港地区的大多数IT专业人士都对他们所在的企业实施大数据计划的态度是十分鲜明的:它们要么非常积极的赞成该技术,要么直接持拒绝态度,并没有留下一点持怀疑态度的空间。
大数据项目的驱动因素和其所面临的挑战
为了更好的了解市场对于该技术的热情和接受程度,我们让受访者基于他们对于大数据三大特性的印象对大数据的益处进行了评价。
大数据的收集和分析大量数据的能力获得最高评价,有47%受访者将这一特性评为最重要的益处。评价第二的是:处理各种数据格式的能力(占29.1%)。大数据技术传递速度和性能分析是排名最低,只有23.9%的IT专业人士认为该特性是其最重要的益处。
调查显示,关于实施大数据项目所面临的挑战:数据集成工具较差(占48.8%),数据质量差(占39.8%),缺乏数据架构(占39%)和混乱的数据所有权(占39%)位列受访者们调查结果的前四名。
在这四大因素中,前三名的挑战与技术不成熟和数据管理有关。尽管这些问题都是相当麻烦的,但他们主要是与技术相关的问题,通常是容易解决的。
好消息是,更为复杂的挑战问题,诸如开发商业案例(占24.4%)或企业内部文化冲突(占14.6%)的排名很低。这一发现表明,企业用户均普遍意识到大数据的益处,今后在员工教育和说服用户方面的不用花费大量的资金投资了。
数据量与种类
除了研究企业部署大数据项目的动机和面临的挑战,本次调查还进一步的研究的大数据的“三大特性”,以了解进行大数据管理的需求和期望。
在香港,被企业视为大数据的数据量标准与全球标准是持平的。大约三分之二的本地IT专业人士认为,大数据的数据量将至少要在10TB以上,接近20%的受访者不是,超过100TB的数据量才能被认为是大数据。
根据维基百科介绍,决定大数据大小的指标永远在变,截至2012年,大数据中的数据集可以由几十兆字节至数拍字节的数据组成。这指标不固定是因为传统数据库管理系统以至NoSQL等新型数据库,它们的科技和处理大容量数据的能力不断在改进。
随着技术的进步,企业的数据量还将继续增加。除了针对数据量的调查,本次调研还试图量化数据的性质对于促进大数据增长的作用。调查采访了受访者们两个单独的问题:不同类型的数据所产生的数据量,以及可能导致大数据分析的数据类型。
调查显示,目前正在大规模产生的海量数据预计也将用于大数据分析。IT专业受访者们表示,目前产生最大数据量的来源为结构化的事务处理数据和电子邮件数据,分类占到数据量的62.7%和53%。这两大数据来源所产生的数据也是可用于大数据分析的最流行的两种数据类型。
后起之秀:社会化媒体内容
鉴于大多数IT用户将能够处理大量数据的能力作为大数据最为重要的益处。大容量的数据类型就更可能被用于先进的分析了。
然而,也有例外的情况发生。社会化媒体内容即是如此。相对而言,仅有较少的企业(26.9%)表示,社交媒体正在产生大量的数据信息,但是社会媒体的数据信息则占到了大数据分析很高的权重(40.5%)。
虽然从社会媒体所产生的数据量是巨大的,大多数企业尚未开始捕获并分析这些数据集。随着社会媒体流动性和影响力的继续增加,更多的企业将转向这方面平台的洞察,届时大数据技术有望在这个过程中发挥关键性的作用。相同的动机驱动因素在利用大数据来分析数字丰富的数字媒体,如视频、音频、图像方面占到的比例更高(37.3%)。
分析当前和未来的状况
该调查还研究了不同类型的业务在当前所支持和采用的先进的分析方法,并预计其将在未来的发展趋势。
顶级商务功能方面,目前正在采用和执行的高级分析包括:业务报告(71.9%),规划和预测(56.8%)和预算(53.5%),这几项在未来先进的分析性能预测中排名很低。
调查表明,目前的分析主要用于执行操作的角色。更具战略性的业务功能,如战略管理(64.8%),利润模型(58.7%),企业绩效管理(58.6%)和研发(58.3%),预计在未来的先进分析应用中将占主导地位。
这一发现表明,香港地区的企业非常了解大数据分析的战略价值。先进的分析方法是将从当前的业务支持更多转向发挥战略方面的作用。随着企业对于更大量数据和更多类型数据的收集的增加,以及分析模型演进,预计企业将在未来利用大数据分析进行战略决策。
输入和处理速度仍然很重要
尽管受访者对于数据分析速度的排名较低,但其性能似乎对本地企业来说仍然是一个问题。
该调研调查了受访者们关于查询分析结果的最佳时间。虽然大多数的IT受访者(42.1%)表示可以为结果等待一分钟的时间,超过三分之一(37.3%)的受访者则希望能够在不到10秒的时间内就得到分析结果,以满足其业务需要。
这一发现表明,输入和处理速度、以及数据量的问题将对企业的IT部门及其处理进程提出相应的要求。如果数据结构和IT基础设施还没有准备好能够在10秒内处理并分析100TB的数据,一些IT用户则表示这是无法接受的。
调查结果表明,大多数IT用户(58.5%)关心的是现有的信息基础设施所采集的大数据的状态。对于数据结构和IT基础设施缺乏信心是香港企业最为关注的问题。而如果不建立这样的信心,大数据项目的采用将很难实现。
数据分析咨询请扫描二维码
数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21大数据技术专业主要学习计算机科学、数学、统计学和信息技术等领域的基础理论和技能,旨在培养具备大数据处理、分析和应用能力的 ...
2024-11-21