二、大数据面面观
当前,大数据正处于快速发展期,每个人对于大数据都有不同的认识,那么什么是大数据?其基本特征又是什么呢?这就需要我们从多个维度来理解和认识大数据。
(一)何谓大数据
所谓大数据,是指以服务于决策为目的,需要新型数据处理模式才能对其内容进行采集、存储、管理和分析的海量、高增长率和多样化的信息资本。认真分析大数据,其本质体现在如下五个方面:第一,数据量大。相对于传统的抽样调查的数据,大数据无疑是巨大的,尤其是依靠传统的计算手段难以有效计算的。第二,服务于决策。大数据的主要目的是服务于各类决策,能够帮助各类组织和个人大幅度提升决策能力。第三,需要新处理模式。由于大数据数量大且非结构化数据很多,现有的处理模式不能有效处理大数据,需要新处理模式。第四,信息资本。大数据是一种信息资本,而不仅仅是一堆数据和成本。所谓信息资本,是指其能够为政府和企业带来未来经济利益的信息资源,更是和土地、资本、人才等一样的新生产要素。第五,更为复杂。大数据比海量数据更为复杂,海量数据包括结构化和半结构化的交易数据,而大数据除此之外还包括非结构化数据和交互数据。
(二)大数据的特点
大数据在量度、频度、速度、维度和温度五个方面具有显著的特点,具体如下:
第一,在量度方面,具有海量性特点,即大数据规模巨大,当前通常指10TB规模以上的数据量,而且随着数据的迅猛增加,大数据的量级还会进一步增加。
第二,在频度方面,具有高频率的特点,即发生的频率很高,重点在于用户参与与互动而产生的数据。在这方面,传统媒体的发行用户数据的价值就很小,关键在于其发行用户非在线,基本上一年才更新一次。
第三,在速度方面,具有实时性的特点,即大数据能够实时反应。例如,在Google搜索框内输入一个关键词,就能够瞬间呈现与其相关的信息,一旦其反应速度稍有不及,就会有大量的用户流失。
第四,在维度方面,具有全样本、多维度、非结构化的特点,即大数据是全体样本的数据,而不是抽样的数据;大数据是多个维度的数据,而不是单个维度的数据;大数据既有惯常的结构化的数据,也有音频、视频等非结构化的数据,而不仅仅是结构化数据。
第五,在温度方面,具有在线性特点,即大数据是永远在线的,能够随时被调用的,这就要求必须基于用户数量巨大的互联网平台。这些平台记录了用户的行为、情感、思想、爱好与需求,能够科学地分析用户的需求。
此外,可以按照生产的主体不同,把大数据分为商务过程数据(由传统的信息系统产生)、环境状态数据(由传感器产生)、社会行为数据(由社交媒体产生)、物理实体数据(由数字化制造产生)四种类型。当然也可以按照归属主体分为政府数据和企业数据,其中政府数据又分为民意数据、业务数据和环境数据。
(三)大数据蕴含着新思想和新思维
在大数据出现之前的小数据时代,我们只能通过抽样调查的方式来回答“为什么”,即找出“因果关系”,找出事情的前因后果。即使有相关关系的研究,重点也是研究“因果关系”。
在大数据时代,大数据大大拓宽了研究范围,大数据能通过全样本的方式来回答“是什么”,即发现相关关系,这能够帮助我们更好地认识和了解世界。因此,大数据既能处理“因果关系”,又能处理“相关关系”,即不仅能够回答“为什么”,又能够回答“是什么”。
典型的相关关系而非因果关系的案例主要有:沃尔玛啤酒与尿布的混搭;鲨鱼对人类的攻击次数和冰淇淋的销量是正相关的;儿童的蛀牙数量与他们的词汇量是正相关的;在美国,自2004年以来,“体重增加”与“房屋出租”的相关性达到90%。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
俗话说的好“文不如表,表不如图”,图的信息传达效率很高,是数据汇报、数据展示的重要手段。好的数据展示不仅需要有图,还要选 ...
2025-01-24数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪70 ...
2025-01-24又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-23“用户旅程分析”概念 用户旅程图又叫做用户体验地图,它是用于描述用户在与产品或服务互动的过程中所经历的各个阶段、触点和情 ...
2025-01-22在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-22在数据分析领域,Excel作为一种普及率极高且功能强大的工具,无疑为无数专业人士提供了便捷的解决方案。尽管Excel自带了丰富的功 ...
2025-01-17在这个瞬息万变的时代,许多人都在寻找能让他们脱颖而出的职业。而数据分析师,作为大数据和人工智能时代的热门职业,自然吸引了 ...
2025-01-14Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09在如今这个信息爆炸的时代,数据已然成为企业的生命线。无论是科技公司还是传统行业,数据分析正在深刻地影响着商业决策以及未来 ...
2025-01-08“数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而言,数据指标体 ...
2025-01-07在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-06在现代企业中,数据分析师扮演着至关重要的角色。每天都有大量数据涌入,从社交媒体到交易平台,数据以空前的速度和规模生成。面 ...
2025-01-06在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02