京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA数据分析师 出品
编译:Mika
【导读】
如果不成为数据科学家,我们该如何区分真实与非真实的信息?如何利用信息做出更好的决策?这时,我们就需要「数据素养」这种技能。本文中,数据分析热爱者Jordan Morrow就分享了他的观点。
我们之中有多少人曾在刷手机新闻时,注意力突然被其他的消息吸引,同时开始产生疑问"这个消息正确吗?" 或者我们之中有多少人曾在看报纸等纸质媒体时,怀疑上面信息的真假。
在如今生活的世界中,每天都会产生很多即时信息,我们如何解读这一切?而且不只解读这一切,我们如何借此做出明智且有深度的决定?
如果我现在告诉你,世界上真的有一个所有人都能学会的技能,而且不只学会,还能精通。这个技能能让我们更好地了解数据和信息,再由数据提供的信息做出决定。
听起来好到不真实?我保证这不是假的,而且所有人都能做到,这项技能就是"数据素养"。
在我解释数据素养是什么之前,我想帮大家先建立一些基础,从而了解在科技和信息影响下我们所生活的时代和世界。
我们现在活在的时代被称作"第四次工业革命"。
这到底是什么意思?这意味着数字世界。我想每个人都赞同,我们正生活在一个相当数字化世界。事实上,现在几乎每个人都有智能手机。
为了让我们更了解这个情况,我要带大家看看几个例子。只想让你知道我们的世界是多么的相互连接,而且有多少信息被创造出了。
第一个例子,你知道如今你需要有触摸屏的冰箱吗?而且不只是触摸屏,它还能帮你播放影片,告诉你天气。你知道你需要它吗?其实我就有一台这种冰箱。
第二,你知道你需要联网的洗碗机吗?那样在你正在影院看电影时,中途洗碗机还能通知你,碗已经洗好了。你知道你需要它吗?
第三,你知道手动打开淋浴洗澡,已经变得太过困难了吗?现在你能下载一个app,帮你把水打开。而且还能设定到你想要的水温。不只如此,还能在浴室安一个触摸屏,又有电又有水。你知道你需要它吗?
现实是,所有事物都被连接在一起,而且不只连在一起,同时还为我们创造了什么?那就是数据和信息。
如今,数据被称为新石油。但我们必需退一步来看,才能更清楚的了解,数据是有价值的资产。但就像石油,必须要经过人和精炼才能有价值,这就是数据素养。
就定义而言,数据素养指的是有阅读、利用、分析和质疑数据的能力。这四项技能遍布各个维度和层面。
注意,数据素养不是数据科学。世界上并不是所有人都必须当数据科学家,但所有人都必须熟悉数据,这样才能在第四次工业革命中成功。
让我们深入这四项技能来更了解它们。为此,假设一个场景,比如我们要去买冰箱。
以下现在我要提到的几点,不仅能用在私人生活,还能用在公共方面;同时还能应用于商业和社会层面。
1. 阅读数据的能力
第一个技能是阅读数据的能力。
假设我们去商场买冰箱。一开始,我们完全不知道哪款适合自己。因此我们的第一步就是,要阅读所提供的冰箱信息和数据。
当你在网上搜索"阅读”一词的含义,它表示:看到某个事物并理解它。
当我们走进一家店,那里共有30款冰箱。我们可以阅读所提供的信息,理解它,以做出更明智的决定。
阅读数据是很强大的能力,这能让我们在第四次工业革命中解放我们的思想。
回想几百年前,你可知道能够阅读可能是个罪行吗?我绝不是说能够阅读数据是某种罪行,但就像几百年前一样,面对这些信息,能够阅读且理解它是一项关键技能。
2. 利用数据的能力
回到买冰箱的场景。我们现在需要第二个数据素养的技能,就是能够利用数据。
现在,有人可能会问"这意味着我必须擅长计算机科学和统计学才能利用数据吗?"
答案是否定的。
这意味着,我们能够得心应手的面对呈现眼前的数据。比如网络上曾流行的一些骗局,能够利用和解读数据就能让我们识别这些骗局,免于被骗。
3. 分析数据的能力
当我们选购冰箱时,每个冰箱都有性能表,我们需要吸收吸收上面的信息。这样就涉及到数据素养的第三个技能,分析数据的能力。
数据分析也就是理解信息背后的"为什么"。我常说,我们要突破表面的观察,进行深入了解,得出领悟。
现实情况中,当社交媒体上某个事件火起来时,我们多半在观察呈现于眼前的信息。
在买冰箱的例子中,店里有30款冰箱,也许当中有5款吸引了我们的注意力,我们进行观察。接着要分析这5款冰箱的信息,并得出结论,这样才能让我们做出更明智的决定。
分析也意味着,勇于提问。在社交媒体盛行的今天,我们应该有质疑的能力。
4. 质疑数据的能力
第四个技能就是,质疑数据。
注意,我不是鼓励你买冰箱时和导购争论。
质疑数据意味着两件事:
第一、质疑呈现在你面前的信息。比如向冰箱导购提出很多问题,询问产品能为你提供什么。
第二、提出立场,并利用信息为立场背书。
举个例子,我和老婆要对房子进行重新装修,还要买新的冰箱。我们在所有事情上都能达成共识吗?才不。我们都有自己的立场。我们质疑,用事实和数据来支持各自的立场,一起决定哪款冰箱最适合我们。
以上提到的这四个技能:阅读、利用、分析和质疑数据,使人人能够理解所有的信息,再以此作决定。
我常常被问:
"我要如何开始?我该做什么?"
"我要回到学校去学统计学吗?"
"我要学怎么编程吗?"
我相当理解,并不是每个人都像我一样是技术宅。也不是每个人都想去学统计学。
那么你该怎么做呢?
我有一个方法,称为"数据素养的两个C"。
第一个C指的是好奇心(Curious)。
我有5个孩子,猜猜他们每天问我多少问题?而意外的是,我从不想让他们别问我问题。
我看着我的孩子们分析问题,得出哪些天马行空的答案。
因为某些原因,长大成人后,我们的好奇心也随之消失了。变得好奇并质问所有事情,这就是培养数据素养的开始。
第二个C是创造力(Creativity)。
如今,关于人工智能、计算机、机器对于未来的影响有很多讨论。我们已经身处在第四次工业革命中,并生活在一个数字化的世界。而我要告诉你,世上最强大的计算机就在这里——即我们的大脑。
在数据中,不应该排除人的参与,而是应该将人与数据、机器、人工智能结合起来。并且数据素养的四个技能遍布各个层面。
第二个C创造力,能运用人的思维,看那些看似无聊或平凡的事物。数据和信息具有力量。
整体来说,当我们提升增进阅读、利用、分析和质疑数据的能力,在社会、商业和生活层面,我们的世界真的会被改善。
如果你想要在未来和在数字化世界中,找到成功的简单方式,那就是成为有"数据素养"能力的人,谢谢。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29