大数据时代的小数字感:数据再有价值,别人听不懂照样没用
目前,“大数据”概念已经深入人心,很多人都喜欢谈论大数据。而我们利用数据,其中一个很重要的目的在于,用之为决策提供支持。因此,如何有效地呈现出大数据给出的结果,并把数据以“人话”说出来的,并让受众(很可能是你的上司)听得懂,就显得非常重要的!
想做到这一点,就得迎合人性,或者,更具体点说,要迎合人类大脑的特征。
一部经典电影引出来的数字感
如果你看过巴里·莱文森导演的经典奥斯卡电影《雨人》(RainMan),或许你不会忘记其中一个非常有意思的桥段:在餐馆里,患有自闭症的哥哥(达斯汀·霍夫曼饰),面对散落一地的牙签,目测就能将其分成三小堆,并能很快给出每小一堆牙签的数量:82,82,82,然后又瞬间心算出牙签总数:246。
哥哥的心算能力,的确不错,但相比于他高超的数字感——能达到82,那只能说,惊为天人了。
当然,这仅仅是影视作品,我们知道,影视作品通常是基于生活,而高于生活的。那么真实的生活场景,我们普通人又是什么样的呢?数字感又是个什么东东呢?
在进行解释之前,请读者快速浏览一下如图1所示图片,不用数出来,告诉我,你看到了多少张人物脸谱?
图1 数字感测试
相信绝大部分人,都能瞬间给出正确的答案:五个!而无需用从一数到五。美籍数学家托拜厄斯·丹齐克(Tobias Dantzig)指出,这就是一种“数字感(number sense)”,亦称数(shù)觉,它是一种不通过数(shǔ)数(shù),就能一眼看出物之多寡的感觉。
乌鸦也有数字感
这种原始的数字感,在很多动物身上也有体现,例如鸟类。丹齐克在其科普名作《数:科学的语言》中,就提供了一个有趣的例子:
有一只乌鸦,在一个庄园主的望楼里筑巢,园主不胜其扰,决心打死这只乌鸦,但他尝试了多次,都没有成功,因为人一旦靠近,乌鸦就非常警惕地飞离了巢穴,远远地待在树上,耐心地等人离开望楼,然后再飞回巢穴。
图2 乌鸦的数字感
有一天,园主心生一计:决定让2个人同时走进望楼,然后留一个潜藏其内,另一个出来走开。但这个乌鸦并不上当,它还是等着,直到第二个人出来。
这个实验一连做了几天:两个人,三个人,四个人,都没有成功。最后,用了五个人:也像前几天一样,先一起进望楼,然后留一人潜藏其内,其他四个人走出来。这次奏效了,乌鸦的数字感终于“失灵”了——也就是说,但集合变大后,乌鸦已经无法辨别四与五的差别,因此它马上飞回巢里,然后就被留在望楼的人,逮个正着。
人类的数字感有多强?
“数字感”是动物的基本心理特征之一。丹齐克指出,“一种比鸟类高强不了多少的原始数觉,就是我们有关数字概念的核心。”
但是,我们能否将这种数字感(即数觉),和人类的其它五种感觉(即视觉,听觉,嗅觉,触觉和味觉)相提并论吗?
答案是:还真能!
在2013年9月6日的《科学》杂志上,荷兰乌得勒支大学(Utrecht University)研究小组,对这一问题实施了深入的研究[3]。这项研究表明,我们的大脑,有一个固定的区域来处理数字感,从而使得我们具备不用计数就能感知数目的能力——也就是说,事实上,我们人人都是具备第六感的(女人那项特殊的专有感觉,要排名第七了!)。这项研究打破了原有的界限:大脑的一边负责处理来自感觉器官的刺激,另一边负责管理抽象概念(比如数字)。
数字,在本质上,是人类是对实物的一种抽象。人类接受这种抽象的能力,历经年代非常久远。英国著名哲学家伯特兰·罗素(Bertrand Russell,1872~1970)针对数的抽象性,总结道:“仅仅在文明的高级阶段上,我们方能以一串数(自然数串)作为我们发现的起点。在远古时期,发现一对锦鸡和两天,都是数字二的实例,一定需要很多时代。其中所包含的抽象程度确实不易达到。”
作为高智慧群体,人类相比于其它动物,这种数字感相对较强。但这个“相对性”也是非常限度的,在目标个数超过7个时,人类的这种感觉也会明显下降。
读者可以尝试看图3所示的图片,在图3第一列中,无论黑点的大小或形状如何变化,你都能一眼判断出目标的数量为1。在第二列中,也没有问题,你也可以秒测出目标数量为4。而在第三列,你可能就没有那么容易在不数数的情况下得出答案为7。当目标元素的个数继续上升,人类的这种引以自豪的数字感,或者说对抽象数字“浑然天成”的理解,就会迅速衰减。
图3 不同个数元素的数字感测试(图片来源《科学》)
从数字感得出什么启发?
从上面的讨论,我们能得出什么启发呢?那就是,如果你想让你的受众,一点也不费力地理解你的数字,你最好换个说法,尽量用10以下的数字来描述。
比如,在加多宝广告里,最好不要给出一个海量数字自夸销量,例如说在中国,我们每天售出312 458罐加多宝(无法得到准确数字,此处仅为说明问题,而虚构了一个大数字)。而是更好的说法可能是:“中国每卖10罐凉茶,7罐加多宝!”这里,我们不去争论其中的是非曲直,但后者用小数字,明显更能打动消费者,因为这样的小数字,他们更容易听懂!
再比如说,如果你是医生,要叮嘱尿路结石的患者,每天要喝1500ml水。这样冰冷冷的数字,患者很容易无感。但是换一种说法,对患者说,你每天喝3瓶农夫山泉的水量,患者的记忆效果就好很多。
此外,另一个方面的启发是,说到底,人还是一个感性居多的动物。人类用了几百万年的进化,才对小于7的数字有瞬间秒懂的数字感。而理解更为复杂的数据,必须越过更高的认知壁垒,才能对客观数据对象建立相应的心理图像,完成认知理解过程。
人类有个爬行脑(那个控制人欲望的那部分大脑)更喜欢视觉化的信息,而不是抽象信息。因此,只有迎合大脑的特性,才能让我们的数字,具有冲击力和感染力,进而更具有说服力。
万维钢先生最近(2016年8月12日)写了一篇小短文《要怎么说,别人才能听懂你的数据》,文中就列举了一个案例:2016年6月《纽约时报》刊登了一篇文章(Compare these gun death rates: The U.S. is in a different world)[4],这篇文章的主旨,是用统计数据来说明美国枪支的泛滥程度,事实上,这个话题毫不新颖,但可圈可点的是,或者说值得数据科学家借鉴的是,文章作者解释数据的方法,别具风格。
根据美国FBI统计,2014年,美国有8 124人死于枪杀。人类那点可怜的数字感,对于这个数字的感觉,只能感性地停留在控枪的情况“比较糟糕”。但具体情况有多糟糕,报纸的受众基本上是没有什么概念的。
而《纽约时报》的做法是——尽量降低数字,增强数字感!
美国人口共有三亿多人,死于枪杀的8124人,其实,这相当于每百万人有31人死于枪杀,平摊到每一天,日死亡27人。
可是国家这么大,每天死亡27人,又有什么特别的呢?
正可谓,不比不知道,一比吓一跳!
文章作者接着又把美国的枪杀死亡数字,跟其它发达国家做了横向对比:假设其它国家的人口,也和美国人口一样多,那么他们日死亡于枪杀的数字又分别是多少呢?文章给出了如图4所示的可视化图。
图4 美国与其它发达国家死于枪杀的人数对比图(图片来源:纽约时报)
由图4可轻易看出,美国就是一个孤立点,“鹤立鸡群”,其死于枪杀的人数,在发达国家中遥遥领先,这就给人以强烈的冲击力——美国的控枪,势在必行了!
结语:
由此,我们可以得知,数据是理性的,而给人震感的,却是感性,而连接感性和理性的途径,靠的就是受众的数字感和数字的可视化。
数据再有价值,别人听不懂,照样没用。抓住人性特征,充分利用人的数字感和可视化青睐,以良好的数字呈现方式,可以让冰冷冷的数字瞬间活过来。
在大数据时代,对于数字,数据科学家们懂,不算懂。大家懂,那才叫真的懂!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31