数据分析方法之数据分类
分类与对比一样,是人类认知事物的基本方法。人类在征服大自然的过程中,先通过各种对比来认知事物,然后把事物之间的差异和相似之处进行总结,给相似的一类事物贴上一个标签,例如将不动的但会慢慢生长的事物叫作“植物”,将会动的事物叫作“动物”;吃肉的动物对于人类是“危险的”,吃草的动物对人类的威胁不大,是“安全的”。其实这就是一种分类的方法。
分类是由“分”和“类”组成的,其本质就是把事物分开,归到不同的类别中并分别识别,从而获得对事物的重新认知。如果我们把客户分成不同的类别,就可以更仔细地识别客户。如果将客户按照大小来分类,就有了大客户、中客户和小客户,这样我们对“客户”这个研究对象就有了更加深刻的认知,对所拥有的客户结构也有了更加深入的了解。例如我们总共有300个客户,如果将其分成10个大客户、30个中客户、60个小客户、200个微客户,那么客户从一个整体变成了由4种客户组成的结构化组合,如下图所示。
汉字分4大类:象形字、会意字、指事字、形声字。“分”就是会意字,拆开看是由“八”和“刀”组成的,本质就是将事物一个切成八刀。在日常生活中,最简单和最基本的拆分事物的方法就是一分为二,笔者把它叫作“一体两面”。
举一个例子,“事情”一词可分为“事”与“情”,做事情肯定与人有关,中国人讲关系、讲人情,所以做事情的时候一定包括“事”与“情”两个方面,即做事情和沟通感情。我们要成就一件事情,就要把握两个方面:“事”要做好,“情”也要做好。
数据分析师大多是工科出身,喜欢钻研技术、算法,却不善于沟通,在“事”方面做得再厉害,也只是在“事情”的一方面上做得很好,但也要在“情”上做得很好。在公司工作时,能否与人深入沟通,能否让更多的人了解你为什么这样做、这样做有什么好处、带来什么价值,能否让别人心甘情愿地听你的,这些都是关于“情”的方面,也是关于“人”的方面。
因为“情”都是跟人有关系的,所以可以将“事情”拆成“事”和“人”。用重要性来评价这两个维度就会形成一个矩阵——“人事矩阵”。这个矩阵可分为4个象限。我们在评价一件事情时,要看“事”和“人”对我们的重要程度。如果“事”重要,“人”也重要,处理时需要有双赢的结果,可以采用双赢策略;如果“人”很重要,而“事”不重要,则为了让对方高兴,让对方赢,可以采用妥协的策略;如果“事”很重要,而“人”不重要,则可以采取竞争策略;如果“事”不重要,“人”也不重要,则可以采取放弃的策略,如下图所示。
例如在生活中,夫妻之间为了一些事情吵架,因为夫妻是要过一辈子的,所以“人”很重要,“事”就不那么重要了,你所采取的策略就只能是双赢和妥协。但是双赢策略容易导致竞争,过多注重“事”的重要性就会进入竞争环节,把吵架升上到打架,就是把“事”看得太重要了,把“人”看得不重要了。
在公司里也是同样的道理。在公司里人际关系是很重要的,但是做事也很重要,公司是一个做事的环境,所以在公司里要尽可能采取双赢的策略;如果人不太重要,像与协作方、供应商等都是商业关系,关系不是那么紧密,一般采取竞争策略;但是如果一家公司历史悠久,人员关系稳定,同事关系超过10年以上,则会很容易弱化事情的重要性,强调人与人关系的重要性,把人看得过于重要,最后只能采取妥协的策略,如下图所示。所以,越是历史悠久的企业,变革管理越难。
下面再介绍一个矩阵——GE矩阵。在做产品或者业务分析时,可以通过产品的未来发展潜力(或行业吸引力)和现在的市场占有率这两个维度对产品进行描述。
麦肯锡在给GE做咨询的时候发现波士顿矩阵有一定的局限性,因此增加了市场吸引力指标,包括业务未来发展前景如何、竞争水平如何、发展速度如何、客户资源状况如何等,由此形成了GE矩阵。GE矩阵有更多的维度来评价市场吸引力和业务竞争力。GE矩阵在本质上是把业务分为两个维度来描述形成的矩阵,我们称其为矩阵分析法。
把一个事物分为两个方面,能够更全面地观察事物的变化情况。在分类时必须要有标准,也就是分类的维度或者看问题的视角。例如把事情从人的重要性和事的重要性两个方面来看,就形成了“人事矩阵”;在处理大量事情的时候,把事情从重要性和紧急性两个方面来看,就形成了时间管理矩阵,如下图所示。
重要且紧急的事情要首先处理;重要但不紧急的事情可以按计划来处理,但千万不能等到事情变得紧急的时候再处理;紧急但不重要的事情可以授权给下属或者其他人去处理;不重要也不紧急的事情,或者没有必要去做的事情,能推掉就推掉吧。
“分”一定要有维度,可以按单维度分,例如新客户和老客户是按时间进行分类,大客户和小客户是按客户的规模进行分类。按客户的规模分类也有不同的分类方式,可以按客户对公司的贡献来分,对公司贡献大的叫大客户,贡献小的叫小客户;
也可以按客户自身的规模来分,虽然GE、阿里巴巴只在你的店里买了一个小图钉,但是其也算大客户,因为公司规模很大。这两种分法是完全不同的,虽然都是按规模来分,关键在于用什么“规模”指标来分,用客户自身的规模来分,则是站在客户的角度;按客户对公司的贡献来分,则是站在公司的角度。RFM模型是三维度分析方法(见下图),用来从企业的角度去分析客户,其三个维度分别为:R——时间进度,代表客户的活跃度或者流失风险;F——购买次数,代表客户的忠诚度;M——购买的金额,代表客户的购买量或金额贡献。这三个维度是从企业管理客户的角度来分的,不是从客户自身特征的角度来分的,所以RFM模型不能看作是客户分类的模型。一个购买量大的客户,不见得其自身就是“大客户”,而一个企业规模大的客户,可能其购买的数量和金额都很小。
RFM模型用来指导企业内部的客户管理。针对不同的客户,企业需要采取不同的策略。F和M值都很高的客户,但R值变大了,说明客户处在休眠期,需要对客户采取激活策略;当R值很小,F值很高,但M值很小,说明这是一个少量多次购买的小型忠诚客户,企业除了要维护他们的利益,还需要采取一定的措施增加他们每次的购买金额,减少购买次数。因为购买次数在整个企业中是“成本中心”,客户每次购买都需要专门的人员进行跟踪、服务,这就导致企业的服务成本很高,所以可以引导客户提高每次的购买金额。RFM模型本质上是客户经理们的绩效评价模型以及管理客户的工具,而不是对客户进行描述的模型。
在对客户进行分类时,可以从各种维度去分析客户,将维度两两组合都可以进行矩阵分析。
下面以一个建筑企业采购水泥为例,从其自身的成长性和与我们的合作关系角度对其进行分析。有一家建筑企业从我们这里采购多少水泥,从其他供应商处采购多少水泥,我们在这家企业供应商中的排名如何,代表着我们与这家建筑企业的客户关系紧密程度。虽然这家企业的销售额可能每年没有太多的增长,但是每年从我们这里采购的水泥数量都在增长,即从其他供应商处削减了采购量,在我们这里增加了采购量,所以从我们的角度来衡量,此客户是增长型客户。客户在我们这里采购额的增长并不代表客户的销售额在增长,也不代表客户对我们的忠诚度或者依赖度在增加。所以,我们在进行数据分析的时候,要清楚数据所代表的本质含义,不能把一个数据的含义给放大了。如果在RFM模型中客户的M值高就认为它是大客户,这是错的;如果客户在我们这里的采购额增加就认为它是增长型客户,这也是错的。这是笔者在讲解数据分析的时候特别强调的观点——基于数据,不要放大数据的内涵和外延。数据的观测点非常重要,是站在自己的角度还是站在客户的角度来分析,结论是不同的。
分类的标准就是分类的维度,一个分类维度叫作单维度,两个分类维度叫作矩阵,三个分类维度就形成了魔方,例如RFM模型就是三个维度的魔方。多维度可以用雷达图、扇形图或其他图形来表示,例如衡量市场竞争要素常用的模型——八爪鱼模型就是从八个维度来分析产品的市场竞争力的。
分类是一个非常强大的工具,没有分类,我们对事物的认识就只能停留在表面。例如,企业要对产品的销售额进行分析,可以从两个不同的视角来看,一个是不同业务的组成,另一个是不同区域的组成,可以通过这两个维度来了解企业的产品组成状况,如下图所示。
在分类的时候可以有很多自己的创意。早在2004年,笔者作为万科“千亿元目标战略项目”的项目组长,帮助万科做了一个客户细分。当时我们向美国的房地产公司老大——普尔特房屋公司学习。普尔特在对客户分类时有一种特殊的维度——家庭生命周期,其将客户分为单身家庭、丁克家庭、有小孩的家庭、有成年孩子的家庭和空巢家庭,家庭在不同阶段就会有不同的住房需求。2004年,当时中国人的理念还是一个家庭一辈子就买一套房子,但是我们进行一个大胆的假设:未来中国的家庭也会根据不同的家庭阶段换不同的房子,并且这会成为常态,因此,我们把万科的客户细分加入一个新的维度——用户家庭生命周期,如下图所示。
这种分类看似很简单,但要找到这个“分”的维度,需要对事物、对商业有充分且深刻的理解。
对于现有的互联网公司,可以从业务的角度对其进行分类,例如阿里巴巴是平台型电商公司,京东是物流型电商公司,百度是搜索引擎型公司,腾讯是通信社交型公司,网易是游戏型公司,新浪是媒体型公司……这些是从各个公司主营或者最大的业务模块来分类的。我们也可以从互联网发展的历程来看不同业务的发展潜力,互联网从一个媒体型工具(互联网媒体、新闻、搜索、信息传播),逐步发展成内容传播平台(微博、博客等)再发展成社交平台(微信、脸书、推特等),目前,互联网开始在传统行业中普及应用,并有了新的创新应用领域,发展成了资源整合平台(O2O服务、共享经济、微商等)。这些都是一个技术在发展阶段上的应用创新所带来的时代变化,这些也影响着不同业务的商业价值,越紧跟时代的技术价值越高,所以媒体型的新浪只有30亿美元左右的市值,游戏平台型的网易则有接近200亿
美元左右的市值,而电商平台型的阿里巴巴和社交平台型的腾讯则有接近2000亿美元的市值,如下图所示。
分类是一种基本的分析方法,但这里面深藏着对事物本质的理解。如果你把互联网看成媒体,那么你就是传统的互联网门户网站(网易、搜狐、新浪)。而随着互联网技术的快速发展,互联网已经不仅仅是媒体,不仅仅是门户网站,而是具有了更多的能量。如果你把互联网看作一个平台,那么你就是阿里巴巴和腾讯,这两家企业都在做平台,一个做交易平台,一个做沟通平台。那么未来的互联网会是什么?
这个很难回答,就如同在1999年时,极少人能够知道在互联网中可以做出滴滴打车、Facebook、微信、Uber等产品。当然不排除猜对的人,但目前的共识是:互联网正在与传统行业深度融合并发生化学变化,引导着传统行业重构。
数据分析咨询请扫描二维码
在准备数据分析师面试时,掌握高频考题及其解答是应对面试的关键。为了帮助大家轻松上岸,以下是10个高频考题及其详细解析,外加 ...
2024-12-20互联网数据分析师是一个热门且综合性的职业,他们通过数据挖掘和分析,为企业的业务决策和运营优化提供强有力的支持。尤其在如今 ...
2024-12-20在现代商业环境中,数据分析师是不可或缺的角色。他们的工作不仅仅是对数据进行深入分析,更是协助企业从复杂的数据信息中提炼出 ...
2024-12-20随着大数据时代的到来,数据驱动的决策方式开始受到越来越多企业的青睐。近年来,数据分析在人力资源管理中正在扮演着至关重要的 ...
2024-12-20在数据分析的世界里,表面上的技术操作只是“入门票”,而真正的高手则需要打破一些“看不见的墙”。这些“隐形天花板”限制了数 ...
2024-12-19在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17数据分析,是一项通过科学方法处理数据以获取洞察并支持决策的艺术。无论是在商业环境中提升业绩,还是在科研领域推动创新,数据 ...
2024-12-17在数据分析领域,图表是我们表达数据故事的重要工具。它们不仅让数据变得更加直观,也帮助我们更好地理解数据中的趋势和模式。相 ...
2024-12-16在当今社会,我们身处着一个飞速发展、变化迅猛的时代。不同行业在科技进步、市场需求和政策支持的推动下蓬勃发展,呈现出令人瞩 ...
2024-12-16在现代商业世界中,数据分析师扮演着至关重要的角色。他们通过解析海量数据,为企业战略决策提供有力支持。要有效完成这项任务, ...
2024-12-16在当今数据爆炸的时代,数据分析师是组织中不可或缺的导航者。他们通过从大量数据中提取可操作的洞察力,帮助企业在竞争激烈的市 ...
2024-12-16