热线电话：13121318867

统计之 - 相关性(Correlation)分析_数据分析师

2014-11-09

统计之 - 相关性(Correlation)分析_数据分析师

相关分析（correlationanalysis），相关分析是研究现象之间是否存在某种依存关系，并对具体有依存关系的现象探讨其相关方向以及相关程度，是研究随机变量之间的相关关系的一种统计方法。相关关系是一种非确定性的关系，例如，以X和Y分别记一个人的身高和体重，或分别记每公顷施肥量与每公顷小麦产量，则X与Y显然有关系，而又没有确切到可由其中的一个去精确地决定另一个的程度，这就是相关关系。

相关分析与回归分析在实际应用中有密切关系。然而在回归分析中，所关心的是一个随机变量Y对另一个（或一组）随机变量X的依赖关系的函数形式。而在相关分析中，所讨论的变量的地位一样，分析侧重于随机变量之间的种种相关特征。例如，以X、Y分别记小学生的数学与语文成绩，感兴趣的是二者的关系如何，而不在于由X去预测Y。

相关分析的分类

1. 线性相关分析

研究两个变量间线性关系的程度。用相关系数r来描述。

正相关：如果x,y变化的方向一致，如身高与体重的关系，r>0；一般地
· |r|>0.95 存在显著性相关；
· |r|≥0.8 高度相关；
· 0.5≤|r|<0.8 中度相关；
· 0.3≤|r|<0.5 低度相关；
· |r|<0.3 关系极弱，认为不相关
负相关：如果x,y变化的方向相反，如吸烟与肺功能的关系，r<0
无线性相关：r=0

如果变量Y与X间是函数关系，则r=1或r=-1；如果变量Y与X间是统计关系，则-1。

r的计算有三种：

① Pearson相关系数：对定距连续变量的数据进行计算。

② Spearman和Kendall相关系数：对分类变量的数据或变量值的分布明显非正态或分布不明时，计算时先对离散数据进行排序或对定距变量值排（求）秩。

2. 偏相关分析

研究两个变量之间的线性相关关系时，控制可能对其产生影响的变量。如控制年龄和工作经验的影响，估计工资收入与受教育水平之间的相关关系。

3. 距离分析

是对观测量之间或变量之间相似或不相似程度的一种测度，是一种广义的距离。分为观测量之间距离分析和变量之间距离分析。

不相似性测度：

对等间隔(定距)数据的不相似性（距离）测度可以使用的统计量有Euclid欧氏距离、欧氏距离平方等。

对计数数据使用卡方

对二值（只有两种取值）数据，使用欧氏距离、欧氏距离平方、尺寸差异、模式差异、方差等。
相似性测度：

等间隔数据使用统计量Pearson相关或余弦。

测度二元数据的相似性使用的统计量有20余种。

CDA学员免费下载查看报告全文：2026全球数智化人才指数报告【CDA数据科学研究院】.pdf

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

特征数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇随机森林 vs XGBoost vs 决策树：算法选择中的

下一篇图论在大数据分析中的作用！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

统计之 - 相关性(Correlation)分析_数据分析师

相关分析的分类

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】大数据赋能，精准破局——程序化广告技 ...

【CDA干货】精准防控，长效留存——玩家用户流失监 ...

从战略到行动：CDA数据分析师视角下的指标体系搭建 ...

【CDA干货】Power BI切片器全选功能添加指南：高效 ...

【CDA干货】以数为据，以析促优——数据分析结果指 ...

从“万能基石”到“定制利器”：CDA数据分析师视角 ...

权威收录｜CDA数据科学院发布的《2026 全球数智化人 ...

【CDA干货】基于客户行为数据序列的意图识别模型构 ...

【CDA干货】数据清洗全流程常见问题解析：规避陷阱 ...

从零散数字到体系洞察：CDA数据分析师视角下的指标 ...

【CDA干货】数据波动性评估：从量化分析到风险防控 ...

【CDA干货】多变量一般线性分析结果解读：从数据关 ...

从样本到总体：CDA数据分析师视角下的参数估计 ...

【CDA干货】SQL日期提取：从文本到可用数据，解锁时 ...

【CDA干货】特征重要性分析：解锁机器学习模型价值 ...

从“杂乱”到“有序”：CDA数据分析师视角下的数据 ...

【CDA干货】数据分析与数据挖掘：必备工具与核心技 ...

【CDA干货】SQL 查询结果转换为字符串：场景、方法 ...

从汇总到洞察：CDA数据分析师视角下的透视分析方法 ...

从表格到洞察：数据分析师视角下的表格结构数据特征 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

统计之 - 相关性(Correlation)分析​_数据分析师

相关分析的分类

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】大数据赋能，精准破局——程序化广告技 ...

【CDA干货】精准防控，长效留存——玩家用户流失监 ...

从战略到行动：CDA数据分析师视角下的指标体系搭建 ...

【CDA干货】Power BI切片器全选功能添加指南：高效 ...

【CDA干货】以数为据，以析促优——数据分析结果指 ...

从“万能基石”到“定制利器”：CDA数据分析师视角 ...

权威收录｜CDA数据科学院发布的《2026 全球数智化人 ...

【CDA干货】基于客户行为数据序列的意图识别模型构 ...

【CDA干货】数据清洗全流程常见问题解析：规避陷阱 ...

从零散数字到体系洞察：CDA数据分析师视角下的指标 ...

【CDA干货】数据波动性评估：从量化分析到风险防控 ...

【CDA干货】多变量一般线性分析结果解读：从数据关 ...

从样本到总体：CDA数据分析师视角下的参数估计 ...

【CDA干货】SQL日期提取：从文本到可用数据，解锁时 ...

【CDA干货】特征重要性分析：解锁机器学习模型价值 ...

从“杂乱”到“有序”：CDA数据分析师视角下的数据 ...

【CDA干货】数据分析与数据挖掘：必备工具与核心技 ...

【CDA干货】SQL 查询结果转换为字符串：场景、方法 ...

从汇总到洞察：CDA数据分析师视角下的透视分析方法 ...

从表格到洞察：数据分析师视角下的表格结构数据特征 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

统计之 - 相关性(Correlation)分析_数据分析师