使用R语言绘制其他图形之相关系数图-CDA数据分析师官网

热线电话：13121318867

使用R语言绘制其他图形之相关系数图

2018-05-22

使用R语言绘制其他图形之相关系数图

虽然cor()函数可以非常方便快捷的计算出连续变量之间的相关系数，但当变量非常多时，返回的相关系数一定时读者看的眼花缭乱。

下面就以R自带的mtcars数据集为例，讲讲相关系数图的绘制：

cor(mtcars[1:7])
很显然，这么多数字堆在一起肯定很难快速的发现变量之间的相关性大小，如果可以将相关系数可视化，就能弥补一大堆数字的缺陷了。这里介绍corrplot包中的corrplot()函数进行相关系数的可视化，首先来看看该函数的语法和一些重要参数：

corrplot(corr,

method = c("circle", "square", "ellipse", "number", "shade", "color", "pie"),

type = c("full", "lower", "upper"), add = FALSE,

col = NULL, bg = "white", title = "", is.corr = TRUE,

diag = TRUE, outline = FALSE, mar = c(0,0,0,0),

addgrid.col = NULL, addCoef.col = NULL, addCoefasPercent = FALSE,

order = c("original", "AOE", "FPC", "hclust", "alphabet"),

hclust.method = c("complete", "ward", "single", "average",

"mcquitty", "median", "centroid"),

addrect = NULL, rect.col = "black", rect.lwd = 2,

tl.pos = NULL, tl.cex = 1,

tl.col = "red", tl.offset = 0.4, tl.srt = 90,

cl.pos = NULL, cl.lim = NULL,

cl.length = NULL, cl.cex = 0.8, cl.ratio = 0.15,

cl.align.text = "c",cl.offset = 0.5,

addshade = c("negative", "positive", "all"),

shade.lwd = 1, shade.col = "white",

p.mat = NULL, sig.level = 0.05,

insig = c("pch","p-value","blank", "n"),

pch = 4, pch.col = "black", pch.cex = 3,

plotCI = c("n","square", "circle", "rect"),

lowCI.mat = NULL, uppCI.mat = NULL, ...)

corr：需要可视化的相关系数矩阵

method：指定可视化的方法，可以是圆形、方形、椭圆形、数值、阴影、颜色或饼图形

type：指定展示的方式，可以是完全的、下三角或上三角

col：指定图形展示的颜色，默认以均匀的颜色展示

bg：指定图的背景色

title：为图形添加标题

is.corr：是否为相关系数绘图，默认为TRUE，同样也可以实现非相关系数的可视化，只需使该参数设为FALSE即可

diag：是否展示对角线上的结果，默认为TRUE

outline：是否绘制圆形、方形或椭圆形的轮廓，默认为FALSE

mar：具体设置图形的四边间距

addgrid.col：当选择的方法为颜色或阴影时，默认的网格线颜色为白色，否则为灰色

addCoef.col：为相关系数添加颜色，默认不添加相关系数，只有方法为number时，该参数才起作用

addCoefasPercent：为节省绘图空间，是否将相关系数转换为百分比格式，默认为FALSE

order：指定相关系数排序的方法，可以是原始顺序(original)、特征向量角序(AOE)、第一主成分顺序(FPC)、层次聚类顺序(hclust)和字母顺序，一般”AOE”排序结果都比”FPC”要好

hclust.method：当order为hclust时，该参数可以是层次聚类中ward法、最大距离法等7种之一

addrect：当order为hclust时，可以为添加相关系数图添加矩形框，默认不添加框，如果想添加框时，只需为该参数指定一个整数即可

rect.col：指定矩形框的颜色

rect.lwd：指定矩形框的线宽

tl.pos：指定文本标签(变量名称)的位置，当type=full时，默认标签位置在左边和顶部(lt)，当type=lower时，默认标签在左边和对角线(ld)，当type=upper时，默认标签在顶部和对角线，d表示对角线，n表示不添加文本标签

tl.cex：指定文本标签的大小

tl.col：指定文本标签的颜色

cl.pos：图例（颜色）位置，当type=upper或full时，图例在右表(r)，当type=lower时，图例在底部，不需要图例时，只需指定该参数为n

addshade：只有当method=shade时，该参数才有用，参数值可以是negtive/positive和all，分表表示对负相关系数、正相关系数和所有相关系数添加阴影。注意：正相关系数的阴影是45度，负相关系数的阴影是135度

shade.lwd：指定阴影的线宽

shade.col：指定阴影线的颜色

虽然该函数的参数比较多，但可以组合各种参数，灵活实现各种各样的相关系数图。下面就举几个例子：

library(corrplot)

corr <- cor(mtcars[,1:7])

#参数全部默认情况下的相关系数图

corrplot(corr = corr)

#指定数值方法的相关系数图

corrplot(corr = corr, method="number", col="black", cl.pos="n")

#按照特征向量角序(AOE)排序相关系数图

corrplot(corr = corr, order = 'AOE')

#同时添加相关系数值

corrplot(corr = corr, order ="AOE", addCoef.col="grey")

#选择方法为color

corrplot(corr = corr, method = 'color', order ="AOE", addCoef.col="grey")

我觉得这幅图比上面的圆形图要清爽很多

#绘制圆形轮廓相关系数图

corrplot(corr = corr, col = wb, order="AOE", outline=TRUE, cl.pos="n")

这个图看起来非常像围棋

#自定义背景色

corrplot(corr = corr, col = wb, bg="gold2", order="AOE", cl.pos="n")

#混合方法之上三角为圆形，下三角为数字

corrplot(corr = corr,order="AOE",type="upper",tl.pos="d")

corrplot(corr = corr,add=TRUE, type="lower", method="number",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")

这幅图将颜色、圆的大小和数值型相关系数相结合，更容易发现变量之间的相关性

#混合方法之上三角为圆形，下三角为方形

corrplot(corr = corr,order="AOE",type="upper",tl.pos="d")

corrplot(corr = corr,add=TRUE, type="lower", method="square",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")

#混合方法之上三角为圆形，下三角为黑色数字

corrplot(corr = corr,order="AOE",type="upper",tl.pos="tp")

corrplot(corr = corr,add=TRUE, type="lower", method="number",order="AOE", col="black",diag=FALSE,tl.pos="n", cl.pos="n")

个人更倾向于上图的展现形式，既清爽又能很好的反映变量间的相关系数。

#以层次聚类法排序

corrplot(corr = corr, order="hclust")

#以层次聚类法排序，并绘制3个矩形框

corrplot(corr = corr, order="hclust", addrect = 3, rect.col = "black")

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

层次聚类特征向量特征 R语言

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇python机器学习案例教程—K最近邻算法的实现

下一篇Python内置函数reversed()用法分析

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

使用R语言绘制其他图形之相关系数图

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：曾津谈互联网数据分析与业务赋能实 ...

【CDA干货】Pandas文本词频统计：查找关键词出现次 ...

从“数据存储”到“智能取数”：CDA数据分析师视角 ...

【CDA干货】CDA透视分析核心计算方法：求和、计数、 ...

【CDA干货】客户交易价值分析：核心逻辑、分析方法 ...

从“数据仓库”到“智能取数”：CDA数据分析师视角 ...

CDA持证人专访：黄冬谈数字化运营核心与数据中台建 ...

【CDA干货】市场调查、竞品分析、需求调研的核心区 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】MySQL分表如何查询数据在哪张表？实战方 ...

【CAD干货】业务模型与逻辑模型的概念辨析及实战案 ...

从“零件”到“引擎”：CDA数据分析师视角下的指标 ...

CDA持证人专访：宋利宝谈电销行业数据运营与数据分 ...

【CDA干货】ARIMA时间序列分析方法：核心原理、建模 ...

从“通用基石”到“场景利器”：CDA数据分析师视角 ...

【CDA干货】SQL Server 提示“实例已在使用”：常见 ...

【CDA干货】Excel数据透视表两列相乘：正确计算方法 ...

从“模糊需求”到“精确标尺”：CDA数据分析师视角 ...

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载