热线电话：13121318867

CDA LEVEL 1 考试，知识点汇总《回归分析》

2021-02-24

一、基本概念

1.线性回归的出现

当被解释变量和解释变量都为连续型，且存在线性关系时，可以采用线性回归对被解释变量进行预测。

多元线性回归的出现是非常自然的，由于在一元线性回归中，因变量只能依赖一个自变量来解释，换一句话说，就是我们只能在一维空间中来解释世界，这是十分糟糕的，毕竟事物之间的关联是非常复杂的，只用其中一个变量来解释，总是显得那么苍白和无力。

下面我们就来以“房价”和“客户价值”为因变量，探索一下影响他们的自变量。首先，影响房价的因素有哪些呢？

CDA LEVEL 1 考试，知识点汇总《<a href='/map/huiguifenxi/' style='color:#000;font-size:inherit;'>回归分析</a>》

因此，我们不难发现，在用更多变量来解释因变量，显然会更加全面、丰富、合理和科学。与一元线性回归类似，一个含

有k个自变量的多元线性回归模型可以表示为：

y= Bo+Bixl+B2x2++bx+8

,β，B1,B,,为模型参数，E为误差项，来解释不能被自变量线性关系解释的部分。

二、基本假设

多元线性回归的基本假设

三、检验方法

1.线性关系假设——线性关系检验

2.线性关系检验——回归系数检验

3.期望为0的假设

（1）假设检验方法：（图形法）可以直接绘制散点图，查看残差是否对称分布在0的两侧；（统计检验）可以用假设检验中的t检验方法，其原假设为H0：E=0，具体操作将在案例中展示。

（2）假设失效的影响：如果残差的期望不等于0，而等于其他的某个常数，那么这个常数就应该出现在多元线性回归的常数项内。

（3）假设失效解决方法：如果失效，考虑是否强制将常数项设置为，或考虑异常值问题。

4.同方差假设

假设检验方法：（图形法）对残差以及因变量的拟合值作图。

如果没有异方差，那么残差和因变量拟合值构成的散点应该是完全随机的，其趋势线应该是几乎是水平的。上图中间的趋势线存在弯曲，即存在一定的异方差。

除了作图，我们也可以选择Breusch－Pagan检验，注意该检验的原假设是同方差，备择假设是异方差，这样读者根据输出的P值就可以直观判断了。

假设失效的影响：如果误差是异方差的，那么OLS估计的标准误差将不可靠。

假设失效解决方法：克服异方差性的影响，我们可以尝试对因变量做一些非线性变换，如等等。

5.正态性假设

假设检验方法：（图形法）做QQ图。

QQ图的解读十分简单，如果散点在直线上或者直线附近，那么我们就可以认为数据是正态分布的，否则就任务不是正态分布。对于正态分布的统计检验，我们可以选择KS检验（Kolmogorov– Smirnov test），其原假设：数据是正态分布的。这样读者可以直接根据输出的P值来对检验结果进行分析。

假设失效的影响：如果误差项不是正态分布的，则OLS估计的标准误差将不可靠。然而对于正态性假设对于线性回归的重要性，目前各方还有一些有价值的观点。

假设失效解决方法：关注样本中两端的异常值是否合理，如异常值不合理，可以考虑删除异常值。也可以尝试对变量做非线性变换。

6.横截面和时间序列数据在回归建模上的差异

横截面是指在同一时间平面上的数据，例如2013年各个上市公司的财报数据，如果研究其不同变量之间的线性关系，可以用多元线性回归模型。但是如果数据包含时间趋势，例如2001-2018年全国各个省市的宏观经济指标数据，如果要研究不同宏观指标之间的线性影响，就要用面板回归模型了（计量模型的一种）。

四、参数估计

1.多元线性回归的参数估计

五、判定系数

六、例题精讲

1. 工人月工资（元）依劳动生产率（千元）变化的回归直线方程为y=60+90x，下列判断正确的是（）？

A. 劳动生产率为1000元时，工资为50元

B. 劳动生产率提高1000元时，工资提高150元

C. 劳动生产率提高1000元时，工资提高90元

D. 劳动生产率为1000元时，工资为90元

答案：C 解析：根据回归直线方程 y=60+90x 得到，劳动生产率为1千元时，工人月工资=60+90*1=150元，劳动生产率提高1千元时，工资提高90元。

2. 以下哪个假设不是线性回归分析的前提假设？ A. 解释变量之间必须严格独立

B. 解释变量之间不能强线性相关

C. 扰动项独立同分布

D. 扰动项服从正态分布

答案：A 解析：回归分析的前提假设中，包含解释变量之间非线性相关、扰动项独立同分布，扰动项服从正态分布。

更多考试介绍及备考福利请点击：CDA 认证考试中心官网

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

线性回归回归分析正态分布方差多元线性回归异常值假设检验客户价值

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇实战｜用Python制作邮箱自动回复机器人

下一篇CDA LEVEL I 数据分析认证考试模拟题库（二十六）

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

CDA LEVEL 1 考试，知识点汇总《回归分析》

一、基本概念

二、基本假设

三、检验方法

四、参数估计

五、判定系数

六、例题精讲

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】序列模式挖掘在用户行为分析中的应用： ...

【CDA干货】Excel卡方检验完整教程：从零上手，轻松 ...

CDA数据分析师：决策树分析实战，可解释性建模的核 ...

【CDA干货】MLP模型隐藏层层数与单元个数确定指南： ...

【CDA干货】详解tensorflow_datasets.load函数：快 ...

CDA数据分析师：聚类分析实战，无监督学习下的精准 ...

【CDA干货】多参数综合作用：解锁机器学习精准性与 ...

【CDA干货】SQL Server CONVERT日期转换：从基础到 ...

CDA数据分析师：主成分分析（PCA）实战，破解高维数 ...

【CDA干货】随机森林算法中的特征重要性分析：原理 ...

【CDA干货】如何提升数据分析能力：从入门到精通的 ...

CDA数据分析师：线性回归建模实战，从关联分析到业 ...

【CDA干货】因子分析如何分组：核心原理、实操流程 ...

【CDA干货】数据赋能营销：从经验决策到科学增长的 ...

CDA数据分析师：用好相关系数，精准挖掘变量关联、 ...

【CDA干货】数据分析与A/B测试：相辅相成的数据决策 ...

【CDA干货】卡方检验是显著性检验吗？一文厘清定义 ...

CDA数据分析师：方差分析与F检验，多组数据差异验证 ...

【CDA干货】Excel如何创建稳定备注列：适配动态更新 ...

【CDA干货】Tableau实用案例全解：从业务场景到可视 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载