热线电话:13121318867

登录
2020-07-12 阅读量: 1231
回归分析

相关分析:有没有关系,关系有多大

回归分析:关系是什么


(扩展:智能识别设备:独立成分分析)


事物总有着向其大概率方向回归的趋势。


现代意义:


构成:因变量(通常1个),自变量(通常多个)

类型:一元线性回归; 多元线性回归;一元非线性回归;多元非线性回归


如何进行一元线性回归模型?

一般分四步:

模型设定-模型估计-模型检验-模型应用


总体

条件均值形式: E(y)=βo+β1x

个别值形式:y=βo+β1x+ε(ε随机误差项)


ε的性质决定了模型方法的选择和使用


样本

条件均值形式: y尖=βo尖+β1尖x

个别值形式:y=βo尖+β1尖x+e(e残差)


最小二乘法(最常用)

有严格的使用条件---一元线性回归模型的基本假定

① 因变量y与自变量x之间具有线性关系

② 在重复抽样中,自变量x的取值是固定的,即x非随机。

③ 误差项ε是一个期望值为0的随机变量,即E(ε)=0。【零均值】

④ 对于所有的x值, ε的方差σ2都相同【同方差】【跨群体跨区域很难做到同方差】

⑤ 误差项ε是一个服从正态分布的随机变量,且相互独立。

即ε~N(0,σ2 )【不同的,不相关的,无自相关】

独立性意味着对于一个特定的 x 值,它所对应的ε与其他 x 值所对

应的ε不相关

对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关


最小二乘估计法:


回归模型的检验:

拟合优度检验:我们把样本回归线对样本观测数据拟合的优劣

程度称为样本回归线的拟合优度。


拟合优度的度量是建立在对数据总变差分解的

基础上的。


变:特指y的变化;可能有两个原因,一个是x导致,一个是x以外导致的。

变差:为了衡量变化作了一个差,叫变差,与均值的比较;y-y拔。

总变差:∑(y-y拔)^2 (平方的原因是防止正负抵消)


可决系数(或判定系数),记作R2。

R2 = SSR/SST = 1-SSE/SST

反映回归直线的拟合程度

取值范围在 [ 0, 1] 之间

R2 →1,说明回归方程拟合的越好; R2→0,说明回归方程拟合的越差

在一元回归中,判定系数等于相关系数的平方,即R2=(r)^ 2



一元线性回归:④检验步骤

如果我们希望模型没问题的话,在这个地方拒绝原假设才好


统计学总是反复性说“显著性”,统计学总是强调的不是“有和无”而是有的“明不明显”,无的“明不明显”。


34.9088
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子