热线电话:13121318867

登录
2019-02-11 阅读量: 1684
多元线性模型中可以将分类变量、顺序变量作为自变量吗?

问题描述:

多元线性模型,特别是研究影响因素的模型,例如研究房价的影响因素有哪些,可以将楼层、学区、地铁这样的类别变量直接放进模型吗?为什么不行?


思路解读:

不能直接放进模型,因为不能合理解释回归系数。

举例来看,当研究“房屋面积”和“房价”的关系时候,我们解读系数为“每提示一个单位的x,带来多少的y”

对于顺序变量,例如研究“楼层”和“房价”的关系时候,并不能说每增加一个楼层,就提示多少的房价,因为样本的总楼层数不一致,不能够拿三层的别墅和二十几层的公寓的楼层多少,去研究房价变化

对于分类变量,比如研究“宗教信仰”与“幸福感”的关系中,不能说“无信仰者”比“基督教信仰者”多了多少个单位的x,变量各水平之间并不存在能够运算的单位关系,只能说不等于而已

因此对于分类变量、顺序变量,去研究它们和因变量的关系时候,需要做预处理,即哑变量操作

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子