2019-02-11
阅读量:
1684
多元线性模型中可以将分类变量、顺序变量作为自变量吗?
问题描述:
多元线性模型,特别是研究影响因素的模型,例如研究房价的影响因素有哪些,可以将楼层、学区、地铁这样的类别变量直接放进模型吗?为什么不行?
思路解读:
不能直接放进模型,因为不能合理解释回归系数。
举例来看,当研究“房屋面积”和“房价”的关系时候,我们解读系数为“每提示一个单位的x,带来多少的y”
对于顺序变量,例如研究“楼层”和“房价”的关系时候,并不能说每增加一个楼层,就提示多少的房价,因为样本的总楼层数不一致,不能够拿三层的别墅和二十几层的公寓的楼层多少,去研究房价变化
对于分类变量,比如研究“宗教信仰”与“幸福感”的关系中,不能说“无信仰者”比“基督教信仰者”多了多少个单位的x,变量各水平之间并不存在能够运算的单位关系,只能说不等于而已
因此对于分类变量、顺序变量,去研究它们和因变量的关系时候,需要做预处理,即哑变量操作
0.0000
0
1
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论