2022-09-02
阅读量:
2328
建立线性回归模型的步骤
1明确需求
2采集数据
3数据清洗: a.重复值的处理 b.缺失值的处理 c.异常值的处理 d.数据编码的处理
其中缺失值的处理可以用均值或众数等描述数据集中趋势的进行填补,异常值中的错误值直接手动删除,离群值的 处理要具体看业务(通常通过画箱线图,或者3西格玛法则判断),数据编码的处理,对于男女这种二分类变量可以用 0和1转化,最好的是在此基础上加上交叉列(改斜率),多分类变量如学历这种,可以采用独热编码或哑变量转换,其 中的某列得删除,避免和线性回归模型中的常量在矩阵化时有相关性
4变量的筛选:查看X与Y的相关系数,查看散点图
5分割测试集训练集(做预测)
6回归建模(F检验,T检验,调整R^2)
7模型调优
8模型精修(交叉项,高次项,季节趋势)
9逐步回归
10模型测试
119.9997
3
0
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
0条评论