热线电话:13121318867

登录
2021-02-05 阅读量: 1672
哑变量与独热编码有什么区别?

本质上差不多,哑变量常用于回归模型,one-hot在任何模型都可以用

哑变量在pandas的get_dummy方法,one-hot在sklearn,就是不同的库from sklearn.preprocessing import OneHotEncoder

最常用的编码:应该还是one-hot用的多,pandas机制问题,它需要在内存中把数据集都读入进来,要是数据量大的话,太消耗资源,one-hot可以读数组,因此大规模数据集很方便


57.1429
0
关注作者
收藏
评论(0)

发表评论

暂无数据