2020-07-28
阅读量:
1478
归一化和标准化的区别是什么?
归一化和标准化的区别:
归一化是将样本的特征值转换到同一量纲下把数据映射到[0,1]或者[-1, 1]区间内,仅由变量的极值决定,因区间放缩法是归一化的一种。标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,转换为标准正态分布,和整体样本分布相关,每个样本点都能对标准化产生影响。它们的相同点在于都能取消由于量纲不同引起的误差;都是一种线性变换,都是对向量X按照比例压缩再进行平移。
归一化和标准化它们都是指特征工程中的特征缩放过程,直接看它们的作用和操作方法,可能会更容易理解。
使用特征缩放的作用是:
使不同量纲的特征处于同一数值量级,减少方差大的特征的影响,使模型更准确。
加快学习算法的收敛速度。
缩放过程可以分为以下几种:
缩放到均值为0,方差为1(Standardization——StandardScaler())
缩放到0和1之间(Standardization——MinMaxScaler())
缩放到-1和1之间(Standardization——MaxAbsScaler())
缩放到0和1之间,保留原始数据的分布(Normalization——Normalizer())






评论(0)


暂无数据
推荐帖子
0条评论
0条评论