热线电话:13121318867

登录
2020-07-28 阅读量: 1478
归一化和标准化的区别是什么?

归一化和标准化的区别:

归一化是将样本的特征值转换到同一量纲下把数据映射到[0,1]或者[-1, 1]区间内,仅由变量的极值决定,因区间放缩法是归一化的一种。标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,转换为标准正态分布,和整体样本分布相关,每个样本点都能对标准化产生影响。它们的相同点在于都能取消由于量纲不同引起的误差;都是一种线性变换,都是对向量X按照比例压缩再进行平移。

归一化和标准化它们都是指特征工程中的特征缩放过程,直接看它们的作用和操作方法,可能会更容易理解。

使用特征缩放的作用是:

  1. 使不同量纲的特征处于同一数值量级,减少方差大的特征的影响,使模型更准确。

  2. 加快学习算法的收敛速度。

缩放过程可以分为以下几种:

  1. 缩放到均值为0,方差为1(Standardization——StandardScaler())

  2. 缩放到0和1之间(Standardization——MinMaxScaler())

  3. 缩放到-1和1之间(Standardization——MaxAbsScaler())

  4. 缩放到0和1之间,保留原始数据的分布(Normalization——Normalizer())


29.1574
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子