特征预处理 - 归一化 & 标准化

本贴最后更新于 2237 天前,其中的信息可能已经事过境迁

特征处理是什么

通过特定的统计方法(数学方法)将数据转换成算法要求的数据.
sklearn.preprosessing
  • 数值型数据: 标准缩放:
    1. 归一化
    2. 标准化
    3. 缺失值
  • 类别型数据:one-hot 编码
  • 时间类型:时间的切分

归一化

使得某一个特征不会对最终的结果造成更大的影响
sklearn.preprosessing.MinMaxScaler

image

image

归一化总结

注意在特定场景下最大值最小值是变化的,另外最大值与最小值非常容易受异常点的影响,所以这种方法鲁棒性较差,只适合传统精确小数据场景.

归一化代码

# 归一化

from sklearn.preprocessing import MinMaxScaler

def mm():

    """
    归一化处理  :return:None
    """
    mm = MinMaxScaler(feature_range=(0,1))

    data = mm.fit_transform([[90,2,10,40],[60,4,15,45],[75,3,16,460]])

    print(data)

    return None

if __name__ == "__main__":
    mm()

运行结果

[[1.         0.         0.         0.        ]
 [0.         1.         0.83333333 0.01190476]
 [0.5        0.5        1.         1.        ]]

归一化视频

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...