特征处理是什么
通过特定的统计方法(数学方法)将数据转换成算法要求的数据.
sklearn.preprosessing
- 数值型数据: 标准缩放:
- 归一化
- 标准化
- 缺失值
- 类别型数据:one-hot 编码
- 时间类型:时间的切分
归一化
使得某一个特征不会对最终的结果造成更大的影响
sklearn.preprosessing.MinMaxScaler
归一化总结
注意在特定场景下最大值最小值是变化的,另外最大值与最小值非常容易受异常点的影响,所以这种方法鲁棒性较差,只适合传统精确小数据场景.
归一化代码
# 归一化
from sklearn.preprocessing import MinMaxScaler
def mm():
"""
归一化处理 :return:None
"""
mm = MinMaxScaler(feature_range=(0,1))
data = mm.fit_transform([[90,2,10,40],[60,4,15,45],[75,3,16,460]])
print(data)
return None
if __name__ == "__main__":
mm()
运行结果
[[1. 0. 0. 0. ]
[0. 1. 0.83333333 0.01190476]
[0.5 0.5 1. 1. ]]
归一化视频
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于