组成结构
CNN 主要由四种结构组成,分别是:
- pooling
- dropouts
- batch normalization
- data augmentation
Pooling
Pooling 中文名叫池化,是通过计算一定区域内的平均值或最大值,带代表这一区域,分别叫做平均池化和最大池化。
Pooling 会使信息丢失,但是减少了噪声的影响,同时也减少了图像尺寸,进而减少了计算量。
Pooling 就像人类的视觉会受一定区域内的显著物体的影响,而忽略非显著物体。
Dropouts
容易过拟合是深度学习一个缺点。为了防止过拟合,在训练阶段随机把一些参数值设置为 0。这样,一些会使模型过拟合的参数就得不到训练,从而防止过拟合。
Batch Normalization(批量标准化)
CNN 往往有很深的层数,而层数越深,越容易出现梯度消失。这是因为随着网络的传播,数据的分布产生了变化,所以利用 Batch Normalization 让数据的分布保持均值为 0,方差为 1 的正太分布。
一般放在 relu 之前,可以提高准确性,加快训练速度。
Data Augmentation(数据增强)
就是把训练数据通过扭曲,旋转,变形等增多训练数据,让模型更好工作。
还可以把图像的像素值标准化。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于