卷积神经网络基本组成结构

本贴最后更新于 2485 天前,其中的信息可能已经时过境迁

组成结构

CNN 主要由四种结构组成,分别是:

  • pooling
  • dropouts
  • batch normalization
  • data augmentation

Pooling

Pooling 中文名叫池化,是通过计算一定区域内的平均值或最大值,带代表这一区域,分别叫做平均池化和最大池化。

Pooling 会使信息丢失,但是减少了噪声的影响,同时也减少了图像尺寸,进而减少了计算量。

Pooling 就像人类的视觉会受一定区域内的显著物体的影响,而忽略非显著物体。

Dropouts

容易过拟合是深度学习一个缺点。为了防止过拟合,在训练阶段随机把一些参数值设置为 0。这样,一些会使模型过拟合的参数就得不到训练,从而防止过拟合。

Batch Normalization(批量标准化)

CNN 往往有很深的层数,而层数越深,越容易出现梯度消失。这是因为随着网络的传播,数据的分布产生了变化,所以利用 Batch Normalization 让数据的分布保持均值为 0,方差为 1 的正太分布。

一般放在 relu 之前,可以提高准确性,加快训练速度。

Data Augmentation(数据增强)

就是把训练数据通过扭曲,旋转,变形等增多训练数据,让模型更好工作。

还可以把图像的像素值标准化。

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...