一篇文章带你了解纹理表示和卷积神经网络

本文最后更新于:4 天前

打卡计算机视觉–纹理表示和卷积神经网络, 帮助快速简单的理解,适合有一定基础的计算机视觉选手。


纹理表示、卷积神经网络

纹理表示

纹理表示可以理解为大量存在的一种图像纹理特征,也可以理解为图像的一种局部特征,比如下:

如何提取纹理特征需要用到上次学到的高斯偏导核(高斯磨平+梯度提取),如下:

利用不同的高斯偏导核进行一种特征的提取,用多种高斯偏导核则可提取多种特征上的响应值,从而得到同一位置上不同特征的响应值。

第一个高斯偏导核得到关于竖直方向上的特征,最后一个高斯偏导核则可以得到圆形斑点状的特征。得到一个响应图后,将响应图求平均值后得到的数值则能表示为该高斯偏导核所对应特征的出现次数大小(不考虑特征的位置),如需要考虑位置则直接将图拉平即可。

卷积神经网络

卷积神经网络包括两部分,卷积部分以及全连接神经网络部分。

全连接神经网络

x1代表图像上的第一像素点,f1代表对每个类别的预测值,因为全连接神经网络会对每个像素值进行操作,如果图像过大则会出现非常多的权值,运算量会很大,所以全连接网络只能处理小图像,或者已经用高斯偏导核组处理后的向量。

卷积神经网络

卷积层

image-20220919222105712

和卷积的情况差不多,只不过彩图会有初始的3层深度,将卷积核与彩图重合后进行点运算的到一个值,最后得到一个特征响应图,多种特征卷积核最后会得到多张特征响应图

卷积步长

卷积完一次后向后移动的位次,可以图像尺寸、卷积核尺寸、卷积步长与最后卷积结果之间的关系,并且如果有零填充时的情况。要明白计算公式

激活层

对每张图每个点上的值进行激活函数操作,不满足的变为0

池化层

池化的作用:对每一个特征响应图独立进行,降低特征响应图组中每个特征响应图的宽度和高度,减少后续卷积层的参数的数量,降低计算资源耗费,进而控制过拟合。

作用

  • 降低响应图的宽度和高度,降低之后的运算量
  • 响应图降低相当于卷积核增大,能观测到较大的图像特征

方法

  • 最大池化:将区域内的全部值取最大值来代表整个区域
  • 平均池化:采用区域内所有值的平均值来代表整个区域