# 卷积神经网络
卷积神经网络(Convolutional Neural Network,CNN)是一种常见的深度学习模型,于 1998 年被提出,主要应用于图像、视频等大型多维矩阵的处理中。
与多层感知器(Multilayer Perceptron,MLP)不同,CNN 的神经网络结构本质上是一种多层卷积运算,卷积层的每个神经元会通过其局部感受野 (Local Receptive Field)和权重,对上一层的输出做卷积操作。由于卷积操作保留原始数据中的位置特征和空间关系,因此 CNN 在图像处理、语音识别等领域拥有广泛的应用。
举个例子,我们可以将卷积操作理解为在一幅图像上扫描一个固定大小的过滤器,找到局部特征并提取出来,之后在不同的位置上进行相同的操作。通过这样的操作,模型可以在不受空间位置限制下,对包含有大量像素的图像进行高效处理。
卷积神经网络通常由卷积层、激活层、池化层和全连接层等构成。其中,卷积层主要用于卷积操作,激活层用于对感知机输出进行非线性映射,池化层则用于对输出结果降维,全连接层则用于将结果映射到指定的输出上。通过这些层的构建和组合,我们可以构建出不同复杂度的 CNN 模型,以达到不同应用场景中的要求。
在图像处理中,CNN 是一种十分有效的算法,例如快速解决图像分类、目标检测、图像分割、人脸识别等问题。另外,CNN 中的一些经典结构,如 VGG、ResNet、MobileNet 等都是业内非常有名的名字。