神经网络算法 - 一文搞懂CNN（卷积神经网络） - 文章 - 开发者社区

本文将从 CNN解决了什么问题、 人类的视觉原理 、 CNN的基本原理、 典型的CNN及实际应用 四个方面，带您一文搞懂卷积神经网络CNN 。

一、 CNN解决了什么问题

图像处理存在两个难题：

数据量巨大： 图像由像素组成，每个像素又由RGB三个颜色参数表示。

对于一张1920×1080 像素的图片，就需要处理6百万个参数。（192010803=6220800）

picture.image

CNN解决问题：

卷积操作提取图像特征，如边缘、纹理等，保留图像特征。

二、 人类的视觉原理

在我们了解 CNN 原理之前，先来看看人类的视觉原理是什么？

1981年诺贝尔医学奖 ：

发现了视觉系统的信息处理，可视皮层是分级的。

****人类视觉原理

：****

三、 CNN的基本原理

构成部分：

：

用来大幅降低参数量级，实现数据降维。

picture.image

****基本原理

：****

通过卷积核的过滤提取出图片中局部的特征， 类似初级视觉皮层进行初步特征提取。****

使用一个过滤器（卷积核）来过滤图像的各个小区域，从而得到这些小区域的特征值。

原始是20×20的，进行下采样，采样为10×10，从而得到2×2大小的特征图。

经过卷积层和池化层处理过的数据输入到全连接层，得到最终想要的结果

四、典型的CNN及实际应用

典型的 CNN 并非只是上面提到的3层结构，而是多层结构。

picture.image

例如， LeNet-5被誉为是卷积神经网络的“Hello Word”。LeNet-5是图灵奖获得者Yann LeCun（杨立昆）在1998年提出的CNN算法，用来解决手写识别的问题。

LeNet-5 的网络结构 ：

C1、C3和C5

输入层- 卷积层 – 池化层- 卷积层 – 池化层 – 卷积层 – 全连接层 - 输出层

****实际应用

：****