- 计算机视觉应用场景
- 医疗:医疗影像诊断
- 安防:人脸闸机,小区监控
- 金融:刷脸支付,柜台自动识别票据
- 工业产业:产品缺陷自动检测
- 交通:车牌识别,道路违章抓拍
- 图像分类(用于识别图像中物体的类别)
- 目标检测(用于检测图像中每个物体的类别,并准确标出他们的位置)
- 语义分割(用于标出图像中每个像素点所属的类别,属于同一类的像素点用一个颜色标记)
- 实例分割(标出物体位置的同时,标注出物体的外形轮廓)
- CNN解决的问题
- CNN卷积神经网络是一种专门用来处理具有类似网格结构的数据神经网络
- 在CNN出现之前,图像对于人工智能来说是一个难题,原因有2;
- 1.图像需要处理的数据量太大,导致成本很高,效率很低
- 2.图像在数字化的过程中很难保留原有的特征,导致图像处理的准确率不高
- 能够有效的将大数据量的图片降维成小数据量
- 能够有效的保留图片特征,符合图片处理的原则
- CNN是一种专门用来处理具有类似网格结构的
- CNN五层网络结构
- 数据输入层/Input layer
- 预处理,图片的像素矩阵
- 卷积层/CONV layer(提取图像中的局部特征)
- 卷积层被称为过滤器(filter)或者内核(kernel)或卷积核
- 对输入图像和滤波矩阵(恒定的滤波器filter)做内积(逐个元素相乘再求和)的操作就是卷积,也是卷积圣神经网络的名字来源
- ReLU激励层/ReLU layer
- 池化层/Pooling layer
- 全连接层/FClayer
- 数据输入层/Input layer
- 1.数据输入层
- 预处理,图像的像素矩阵
- 2.卷积层
- 卷积层负责提取图像中的局部特征
- 激活层
- 激活函数(加入非线性因素)
- 特高模型鲁棒性(抗干扰能力)
- 将当前特征空间映射转换到另一个空间,让数据能更好被分类
- 池化层
- 池化层用来大幅降低参数量级(降维)
- 平均池化
- 最大池化
- 目的
- 是特征图变小,简化计算
- 特征压缩,提取主要特征
- 加快计算速度
- 防止过拟合
- 缩小最后全连接层中节点的个数,减少整个神经网络参数
- 池化层相比卷积层可以更有效的降低数据维度,这么做不但可以大大减少运算量,还可以有效的避免过拟合。
- 全连接层
- 全连接层类似传统神经网络的部分,用来输出想要的结果。