卷积层
¥
支付方式
请使用微信扫一扫 扫描二维码支付
请使用支付宝扫一扫 扫描二维码支付
开通会员,立省699元 立即开通
卷积层
1. 图像分类介绍
1) 把图像归为某一类
2)图像分类的挑战:
a.光照变化
b.形变
c.大小变化(尺度)
d.类内变化
【问题1】图像分类的应用场景有什么?
【问题2】a.深度学习,学习的图像特征效果更好,具体就是泛化能力更好,这里的“学习”怎么理解?特征表示更好是什么意思?
b. 为什么深度学习提的特征对遮挡有效?
个人理解:深度学习的特征是更高层的语义特征
2. 图像分类的定义
y = f(x)
3. 图像特征
1)传统方法及特征:
颜色、全局形状、局部形状、纹理
SIFT特征、HOG特征、LBP特征、Harr特征(这些特征维度很低)
4. 支持向量机
5. CNN特征
【问题3】为什么CNN特征对遮挡有效?
传统的特征为什么不行?
物理意义上怎么理解?
(在维度上的解释)
个人理解:CNN特征拿到了语义特征
6. 用神经网络做图像分类
【问题4】每层网络做非线性操作,在前传的过程中,达到了什么效果?
在数学上,非线性函数主要用来解决什么问题?
【问题5】1X3072这个向量是如何得来的?
【问题6】 全连接层作为输出层。Sigmoid函数作为输出层。怎么理解一个函数可以作为一个全连接层?
【问题7】损失函数的物理意义是什么?
7. 神经网络达到了实用的效果。深度学习让计算机视觉得到了广泛的发展。
sift特征:主要用于图像分类和图像匹配
hog特征:主要用于图像检测/图像跟踪
LBP特征:主要用于人脸识别
Harr特征:
http://www.vfleat.org/ 该网站有很多图像特征提取方法
cnn的low-level层表征的特征类似融合了上述各类图像特征提取方法,但CNN的优势是同时在Mid-level、High-level层能够表征图像的抽象特征,这在图像处理中特别有用。
池化层其实就是一个下采样过程。特征表达更加紧凑,同时具有位移不变性。
损失函数:
预测函数衡量指标:泛化能力。
训练集要尽可能包含更多的素材。
训练和测试的流程:训练图片,提图像特征,训练(图片和标签丢到此训练),训练好一个分类器。将测试图片,提取特征,到训练好的分类器,预测出类别。
图像特征:全局、局部。
PCA降维?
SIFT,HOG,LBP,HArr。