首页 AI学术青年与开发者社区

【中文字幕】2017春季CS231n 斯坦福深度视觉识别课

开课时间:2017年11月10日
开课时长:讲座共有6个lecture,3个 Guest Talk,已完结。加入小组即可立即观看(完全免费):https://ai.yanxishe.com/page/groupDetail/19。
免费课 基础入门
现价: 免费
该课程已关闭

 

K-近邻

线性分类器--SVM    逻辑回归

两层NN

numpy

 

数据驱动方法

不写具体的分类规则来识别一只猫或鱼
而是:用大量猫的图片数据集+标签
机器分类,总结核心要素,
测试
训练集:接收数据和标签生成模型
测试集:接收模型和数据进行预测
 
最近邻 2-17

 

 

[展开全文]

重点:图像分类

语义鸿沟:计算机不认识猫

数据驱动:数据集 训练 模型 识别

训练函数 预测函数

最近邻算法

曼哈顿距离:绝对值相加

K-最近邻算法:根据距离选K个点投票决定颜色,K越大边缘越平滑

白色区域:没有最近的点(超过阈值))

[展开全文]

“语义鸿沟”就是:由于计算机获取的图像的视觉信息与用户对图像理解的语义信息的不一致性而导致的低层和高层检索需求间的距离。

[展开全文]

加油字幕君你是最棒的

[展开全文]

challenges:

  • viewpoint variantion
  • illumination(照明)
  • deformation(可变形性)
  • occlusion(遮挡)
  • background clutter(物体和背景难以区分)
Data-Driven Approach
NN-L1 distance
KNN-take vote(the larger value of k, the more smooth of decision boundaries)
 
 
 

 

[展开全文]

机器视觉算法的来源:

图像在计算机上的存储是一个矩阵,你并不知道什么样的矩阵对应着什么样的图像。

1.相同的图像在不同的角度上矩阵完全不同,不同的视角

2. 不同的关照

3.图像的变形,背景

4.物体本身的动作

 

思想的转变:

旧:输入一张图片,返回具体的信息。旧有的传统的算法,建立在你可以枚举所有可能性的前提下。

旧方法:物体的特性,比如猫有眼睛,鼻子。然后计算图像的边缘,统计边,角,通过这些规则来识别到猫的存在

旧算法缺点:1,实际效果不是很好,2.更改识别内容,等于重新来一遍

新:使用数据驱动的算法,我们写的算法并不是去识别这个物体而是去通过大量的数据去生成识别到此物体的模型 或者说函数

numpy 

向量化操作

线性分类器 

k-means

svm

图像分类:

把图片与标注统一起来

 

思想的转变:

以前的思想:输入一个图片,识别他是以是什么,输出

现在的思想:输入一堆图片,得到一个模型 training函数

然后是一个预测函数,接受一个模型和一个图像,输出预测。

CIFAR10数据集

 

 

 

[展开全文]

分类任务:

1.训练函数:输入数据 标签,输出模型

2.预测函数:输入模型,输出结果

[展开全文]

图像分类

谷歌云

python3 numpy

api

edges

conners

not good

最近邻:fast train, slow training  

cifar-10

曼哈顿距离

K最近邻

 

[展开全文]

图像分类-数据驱动犯方法

  • 图像分类
  1. 类别标签集合
  2. 计算机给图片分配其中一些固定的分类标签
  3. 计算机呈现的图片是像素值矩阵[0,255]   eg:800*600*3(3个通道 RGB) 
  4. 语义鸿沟,对于某种类别的标签,是我们赋给图像的一个语义标签,类别的语义概念和计算机实际看到的像素值之间有着巨大的差距9.
  5. 形变,遮挡,类内差异:算法的鲁棒性。
  6. 计算图像边缘对于图像识别十分重要
  7. 数据驱动方法:不写具体的分类规则来识别一只猫或者鱼
    1. collect a dataset of images and labels
    2. Use Machine Learning to train a classifier
    3. Evaluate the classifier on new images.

      8.  First clssifier:Nearest Neighbor

  • train:Memorize all data and labels
  • Predict the label of the most similar training image 
def train(images, labels):
  # Machine learning!
  return model

def predict(model, test_images):
  # Use model to predict labels
  return test_labels
  • 比较两幅图片
    • L1距离(曼哈顿距离)
    •  

 

 

 

 

[展开全文]

相关课程

开课日期:直播已结束,可回看开始
智能驾驶 基础入门 86959
开课日期:开始
机器学习 基础入门 111689

授课教师

暂无教师
微信扫码分享课程