首页意见反馈 AI学术青年与开发者社区

登录

...

【中文字幕】2017春季CS231n 斯坦福深度视觉识别课

【中文字幕】2017春季CS231n 斯坦福深度视觉识别课

开课时间：2017年11月10日

开课时长：讲座共有6个lecture，3个 Guest Talk，已完结。加入小组即可立即观看（完全免费）：https://ai.yanxishe.com/page/groupDetail/19。

免费课基础入门

现价：免费

课程未发布

该课程已关闭

排序：最新笔记
- 最新笔记
- 点赞最多

K-近邻

线性分类器--SVM 逻辑回归

两层NN

numpy

数据驱动方法

不写具体的分类规则来识别一只猫或鱼

而是：用大量猫的图片数据集+标签

机器分类，总结核心要素，

测试

训练集：接收数据和标签生成模型

测试集：接收模型和数据进行预测

最近邻 2-17

依耶芙特•亨 · 2019-07-02 · 2.1 图像分类 - 数据驱动方法 0

重点：图像分类

语义鸿沟：计算机不认识猫

数据驱动：数据集训练模型识别

训练函数预测函数

最近邻算法

曼哈顿距离：绝对值相加

K-最近邻算法：根据距离选K个点投票决定颜色，K越大边缘越平滑

白色区域：没有最近的点（超过阈值））

yangyanglin_n · 2019-03-13 · 2.1 图像分类 - 数据驱动方法 1

“语义鸿沟”就是：由于计算机获取的图像的视觉信息与用户对图像理解的语义信息的不一致性而导致的低层和高层检索需求间的距离。

abubble · 2018-12-13 · 2.1 图像分类 - 数据驱动方法 1

加油字幕君你是最棒的

酱番梨 · 2018-11-15 · 2.1 图像分类 - 数据驱动方法 0

cifar10

Kratos_yfc · 2018-10-01 · 2.1 图像分类 - 数据驱动方法 0

challenges:

viewpoint variantion
illumination（照明）
deformation（可变形性）
occlusion(遮挡)
background clutter（物体和背景难以区分）

Data-Driven Approach

NN-L1 distance

KNN-take vote(the larger value of k, the more smooth of decision boundaries)

Jerry同 · 2018-08-24 · 2.1 图像分类 - 数据驱动方法 0

机器视觉算法的来源：

图像在计算机上的存储是一个矩阵，你并不知道什么样的矩阵对应着什么样的图像。

1.相同的图像在不同的角度上矩阵完全不同，不同的视角

2. 不同的关照

3.图像的变形，背景

4.物体本身的动作

思想的转变：

旧：输入一张图片，返回具体的信息。旧有的传统的算法，建立在你可以枚举所有可能性的前提下。

旧方法：物体的特性，比如猫有眼睛，鼻子。然后计算图像的边缘，统计边，角，通过这些规则来识别到猫的存在

旧算法缺点：1，实际效果不是很好，2.更改识别内容，等于重新来一遍

新：使用数据驱动的算法，我们写的算法并不是去识别这个物体而是去通过大量的数据去生成识别到此物体的模型或者说函数

numpy

向量化操作

线性分类器

k-means

svm

图像分类：

把图片与标注统一起来

思想的转变：

以前的思想：输入一个图片，识别他是以是什么，输出

现在的思想：输入一堆图片，得到一个模型 training函数

然后是一个预测函数，接受一个模型和一个图像，输出预测。

CIFAR10数据集

日杰夫•张伯 · 2018-08-05 · 2.1 图像分类 - 数据驱动方法 0

分类任务：

1.训练函数：输入数据标签，输出模型

2.预测函数：输入模型，输出结果

奕之 · 2018-08-04 · 2.1 图像分类 - 数据驱动方法 0

图像分类

谷歌云

python3 numpy

api

edges

conners

not good

最近邻：fast train, slow training

cifar-10

曼哈顿距离

K最近邻

鹿米 · 2018-07-30 · 2.1 图像分类 - 数据驱动方法 0

图像分类-数据驱动犯方法

图像分类

类别标签集合
计算机给图片分配其中一些固定的分类标签
计算机呈现的图片是像素值矩阵[0,255] eg:800*600*3(3个通道 RGB)
语义鸿沟，对于某种类别的标签，是我们赋给图像的一个语义标签，类别的语义概念和计算机实际看到的像素值之间有着巨大的差距9.
形变，遮挡，类内差异：算法的鲁棒性。
计算图像边缘对于图像识别十分重要
数据驱动方法：不写具体的分类规则来识别一只猫或者鱼
1. collect a dataset of images and labels
2. Use Machine Learning to train a classifier
3. Evaluate the classifier on new images.

8. First clssifier:Nearest Neighbor

train:Memorize all data and labels
Predict the label of the most similar training image

def train(images, labels):
  # Machine learning!
  return model

def predict(model, test_images):
  # Use model to predict labels
  return test_labels

比较两幅图片
- L1距离（曼哈顿距离）

依耶芙特•张 · 2018-07-15 · 2.1 图像分类 - 数据驱动方法 0

相关课程

未来汽车大讲堂——智能驾驶第一课

￥399.00 ￥599

会员￥258

开课日期：直播已结束，可回看开始

智能驾驶基础入门 86959

从Python入门-如何成为一名AI工程师

￥299.00 ￥499

会员免费

开课日期：开始

机器学习基础入门 111689

Hinton《面向机器学习的神经网络》中文版

免费

开课日期：深度学习鼻祖Hinton公开课视频，随到随学开始

免费课 29690

授课教师

暂无教师

微信扫码分享课程

最新学员

学员动态

wwwzzZ 加入课程【中文字幕】2017春季CS2...

伊蒂丝•劳森开始学习课时 1.2 计算机视觉历史背景

郑卓峰开始学习课时 3.1 损失函数

德维特•柯林开始学习课时 6.2 批量归一化

凯尔•贺拉斯开始学习课时 5.3 视觉之外的卷积神经网络