计算机视觉基础入门课程（从算法到实战应用）

从获取图像到读懂图像

1、数据（图片、视频）

2、算法（机器学习算法、神经网络）回归+分类

计算机视觉应用

三大任务

1、图像识别

包括精细识别，例如：车牌识别(ETC)、人脸识别(属性显示)

2、目标检测

行人检测、车辆检测等

3、图像分割

图像语义分割、个体分割=检测+分割

其它任务

视觉目标跟踪（Tracking）

例如：多目标跟踪、车辆跟踪等

视频分割

有趣的应用：图像风格迁移、生成对抗网路(GAN)、视频生成(预测)

二、深度学习简介

1、全神经网路

2、卷积神经网路

3、RNN（递归神经网络）

4、LSTM

VGGNet、GoogleNet、ResNet、DenseNet

常见深度学习开发平台：Torch、TensorFlow、Caffe。。。

pyTorch

[展开全文]

威尔•边沁 · 2020-05-08 · 计算机视觉历史回顾，从浅层学习到深度学习 1

计算机视觉是从图像和视频中提出数值或符号信息的计算系统，是计算机看到并理解图像。

三大任务：

1、检测

车牌识别，人脸识别，目标检测

行人检测：估计人群

车辆检测：估计车流密度

2、分割

图像语义分割：图片分割成一个个独立的个体。

个体分割=检测+分割

视频分割

3、视觉目标跟踪

多目标跟踪、车辆跟踪

有趣应用：

图像风格迁移

GAN(生成对抗网络)：换脸，视频合成

深度学习简介

人脸识别：LFW上错误率5%下降到了0.5%

图像分割：50%到75%（交并比）

看图说话（图题生成）

图像识别：

Alexnet,VGGnet,GoogleNet,ReesNet

目标检测：

Fast-rcnn,faster-rcnn,Yolo,Retina-Net

图像分割：

FCN,Mask-Rcnn

目标跟踪：

GOTURN,ECO

图像生成：

GAN,WGAN

光流：

FlowNet

视频分割：

Segnet

[展开全文]

亚力士•沃格 · 2020-01-29 · 计算机视觉历史回顾，从浅层学习到深度学习 0

计算机视觉概述和深度学习简介

• 1. 计算机视觉回顾
定义：计算机视觉(computer vision)是从图像和视频中提出数值或符号信息的计算系统，更形象一点说，计算机视觉是让计算机具备像人类一样的眼睛，看到图像，并理解图像。

主要内容：

图像识别 image classification

eg：车牌识别，人脸识别

目标检测 object detection=classification + localization（图像识别的进一步发展）

eg：行人检测，车辆检测

分割：图像语义分割，个体分割=检测+分割

视觉目标跟踪(Tracking)

视频分割

图像风格迁移

生成对抗网络（GAN）

如何实现直播换脸

视频生成（应用无人驾驶，电影拍摄）

• 2.深度学习简介
• 3.课程介绍

本课程将系统的介绍计算机视觉的图像识别，目标检测，图像和视频分割，目标跟踪，图像和视频生成。并结合深度学习讲解实现这些任务需要的算法，模型以及实战应用。
图像识别：
Alexnet, VGGnet, GoogleNet, ResNet, RetinaNet
目标检测：
Fast-rcnn, faster-rcnn, Yolo, Retina-Net
图像分割：
FCN，Mask-Rcnn
目标跟踪：
GOTURN， ECO
图像生成：
GAN，WGAN
光流：
FlowNet
视频分割：
Segnet

[展开全文]

马休•鲍勃 · 2019-08-02 · 计算机视觉历史回顾，从浅层学习到深度学习 2

[展开全文]

尖沙咀117 · 2019-07-26 · 计算机视觉历史回顾，从浅层学习到深度学习 1

笔记审核

[展开全文]

我系墙颈鹿 · 2019-07-09 · 计算机视觉历史回顾，从浅层学习到深度学习 0

整体流程框架：
1. selective search在一张图片中得到约2k个object proposal(这里称为RoI)；
2. （joint training）缩放图片的scale得到图片金字塔，FP得到conv5的特征金字塔
3. （joint training）对于每个scale的每个ROI，求取映射关系，在conv5中crop出
patch。并用一个单层的SPP layer（这里称为Rol pooling layer）来统一到一样的
（对于AlexNet是6x6）；
4. （joint training）继续经过两个全连接得到特征，这特征有分别share到两个新的
连接上两个优化目标。第一个优化目标是分类，使用softmax，第二个优化目标是
regression，使用了一个smooth的L1-loss。
5. 训练时没有这步，测试的时候需加上NMS处理：利用窗口得分分别对每一类物体
大值抑制剔除重叠建议框，最终得到每个类别中回归修正后的得分最高的窗口

[展开全文]

希拉•哈伯德 · 2019-06-26 · 计算机视觉历史回顾，从浅层学习到深度学习 0