首页 AI学术青年与开发者社区

【中文字幕】2017春季CS231n 斯坦福深度视觉识别课

开课时间:2017年11月10日
开课时长:讲座共有6个lecture,3个 Guest Talk,已完结。加入小组即可立即观看(完全免费):https://ai.yanxishe.com/page/groupDetail/19。
免费课 基础入门
现价: 免费
该课程已关闭

这个翻译一般般,举个例子,有一个很关键词翻译错了fix应该翻译成固定,不是修正,完全不同的两个意思,固定权重,这个时候不要修改权重了,在梯度上升的时候

[展开全文]

原来已经发展到这种程度了么。

正处在一个大变革的时代,

一旦强人工智能实现,整个世界将会完全变得不一样。人类历史大变革。就在此刻

[展开全文]

1.1 计算机视觉概述

 

计算机视觉是研究视觉数据的学科。为什么这门学科很重要呢?目前在互联网上新增的80%的数据(现在可能更多了)都是视觉数据(举例:油管每秒都有5个小时的上传视频),很多时候人们都把视觉数据成为互联网上的“暗物质”,因为它们占据了整个网络极大部分的流量,而我们的算法对视觉数据却很难理解。

另一方面计算机视觉的研究要涉及到物理学、生物学和生理学、工程、数学和计算机科学等,这是由这门学科的本质决定的。我们必须通过光才能够获得视觉数据,必须了解眼睛和大脑工作的机理才能进行模仿,必须有足够的计算机和数学功底才能够设计出一个通用的计算机视觉系统。

[展开全文]

1.每一个对象都由简单的几何图单位组成。

2.剃须刀通过边缘和直线进行识别

3.对象识别太难了,我们先要做的就是先要分割对象---图像分割

4.进一步发展--人脸识别

5.找到某些特征,,他们往往能够在变化中具有表现性和不变性,,所以首要任务就是把这些进行对比,简化操作(不用对比整个图像)

6.卷积神经网路 模型 实践

7.

 

[展开全文]

重点:图像分类

语义鸿沟:计算机不认识猫

数据驱动:数据集 训练 模型 识别

训练函数 预测函数

最近邻算法

曼哈顿距离:绝对值相加

K-最近邻算法:根据距离选K个点投票决定颜色,K越大边缘越平滑

白色区域:没有最近的点(超过阈值))

[展开全文]

02:57是SVM吧,不是SVN

[展开全文]

执行

pip install -r requirements.txt

出现问题:

No matching distribution found for site==0.0.1 (from -r requirements.txt (line 42)

 

另外,中途遇到jupyter nootbook有个数据库无法打开的问题,其实际上是

/home/libin/.local/share/jupyter 没有权限,

[展开全文]

1. activation functions

  sigmoid,tanh,relu, leaky relu, maxout, elu

   sigmoid: 1/(1+e-x) [0,1]  饱和 梯度消失,非0中心

tanh [-1,1] ,0 中心, 梯度消失

relu,不饱和, 合理,收敛快,plausible,为负:梯度消失

dead relu,

不合理的初始化,lr太多

dont use sigmoid

 

初始化也很重要,随着传播每层的分布会变,sigmod的方差会减小,relu的方差也会减少,

目前有些比较好的初始化方法xavier

   

 

 

[展开全文]

“语义鸿沟”就是:由于计算机获取的图像的视觉信息与用户对图像理解的语义信息的不一致性而导致的低层和高层检索需求间的距离。

[展开全文]

相关课程

开课日期:直播已结束,可回看开始
智能驾驶 基础入门 86962
开课日期:开始
机器学习 基础入门 111693

授课教师

暂无教师
微信扫码分享课程