首页 AI学术青年与开发者社区

【中文字幕】2018 MIT 6.S094 麻省理工深度学习和自动驾驶课程

开课时间:已完结!
开课时长:讲座共有5个lecture,3个 Guest Talk,每周五更新

滑动窗口法:当不能事先定义物体的形状时应用;(semantic segmentation)

预选框;

embeddings for finer classificatioin: 携带信息的向量 (word2vec);

 

自动驾驶系统:

标记:监督深度学习

(无监督是热点)

[展开全文]

为什么要实现无人驾驶

价值意义

最前沿的自动驾驶技术

LSD算法20年前

[展开全文]

waymo; 

human-centered autonomy;

full autonomy;

感知控制问题很难解决(未来二三十年内);

 

 

[展开全文]

markov decision process;

贝尔曼方程;Q-learning;

deep Q-network;

MCTS;

 

 

[展开全文]

computer vision is deep learning;

CNN:与全连接神经网络相比,参数数量大大减少;这是因为CNN基于特征在空间的共享特性。

 

[展开全文]

自动驾驶汽车不仅仅通过感知环境来运动,而是可以进行互动,交流,并且赢得信任,同时理解车内的驾驶员和乘客,也能理解车外的行人,其他驾驶员以及骑自行车的人

有超过十亿辆汽车在路上行驶,自动驾驶技术的发展和应用将会彻底改变人们的交通方式,而当驾驶的方式发生改变时,人与车之间将建立亲密的联系,例如相互沟通,协同工作,互相理解和彼此信任。自动驾驶汽车不能只通过感知环境来控制汽车的运动,同时应该感知驾驶员和乘客的一举一动,进行互动和交流,并获得驾驶员的信任。同样,自动驾驶的人工智能系统,不能忽视人的天性,它们必须适应人性。

使用3d卷积神经网络,根据眼部区域的眨眼和瞳孔运动来决定驾驶员的认知负荷

检测情感,认知负荷,身体姿势预测以及睡意

应该以人类为中心,所有的算法设计和人机交互界面的设计都需要考虑人的因素

一方面需要进行感知控制,另一方面对于人类来说,感知,交流,互动,以及与人的合作

[展开全文]

 传感器感知,提取数据特征以及数据结构,作为输入,映射成更高阶的感知

 

强化学习的目  标,就是对稀疏的奖励数据进行学习,通过从稀疏的人工标定的数据当中获取知识

我们可以将监督学习想象成对真实数据的一种记忆模式,这种模式能够从真实数据中提取出表征。我们可以认为强化学习是一种暴力传播信息的方式,尤其是松散稀疏且基于时间的信息。通过对某些行为赋予奖励点数,以此来固化智能体学习到的知识。

 

价值函数是对每个状态以及基于这个状态所采取的行动的一种评估。

深度学习能够学习到表征

 

损失函数是神经网络和Q-Learnging结合的核心,通俗来说就是Q Leanring 通过之前的知识,Q表格来规划接下来的状态和行动变化,然后神经网络通过这个损失函数来学习和评估这个行动计划是否足够好,然后反馈给Q表以如此循环

 

 

 

[展开全文]

进入小组观看课程

以下为该课程相关学习小组,您可以选择任意小组加入学习课程并交流