首页 AI学术青年与开发者社区

【中英字幕】伯克利大学 2018 年秋季 CS 294-112 深度强化学习

课时列表 15课时
  • 课时1 : 第一讲:课程介绍和概览
    69:09
  • 课时2 : 第二讲:监督学习和模仿学习
    80:18
  • 课时3 : 第三讲:TensorFlow 和神经网络简述
    78:21
  • 课时4 : 第四讲:强化学习简介
    83:32
  • 课时5 : 第五讲:策略梯度简介
    88:38
  • 课时6 : 第六讲:Actor-Critic 算法简介
    88:20
  • 课时7 : 第七讲:价值函数介绍
    72:01
  • 课时8 : 第八讲:高级 Q-学习算法
    87:14
  • 课时9 : 第九讲:高级策略梯度
    78:32
  • 课时10 : 第十讲:最优控制和规划
    86:32
  • 课时11 : 第十一讲:基于模型的强化学习
    80:13
  • 课时12 : 第十二讲:高级强化学习和图像处理应用
    75:15
  • 课时13 : 第十三讲:利用模仿优化控制器学习策略
    86:40
  • 课时14 : 第十四讲:概率和变分推断入门
    77:05
  • 课时15 : 第十五讲:推断和控制之间的联系
    76:20

相关课程

开课日期:深度学习鼻祖Hinton公开课视频,随到随学开始
免费课 31964
扫码加入课程交流群