首页 AI学术青年与开发者社区

2019 加州大学伯克利分校 CS 285 深度强化学习

课时列表 16课时
  • 课时1 : 课程介绍和概览
    72:24
  • 课时2 : 针对行为的监督学习
    81:59
  • 课时3 : TensorFlow 和神经网络简述
    74:50
  • 课时4 : 强化学习简介
    75:12
  • 课时5 : 策略梯度
    82:02
  • 课时6 : Actor-Critic 算法
    79:00
  • 课时7 : 价值函数
    82:22
  • 课时8 : 深度强化学习之Q函数
    82:07
  • 课时9 : 策略梯度前沿
    78:16
  • 课时10 : 基于模型的规划
    82:02
  • 课时11 : 基于模型的强化学习
    78:20
  • 课时12 : 第十二讲:基于模型的策略学习
    82:03
  • 课时13 : 第十三讲因录制时停电,校方未上传。
    00:00
  • 课时14 : 第十四讲:将控制重构为推理问题
    40:08
  • 课时15 : 第十五讲:逆向强化学习
    89:02
  • 课时16 : 迁移学习与多任务学习
    89:02

相关课程

开课日期:深度学习鼻祖Hinton公开课视频,随到随学开始
免费课 32361
扫码加入课程交流群