-
第1
章
:
强化学习简介及其应用
-
免费
课时1:课程介绍
02:54
-
课时2:一张图通俗解释强化学习
04:47
-
课时3:强化学习的指导依据
07:07
-
课时4:强化学习AI游戏DEMO
04:48
-
课时5:应用领域简介
06:28
-
课时6:强化学习工作流程
05:48
-
课时7:计算机眼中的状态与行为
07:25
-
第2
章
:
PPO算法与公式推导
-
课时8:1-基本情况介绍
11:17
-
课时9:与环境交互得到所需数据
08:30
-
课时10:要完成的目标分析
10:40
-
课时11:策略梯度推导
09:01
-
课时12:baseline方法
06:10
-
课时13:OnPolicy与OffPolicy策略
07:44
-
课时14:importance sampling的作用
08:31
-
课时15:PPO算法整体思路解析
09:19
-
第3
章
:
PPO实战-月球登陆器训练实例
-
课时16:Critic的作用与效果
10:39
-
课时17:2-PPO2版本公式解读
11:45
-
课时18:参数与网络结构定义
08:04
-
课时19:得到动作结果
07:17
-
课时20:奖励获得与计算
08:08
-
课时21:参数迭代与更新
11:03
-
第4
章
:
Q-learning与DQN算法
-
课时22:算法原理通俗解读
07:11
-
课时23:目标函数与公式解析
10:07
-
课时24:Qlearning算法实例解读
07:45
-
课时25:Q值迭代求解
08:59
-
课时26:DQN简介
05:07
-
第5
章
:
DQN算法实例演示
-
课时27:整体任务流程演示
05:21
-
课时28:探索与action获取
06:58
-
课时29:计算target值
05:17
-
课时30:训练与更新
08:12
-
第6
章
:
DQN改进与应用技巧
-
课时31:DoubleDqn要解决的问题
06:47
-
课时32:DuelingDqn改进方法
06:26
-
课时33:Dueling整体网络架构分析
08:27
-
课时34:MultiSetp策略
03:45
-
课时35:连续动作处理方法
08:22
-
第7
章
:
Actor-Critic算法分析(A3C)
-
课时36:AC算法回顾与知识点总结
07:18
-
课时37:优势函数解读与分析
07:12
-
课时38:计算流程实例
05:50
-
课时39:A3C整体架构分析
06:01
-
课时40:损失函数整理
08:32
-
第8
章
:
用A3C玩转超级马里奥
-
课时41:整体流程与环境配置
05:38
-
课时42:启动游戏环境
06:59
-
课时43:要计算的指标回顾
09:01
-
课时44:初始化局部模型并加载参数
08:05
-
课时45:与环境交互得到训练数据
09:31
-
第9
章
:
算法补充-卷积神经网络原理与参数解读
-
课时46:卷积神经网络应用领域
07:24
-
课时47:卷积的作用
09:23
-
课时48:卷积特征值计算方法
08:07
-
课时49:得到特征图表示
06:58
-
课时50:步长与卷积核大小对结果的影响
08:11
-
课时51:边缘填充方法
06:30
-
课时52:特征图尺寸计算与参数共享
07:02
-
课时53:池化层的作用
05:38
-
课时54:整体网络架构
06:20
-
课时55:VGG网络架构
06:16
-
课时56:残差网络Resnet
07:41
-
课时57:感受野的作用
05:46
-
第10
章
:
基础补充-PyTorch框架基本处理操作
-
课时58:PyTorch框架发展趋势简介
08:25
-
课时59:框架安装方法(CPU与GPU版本)
05:13
-
课时60:PyTorch基本操作简介
09:25
-
课时61:自动求导机制
10:59
-
课时62:线性回归DEMO-数据与参数配置
08:56
-
课时63:线性回归DEMO-训练回归模型
10:08
-
课时64:常见tensor格式
07:10
-
课时65:Hub模块简介
08:25
-
第11
章
:
基础补充-PyTorch图像识别实例
-
课时66:卷积网络参数定义
07:21
-
课时67:网络流程解读
07:26
-
课时68:Vision模块功能解读
05:10
-
课时69:分类任务数据集定义与配置
06:27
-
课时70:图像增强的作用
04:51
-
课时71:数据预处理与数据增强模块
09:25
-
课时72:Batch数据制作
08:37
-
课时73:迁移学习的目标
05:31
-
课时74:迁移学习策略
07:11
-
课时75:加载训练好的网络模型
09:54
-
课时76:优化器模块配置
05:14
-
课时77:实现训练模块
08:15
-
课时78:训练结果与模型保存
09:31
-
课时79:加载模型对测试数据进行预测
09:10
-
课时80:13-额外补充-Resnet论文解读
11:47
-
课时81:额外补充-Resnet网络架构解读
08:26
相关课程
开课日期:2018-06-20 20:00开始
5439
开课日期:2020-03-15 10:00开始
3969
开课日期:2020-07-10 13:30开始
2075
官方群
597441272
工作时间:9:30 - 18:30
客服1:18201476932
客服2:15210889238
邮箱: mooc@leiphone.com