强化学习实战系列

开课时间：本课程全部更新完毕

开课时长：

机器学习中级进阶

会员价￥228.00

现价：￥298.00

原价：￥298.00

AI研习社会员购买更加优惠！

开通会员，立省70元立即开通

券当前课程，会员领券立减30元>>

报名关闭课程咨询

该课程已关闭

第1 章：强化学习简介及其应用
免费课时1：课程介绍 02:54
课时2：一张图通俗解释强化学习 04:47
课时3：强化学习的指导依据 07:07
课时4：强化学习AI游戏DEMO 04:48
课时5：应用领域简介 06:28
课时6：强化学习工作流程 05:48
课时7：计算机眼中的状态与行为 07:25
第2 章： PPO算法与公式推导
课时8：1-基本情况介绍 11:17
课时9：与环境交互得到所需数据 08:30
课时10：要完成的目标分析 10:40
课时11：策略梯度推导 09:01
课时12：baseline方法 06:10
课时13：OnPolicy与OffPolicy策略 07:44
课时14：importance sampling的作用 08:31
课时15：PPO算法整体思路解析 09:19
第3 章： PPO实战-月球登陆器训练实例
课时16：Critic的作用与效果 10:39
课时17：2-PPO2版本公式解读 11:45
课时18：参数与网络结构定义 08:04
课时19：得到动作结果 07:17
课时20：奖励获得与计算 08:08
课时21：参数迭代与更新 11:03
第4 章： Q-learning与DQN算法
课时22：算法原理通俗解读 07:11
课时23：目标函数与公式解析 10:07
课时24：Qlearning算法实例解读 07:45
课时25：Q值迭代求解 08:59
课时26：DQN简介 05:07
第5 章： DQN算法实例演示
课时27：整体任务流程演示 05:21
课时28：探索与action获取 06:58
课时29：计算target值 05:17
课时30：训练与更新 08:12
第6 章： DQN改进与应用技巧
课时31：DoubleDqn要解决的问题 06:47
课时32：DuelingDqn改进方法 06:26
课时33：Dueling整体网络架构分析 08:27
课时34：MultiSetp策略 03:45
课时35：连续动作处理方法 08:22
第7 章： Actor-Critic算法分析(A3C)
课时36：AC算法回顾与知识点总结 07:18
课时37：优势函数解读与分析 07:12
课时38：计算流程实例 05:50
课时39：A3C整体架构分析 06:01
课时40：损失函数整理 08:32
第8 章：用A3C玩转超级马里奥
课时41：整体流程与环境配置 05:38
课时42：启动游戏环境 06:59
课时43：要计算的指标回顾 09:01
课时44：初始化局部模型并加载参数 08:05
课时45：与环境交互得到训练数据 09:31
第9 章：算法补充-卷积神经网络原理与参数解读
课时46：卷积神经网络应用领域 07:24
课时47：卷积的作用 09:23
课时48：卷积特征值计算方法 08:07
课时49：得到特征图表示 06:58
课时50：步长与卷积核大小对结果的影响 08:11
课时51：边缘填充方法 06:30
课时52：特征图尺寸计算与参数共享 07:02
课时53：池化层的作用 05:38
课时54：整体网络架构 06:20
课时55：VGG网络架构 06:16
课时56：残差网络Resnet 07:41
课时57：感受野的作用 05:46
第10 章：基础补充-PyTorch框架基本处理操作
课时58：PyTorch框架发展趋势简介 08:25
课时59：框架安装方法（CPU与GPU版本） 05:13
课时60：PyTorch基本操作简介 09:25
课时61：自动求导机制 10:59
课时62：线性回归DEMO-数据与参数配置 08:56
课时63：线性回归DEMO-训练回归模型 10:08
课时64：常见tensor格式 07:10
课时65：Hub模块简介 08:25
第11 章：基础补充-PyTorch图像识别实例
课时66：卷积网络参数定义 07:21
课时67：网络流程解读 07:26
课时68：Vision模块功能解读 05:10
课时69：分类任务数据集定义与配置 06:27
课时70：图像增强的作用 04:51
课时71：数据预处理与数据增强模块 09:25
课时72：Batch数据制作 08:37
课时73：迁移学习的目标 05:31
课时74：迁移学习策略 07:11
课时75：加载训练好的网络模型 09:54
课时76：优化器模块配置 05:14
课时77：实现训练模块 08:15
课时78：训练结果与模型保存 09:31
课时79：加载模型对测试数据进行预测 09:10
课时80：13-额外补充-Resnet论文解读 11:47
课时81：额外补充-Resnet网络架构解读 08:26

授课教师

暂无教师

微信扫码分享课程

学员动态

177411 开始学习课时课程介绍

李耀开始学习课时课程介绍

小白U1640948970 开始学习课时课程介绍

wangwangtao 收藏了课程强化学习实战系列

强化学习实战系列

相关课程

授课教师

最新学员

学员动态