首页 AI学术青年与开发者社区
  • 第1 章 : 强化学习简介及其应用
  • 免费 课时1:课程介绍 02:54
  • 课时2:一张图通俗解释强化学习 04:47
  • 课时3:强化学习的指导依据 07:07
  • 课时4:强化学习AI游戏DEMO 04:48
  • 课时5:应用领域简介 06:28
  • 课时6:强化学习工作流程 05:48
  • 课时7:计算机眼中的状态与行为 07:25
  • 第2 章 : PPO算法与公式推导
  • 课时8:1-基本情况介绍 11:17
  • 课时9:与环境交互得到所需数据 08:30
  • 课时10:要完成的目标分析 10:40
  • 课时11:策略梯度推导 09:01
  • 课时12:baseline方法 06:10
  • 课时13:OnPolicy与OffPolicy策略 07:44
  • 课时14:importance sampling的作用 08:31
  • 课时15:PPO算法整体思路解析 09:19
  • 第3 章 : PPO实战-月球登陆器训练实例
  • 课时16:Critic的作用与效果 10:39
  • 课时17:2-PPO2版本公式解读 11:45
  • 课时18:参数与网络结构定义 08:04
  • 课时19:得到动作结果 07:17
  • 课时20:奖励获得与计算 08:08
  • 课时21:参数迭代与更新 11:03
  • 第4 章 : Q-learning与DQN算法
  • 课时22:算法原理通俗解读 07:11
  • 课时23:目标函数与公式解析 10:07
  • 课时24:Qlearning算法实例解读 07:45
  • 课时25:Q值迭代求解 08:59
  • 课时26:DQN简介 05:07
  • 第5 章 : DQN算法实例演示
  • 课时27:整体任务流程演示 05:21
  • 课时28:探索与action获取 06:58
  • 课时29:计算target值 05:17
  • 课时30:训练与更新 08:12
  • 第6 章 : DQN改进与应用技巧
  • 课时31:DoubleDqn要解决的问题 06:47
  • 课时32:DuelingDqn改进方法 06:26
  • 课时33:Dueling整体网络架构分析 08:27
  • 课时34:MultiSetp策略 03:45
  • 课时35:连续动作处理方法 08:22
  • 第7 章 : Actor-Critic算法分析(A3C)
  • 课时36:AC算法回顾与知识点总结 07:18
  • 课时37:优势函数解读与分析 07:12
  • 课时38:计算流程实例 05:50
  • 课时39:A3C整体架构分析 06:01
  • 课时40:损失函数整理 08:32
  • 第8 章 : 用A3C玩转超级马里奥
  • 课时41:整体流程与环境配置 05:38
  • 课时42:启动游戏环境 06:59
  • 课时43:要计算的指标回顾 09:01
  • 课时44:初始化局部模型并加载参数 08:05
  • 课时45:与环境交互得到训练数据 09:31
  • 第9 章 : 算法补充-卷积神经网络原理与参数解读
  • 课时46:卷积神经网络应用领域 07:24
  • 课时47:卷积的作用 09:23
  • 课时48:卷积特征值计算方法 08:07
  • 课时49:得到特征图表示 06:58
  • 课时50:步长与卷积核大小对结果的影响 08:11
  • 课时51:边缘填充方法 06:30
  • 课时52:特征图尺寸计算与参数共享 07:02
  • 课时53:池化层的作用 05:38
  • 课时54:整体网络架构 06:20
  • 课时55:VGG网络架构 06:16
  • 课时56:残差网络Resnet 07:41
  • 课时57:感受野的作用 05:46
  • 第10 章 : 基础补充-PyTorch框架基本处理操作
  • 课时58:PyTorch框架发展趋势简介 08:25
  • 课时59:框架安装方法(CPU与GPU版本) 05:13
  • 课时60:PyTorch基本操作简介 09:25
  • 课时61:自动求导机制 10:59
  • 课时62:线性回归DEMO-数据与参数配置 08:56
  • 课时63:线性回归DEMO-训练回归模型 10:08
  • 课时64:常见tensor格式 07:10
  • 课时65:Hub模块简介 08:25
  • 第11 章 : 基础补充-PyTorch图像识别实例
  • 课时66:卷积网络参数定义 07:21
  • 课时67:网络流程解读 07:26
  • 课时68:Vision模块功能解读 05:10
  • 课时69:分类任务数据集定义与配置 06:27
  • 课时70:图像增强的作用 04:51
  • 课时71:数据预处理与数据增强模块 09:25
  • 课时72:Batch数据制作 08:37
  • 课时73:迁移学习的目标 05:31
  • 课时74:迁移学习策略 07:11
  • 课时75:加载训练好的网络模型 09:54
  • 课时76:优化器模块配置 05:14
  • 课时77:实现训练模块 08:15
  • 课时78:训练结果与模型保存 09:31
  • 课时79:加载模型对测试数据进行预测 09:10
  • 课时80:13-额外补充-Resnet论文解读 11:47
  • 课时81:额外补充-Resnet网络架构解读 08:26

相关课程

开课日期:2018-06-20 20:00开始
5218
开课日期:2020-03-15 10:00开始
3742

授课教师

暂无教师
微信扫码分享课程

最新学员

暂无学员

学员动态

177411 开始学习课时 课程介绍
李耀 开始学习课时 课程介绍
小白U1640948970 开始学习课时 课程介绍