首页 AI学术青年与开发者社区

UCL汪军教授:多智能体机器学习

课时列表 47课时
  • 第一章 博弈论基础介绍
  • 课时1 : 引言
    19:05
  • 课时2 : 博弈论的基本概念
    22:39
  • 课时3 : 纯策略纳什均衡
    26:34
  • 课时4 : 混合策略纳什均衡
    17:16
  • 课时5 : 纳什均衡的存在性证明
    26:34
  • 课时6 : 古诺双寡头模型
    25:10
  • 第二章 更多博弈形式
  • 课时7 : 重复博弈
    20:32
  • 课时8 : 扩展形式博弈
    14:33
  • 课时9 : 位势博弈(上)
    33:01
  • 课时10 : 位势博弈(下)
    19:54
  • 第三章 纳什均衡
  • 课时11 : 零和博弈及纳什均衡计算
    18:16
  • 课时12 : 极大极小博弈(Minmax Game
    12:19
  • 课时13 : 纳什均衡的线性规划解法
    20:46
  • 课时14 : 性互补问题
    20:56
  • 课时15 : Lemke–Howson 算法求解线性互补问题
    20:33
  • 第四章 贝叶斯博弈与拍卖理论
  • 课时16 : 贝叶斯博弈(Bayesian Game)
    22:09
  • 课时17 : 在线拍卖的设置与步骤
    10:45
  • 课时18 : 拍卖模式:一口价拍卖与密封式拍卖
    10:52
  • 课时19 : 竞价策略与纳什均衡
    24:45
  • 第五章 神经网络与深度学习
  • 课时20 : 深度学习基础
    28:42
  • 课时21 : 词嵌入
    11:00
  • 课时22 : 深度神经网络层
    05:14
  • 课时23 : 卷积神经网络
    06:55
  • 课时24 : 循环神经网络
    05:33
  • 课时25 : 网络信息检索
    04:44
  • 课时26 : 表征学习
    36:27
  • 基于值函数的单智能体强化学习
  • 课时27 : 强化学习基础
    25:25
  • 课时28 : Model-based 方法
    38:01
  • 课时29 : model-free-
    82:28
  • 多智能体强化学习(一)
  • 课时30 : 多智能体强化学习介绍及基本概念
    43:22
  • 课时31 : 值迭代与策略迭代
    26:43
  • 课时32 : 均衡学习
    05:35
  • 课时33 : 最佳对策
    21:40
  • 基于策略的单智能体强化学习
  • 课时34 : 策略方法
    59:02
  • 课时35 : 策略方法学习理论介绍
    43:49
  • 课时36 : 理论分析
    06:20
  • 多智能体强化学习(二)
  • 课时37 : 采用策略预测的IGA
    08:50
  • 课时38 : 类动态系统的梯度提升优化
    11:28
  • 课时39 : 不同博弈中的学习.
    11:26
  • 课时40 : 虚拟模拟
    18:00
  • 课时41 : 平滑虚拟博弈
    04:31
  • 课时42 : 理性学习
    05:13
  • 课时43 : 演化博弈论
    52:44
  • 课时44 : 模仿者动态理论
    14:23
  • 多智能体强化学习(三)
  • 课时45 : 相关均衡与无悔学习
    77:43
  • 课时46 : 多智能体评价
    37:09
  • 课时47 : 多智能体强化学习:进阶主题
    28:01
微信扫码分享课程