1.CS231n课程回顾
斯坦福大学的cs231n课程主要介绍了卷积神经网络相关的深度学习知识,课程从算法的公式到实践进行了全面的介绍。
- 什么是强化学习
- 马尔可夫决策过程
注意各个代表的值。
pi:A=F(s)
- Q-Learning
- DQN论文解读
亮点:
replay memory
训练网络和计算标签的网络分离(tranining net,target net))
网络结构
训练网络
- 算法流程介绍
- Tensorflow实现
主函数
if __name__ == '__main__':
dqn_learning = Learning()
dqn_learning.train()
抽象要实现的类