归档 | 微笑紫瞳星

2021

09

25

强化学习之DQN超级进化版Rainbow

阅读本文前可以先了解我前三篇文章《强化学习之DQN》《强化学习之DDQN》、《强化学习之 Dueling DQN》。 Rainbow结合了DQN算法的6个扩展改进，将它们集成在同一个智能体上，其中包括DDQN，Dueling DQN，Pr

2021-09-25 强化学习

强化学习

19

交易与分析

https://www.youtube.com/watch?v=sNZ2y5XamPk&list=PLhhGIAWVvaGxHCN1HxcsR15acdK4dy2-c&index=1&ab_channel=%E6%

2021-09-19 投资

投资

16

Unity商业级网络游戏开发

参考视频：https://www.bilibili.com/video/BV1C7411i7Rg?p=2 开发准备：基本操作下载git，安装时注意以下选项：下载安装TortoiseGit，可以下载一个语言包切换成中文。下载安装

2021-09-16 游戏开发

游戏开发

13

强化学习之DQN代码带讲解

本代码取自周博磊强化学习课程https://space.bilibili.com/511221970/channel/detail?cid=105354&ctype=0 源码：https://download.csdn.net/

2021-09-13 强化学习

强化学习

08

强化学习之PPO

阅读本文前先了解TRPO算法有助于理解，我对此也写过博客：https://blog.csdn.net/tianjuewudi/article/details/120191097 参考李宏毅老师的视频：https://www.bilibi

2021-09-08 强化学习

强化学习

05

个人学习方向及研究方向

本文主要记录了个人研究生开始学习的方向性内容，主要从知乎，CSDN等网站摘录我认为对自己有启发的内容，希望能给后人指引方向，这里只从整体着眼，不设计具体细节。

2021-09-05 学习方法

论文写作研究方法

03

强化学习之TRPO

注：TRPO算是我至今遇到过的最难理解的算法了，我查了很多资料，花费好几天时间，也未曾理解，向TRPO的一作致敬。。。本文是我的查资料笔记，由于公式过多，可以先学比较重要的PPO。 TRPO全称为Trust

2021-09-03 强化学习

强化学习

02

强化学习之A2C和A3C

阅读本文可参考我以前的文章《强化学习实践教学》https://tianjuewudi.gitee.io/2021/07/16/qiang-hua-xue-xi-shi-jian-jiao-xue/#toc-heading-29，其中的连续

2021-09-02 强化学习

强化学习

01

挖矿教程

此方法为新手教程，给想入坑挖矿的小白使用

2021-09-01 其他

08

29

强化学习之Dueling DQN

注：本文续于《强化学习之DDQN》 Dueling DQN的思想是把神经网络中Q价值的输出分成两部分，第一部分是状态价值V，这部分价值由状态直接决定和Action无关。第二部分就是动作价值和状态价值的差值A，每一个Action都存在一个差

2021-08-29 强化学习

强化学习