归档: 2021 | 微笑紫瞳星

2021

09

02

强化学习之A2C和A3C

阅读本文可参考我以前的文章《强化学习实践教学》https://tianjuewudi.gitee.io/2021/07/16/qiang-hua-xue-xi-shi-jian-jiao-xue/#toc-heading-29，其中的连续

2021-09-02 强化学习

强化学习

01

挖矿教程

此方法为新手教程，给想入坑挖矿的小白使用

2021-09-01 其他

08

29

强化学习之Dueling DQN

注：本文续于《强化学习之DDQN》 Dueling DQN的思想是把神经网络中Q价值的输出分成两部分，第一部分是状态价值V，这部分价值由状态直接决定和Action无关。第二部分就是动作价值和状态价值的差值A，每一个Action都存在一个差

2021-08-29 强化学习

强化学习

29

强化学习之DDQN

知识基础DQN参考我的博文：https://tianjuewudi.gitee.io/2021/07/16/qiang-hua-xue-xi-shi-jian-jiao-xue/#toc-heading-19 DQN复习我

2021-08-29 强化学习

强化学习

07

21

强化学习纲要（周博磊课程）

提示：阅读本文需要一定的深度学习基础。课程链接：https://www.bilibili.com/video/BV1LE411G7Xj 我以前的强化学习笔记，相同的内容在下面就不再赘述： 1、强化学习概述 2、强化学习实践教学 Fou

2021-07-21 强化学习

强化学习

16

强化学习实践教学

参考视频：https://www.bilibili.com/video/BV1yv411i7xd 代码下载：https://github.com/PaddlePaddle/PARL 可以先阅读我的文章《强化学习概述》，重复的内容不再叙述

2021-07-16 强化学习

强化学习

15

元学习（Meta Learning）

名词解释：Meta Learning = Learn to learn ，也就是学习如何学习。和机器学习不同，这个是另外一个层次的东西了。在我们深度学习领域，其实大多数时候都是在调超参数（hyperparameters），在工

2021-07-15 机器学习

机器学习

14

神经网络压缩

本文的内容主要讲解如何压缩一个较为庞大的神经网络，使其在较少参数的情况下，拥有和原来差不多的效能。这是因为在一些场景中，例如智能手表，它的内存是有限的，如果模型太过庞大，会导致无法运行在这样的小型智能物件上。下面来介绍五个常用做法： Ne

2021-07-14 机器学习

机器学习深度学习

14

机器终身学习与灾难性遗忘

按照我们以往的观点，当neural network的模型上线之后，我们可以源源不断地从网上获得反馈，获得新的资料，从而更好地更新我们的模型，达到life-long-learning的效果，使得模型越来越强大。但真的是这样吗？这里举一

2021-07-14 机器学习

机器学习

08

强化学习概述（Reinforcement Learning）

视频课程链接：https://www.bilibili.com/video/BV1Wv411h7kN?p=73 序章一般我们做监督式学习（supervised-learning），你不仅需要数据，还需要对应的标签，这样才能训练一个模型。这

2021-07-08 强化学习

强化学习