以此博客记录我的成长轨迹,与诸君共勉
09
02
01
08
29
强化学习之Dueling DQN 强化学习之Dueling DQN
注:本文续于《强化学习之DDQN》 Dueling DQN的思想是把神经网络中Q价值的输出分成两部分,第一部分是状态价值V,这部分价值由状态直接决定和Action无关。第二部分就是动作价值和状态价值的差值A,每一个Action都存在一个差
2021-08-29
29
07
21
16
15
元学习(Meta Learning) 元学习(Meta Learning)
名词解释:Meta Learning = Learn to learn ,也就是学习如何学习。和机器学习不同,这个是另外一个层次的东西了。 在我们深度学习领域,其实大多数时候都是在调超参数(hyperparameters),在工
2021-07-15
14
神经网络压缩 神经网络压缩
本文的内容主要讲解如何压缩一个较为庞大的神经网络,使其在较少参数的情况下,拥有和原来差不多的效能。这是因为在一些场景中,例如智能手表,它的内存是有限的,如果模型太过庞大,会导致无法运行在这样的小型智能物件上。下面来介绍五个常用做法: Ne
2021-07-14
14
机器终身学习与灾难性遗忘 机器终身学习与灾难性遗忘
按照我们以往的观点,当neural network的模型上线之后,我们可以源源不断地从网上获得反馈,获得新的资料,从而更好地更新我们的模型,达到life-long-learning的效果,使得模型越来越强大。但真的是这样吗? 这里举一
2021-07-14
08
5 / 9