以此博客记录我的成长轨迹,与诸君共勉
08
29
强化学习之Dueling DQN 强化学习之Dueling DQN
注:本文续于《强化学习之DDQN》 Dueling DQN的思想是把神经网络中Q价值的输出分成两部分,第一部分是状态价值V,这部分价值由状态直接决定和Action无关。第二部分就是动作价值和状态价值的差值A,每一个Action都存在一个差
2021-08-29
29