以此博客记录我的成长轨迹,与诸君共勉
请刷新
训练流程:强化学习落地挑战赛——学习指定平等的促销策略 训练流程:强化学习落地挑战赛——学习指定平等的促销策略
比赛中详细专业的的强化学习训练流程,对以后的强化学习的训练有着重要的认知作用
多智能体强化学习算法MA-POCA 多智能体强化学习算法MA-POCA
论文原文:On the Use and Misuse of Absorbing States in Multi-agent Reinforcement Learning 预备知识参考: 强化学习纲要(周博磊课程) 强化学习实践教学 多智能
2021-12-29
论文阅读:Variational Discriminator Bottleneck 论文阅读:Variational Discriminator Bottleneck
对判别器进行信息约束来达到更为稳定的生成对抗训练
2021-12-24
ML-Agents中的模仿学习 ML-Agents中的模仿学习
简介 模仿学习是强化学习的好伙伴,使用模仿学习可以让智能体在比强化学习短得多的时间内得到与人类操作相近的结果,但是这种做法并不能超越人类,而强化学习能够得到远超人类的智能体,但训练时间往往非常漫长。因此我们希望让智能体并不是从零开始学,我们
ML-Agents案例之“硬核排序” ML-Agents案例之“硬核排序”
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一定的
ML-Agents案例之看图记忆 ML-Agents案例之看图记忆
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一定
ML-Agents案例之机器人学走路 ML-Agents案例之机器人学走路
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一定
ML-Agents案例之蠕虫 ML-Agents案例之蠕虫
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一
强化学习中的好奇心奖励机制 强化学习中的好奇心奖励机制
参考视频:李宏毅强化学习系列 参考论文: Large-Scale Study of Curiosity-Driven Learning Curiosity-driven Exploration by Self-supervised Pred
2021-12-02
ML-Agents案例之金字塔 ML-Agents案例之金字塔
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一
ML-Agents案例之地牢逃脱 ML-Agents案例之地牢逃脱
本案例源自ML-Agents官方的示例,Github地址:https://github.com/Unity-Technologies/ml-agents,本文是详细的配套讲解。 本文基于我前面发的两篇文章,需要对ML-Agents有一
4 / 11