D

Dqn MountainCar V0

由 sb3 开发
这是一个使用stable-baselines3训练的DQN智能体模型,专门用于解决MountainCar-v0环境中的强化学习任务。
下载量 578
发布时间 : 5/19/2022
模型介绍
内容详情
替代品

模型简介

该模型基于深度Q网络(DQN)算法,用于解决经典的MountainCar控制问题,目标是让小车通过摆动爬上山顶。

模型特点

基于深度强化学习
使用深度Q网络(DQN)算法,结合深度神经网络和强化学习技术
优化的超参数
经过精心调优的超参数组合,包括学习率、探索率等
稳定训练框架
基于stable-baselines3和RL Zoo训练框架,确保训练稳定性

模型能力

解决连续控制问题
学习最优策略
适应MountainCar环境

使用案例

教育演示
强化学习教学
用于展示深度强化学习算法在经典控制问题中的应用
平均奖励达到-103.40
算法研究
DQN算法基准测试
作为其他强化学习算法的性能基准
提供可比较的性能指标