D

Dqn Acrobot V1

由 sb3 开发
这是一个基于 stable-baselines3 库训练的 DQN 强化学习智能体,专门用于解决 Acrobot-v1 控制问题。
下载量 403
发布时间 : 6/2/2022
模型介绍
内容详情
替代品

模型简介

该模型使用深度Q网络(DQN)算法在Acrobot-v1环境中进行训练,能够学习如何控制双连杆摆系统以达到目标状态。

模型特点

基于稳定强化学习框架
使用 stable-baselines3 库实现,这是一个可靠的强化学习框架
优化的超参数配置
经过调优的超参数设置,包括学习率、探索策略等
完整的训练流程支持
可通过 RL Zoo 框架进行训练、评估和部署

模型能力

强化学习控制
连续动作空间处理
环境状态感知

使用案例

学术研究
强化学习算法比较
可作为基准模型与其他强化学习算法在Acrobot环境中的表现进行比较
平均奖励-72.10 ±6.44
教育演示
强化学习教学案例
用于展示DQN算法在控制问题中的应用