D

Dqn LunarLander V2

由 araffin 开发
这是一个使用stable-baselines3库训练的DQN智能体,用于解决LunarLander-v2环境中的强化学习任务。
下载量 54
发布时间 : 5/5/2022
模型介绍
内容详情
替代品

模型简介

该模型基于深度Q网络(DQN)算法,专门用于解决LunarLander-v2环境中的着陆控制问题。

模型特点

稳定训练
使用stable-baselines3库实现,提供稳定的训练过程和可靠的性能
高效探索
采用优化的探索策略,在40,000时间步内完成探索
双层网络架构
使用256x256的双层神经网络结构,平衡了模型容量和训练效率

模型能力

强化学习
连续控制
环境交互
决策制定

使用案例

游戏AI
月球着陆器控制
控制虚拟月球着陆器安全着陆在指定区域
平均奖励280.22±13.03
教育演示
强化学习教学示例
作为深度强化学习的教学案例