D

Dqn PongNoFrameskip V4

由 sb3 开发
这是一个基于DQN算法的强化学习模型,专门用于在PongNoFrameskip-v4环境中进行游戏。
下载量 16
发布时间 : 6/2/2022
模型介绍
内容详情
替代品

模型简介

该模型使用stable-baselines3库和RL Zoo框架训练,能够在Atari游戏Pong中实现稳定的表现。

模型特点

稳定的游戏表现
在PongNoFrameskip-v4环境中实现了20.70的平均奖励分数
优化的超参数
使用了经过调优的超参数组合,包括学习率、探索策略等
Atari专用包装器
集成了Atari专用环境包装器,优化了游戏帧处理

模型能力

Atari游戏控制
强化学习决策
实时游戏响应

使用案例

游戏AI
Pong游戏AI
作为Pong游戏的对手AI,能够与人类玩家对战
平均奖励达到20.70分
强化学习研究
DQN算法验证
用于验证DQN算法在Atari游戏中的表现